JP7140766B2 - オーディオオブジェクトをパンする処理方法及び処理システム - Google Patents

オーディオオブジェクトをパンする処理方法及び処理システム Download PDF

Info

Publication number
JP7140766B2
JP7140766B2 JP2019540554A JP2019540554A JP7140766B2 JP 7140766 B2 JP7140766 B2 JP 7140766B2 JP 2019540554 A JP2019540554 A JP 2019540554A JP 2019540554 A JP2019540554 A JP 2019540554A JP 7140766 B2 JP7140766 B2 JP 7140766B2
Authority
JP
Japan
Prior art keywords
transducer
gain
audio object
transducers
angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019540554A
Other languages
English (en)
Other versions
JP2020505860A5 (ja
JP2020505860A (ja
Inventor
ベルナール,ベンジャミン
ベッカー,フランソワ
Original Assignee
アウロ テクノロジーズ エンフェー.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アウロ テクノロジーズ エンフェー. filed Critical アウロ テクノロジーズ エンフェー.
Publication of JP2020505860A publication Critical patent/JP2020505860A/ja
Publication of JP2020505860A5 publication Critical patent/JP2020505860A5/ja
Application granted granted Critical
Publication of JP7140766B2 publication Critical patent/JP7140766B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems

Description

本発明は、マルチチャネルスピーカー構成(setups)においてオーディオオブジェクトをパンする音響処理方法及び音響処理システムに関する。
音響パンシステムは、オーディオ制作/再生チェーンの代表的な構成要素である。これらのシステムは、数十年間シネマミキシングステージにおいて一般に見られてきたものであり、より最近では映画館及びホームムービーシアターにおいて見られ、複数のラウドスピーカーを用いてオーディオコンテンツを空間化することを可能にする。
現代のシステムは、通常、オーディオデータ及び時間依存位置メタデータを含む1つ以上のオーディオ入力ストリームを取り込み、これらのオーディオストリームを、空間配置が任意である複数のラウドスピーカーに動的に分配する。
時間依存位置メタデータは、通常、デカルト座標又は球座標等の3次元(3D)座標を含む。ラウドスピーカーの空間配置は、通常、同様の3D座標を用いて記述される。
理想的には、上記パンシステムは、ラウドスピーカーの空間ロケーション及びオーディオプログラムの空間ロケーションを考慮し、パンされるストリームの知覚されるロケーションが、入力されたメタデータのロケーションとなるように、出力されるラウドスピーカー利得を動的に適合させる。
通常のパンシステムは、位置メタデータが与えられると、N個のラウドスピーカー利得のセットを計算し、このN個の利得を、入力されるオーディオストリームに適用する。
研究施設又は劇場施設に用いられる非常に多くのパンシステム技術が開発されている。
立体音響システムは、特に特許文献1におけるBlumleinの研究以降知られており、その後、特許文献2に記載されているようにファンタジア(Fantasia)映画に用いられるシステムが、WarnerPhonic等の他の映画関連システムとともに知られている。立体音響ビニール盤の標準化によって、立体音響オーディオシステムの大きな民主化が可能になった。
コンテンツ作成システム、特にミキシングデスクは、モノラルの音響ミキシングしか可能ではなかったので、それらのシステムの適合が、その後、必須となった。音を1つのチャネル又は同時に2つのチャネルに送るスイッチがコンソールに加えられた。そのような離散的なパンシステムは、元の信号を劣化させることなく立体音響パンの連続した変化を可能にするためにダブルポテンショメーターシステムが導入された1960年代中半まで広く用いられていた。
同じ再分割(repartition)原理に基づいて、いわゆるサラウンドパンシステムが、その後、導入され、例えば、3~7つのチャネルの使用が一般的である映画サウンドトラックの状況では、3つ以上のチャネル上でのモノラル信号の分配が可能になった。一般に「ペアワイズパン」と呼ばれる最も高い頻度で遭遇する実施態様は、一方が左右の分配に用いられ、他方が前後の分配に用いられるダブル立体音響パンシステムからなる。トランスデューサーの水平レイヤ間のアップダウン音響再分割を管理する第3のパンシステムを追加することによってそのようなシステムを3次元に拡張することは、その場合、取るに足らないことである。
しかしながら、幾つかの場合には、左右の位置又は前後の位置の間にトランスデューサーを位置決めしなければならない。例えば、中心チャネルは、左チャネルと右チャネルとの中央に配置され、映画サウンドトラックにおけるダイアログに用いられる。これは、立体音響パンシステムの実質的な変更を要求している。確かに、審美的な理由又は技術的な理由によって、中心信号の再生は、左チャネル及び右チャネルを介して行うか、又は、中心チャネルのみを介して行うか、更にはこれら3つのチャネルを同時に介して行うことが望ましいものとすることができる。
Dolby Atmos又はAuro-Max等のオブジェクトベースオーディオフォーマットの出現によって、最近、上記オーディオオブジェクトの良好な位置決定精度を保証するために、中間位置にある追加のトランスデューサーを、例えば、映画館の壁に沿って加えることが必要となった。そのようなシステムは、一般に、トランスデューサーがペアで用いられる上述したいわゆるペアワイズパンシステムによって管理される。そのようなペアワイズパンシステムの使用は、数ある理由の中で、部屋内のトランスデューサーセットの対称性によって正当化することができる。そのようなシステムに用いられる座標は、通常、デカルト座標であり、トランスデューサーが、聴衆を取り囲む部屋の面に沿って位置決めされることを前提とする。
三角形3Dメッシュの頂点に位置決めされたトランスデューサーの利得の計算を可能にするアルゴリズムであるベクトルベース振幅パン(VBAP:Vector-Based Amplitude Panning)等の他の手法が開示されている。更なる開発によって、四角形の面(特許文献3)又は任意のn角形(n-gons)(特許文献4)を備える配置上でVBAPを用いることが可能になる。
VBAPは、当初、任意の配置において点音源(point-sources)パンを生成するように開発されたものである。非特許文献1において、Pulkkiは、VBAPへの新たな追加、すなわち、音源の均一な拡散(spread:広がり)を可能にする複数方向振幅パン(MDAP:multiple-direction amplitude panning)を提示した。この方法は、基本的には、元の音源位置の周囲に追加の音源を必要とし、これらの追加の音源は、その後、VBAPを用いてパンされ、元のパン利得に重ね合わされる。非均一な拡散が必要とされる場合、より一般的には、高密度のスピーカー配置における3次元パンの場合、追加される音源の数は、非常に多くなる可能性があり、計算オーバーヘッドは大きくなる。MDAPは、MPEG-H VBAPレンダラーに用いられる方法である。
同様に、3次元パン方法に関して、特許文献5(Renderingof audio objects with apparent size to arbitrary loudspeaker layouts)は、初期音源の周囲の複数の仮想音源の作成に基づく音源幅技法を導入する。この寄与は、最終的には合計されて、トランスデューサー利得を形成する。
非特許文献2において、Franck他は、凸最適化技法に基づく音源幅制御の別の方法を提案した。この方法は、音源幅がない場合のVBAPに還元される。特許文献6等の幾つかの仮想音源方法は、無相関ステップも伴う。
音響場の球面調和関数表現に基づいているアンビソニックスも、オーディオパンに広範に用いられてきた(最近の例は、特許文献7に示されている)。
オリジナルのアンビソニックスパン技法における最も重要な欠点は、ラウドスピーカー配置が3D空間において可能な限り規則的であるべきであり、ラウドスピーカーがプラトン立体の頂点に位置決めされる等の規則的なレイアウト、又は3D球の他の最大限規則的であるテッセレーションの使用が要求されるということである。そのような制約は、多くの場合、アンビソニックパンの使用を特殊な場合に制限する。これらの制限を克服するために、例えば、VBAP及びアンビソニックスの双方を用いた混合手法が、特許文献8に開示されており、特許文献9において更に精緻化されている。
アンビソニックスに関する別の課題は、点音源が1つ又は2つのスピーカーのみによって再生されることがほとんどないということである。すなわち、この技術は、所与の位置又は所与の空間における音響場の再構築に基づいているので、単一の点音源について、多数のスピーカーが、おそらく位相がシフトされた信号を放出する。この技術は、理論的には、特定のロケーションにおける音響場の完全な再構築を可能にするが、この挙動は、中心から外れた聴取位置がこの点に関して幾分最適でないことも意味する。すなわち、先行音効果によって、幾つかの状況では、点音源が、空間内の予想外の位置から来るように知覚されることになる。
完全に任意の空間レイアウトを用いることができる他の手法、例えば、距離ベースオーディオパン(DBAP:Distance-Based Audio Panning)(非特許文献3)も提示されている。非特許文献4には、DBAPは、特に、リスナーがスピーカー配置に対して中心から外れているときに、3次アンビソニックスと比較して満足な結果を与えることが示されており、ほとんどの構成においてVBAPと非常に類似して動作することも示されている。
DBAPに関する最も突出した課題は、このアルゴリズムの中核をなす距離ベース減衰法則の選択である。特許文献10に示されているように、一定の法則は、規則的な配置しかハンドリングすることができず、DBAPは、アルゴリズムが空間スピーカー密度を考慮しないことに起因した不規則な空間スピーカー配置に関する問題を有する。
また、スピーカー配置補正振幅パン(SPCAP:Speaker Placement Correction Amplitude Panning)(非特許文献5)も提示されている。DBAP方法及びSPCAP方法の双方は、入力音源の意図した位置とラウドスピーカーの位置との間のメトリック、例えば、DBAPの場合にはユークリッド距離又はSPCAPの場合には音源とスピーカーとの間の角度しか考慮しない。
上記離散的パン方式を上回るSPCAPの利点のうちの1つは、ワイド(非点音源)音を生成するフレームワークを提供するように当初開発されていたということである。
この趣旨から、その主軸がパンされる音の方向である仮想3次元カーディオイドが、空間ラウドスピーカー配置内に投影され、カーディオイド関数の値は、最終的なラウドスピーカー利得を間接的に与える。このカーディオイド関数のタイトネスは、ユーザー設定可能な幅を有する音を生成することができるように、関数全体を0以上の所与の出力(power:電力)に上昇させることによって制御することができる。
非特許文献5に提案されているカーディオイド法則は、以下の式の出力上昇法則(power-raisedlaw:電力上昇法則)である。
Figure 0007140766000001
ここで、dは、音源の位置に対する音源の空間広がりを示す拡散関連幅(spread-relatedwidth)を表し、0~1の範囲を有する。
英国特許第394325号 米国特許第2298618号 国際公開第2013181272号 国際公開第2014160576号 国際公開第2014159272号 国際公開第2015017235号 国際公開第2014001478号 国際公開第2011117399号 国際公開第2013143934号 米国特許出願公開第20160212559号
「Uniform spreading of amplitude panned virtual sources」Proc. 1999 IEEE Workshop on Applications of Signal Processing toAudio and Acoustics, New Paltz, New York, Oct. 17-20, 1999 「An optimization approach to control sound source spread withmultichannel amplitude panning」Proc. CSV24, London,23-27 July 2017 「Distance-based Amplitude Panning」Lossius他、ICMC 2009 「Evaluation of distance based amplitude panning for spatial audio」 「A novel multichannel panning method for standard and arbitraryloudspeaker configurations」Kyriakakis他、AES2004
SPCAP等の従来技術の方法に関する1つの重要な知見は、非特許文献5に提案されているようなカーディオイド法則が点音源を生成するのに十分でないということである。すなわち、スピーカーアトラクション問題(speaker attraction issues)に陥ることなく、そのような焦点音源(focusedsources)をシミュレーションすることはできない。
オリジナルのSPCAPアルゴリズムにおける提案された出力上昇法則に関する別の課題は、上記カーディオイド関数がπの角度において不連続であることである。すなわち、u≠0である場合、r(π)=0であるが、u=0である場合、r(π)=1である。これは、パンされる音源の正確に反対側に位置決めされたスピーカーが、0に近いが0に等しくないuの値のあらゆる音を決して生成しないが、u=0の場合に音を突然生成することを意味する。
カーディオイド法則が不十分であることを示すために、図4及び図5は、オリジナルのSPCAPアルゴリズムのタイトネス制御(言い換えると、拡散制御)の効果を示している。狭い指向性を用いた図4では、Makitaの「速度」ベクトル方向及びGerzonの「エネルギー」ベクトル方向を示すグレー曲線に見ることができるように、音は、スピーカーからスピーカーにジャンプする。速度ベクトルは、
Figure 0007140766000002
として計算することができ、700 Hz~1000 Hz未満で音源定位がどのように知覚されるのかの良好なインジケーターとみなされるのに対して、
Figure 0007140766000003
として計算されるエネルギーベクトルは、700 Hz~1000 Hzを上回る場合の音源定位を与える。上記式において、
Figure 0007140766000004
は、第iのトランスデューサーを指し示す単位ベクトルであり、
Figure 0007140766000005
は、第iのトランスデューサーの利得である。広い指向性を用いた図5では、予想どおりに、隣接するスピーカーにおいて音「漏れ」を見ることができる。したがって、オリジナルのSPCAPアルゴリズムは、移動する点音源を生成する満足な方法を提供することができない。
本発明の目的は、前述の全ての標準的なアルゴリズムの課題、すなわち、
VBAPの音源拡散手法の複雑さ、
満足できる固定された又は移動する点音源を生成する能力がSPCAPにないこと、
アンビソニックの点音源は、通常、多数のスピーカーによって放出され、したがって、中心から外れた聴取位置では最適でない音響場が生み出されること、及び、
映画館で見られる配置のような不規則な配置に関するDBAPの課題、
に対する解決策を提供することである。
第1の態様では、本発明は、請求項1に記載の、オーディオ軸に沿ってオーディオオブジェクトを処理する方法を提供する。
開示された発明は、オリジナルのSPCAPを、このアルゴリズムの利点を維持しながら大幅に変更したものを構築し、上述した課題を解決する。
開示された発明では、カーディオイド法則は、拡散が変化したときに空間不連続性を生み出さず、拡散がもはや0..1の区間に制約されないように変更される。
1つの実施の形態では、カーディオイド法則は、以下の式の擬似カーディオイド法則に変更される。
Figure 0007140766000006
ここで、uは、0~無限大の範囲を有する本発明による拡散を表す。可変の拡散値を有する同じ空間連続性を有する他の任意の法則を代わりに用いることができる。本発明による一例は、図6に提示されている。
図4及び図5に提示された移動する点音源の課題を解決するために、本アルゴリズムも、音源と同じ位置に仮想スピーカーを追加する。次に、本アルゴリズムは、以下のステップを用いる。
1. 音源を取り囲むラウドスピーカーの利得が、任意の適用可能なパン法則によって、例えば、振幅ベースパン又は距離ベースパンを介して計算される。
2. 追加の仮想スピーカーも、スピーカー配置に加えられる。この仮想スピーカーは、パンされる音源と同じ位置を有する。
3. SPCAPアルゴリズムが、変更されたカーディオイド法則と、変更されたスピーカー配置のラウドスピーカー利得を生じる、上記仮想スピーカーが加えられた物理ラウドスピーカー配置とを用いて実行される。
4. 第1のステップにおいて得られ、任意選択でタイトネス値によって変更された利得を用いて、仮想ラウドスピーカー信号が上記周囲のスピーカーにわたって再分配される。
この新規なアルゴリズムは、前述の課題を解決する。すなわち、
SPCAPとは逆に、この場合、タイトネスは高く、スピーカー利得は、第1のステップの間に用いられる標準的なパン法則(例えば、振幅ベース又は距離ベース)を用いて得られたものに正確に従うので、開示された方法によって点音源を生成することができる。
アンビソニックスとは逆に、点音源は、限られた数のラウドスピーカーによって放出され、幾つかの状況では単一のスピーカーによって放出される可能性さえある。
VBAPとは逆に、上記で開示された単純で空間的に連続した法則によって、最大限に広い音を生成することができ、全ての中間音源幅値を、余分なステップを伴うことなく、このアルゴリズムによって生成することができる。
DBAPとは逆に、変更されたSPCAPアルゴリズムが用いられることによって、パンアルゴリズムがスピーカー密度を考慮することができることが確保される。
このアルゴリズムは、拡散値が大きい場合であっても、パンされる音源の音響エネルギー及び速度ベクトルが、引き続き、意図した音源位置に密接に位置合わせされることも確保する。
したがって、本発明の新規な技術的態様は、オリジナルのSPCAPアルゴリズムと比較すると、以下のものに関係し得る。
追加の仮想スピーカーの使用、
拡散音源(spread sources:広がり音源、スプレッド音源)を用いた場合であっても、意図した音源位置に位置合わせされたエネルギー及び速度ベクトルの双方の維持、
焦点音源の隣接するラウドスピーカーにおけるチャネル漏れ(channel spilling)の防止、
最大拡散音源が360度の拡散を実際に有することを可能にする、変更された拡散法則との連続性の確保。
第2の態様では、本発明は、請求項3に記載の、平行六面体室の内側表面に関してオーディオオブジェクトを処理する方法を提供する。
第3の態様では、本発明は、請求項4に記載の、球の内側表面に関してオーディオオブジェクトを処理する方法を提供する。
更なる態様によれば、本発明は、請求項4又は5に記載の、軸に沿ってオーディオオブジェクトを処理するシステムと、請求項6(7)に記載の、平行六面体室の内側表面に関してオーディオオブジェクトを処理するシステムと、請求項7(8)に記載の、球の内側表面に関してオーディオオブジェクトを処理するシステムとを提供する。
更なる態様によれば、本発明は、請求項5又は6に記載のシステムにおける請求項1又は2に記載の方法の使用と、請求項7に記載のシステムにおける請求項3に記載の方法の使用と、請求項8に記載のシステムにおける請求項4に記載の方法の使用とを提供する。
好ましい実施の形態及びそれらの利点は、詳細な説明及び従属請求項に提供されている。
本発明による方法の第1の例示の実施形態を示す図である。 本発明による方法の第2の例示の実施形態を示す図である。 本発明による方法の第3の方法例の実施形態を示す図である。 狭い指向性を有する現行技術水準のSPCAPアルゴリズムのタイトネス制御の効果を示す図である。 広い指向性を有する現行技術水準のSPCAPアルゴリズムのタイトネス制御の効果を示す図である。 本発明による一例示の変更された擬似カーディオイド法則(pseudo-cardioid law)の挙動を示す図である。 本発明の一例示の実施形態の結果の範囲を示す図である。
本発明は、オーディオオブジェクトをパンする処理方法及び処理システムに関する。
本明細書において、「ラウドスピーカー」及び「トランスデューサー」という用語は区別なく用いられる。さらに、「拡散」、「指向性」及び「タイトネス」という用語は、必ずしも全ての場合ではないが幾つかの場合において、区別なく用いられる場合があり、全て、オーディオオブジェクトの位置に関するオーディオオブジェクトの空間広がりに関係することができ、0~1の範囲を有する。
本明細書において、「音源」という用語は、音源の役割をするオーディオオブジェクトを指す。
好ましい実施形態では、表記の便宜上、拡散関連幅dは、本発明によれば、拡散uに置き換えられる。この拡散uは、音源の位置に関する音源の空間広がりを示し、0~無限大の範囲を有し、次の式、すなわち、u=d/(1-d)及びこれを逆にしたd=u/(1+u)に従って拡散関連幅dに関係し得る。拡散uは、例えば、特許請求の範囲全体にわたって用いられる。他の実施形態では、本発明は、例えば、図7の場合のように、等価な拡散関連幅dを用いることによって示される。当業者には明らかなように、u及びdの双方は、同じ物理量を異なる表記で表しているにすぎず、したがって、これらの2つのうちの一方を用いる任意の式を含むどの記述も、これらの2つのうちの他方が用いられる相補的な記述も開示している。
本発明は、複数の関連した実施形態を提供し、以下の3つのグループの実施形態にカテゴリー化することができる。
単一の軸に沿って位置決めされたトランスデューサーにおけるオーディオパンに対処する1次元の実施形態のグループ。これは、請求項1及び2に記載の方法と、請求項5及び6に記載のシステムとに関係し得る。1つの実施形態では、このグループの実施形態の出力は、物理スピーカーに対して即座に適用することができる。別の実施形態では、本発明は、出力を新たな処理ステップへの入力とすることができるバイノーラルレンダリングの計算等のより大きな処理コンテキストの一部とすることができる。
幾分平行六面体である部屋の内部表面上に位置決めされたトランスデューサーにおけるオーディオパンに最適なトリプル1D(triple-1D)実施形態のグループ。これは、請求項3に記載の方法と、請求項7に記載のシステムとに関係し得る。1つの実施形態では、このグループの実施形態の出力は、物理スピーカーに対して即座に適用することができる。別の実施形態では、本発明は、出力を新たな処理ステップへの入力とすることができるバイノーラルレンダリングの計算等のより大きな処理コンテキストの一部とすることができる。
球形トランスデューサーセットに対処する球形3D実施形態のグループ。これは、請求項4に記載の方法と、請求項8に記載のシステムとに関係し得る。1つの実施形態では、このグループの実施形態の出力は、物理スピーカーに対して即座に適用することができる。好ましい実施形態では、本発明は、出力を新たな処理ステップへの入力とすることができるバイノーラルレンダリングの計算等のより大きな処理コンテキストの一部である。
第1の態様では、本発明は、請求項1に記載の、オーディオ軸に沿ってオーディオオブジェクトを処理する方法を提供する。これは、軸に沿って単一の壁に位置決めされたスピーカーにおけるパンの使用に関する。好ましい実施形態では、これは、以下のアルゴリズムに関する。
最小横座標値及び最大横座標値が四分円(π/2アパーチャ)にまたがるように、横座標から仮想円形セグメントを作成する。
(1)上記四分円上のオブジェクト及びスピーカーの仮想方位角を用いることによって2つの取り囲むスピーカーα及びβを見つける。
(2)任意のステレオパン法則(例えば、「タンジェント」パン法則若しくは「サインコサインパン法則」又は他の任意の法則)を用いて、2つの取り囲むスピーカーの利得Qα及びQβを計算する。
(3)オブジェクト位置に位置決めされた新たなラウドスピーカーを上記四分円上に仮想的に作成する。このレイヤは、この時、N+1個のスピーカー(N個の物理スピーカー及び1つの仮想スピーカー)を備える。
(4)変更されたLSPCAP方法を用いて上記四分円におけるN個のスピーカーのSPCAP利得を計算する。
(a)以下の法則を用いてN+1個(N個の実際のスピーカー、1個の仮想スピーカー)の当初利得を計算する。
Figure 0007140766000007
ここで、θisは、音源とスピーカーとの間の角度である。
(b)上記ステップ(2)において計算されたステレオ利得Qα及びQβを用いることによって、仮想の第(N+1)のスピーカーの以下の計算された利得を再分配する。
Figure 0007140766000008
1ここで、i=α又はi=β
(c)事前計算されたスピーカー有効数によって当初利得を除算することによって「初期利得値」Giを計算する。
Figure 0007140766000009
(d)総放出出力
Figure 0007140766000010
を計算し、初期利得を除算して各スピーカーの補正された利得
Figure 0007140766000011
を得ることによって出力節約を確保する。
第2の態様では、本発明は、請求項3に記載の、平行六面体室の内側表面に関してオーディオオブジェクトを処理する方法を提供する。これは、「トリプル1D処理」に関し、独立した3軸拡散値が必要とされる部屋の壁(前後左右上壁)に位置決めされたスピーカーにおけるパンとの使用に関する。
好ましい入力は、以下のとおりである。
オブジェクト座標、デカルト。
x軸、y軸及びz軸(0~+無限大の範囲を有する)に沿ったオブジェクト3次元拡散値。
スピーカー配置:
各スピーカーのデカルト座標は正規化される(左右及び前後の寸法は-1~1の範囲を有する。上下に関して、耳のレベルはZ=0であり、天井はZ=1である)。
好ましい実施形態では、アルゴリズムは、以下のものに関する:
グローバルアルゴリズム:
(オプション:スピーカースナップを適用する)
ラウドスピーカーのZ横座標及びZ拡散値のみを用いて、Z軸に沿って1Dアルゴリズムを実行する:全てのラウドスピーカーのZ利得を取得する。
Zレイヤを効果的に作成するスピーカー配置の一意のZ座標リストを求める。
各Zレイヤについて、そのレイヤのラウドスピーカーのY横座標及びY拡散値のみを用いて、Y軸に沿って1Dアルゴリズムを実行する:全てのラウドスピーカーのY利得を取得する。
各Zレイヤについて、Y行を効果的に作成する一意のY座標リストを求める。
各Zレイヤ及び各Y行について、その行のラウドスピーカーのX横座標及びX拡散値のみを用いて、X軸に沿って1Dアルゴリズムを実行する:全てのラウドスピーカーのX利得を取得する。
X利得、Y利得及びZ利得を要素ごとに乗算し、2ノルム正規化を適用して、最終的なラウドスピーカー利得を得る。
第3の態様では、本発明は、請求項4に記載の、球の内側表面に関してオーディオオブジェクトを処理する方法を提供する。これは、球面上に位置決めされたスピーカーにおけるパンの使用に関する。
好ましい入力は、以下のものである。
オブジェクト座標、球。
オブジェクト拡散値u(0~+無限大の範囲を有する)
スピーカー配置:
各スピーカーの球座標、
スピーカーが頂点に位置決めされる球形三角形メッシュ。
好ましい実施形態では、このアルゴリズムは、以下のものに関する:
オフライン部分:
スピーカー配置についてのスピーカー有効数を事前計算する:N個の実際のラウドスピーカーのみのいわゆる「スピーカー有効数」βiを計算する:
Figure 0007140766000012
その値は、互いに接近したスピーカーにはより小さな重み(すなわち、より小さな利得)を与えることによってスピーカー空間密度を考慮することを可能にする。この数は、スピーカー(計算に考慮されるスピーカーを含む)の全体セットを用いて、スピーカーごとに計算される。βiは少なくとも1に等しいことが分かる。この値は、必要に応じて、1とその元の値との間でアフィン関数によって更に変更され、スピーカー密度を徐々に考慮する(考慮しない)ことができる。
所与のオブジェクト座標のリアルタイム部分:
(B):メッシュにおける各小面(facet)についてVBAP利得を計算し、全てのスピーカー利得が正である取り囲む小面を見つける。その小面の3つの利得のみを保持し、残りを廃棄する(詳細なVBAP方法について、Pulkki, 2001を参照)。
(C):スピーカー配置内にオブジェクト位置に位置決めされる新たなラウドスピーカーを仮想的に生成する。この配置は、この時点で、N+1個のスピーカー(N個の物理スピーカー及び1つの仮想スピーカー)を備える。
(D):以下の変更されたLSPCAP方法を用いてN個のスピーカーのSPCAP利得を計算する:
(1)以下の法則を用いて、N+1個(N個の実際のスピーカー、1つの仮想スピーカー)の当初利得を計算する。
Figure 0007140766000013
ここで、θisは、音源とスピーカーとの間の角度である。
(2)上記ステップ(A)において計算された3つのVBAP利得Qiを用いることによって、仮想の第(N+1)のスピーカーの以下の計算された利得を再分配する。
Figure 0007140766000014
1iは、アクティブなVBAP小面に属するスピーカーiのiである。
(4)スピーカー有効数によって当初利得を除算することによって「初期利得値」Giを計算する。
Figure 0007140766000015
(5)総放出出力
Figure 0007140766000016
を計算し、初期利得を除算して各スピーカーの補正された利得
Figure 0007140766000017
を得ることによって出力節約を確保する。
更なる態様では、本発明は、以下の考慮事項に関する。
通常のパンシステムは、位置メタデータが与えられると、N個のラウドスピーカー利得のセットを計算し、このN個の利得を入力されるオーディオストリームに適用する。
例えば、ベクトルベース振幅パンは、三角形3Dメッシュの頂点に位置決めされたラウドスピーカーの上記利得を計算することを可能にする。更なる開発によって、四角形の面(特許文献3)又は任意のn角形(特許文献4)を備える配置上でVBAPを用いることが可能になる。
アンビソニックスも、オーディオパンに広範に用いられてきた(特許文献7)。アンビソニックスパンにおける最も重要な欠点は、ラウドスピーカー配置が3D空間において可能な限り規則的でなければならず、ラウドスピーカーがプラトン立体の頂点に位置決めされる等の規則的なレイアウト、又は3D球の他の最大限規則的であるテッセレーションの使用が要求されるということである。これらの制約は、アンビソニックパンの使用を特殊な場合に制限する。
これらの問題を克服するために、VBAP及びアンビソニックスの双方を用いた混合手法が、特許文献8に開示されており、特許文献9において更に精緻化されている。
完全に任意の空間レイアウトを用いることができる他の手法、例えば、距離ベースオーディオパン(DBAP)(非特許文献3)、又は、スピーカー配置補正振幅パン(SPCAP)(非特許文献5)も提示されている。それらの方法は、入力音源の意図した位置とラウドスピーカーの位置との間の距離、例えば、DBAPの場合にはユークリッド距離又はSPCAPの場合には音源とスピーカーとの間の角度しか考慮しない。
非特許文献4では、DBAPは、特に、リスナーがスピーカー配置に対して中心から外れているときに、3次アンビソニックスと比較して満足な結果を与えることが示されており、ほとんどの構成においてVBAPと非常に類似して動作することも示されている。
これによって、これらの距離ベース方法に関する重要な欠点は、入力音源の空間拡散に対する制御が欠如していることである。
本発明は、以下の非限定的な例によって更に説明される。これらの例は、本発明を更に例示するものであり、本発明の範囲を限定することを意図するものでもなければ、本発明の範囲を限定するものと解釈されるべきでもない。

例1:本発明による方法の第1の例示の実施形態
図1は、N個のトランスデューサー及びオーディオオブジェクトが全て、本質的に単一の軸上に存在する本発明の方法の一例示の実施形態を示している。N個のトランスデューサー(言い換えると、ラウドスピーカー)の位置は、上記単一の軸に沿ったそれらの横座標によって表される。オーディオオブジェクトの位置も、横座標として表すことができる。さらに、オーディオオブジェクトは、[0, +∞]の値の拡散uを有する。
特に、図1は、音源151及びラウドスピーカー152の横座標が既知である、軸に沿ったN個のラウドスピーカーにわたる音源のパンを確保する、本発明の一実施形態において実施される方法を示している。図1には、N個の横座標を四分円にマッピングするステップ(110)と、2つの最も接近したラウドスピーカー113、114を求めるステップ(111)と、ステレオパン法則を用いて上記最も接近したスピーカーの2つのステレオパン利得115、116を計算するステップ(112)と、仮想トランスデューサーを音源の位置に加えるステップ(120)と、本発明に開示された1つの方法を用いてN+1個のトランスデューサー利得103を計算するステップ(121)と、N個の利得104を生じるステレオパン利得115、116を用いて、仮想トランスデューサーの第N+1の利得を2つの最も接近したラウドスピーカー113、114に再分配するステップ(130)と、上記N個の利得104を出力正規化して最終的なパン利得105を得るステップ(131)とが示されている。
詳細な態様1は、以下である;
軸に沿って整列された複数のN個の音響トランスデューサーにわたって空間化回復を行うように前記軸に沿ってオーディオオブジェクトを処理する方法であって、該オーディオオブジェクト(151)は、オーディオオブジェクト横座標及びオーディオオブジェクト拡散を有し、前記音響トランスデューサーのそれぞれは、トランスデューサー横座標(152)を有し、Nは少なくとも2に等しく、該方法は、
前記複数の音響トランスデューサーのそれぞれの前記トランスデューサー横座標(152)と、前記オーディオオブジェクト横座標(151)との四分円上へのマッピングを含む第1のプロセス(110)を実行し、前記複数のトランスデューサーのN個のトランスデューサー角(154)と、前記オーディオオブジェクトの1つのオーディオオブジェクト角(153)とを得るステップと、
第3のプロセス(130)を実行するステップであって、
以下の式によって、前記複数のトランスデューサーのそれぞれのトランスデューサー有効数(159)を計算するサブステップ(132)と、
Figure 0007140766000018
ここで、θ i は、トランスデューサー iのトランスデューサー角であり、θ は、トランスデューサーjのトランスデューサー角であり、
以下の式によって、i∈[1..N]である前記複数のトランスデューサーのそれぞれのトランスデューサー利得P i (160)を計算するサブステップ(133)と、
Figure 0007140766000019
を含む、ステップと、
第4のプロセス(140)を実行するステップであって、
前記トランスデューサー有効数(159)によって前記利得(162)を除算することによって、前記複数のN個のトランスデューサーのそれぞれの以下の初期利得値G i (163)を計算するサブステップ(142)と、
Figure 0007140766000020
ここで、θ is は、オーディオオブジェクトとトランスデューサー i間の角であり、
総放出出力を、
Figure 0007140766000021
によって計算し、前記複数のN個のトランスデューサーのそれぞれについて、
Figure 0007140766000022
によって補正された利得(164)を計算することによって出力節約を確保するサブステップ(143)と、
を含む、ステップと、
を含み、
該方法は、
前記複数のトランスデューサーから、前記オーディオオブジェクトに最も接近した第1のトランスデューサーα(155)及び第2のトランスデューサーβ(156)を識別するサブステップ(122)と、
前記第1のトランスデューサーα(155)及び前記第2のトランスデューサーβ(156)に対するステレオパン法則に従って前記利得Q α (157)及びQ β (158)を計算するサブステップ(123)と、
を含む第2のプロセス(120)を実行することを更に含み、
前記第3のプロセス(130)は、
前記オーディオオブジェクト角(153)に本質的に等しい仮想トランスデューサー角を含む仮想トランスデューサーを作成し、該仮想トランスデューサー角をN個のトランスデューサー角(154)のリストに加え、それによって、N+1個のトランスデューサー角の拡張されたリストを作成する追加のサブステップ(131)と、
前記トランスデューサー利得を計算する変更されたサブステップ(133)であって、
Figure 0007140766000023
(ここで、θ N+1,S は、オーディオオブジェクトと仮想トランスデューサー間の角であり)
によって、前記仮想トランスデューサー角に対応する仮想トランスデューサー利得P N+1 (161)を計算することを更に含み、
前記第4のプロセス(140)は、
前記第2のプロセス(120)において計算された前記利得Q α (157)及びQ β (158)を用いることによって前記第1のトランスデューサーα(155)及び前記第2のトランスデューサーβ(156)にわたって前記仮想トランスデューサー利得P N+1 (161)を再分配し、
Figure 0007140766000024
(ここで、i=α又はi=βである)
に従って、前記第1のトランスデューサーα(155)の変更された利得P' α (162)と、前記第2のトランスデューサーβ(156)の変更された利得P' β (162)とを得る追加のサブステップ(141)、
を更に含み、
前記初期利得値G i (163)の前記計算は、前記第1のトランスデューサーα(155)の前記利得P α の代わりに前記変更された利得P' α (162)と、前記第2のトランスデューサーβ(156)の前記利得P β の代わりに前記変更された利得P' β (162)とを用いて行われる、
ことを特徴とする、方法。
詳細な態様2は、以下である;
軸に沿って整列された複数のN個の音響トランスデューサーにわたって空間化回復を行うように前記軸に沿ってオーディオオブジェクトを処理するシステムであって、該オーディオオブジェクト(151)は、オーディオオブジェクト横座標及びオーディオオブジェクト拡散を有し、前記音響トランスデューサーのそれぞれは、トランスデューサー横座標を有し、Nは少なくとも2に等しく、該システムは、
前記複数の音響トランスデューサーのそれぞれの前記トランスデューサー横座標(152)と、前記オーディオオブジェクト横座標(151)との四分円上へのマッピングを実行し、前記複数のトランスデューサーのN個のトランスデューサー角(154)と、前記オーディオオブジェクトの1つのオーディオオブジェクト角(153)とを得るように構成された第1のモジュール(110)と、
第3のモジュール(130)であって、
以下の式によって、前記複数のトランスデューサーのそれぞれのトランスデューサー有効数(159)を計算すること(132)と、
Figure 0007140766000025
ここで、θ i はトランスデューサーiのトランスデューサー角であり、θjは、トランスデューサーjのトランスデューサー角であり、
以下の式によって、i∈[1..N]である前記複数のトランスデューサーのそれぞれのトランスデューサー利得P i (160)を計算すること(133)と、
Figure 0007140766000026
ここで、θ is は、前記オーディオオブジェクトと前記トランスデューサーiとの間の前記角度であり、
の方法を実行するように構成された、第3のモジュールと、
第4のモジュール(140)であって、
前記トランスデューサー有効数(159)によって前記利得(162)を除算することによって、前記複数のN個のトランスデューサーのそれぞれの以下の初期利得値G i (163)を計算すること(142)と、
Figure 0007140766000027
総放出出力を、
Figure 0007140766000028
によって計算し、前記複数のN個のトランスデューサーのそれぞれについて、
Figure 0007140766000029
によって補正された利得(164)を計算することによって出力節約を確保すること(143)と、
の方法を実行するように構成された、第4のモジュール(140)と、
を備え、
該システムは、
前記複数のトランスデューサーから、前記オーディオオブジェクトに最も接近した第1のトランスデューサーα(155)及び第2のトランスデューサーβ(156)を識別すること(122)と、
前記第1のトランスデューサーα(155)及び前記第2のトランスデューサーβ(156)に対するステレオパン法則に従って前記利得Q α (157)及びQ β (158)を計算すること(123)と、
の方法を実行するように構成された第2のモジュール(120)を更に備え、
前記第3のモジュール(130)は、
前記オーディオオブジェクト角(153)に本質的に等しい仮想トランスデューサー角を有する仮想トランスデューサーを作成し、該仮想トランスデューサー角をN個のトランスデューサー角(154)のリストに加え、それによって、N+1個のトランスデューサー角の拡張されたリストを作成する追加のサブステップ(131)と、
前記トランスデューサー利得を計算する変更されたサブステップ(133)であって、
Figure 0007140766000030
(ここで、θ N+1,S は、オーディオオブジェクトと仮想トランスデューサー間の角であり)
によって、前記仮想トランスデューサー角に対応する仮想トランスデューサー利得P N+1 (161)を計算する追加のサブステップを、実行するように更に構成され、
前記第4のモジュール(140)は、
前記第2のモジュール(120)において計算された前記利得Q α (157)及びQ β (158)を用いることによって前記第1のトランスデューサーα(155)及び前記第2のトランスデューサーβ(156)にわたって前記仮想トランスデューサー利得P N+1 (161)を再分配し、
Figure 0007140766000031
(ここで、i=α又はi=βである)
に従って、前記第1のトランスデューサーα(155)の変更された利得P' α (162)と、前記第2のトランスデューサーβ(156)の変更された利得P' β (162)とを得る追加のサブステップ(141)、
を実行するように更に構成され、
前記初期利得値G i (163)の前記計算は、前記第1のトランスデューサーα(155)の前記利得P α の代わりに前記変更された利得P' α (162)と、前記第2のトランスデューサーβ(156)の前記利得P β の代わりに前記変更された利得P' β (162)とを用いて行われる、
ことを特徴とする、システム。
例2:本発明による方法の第2の例示の実施形態
図2は、N個のトランスデューサーが本質的に平行六面体室上に位置決めされている、本発明の方法の一例示の実施形態を示している。
特に、図2は、ラウドスピーカーが所与のデカルト座標200を有する壁に位置決めされている、本発明の一実施形態において実施される方法を示している。図2には、Z軸に沿ったZ利得207を計算するステップ(201)と、Zレイヤを構築するステップ(202)と、ZレイヤごとにY軸に沿ったY利得208を計算するステップ(203)と、ZレイヤごとにY行を構築するステップ(204)と、Y行ごとにX軸に沿ったX利得209を計算するステップ(205)と、Z利得207、Y利得208及びX利得209を要素ごとに乗算し、その結果を出力正規化して最終的なラウドスピーカー利得210を得るステップ(206)とが示されている。
例3:本発明による方法の第3の例示の実施形態
図3は、N個のトランスデューサーが球の内側表面上に位置決めされている、本発明の方法の一例示の実施形態を示している。
特に、図3は、音源311の球座標及びラウドスピーカー312の球座標が既知である球表面上に位置決めされたN個のラウドスピーカーにわたる音源のパンを確保する、本発明の一実施形態において実施される方法を示している。図3には、N個の変更されたスピーカー有効数313を計算するステップ(301)と、各小面のVBAP利得を計算し、全ての利得が正である小面を求め、それによって、3つの取り囲む小面の利得314を保持するステップ(302)と、仮想スピーカーを音源位置311に加えるステップ(303)と、請求項3に記載の第2のシステムの第3のステップに列挙された方法を用いて、N+1個のラウドスピーカーの変更されたSPCAP利得315を計算するステップ(304)と、N個の利得316を生じる取り囲むラウドスピーカーの利得313を用いて、取り囲む小面にわたって第N+1の利得を再分配するステップ(305)と、初期利得値317を計算するステップ(306)と、N個の利得を出力正規化して、N個の最終的な利得318を得るステップ(307)とが示されている。
詳細な態様は、以下である;
球の内側表面上に位置決めされた複数のN個の音響トランスデューサーにわたって空間化回復を行うようにオーディオオブジェクトを処理する方法であって、Nは少なくとも2に等しく、前記オーディオオブジェクトは、オーディオオブジェクト位置及びオーディオオブジェクト拡散を有し、該方法は、
第1のプロセス(301)を実行するステップであって、該第1のプロセスは、
前記複数のトランスデューサー、前記オーディオオブジェクト位置及び前記オーディオオブジェクト拡散に基づいて前記トランスデューサー有効数β i を事前計算するサブステップと、
トランスデューサー密度を徐々に考慮し、1とその元の値との間でアフィン関数によってβ i を変更し、変更されたトランスデューサー有効数(313)を得るサブステップと、
を含む、ステップと、
所与のオブジェクト座標について、第2のプロセスを実行するステップであって、該第2のプロセスは、
前記メッシュにおける各小面のベクトルベース振幅パン(VBAPと略す)利得を計算し、ここで該トランスデューサーは、該メッシュの頂点に位置決めされ、そして、前記トランスデューサー利得Q i のそれぞれが正である取り囲むアクティブな小面を見つけ、それ以外の利得を廃棄して、3つのVBAP利得(314)を得る第1のステップ(302)と、
前記トランスデューサー配置内に、前記オーディオオブジェクト位置(311)に位置決めされる仮想トランスデューサーを作成し、前記変更された配置がN+1個のトランスデューサーを備えるようにする第2のステップ(303)と、
前記N+1個のトランスデューサーの元のスピーカー配置補正振幅パン(SPCAP)利得(315)P i (θ is )を計算する第3のステップ(304)と、
前記第1のステップ(302)において計算された前記3つのVBAP利得Q i (312)と、前記元のSPCAP利得(315)とを用いることによって前記仮想の第(N+1)のトランスデューサーの前記計算された利得を再分配し、N個の変更されたSPCAP利得(316)を得る第4のステップ(305)と、
以下の式のように、前記第1のシステムによって事前計算された前記変更されたトランスデューサー有効数(313)によって前記元のSPCAP利得(316)P i (θ is )を除算することによって、前記初期利得値G i (θ s )(317)を計算する第5のステップ(306)と、
Figure 0007140766000032
ここで、θ is は、オーディオオブジェクトとトランスデューサー i間の角であり、及び
前記総放出出力
Figure 0007140766000033
を計算し、前記初期利得値(317)G i s )を除算して、各トランスデューサーの前記補正された利得(318)
Figure 0007140766000034
を得ることによって、出力節約を確保する第6のステップ(307)と、
を含む、ステップと、
を含み、
前記トランスデューサー有効数(313)の前記計算は、以下の式を用い、
Figure 0007140766000035
ここで、θ i はトランスデューサーiのトランスデューサー角であり、θjは、トランスデューサーjのトランスデューサー角であり、
前記第2のプロセスの前記第3のステップ(304)は、以下の式を用い、
Figure 0007140766000036
ここで、θ is は、前記オーディオオブジェクトと前記トランスデューサーiとの間の前記角度であり、
前記第2のプロセスの前記第4のステップ(305)は、以下の式を用い、
Figure 0007140766000037


iは、トランスデューサーiが、該取り囲むアクティブなVBAP小面に属するものである、
ことを特徴とする、方法。
例4:本発明の一例示の実施形態と現行技術水準の方法との比較
図4は、狭い指向性を有する現行技術水準のSPCAPアルゴリズムのタイトネス制御の効果を示している。特に、図4は、オリジナルのSPCAPアルゴリズムに関して、可変のタイトネス制御(dは0~1の範囲を有する)の拡散関連幅の値がd=0.75である場合の、通常の不規則な4スピーカーレイアウト(±30度、±110度)について、スピーカー利得401、402、403、404と、求められるパン角度407と比較される音響速度405ベクトル及び音響エネルギー406ベクトルの角度とを示している。見て取ることができるように、そのような狭いタイトネスによって、エネルギーベクトル及び速度ベクトルが角度間でジャンプするスピーカーアトラクション効果がもたらされる。
図5は、広い指向性を有する現行技術水準のSPCAPアルゴリズムのタイトネス制御の効果を示している。特に、図5は、オリジナルのSPCAPアルゴリズムに関して、可変のタイトネス制御(dは0~1の範囲を有する)の拡散関連幅の値がd=0.50である場合の、通常の不規則な4スピーカーレイアウト(±30度、±110度)について、スピーカー利得501、502、503、504と、求められるパン角度507と比較される音響速度505ベクトル及び音響エネルギー506ベクトルの角度とを示している。見て取ることができるように、そのような広いタイトネスによって、ラウドスピーカー間で信号漏れが引き起こされる。
図6は、本発明による一例示の変更された擬似カーディオイド法則の挙動を示している。特に、図6は、本発明の幾つかの実施形態において実施される、0度~360度に変化する方位角601に沿った変更された擬似カーディオイド法則602の挙動を提示している。
図7は、本発明の一例示の実施形態の様々な結果を示している。特に、図7は、本発明の原理を用いて、それぞれの方位角0度、±45度、±90度及び±135度に位置決めされた7つのスピーカー(N=7)のセットにおいて音源をパンした結果を示している。これによって、ラウドスピーカーは、それらのそれぞれが球の表面上に画定された単一の水平ラインセクション上に位置決めされる、本質的に球形体積の内側表面上に位置決めされていると仮定される。1.0、0.8、0.6、0.4、0.2及び0.0に等しい拡散関連幅値dを用いた結果が、左から右及び上から下にそれぞれ示されている。これによって、拡散関連幅dは、従来技術の方法との比較を容易にするためだけに拡散uの代わりに用いられ、対応する拡散値uは、u=d/(1-d)を通じて取得される。各拡散値について、上部チャートは、全てのスピーカーのパン利得及びスピーカー位置(丸印)を示し、下部チャートは、理論的なパン角度(点線)並びに速度(実線)ベクトル角及びエネルギー(破線)ベクトル角を示している。焦点音源について、標準的なVBAPパン利得を密に取り出すことができ、音源拡散が増加すると、位置精度が徐々に(gradually)劣化することが分かる。
例5:監視及び再生のためにオブジェクトベースオーディオレンダリングに関する一例示の実施形態
この例は、オブジェクトベースオーディオのレンダリングに関する本発明の一例示の実施形態を提供する。オブジェクトベースオーディオ、及び、バイノーラルオーディオのヘッドトラッキング等の他の特徴部のレンダリングには、高品質なパン/レンダリングアルゴリズムの使用が必要とされる。
この例では、LSPCAPが、これらのタスクを実行するのに用いられる。
高レベル特徴部
LSPCAPは、軽量でスケーラブルなパンアルゴリズムであり、任意の2D/3Dスピーカー配置を対象とする以下の2つのバージョンにおいて利用可能である。
スナップ制御及びゾーン制御を有するAuro-3D等の不規則な部屋中心のレイアウト、
規則的なリスナー中心のレイアウト、特に、アンビソニックス復号化に適したレイアウト。
LSPCAPは、オーディオオブジェクト集中/拡散に対する分離された水平/垂直制御も可能にする。LSPCAPは、広い(拡散した)オーディオオブジェクトの場合であっても、ペアワイズのVBAPパン又はHOAパンよりも良好な方向精度(エネルギーベクトル及び振幅ベクトル)を保証する。
基礎をなす技術
LSPCAPは、変更されたスピーカー配置補正振幅パン(SPCAP)アルゴリズムを、特定のエネルギーベクトル最大化とともに、一般化されたベクトルベース振幅パン(VBAP)と結合することによって機能する。
強化型LSPCAPアルゴリズムの使用
フル3Dリスナー中心モード及びレイヤード3D部屋中心モードの2つのモードのアルゴリズムが開発された。
リスナー中心モード
このバージョンは、オブジェクトの球座標又は極座標を許容し、球形のスピーカー配置を用いる。この配置は、有利には、可能な限り規則的であるべきである。以下の配置が実施される。
1. 表1 - LSPCAPのリスナー中心モードにおけるスピーカー配置
Figure 0007140766000038
各配置について、HOAレンダラーがこの配置とともに用いられる場合の達成可能なHOA次数が示されている。その隣には、LSPCAPによって達成される等価なHOA次数が示されている。これは、球全体及び周波数レンジ全体にわたる以下のメトリック、すなわち、ITD精度、ILD精度をマージする。
指向性レンダリングの精度は、スピーカーの数とともに向上する。もちろん、計算複雑度も同様に上昇し、これは、特に、バイノーラルレンダリングにLSPCAPを用いるときに重要となる。
このバージョンは、球形の規則的なスピーカーレイアウトが、ほとんどの実世界の状況において実用的でないので、ほとんどがオブジェクトのパンとバイノーラルレンダリング(例えば、Auro-Headphones)との間の中間レンダリングとして用いられる。その精度は、ITD及びILDに関して、所与のレイアウトについて達成可能なHOAレンダリングの精度よりも良好である。
部屋中心モード
部屋中心モードは、デカルト座標に適応し、特に、部屋における実際のスピーカー構成へのオブジェクトのパンを対象としている。
内部では、このモードは、SPCAPの平面(2D)バージョンの複数のレイヤを用いて構築される。
各レイヤは、オブジェクトの方位角のみに適応し、スピーカーの方位角を用いてスピーカーも記述する。これらの方位角は、オブジェクト及びスピーカーのXY座標から導出される。
Z座標は、連続するレイヤの間のパンに用いられる。最上位レイヤは、特殊な挙動を有する。すなわち、デュアルSPCAP-2Dアルゴリズムが、XZ平面及びYZ平面上で実行され(最上位レイヤのスピーカーは、その場合、それらの2つの平面上に投影される)、それらの結果はマージされて、最上位レイヤ利得が形成される。
パラメーター
リスナー中心のバージョン
スピーカーレイアウト構成
2. 表2 - LSPCAPリスナー中心モード:スピーカー構成
Figure 0007140766000039
リスナー中心のラウドスピーカー構成は、規則的な球形配置及びレイアウト内のスピーカーの量を制御する、1~8の範囲を有する離散スピーカー密度パラメーターによって規定することができる(本明細書の他の箇所も参照)。
音源パラメーター
3. 表3 - LSPCAPリスナー中心モード:音源パラメーター
Figure 0007140766000040
部屋中心モード
スピーカーレイアウト構成
部屋中心LSPCAPアルゴリズムは、仮想部屋の壁に位置決めされたスピーカーのみをサポートする。したがって、スピーカーごとに、Xパラメーター、Yパラメーター、Zパラメーターのうちの少なくとも1つは、1.0fの絶対値を有しなければならない。
4. 表4 - LSPCAP部屋中心モード:スピーカー構成
Figure 0007140766000041
音源パラメーター
5. 表5 - LSPCAP部屋中心モード:音源パラメーター
Figure 0007140766000042
ゾーン制御パラメーターは、どのスピーカー(又はスピーカーゾーン)がパンされる音源によって用いられるのかを制御することを可能にする。パラメーターの正確な意味は、実際のスピーカーレイアウトに依存する。以下の表では、アクティブスピーカーが、7.1平面レイアウト用に与えられ、同じ原理は、Auro-3Dレイアウトを含む他のレイアウトに当てはまる。必要に応じてSDKに新たなゾーンを実施することができる。これは、TpFL/TpFRが+45/-45の方位角にあることに関係し得る。
2Dバージョンアルゴリズム
用法:
部屋の壁(前後左右上壁)に位置決めされたスピーカーにおけるパン
入力:
オブジェクト座標、デカルト
オブジェクト水平拡散値u(0~+無限大の範囲)
オブジェクト垂直拡散値v(0~+無限大の範囲)
スピーカー配置:
各スピーカーのデカルト座標は正規化される(左右及び前後の寸法は-1~1の範囲を有し、上下に関しては、耳レベルがZ=0であり、天井がZ=1である)。
アルゴリズム:
オフライン部分:
全てのスピーカー座標(X, Y, Z)を円柱座標(方位角, Z)に変換する。
水平レイヤの決定:同じZ座標を有するスピーカーは同じレイヤに属する。
リアルタイム部分:
(A)方位角=atan 2(X, Y)を用いることによって、オブジェクト座標を円柱座標(方位角, Z)に変換する。
方位角を計算することができない(元のオブジェクト座標が0, 0であった)場合、任意の方位角を割り当て、オブジェクト拡散値を0(最大拡散)に設定する。
(B)オブジェクトをZ軸に沿って各レイヤ上に投影する(すなわち、Z座標を除去する)。
(C)レイヤごとに、最上部/天井のレイヤを保存する:
(1)オブジェクト及びレイヤのスピーカー方位角を用いることによって、2つの取り囲むスピーカーα及びβを見つける。
(2)任意のステレオパン法則(例えば、「タンジェント」パン法則若しくは「サインコサインパン法則」又は他の任意の法則)を用いて2つの取り囲むスピーカー利得Qα及びQβを計算する。
(3)オブジェクト位置に位置決めされた新たなラウドスピーカーをレイヤに仮想的に作成する。このレイヤは、この時、N+1個のスピーカー(N個の物理スピーカー及び1つの仮想スピーカー)を備える。
(4)変更されたLSPCAP方法を用いて、現在のレイヤにおけるN個のスピーカーのSPCAP利得を計算する:
(a)以下の法則を用いてN+1個(N個の実際のスピーカー、1つの仮想スピーカー)の当初利得を計算する。
Figure 0007140766000043
ここで、θisは、音源とスピーカーとの間の角度である。
(b)N個の実際のラウドスピーカーのみのいわゆる「スピーカー有効数」βiを計算する。
Figure 0007140766000044
その値は、互いに接近したスピーカーにより小さな重み(すなわち、より少ない利得)を与えることによって、スピーカー空間密度を考慮することを可能にする。この数は、スピーカー(計算に考慮されるスピーカーを含む)の全体セットを用いて、スピーカーごとに計算される。βiは少なくとも1に等しいことが分かる。この値は、必要に応じて、1とその元の値との間でアフィン関数によって更に変更され、スピーカー密度を徐々に考慮する(考慮しない)ことができる。
(c)上記ステップ(2)において計算されたステレオ利得Qα及びQβを用いることによって、仮想の第(N+1)のスピーカーの計算された利得を再分配する
Figure 0007140766000045
1ここで、i=α又はi=βである。
(d)当初利得をスピーカー有効数によって除算することによって「初期利得値」Giを計算する。
Figure 0007140766000046
(e)総放出出力
Figure 0007140766000047
を計算し、初期利得を除算して、各スピーカーの補正された利得
Figure 0007140766000048
を得ることによって出力節約を確保する。
(D)最上位(Z=1)レイヤについて:
(1)M個の最上位レイヤスピーカー座標をX軸上に投影する(Xi座標のみを保持する。ここで、i∈[1..M]である)。
(2)音源座標をX軸上に投影する(Xs座標のみを保持する)。
(3)音源座標がM個のスピーカーのX座標と同じ範囲内にあるように、音源座標を飽和させる。
Figure 0007140766000049
(4)M個の角度のアレイを構築する。
Figure 0007140766000050
(5)音源の角度を構築する。
Figure 0007140766000051
(6)(C4)における方法を用いてM個のSPCAP利得Aixを計算する。
(7)ステップD1~D6を再実行するが、X軸の代わりに、M個のSPCAP利得Aiyを生じるY軸を用いる。
(8)結合最上位レイヤ利得(joint top-layer gain)Ai=Aix・Aiyを計算する。
(9)総放出出力
Figure 0007140766000052
を計算する。
(10)結合最上位レイヤ利得を総出力によって除算して、正規化された最上位レイヤ利得
Figure 0007140766000053
を得る。
(E)各レイヤを1つのスピーカーとして扱い、以下のステップ((C)からのSPCAPアルゴリズムがその後に続く、最上位レイヤにおいて行うものと同様である)を用いることによって、K個のレイヤ内の各レイヤのレイヤ利得を計算する。
(1)角度のアレイ
Figure 0007140766000054
を構築する。
(2)音源の角度
Figure 0007140766000055
を構築する。
(3)ステップ(E1)及び(E2)からのオブジェクト及びレイヤの角度を用いることによって、取り囲むレイヤα及びβを見つける。
(4)任意のステレオパン法則(例えば、「タンジェント」パン法則若しくは「サインコサインパン法則」又は他の任意の法則)を用いて、2つの取り囲むレイヤの利得Qα及びQβを計算する。
(5)E2からのオブジェクト角に位置決めされた新たなラウドスピーカーを仮想的に作成する。
(6)(E1)及び(E2)からのK+1個の角度を用い、水平拡散uを垂直拡散vに置き換えて、C4a~C4eのステップを適用する。これによって、K個のレイヤ利得が得られる。
(7)レイヤごとに、(C)からのスピーカー利得に(E6)からのレイヤ利得を乗算する。
更なる態様及び可能性のある拡張は、ゾーン制御及びスピーカーグループの定義に関するものである。
3Dバージョン
用法:
球上に位置決めされたスピーカーにおけるパン
入力:
オブジェクト座標、球
オブジェクト拡散値u(0~+無限大の範囲)
スピーカー配置:
各スピーカーの球座標
スピーカーが頂点に位置決めされた球形三角形メッシュ。
アルゴリズム:
(A):メッシュ内の各小面のVBAP利得を計算し、全てのスピーカー利得が正である取り囲む小面を見つける。その小面の3つの利得のみを保持し、残りを廃棄する(詳細なVBAP方法については、Pulkki, 2001を参照)。
(B):オブジェクト位置に位置決めされた新たなラウドスピーカーをスピーカー配置に仮想的に作成する。この配置は、この時、N+1個のスピーカー(N個の物理スピーカー及び1つの仮想スピーカー)を備える。
(C):変更されたLSPCAP方法を用いて、N個のスピーカーのSPCAP利得を計算する:
(1)以下の法則を用いて、N+1個(N個の実際のスピーカー、1つの仮想スピーカー)の当初利得を計算する。
Figure 0007140766000056
ここで、θisは、音源とスピーカーとの間の角度である。
(2)N個の実際のラウドスピーカーのみのいわゆる「スピーカー有効数」βiを計算する。
Figure 0007140766000057
その値は、互いに接近したスピーカーにはより小さな重み(すなわち、より小さな利得)を与えることによってスピーカー空間密度を考慮することを可能にする。この数は、スピーカー(計算に考慮されるスピーカーを含む)の全体セットを用いて、スピーカーごとに計算される。βiは少なくとも1に等しいことが分かる。この値は、必要に応じて、1とその元の値との間でアフィン関数によって更に変更され、スピーカー密度を徐々に考慮する(考慮しない)ことができる。
(3)上記ステップ(A)において計算された3つのVBAP利得Qiを用いることによって、仮想の第(N+1)のスピーカーの以下の計算された利得を再分配する。
Figure 0007140766000058
1iは、アクティブなVBAP小面に属するスピーカーiのiである。
(4)スピーカー有効数によって当初利得を除算することによって「初期利得値」Giを計算する。
Figure 0007140766000059
(5)総放出出力
Figure 0007140766000060
を計算し、初期利得を除算して各スピーカーの補正された利得
Figure 0007140766000061
を得ることによって出力節約を確保する。
110:オーディオオブジェクト横座標(151)との四分円上へのマッピングを含む第1のプロセス
110:第1のモジュール
120:122と123のステップを含む第2のステップ
120:第2のモジュール
122:前記複数のトランスデューサーから、前記オーディオオブジェクトに最も接近した第1のトランスデューサーα(155)及び第2のトランスデューサーβ(156)を識別するサブステップ
123:第1のトランスデューサーα(155)及び第2のトランスデューサーβ(156)に対するステレオパン法則に従って前記利得Qα(157)及びQβ(158)を計算すること
130:第3のステップ
130:第3のプロセスである、サブステップ(132)とサブステップ(133)とPi(θis)を実行する以下のステップ
130:第3のモジュール
130:第3のモジュール
131:オーディオオブジェクト角(153)に本質的に等しい仮想トランスデューサー角を含む仮想トランスデューサーを作成し、該仮想トランスデューサー角をN個のトランスデューサー角(154)のリストに加え、それによって、N+1個のトランスデューサー角の拡張されたリストを作成する追加のサブステップ
131:オーディオオブジェクト角(153)に本質的に等しい仮想トランスデューサー角を有する仮想トランスデューサーを作成し、該仮想トランスデューサー角をN個のトランスデューサー角(154)のリストに加え、それによって、N+1個のトランスデューサー角の拡張されたリストを作成する追加のサブステップ
132:以下の式によって、前記複数のトランスデューサーのそれぞれのトランスデューサー有効数(159)を計算するサブステップ
133:トランスデューサー利得を計算する変更されたサブステップ
133:以下の式によって、i∈[1..N]である前記複数のトランスデューサーのそれぞれのトランスデューサー利得Pi(160)を計算するサブステップ
140:第4のプロセスであって、サブステップ(142)とサブステップ(143)を含む
140:第4のモジュール
141:第1のトランスデューサーα(155)の変更された利得P'α(162)と、前記第2のトランスデューサーβ(156)の変更された利得P'β(162)とを得る追加のサブステップ
142:トランスデューサー有効数(159)によって前記利得(162)を除算することによって、前記複数のN個のトランスデューサーのそれぞれの以下の初期利得値Gi(163)を計算するサブステップ
142:初期利得値Gi(163)を計算すること
143:補正された利得(164)を計算することによって出力節約を確保するサブステップ
151:オーディオオブジェクト
151:オーディオオブジェクト横座標
152:トランスデューサー横座標
153:オーディオオブジェクトの1つのオーディオオブジェクト角
154:複数のトランスデューサーのN個のトランスデューサー角
155:第1のトランスデューサーα
156:第2のトランスデューサーβ
157:利得Qα
158:利得Qβ
159:トランスデューサー有効数
160:トランスデューサー利得Pi
161:仮想トランスデューサー利得PN+1
162:第1のトランスデューサーα(155)の変更された利得P'α
162:利得
162:利得(160)当初利得
163:初期利得値Gi
164:補正された利得
200:横座標の前記XYZ正規直交フレームに関するデカルト座標
201:複数のトランスデューサーの前記Z横座標及び前記Z拡散値のみを用いて、前記複数のトランスデューサーのそれぞれのZ利得(207)を取得する第1のステップ
202:Zレイヤを効果的に構築するトランスデューサー配置の一意のZ座標リストを求める第2のステップ
203:ZレイヤのトランスデューサーのY横座標及び前記Y拡散値のみを用いて、前記複数のトランスデューサーのそれぞれ及び前記Zレイヤのそれぞれについて、Y利得(208)を取得する第3のステップ
204:Zレイヤごとに、Y行を効果的に構築する一意のY座標リストを求める第4のステップ
205:トランスデューサーのX横座標及び前記X拡散値のみを用いて、前記複数のトランスデューサーのそれぞれ、各Zレイヤ及び各Y行について、X利得(209)を取得する第5のステップ
206:X利得(209)、前記Y利得(208)及び前記Z利得(207)を要素ごとに乗算し、2ノルム正規化を適用して、前記トランスデューサー配置全体の最終的なトランスデューサー利得(210)を取得する第6のステップ
207:Z利得
208:Y利得
209:X利得
210:トランスデューサー配置全体の最終的なトランスデューサー利得
301:第1のプロセス
302:第1のステップ
303:第2のステップ
304:第3のステップ
305:第4のステップ
306:第5のステップ
307:第6のステップ
311:オブジェクト位置
312;3つのVBAP利得Qi
313:1とその元の値との間でアフィン関数によってβiを変更し、変更されたトランスデューサー有効数
313:トランスデューサー有効数
313:第1のシステムによって事前計算された前記変更されたトランスデューサー有効数
313:変更されたトランスデューサー有効数
314:3つのVBAP利得
315:N+1個のトランスデューサーの元のSPCAP利得
315:元のSPCAP利得
315:元のSPCAP利得
316:N個の変更されたSPCAP利得
316:元のSPCAP利得
317:初期利得値Gi
318:補正された利得

Claims (11)

  1. 軸に沿って整列された複数のN個の音響トランスデューサーにわたって空間化回復を行うように前記軸に沿ってオーディオオブジェクトを処理する方法であって、該オーディオオブジェクト(151)は、オーディオオブジェクト横座標及びオーディオオブジェクト拡散を有し、前記音響トランスデューサーのそれぞれは、トランスデューサー横座標(152)を有し、Nは少なくとも2に等しく、該方法は、
    前記複数の音響トランスデューサーのそれぞれの前記トランスデューサー横座標(152)と、前記オーディオオブジェクト横座標(151)との四分円上へのマッピングを含む第1のプロセス(110)を実行し、前記複数のトランスデューサーのN個のトランスデューサー角(154)と、前記オーディオオブジェクトの1つのオーディオオブジェクト角(153)とを得るステップと、
    第3のプロセス(130)を実行するステップであって、
    以下の式によって、前記複数のトランスデューサーのそれぞれのトランスデューサー有効数(159)を計算するサブステップ(132)と、
    Figure 0007140766000062
    ここで、θ i は、トランスデューサー iのトランスデューサー角であり、θ は、トランスデューサーjのトランスデューサー角であり、
    以下の式によって、i∈[1..N]である前記複数のトランスデューサーのそれぞれのトランスデューサー利得Pi(160)を計算するサブステップ(133)と、
    Figure 0007140766000063
    を含む、ステップと、
    第4のプロセス(140)を実行するステップであって、
    前記トランスデューサー有効数(159)によって前記利得(162)を除算することによって、前記複数のN個のトランスデューサーのそれぞれの以下の初期利得値Gi(163)を計算するサブステップ(142)と、
    Figure 0007140766000064
    ここで、θ is は、オーディオオブジェクトとトランスデューサー i間の角であり、
    総放出出力を、
    Figure 0007140766000065
    によって計算し、前記複数のN個のトランスデューサーのそれぞれについて、
    Figure 0007140766000066
    によって補正された利得(164)を計算することによって出力節約を確保するサブステップ(143)と、
    を含む、ステップと、
    を含み、
    該方法は、
    前記複数のトランスデューサーから、前記オーディオオブジェクトに最も接近した第1のトランスデューサーα(155)及び第2のトランスデューサーβ(156)を識別するサブステップ(122)と、
    前記第1のトランスデューサーα(155)及び前記第2のトランスデューサーβ(156)に対するステレオパン法則に従って前記利得Qα(157)及びQβ(158)を計算するサブステップ(123)と、
    を含む第2のプロセス(120)を実行することを更に含み、
    前記第3のプロセス(130)は、
    前記オーディオオブジェクト角(153)に本質的に等しい仮想トランスデューサー角を含む仮想トランスデューサーを作成し、該仮想トランスデューサー角をN個のトランスデューサー角(154)のリストに加え、それによって、N+1個のトランスデューサー角の拡張されたリストを作成する追加のサブステップ(131)と、
    前記トランスデューサー利得を計算する変更されたサブステップ(133)であって、
    Figure 0007140766000067
    (ここで、θ N+1,S は、オーディオオブジェクトと仮想トランスデューサー間の角であり)
    によって、前記仮想トランスデューサー角に対応する仮想トランスデューサー利得PN+1(161)を計算することを更に含み
    前記第4のプロセス(140)は、
    前記第2のプロセス(120)において計算された前記利得Qα(157)及びQβ(158)を用いることによって前記第1のトランスデューサーα(155)及び前記第2のトランスデューサーβ(156)にわたって前記仮想トランスデューサー利得PN+1(161)を再分配し、
    Figure 0007140766000068
    (ここで、i=α又はi=βである)
    に従って、前記第1のトランスデューサーα(155)の変更された利得P'α(162)と、前記第2のトランスデューサーβ(156)の変更された利得P'β(162)とを得る追加のサブステップ(141)、
    を更に含み、
    前記初期利得値Gi(163)の前記計算は、前記第1のトランスデューサーα(155)の前記利得Pαの代わりに前記変更された利得P'α(162)と、前記第2のトランスデューサーβ(156)の前記利得Pβの代わりに前記変更された利得P'β(162)とを用いて行われる、
    ことを特徴とする、方法。
  2. 前記ステレオパン法則は、次のもの、すなわち、タンジェントパン法則、サインコサインパン法則のうちの任意のもの又は任意の組み合わせである、請求項1に記載の方法。
  3. 天井、前壁及び側壁を備える平行六面体室の内側表面上に位置決めされた複数のN個の音響トランスデューサーにわたって空間化回復を行うようにオーディオオブジェクトを処理する方法であって、Nは少なくとも2に等しく、前記音響トランスデューサーは、X軸、Y軸及びZ軸を備えるXYZ正規直交フレームに従って位置決めされ、前記Z軸は、前記天井に向かって延在し、前記天井と直交し、前記Y軸は、前記前壁に向かって延在し、前記前壁と直交し、前記X軸は、前記側壁に向かって延在し、前記側壁と直交し、前記トランスデューサー及び前記オーディオオブジェクトのそれぞれは、横座標の前記XYZ正規直交フレームに関するデカルト座標(200)を有し、前記オーディオオブジェクトは、前記XYZ正規直交フレームに関する拡散値を有し、該方法は、
    前記複数のトランスデューサーのそれぞれのZ利得(207)を取得する第1のステップ(201)と、
    Zレイヤを効果的に構築するトランスデューサー配置の一意のZ座標リストを求める第2のステップ(202)と、
    前記複数のトランスデューサーのそれぞれについて、Y利得(208)を取得する第3のステップ(203)と、
    前記Zレイヤごとに、Y行を効果的に構築する一意のY座標リストを求める第4のステップ(204)と、
    前記複数のトランスデューサーのそれぞれについて、X利得(209)を取得する第5のステップ(205)と、
    前記X利得(209)、前記Y利得(208)及び前記Z利得(207)を要素ごとに乗算し、2ノルム正規化を適用して、前記トランスデューサー配置全体の最終的なトランスデューサー利得(210)を取得する第6のステップ(206)と、
    を含み、
    前記第1のステップ(201)において前記Z利得(207)を前記取得することは、ラウドスピーカーのZ横座標及びZ拡散値のみを用いて、前記Z軸に沿って、請求項1又は2に記載の方法を履行して実行され、
    前記第3のステップ(203)において前記Y利得(208)を前記取得することは、ラウドスピーカーのY横座標及びY拡散値のみを用いて、各Zレイヤについて前記Y軸に沿って、請求項1又は2に記載の方法を履行して実行され、
    前記第5のステップ(205)において前記X利得(209)を前記取得することは、ラウドスピーカーのX横座標及びX拡散値のみを用いて、各Zレイヤ及び各Y行について、前記X軸に沿って、請求項1又は2に記載の方法を履行して実行される、
    ことを特徴とする、方法。
  4. 球の内側表面上に位置決めされた複数のN個の音響トランスデューサーにわたって空間化回復を行うようにオーディオオブジェクトを処理する方法であって、Nは少なくとも2に等しく、前記オーディオオブジェクトは、オーディオオブジェクト位置及びオーディオオブジェクト拡散を有し、該方法は、
    第1のプロセス(301)を実行するステップであって、該第1のプロセスは、
    前記複数のトランスデューサー、前記オーディオオブジェクト位置及び前記オーディオオブジェクト拡散に基づいて前記トランスデューサー有効数β i を事前計算するサブステップと
    トランスデューサー密度を徐々に考慮し、1とその元の値との間でアフィン関数によってβiを変更し、変更されたトランスデューサー有効数(313)を得るサブステップと、
    を含む、ステップと、
    所与のオブジェクト座標について、第2のプロセスを実行するステップであって、該第2のプロセスは、
    メッシュにおける各小面のベクトルベース振幅パン(VBAPと略す)利得を計算し、ここで該トランスデューサーは、該メッシュの頂点に位置決めされ、そして、前記トランスデューサー利得Qiのそれぞれが正である取り囲むアクティブな小面を見つけ、それ以外の利得を廃棄して、3つのVBAP利得(314)を得る第1のステップ(302)と、
    前記トランスデューサー配置内に、前記オーディオオブジェクト位置(311)に位置決めされる仮想トランスデューサーを作成し、前記変更された配置がN+1個のトランスデューサーを備えるようにする第2のステップ(303)と、
    前記N+1個のトランスデューサーの元のスピーカー配置補正振幅パン(SPCAPと略す)利得(315)P i (θ is を計算する第3のステップ(304)と、
    前記第1のステップ(302)において計算された前記3つのVBAP利得Qi(312)と、前記元のSPCAP利得(315)とを用いることによって前記仮想の第(N+1)のトランスデューサーの前記計算された利得を再分配し、N個の変更されたSPCAP利得(316)を得る第4のステップ(305)と、
    以下の式のように、前記第1のシステムによって事前計算された前記変更されたトランスデューサー有効数(313)によって前記元のSPCAP利得(316)P i (θ is を除算することによって、初期利得値Gi (θ s (317)を計算する第5のステップ(306)と、
    Figure 0007140766000069
    ここで、θ is は、オーディオオブジェクトとトランスデューサー i間の角であり、及び
    前記総放出出力
    Figure 0007140766000070
    を計算し、前記初期利得(317)G i s )を除算して、各トランスデューサーの前記補正された利得(318)
    Figure 0007140766000071
    を得ることによって、出力節約を確保する第6のステップ(307)と、
    を含む、ステップと、
    を含み、
    前記トランスデューサー有効数(313)の前記計算は、以下の式を用い、
    Figure 0007140766000072

    ここで、θ i はトランスデューサーiのトランスデューサー角であり、θjは、トランスデューサーjのトランスデューサー角であり、
    前記第2のプロセスの前記第3のステップ(304)は、以下の式を用い、
    Figure 0007140766000073

    ここで、θisは、前記オーディオオブジェクトと前記トランスデューサーiとの間の前記角度であり、
    前記第2のプロセスの前記第4のステップ(305)は、以下の式を用い、
    Figure 0007140766000074
    iは、トランスデューサーiが、該取り囲むアクティブなVBAP小面に属するものである、
    ことを特徴とする、方法。
  5. 軸に沿って整列された複数のN個の音響トランスデューサーにわたって空間化回復を行うように前記軸に沿ってオーディオオブジェクトを処理するシステムであって、該オーディオオブジェクト(151)は、オーディオオブジェクト横座標及びオーディオオブジェクト拡散を有し、前記音響トランスデューサーのそれぞれは、トランスデューサー横座標を有し、Nは少なくとも2に等しく、該システムは、
    前記複数の音響トランスデューサーのそれぞれの前記トランスデューサー横座標(152)と、前記オーディオオブジェクト横座標(151)との四分円上へのマッピングを実行し、前記複数のトランスデューサーのN個のトランスデューサー角(154)と、前記オーディオオブジェクトの1つのオーディオオブジェクト角(153)とを得るように構成された第1のモジュール(110)と、
    第3のモジュール(130)であって、
    以下の式によって、前記複数のトランスデューサーのそれぞれのトランスデューサー有効数(159)を計算すること(132)と、
    Figure 0007140766000075
    ここで、θ i はトランスデューサーiのトランスデューサー角であり、θjは、トランスデューサーjのトランスデューサー角であり、
    以下の式によって、i∈[1..N]である前記複数のトランスデューサーのそれぞれのトランスデューサー利得Pi(160)を計算すること(133)と、
    Figure 0007140766000076
    ここで、θ is は、前記オーディオオブジェクトと前記トランスデューサーiとの間の前記角度であり
    の方法を実行するように構成された、第3のモジュールと、
    第4のモジュール(140)であって、
    前記トランスデューサー有効数(159)によって前記利得(162)を除算することによって、前記複数のN個のトランスデューサーのそれぞれの以下の初期利得値Gi(163)を計算すること(142)と、
    Figure 0007140766000077
    総放出出力を、
    Figure 0007140766000078
    によって計算し、前記複数のN個のトランスデューサーのそれぞれについて、
    Figure 0007140766000079
    によって補正された利得(164)を計算することによって出力節約を確保すること(143)と、
    の方法を実行するように構成された、第4のモジュール(140)と、
    を備え、
    該システムは、
    前記複数のトランスデューサーから、前記オーディオオブジェクトに最も接近した第1のトランスデューサーα(155)及び第2のトランスデューサーβ(156)を識別すること(122)と、
    前記第1のトランスデューサーα(155)及び前記第2のトランスデューサーβ(156)に対するステレオパン法則に従って前記利得Qα(157)及びQβ(158)を計算すること(123)と、
    の方法を実行するように構成された第2のモジュール(120)を更に備え、
    前記第3のモジュール(130)は、
    前記オーディオオブジェクト角(153)に本質的に等しい仮想トランスデューサー角を有する仮想トランスデューサーを作成し、該仮想トランスデューサー角をN個のトランスデューサー角(154)のリストに加え、それによって、N+1個のトランスデューサー角の拡張されたリストを作成する追加のサブステップ(131)と、
    前記トランスデューサー利得を計算する変更されたサブステップ(133)であって、
    Figure 0007140766000080
    (ここで、θ N+1,S は、オーディオオブジェクトと仮想トランスデューサー間の角であり)
    によって、前記仮想トランスデューサー角に対応する仮想トランスデューサー利得PN+1(161)を計算する追加のサブステップを、実行するように更に構成され、
    前記第4のモジュール(140)は、
    前記第2のモジュール(120)において計算された前記利得Qα(157)及びQβ(158)を用いることによって前記第1のトランスデューサーα(155)及び前記第2のトランスデューサーβ(156)にわたって前記仮想トランスデューサー利得PN+1(161)を再分配し、
    Figure 0007140766000081
    (ここで、i=α又はi=βである)
    に従って、前記第1のトランスデューサーα(155)の変更された利得P'α(162)と、前記第2のトランスデューサーβ(156)の変更された利得P'β(162)とを得る追加のサブステップ(141)、
    を実行するように更に構成され、
    前記初期利得値Gi(163)の前記計算は、前記第1のトランスデューサーα(155)の前記利得Pαの代わりに前記変更された利得P'α(162)と、前記第2のトランスデューサーβ(156)の前記利得Pβの代わりに前記変更された利得P'β(162)とを用いて行われる、
    ことを特徴とする、システム。
  6. 前記ステレオパン法則は、タンジェントパン法則、サインコサインパン法則のうちの任意のもの又は任意の組み合わせである、請求項5に記載のシステム。
  7. 天井、前壁及び側壁を備える平行六面体室の内側表面上に位置決めされた複数のN個の音響トランスデューサーにわたって空間化回復を行うようにオーディオオブジェクトを処理するシステムであって、Nは少なくとも2に等しく、前記音響トランスデューサーは、X軸、Y軸及びZ軸を備えるXYZ正規直交フレームに従って位置決めされ、前記Z軸は、前記天井に向かって延在し、前記天井と直交し、前記Y軸は、前記前壁に向かって延在し、前記前壁と直交し、前記X軸は、前記側壁に向かって延在し、前記側壁と直交し、前記トランスデューサー及び前記オーディオオブジェクトのそれぞれは、横座標の前記XYZ正規直交フレームに関するデカルト座標(200)を有し、前記オーディオオブジェクトは、前記XYZ正規直交フレームに関する拡散値を有し、該システムは、
    記複数のトランスデューサーのそれぞれのZ利得(207)を取得する第1のステップ(201)と、
    Zレイヤを効果的に構築するトランスデューサー配置の一意のZ座標リストを求める第2のステップ(202)と、
    記複数のトランスデューサーのそれぞれについて、Y利得(208)を取得する第3のステップ(203)と、
    前記Zレイヤごとに、Y行を効果的に構築する一意のY座標リストを求める第4のステップ(204)と、
    記複数のトランスデューサーのそれぞれについて、X利得(209)を取得する第5のステップ(205)と、
    前記X利得(209)、前記Y利得(208)及び前記Z利得(207)を要素ごとに乗算し、2ノルム正規化を適用して、前記トランスデューサー配置全体の最終的なトランスデューサー利得(210)を取得する第6のステップ(206)と、
    を含む方法を実行するように構成され、
    前記第1のステップ(201)において前記Z利得(207)を前記取得することは、前記複数のトランスデューサーの前記Z横座標及び前記Z拡散値のみを用いて、前記Z軸に沿って、請求項1又は2に記載の方法を実行され、
    前記第3のステップ(203)において前記Y利得(208)を前記取得することは、前記Y軸に沿って、請求項1又は2に記載の方法を実行され、及び、前記Zレイヤのそれぞれについて前記ZレイヤのトランスデューサーのY横座標及び前記Y拡散値のみを用いて、前記Y軸に沿って、請求項1又は2に記載の方法を実行され
    前記第5のステップ(205)において前記X利得(209)を前記取得することは、各Zレイヤ及び各Y行について、前記行のトランスデューサーのX横座標及び前記X拡散値のみを用いて、前記X軸に沿って、請求項1又は2に記載の方法を実行される、
    ことを特徴とする、システム。
  8. 球の内側表面上に位置決めされた複数のN個の音響トランスデューサーにわたって空間化回復を行うようにオーディオオブジェクトを処理するシステムであって、Nは少なくとも2に等しく、前記オーディオオブジェクトは、オーディオオブジェクト位置及びオーディオオブジェクト拡散を有し、該システムは、
    第1のプロセス(301)を実行するステップであって、該第1のプロセスは、
    前記複数のトランスデューサー、前記オーディオオブジェクト位置及び前記オーディオオブジェクト拡散に基づいて前記トランスデューサー有効数βiを事前計算するサブステップと、
    1とその元の値との間でアフィン関数によってβiを変更し、トランスデューサー密度を徐々に考慮し、変更されたトランスデューサー有効数(313)を得るサブステップと、
    を含む、ステップと、
    所与のオブジェクト座標について、第2のプロセスを実行するステップであって、該第2のプロセスは、
    ッシュにおける各小面のベクトルベース振幅パン(VBAP)利得を計算し、ここで、該トランスデューサーは、該メッシュの頂点に位置決めされ、そして、前記トランスデューサー利得Qiのそれぞれが正である取り囲むアクティブな小面を見つけ、それ以外の利得を廃棄して、3つのVBAP利得(314)を得る第1のステップ(302)と、
    前記トランスデューサー配置内に、前記オーディオオブジェクト位置(311)に位置決めされる仮想トランスデューサーを作成し、前記変更された配置がN+1個のトランスデューサーを備えるようにする第2のステップ(303)と、
    前記N+1個のトランスデューサーの元のスピーカー配置補正振幅パン(SPCAP)利得(315)P i is )を計算する第3のステップ(304)と、
    前記第1のステップ(302)において計算された前記3つのVBAP利得Qi(312)と、前記元のSPCAP利得(315)とを用いることによって前記仮想の第(N+1)のトランスデューサーの前記計算された利得を再分配し、N個の変更されたSPCAP利得(316)を得る第4のステップ(305)と、
    以下の式のように、前記第1のシステムによって事前計算された前記変更されたトランスデューサー有効数(313)によって前記元のSPCAP利得(316)P i is )を除算することによって、前記初期利得値G i s )(317)を計算する第5のステップ(306)と、
    Figure 0007140766000082
    前記総放出出力
    Figure 0007140766000083
    を計算し、前記初期利得(317)を除算して、各トランスデューサーの前記補正された利得(318)
    Figure 0007140766000084
    を得ることによって、出力節約を確保する第6のステップ(307)と、
    を含む、ステップと、
    を実行するように構成され、
    前記トランスデューサー有効数(313)の前記計算は、以下の式を用い、
    Figure 0007140766000085

    前記第2のプロセスの前記第3のステップ(304)は、以下の式を用い、
    Figure 0007140766000086
    ここで、θisは、前記オーディオオブジェクトと前記トランスデューサーとの間の前記角度であり、
    前記第2のプロセスの前記第4のステップ(305)は、以下の式を用い、
    Figure 0007140766000087
    iは、前記取り囲むアクティブなVBAP小面に属するスピーカーiのiである、
    ことを特徴とする、システム。
  9. 請求項5又は6に記載のシステムにおける請求項1又は2に記載の方法の使用。
  10. 請求項7に記載のシステムにおける請求項3に記載の方法の使用。
  11. 請求項8に記載のシステムにおける請求項4に記載の方法の使用。
JP2019540554A 2017-01-27 2018-01-29 オーディオオブジェクトをパンする処理方法及び処理システム Active JP7140766B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17153650 2017-01-27
EP17153650.1 2017-01-27
PCT/EP2018/052160 WO2018138353A1 (en) 2017-01-27 2018-01-29 Processing method and system for panning audio objects

Publications (3)

Publication Number Publication Date
JP2020505860A JP2020505860A (ja) 2020-02-20
JP2020505860A5 JP2020505860A5 (ja) 2020-12-24
JP7140766B2 true JP7140766B2 (ja) 2022-09-21

Family

ID=57914862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019540554A Active JP7140766B2 (ja) 2017-01-27 2018-01-29 オーディオオブジェクトをパンする処理方法及び処理システム

Country Status (6)

Country Link
US (1) US11012803B2 (ja)
EP (1) EP3574661B1 (ja)
JP (1) JP7140766B2 (ja)
CN (2) CN110383856B (ja)
CA (1) CA3054237A1 (ja)
WO (1) WO2018138353A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10904687B1 (en) 2020-03-27 2021-01-26 Spatialx Inc. Audio effectiveness heatmap

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130329922A1 (en) 2012-05-31 2013-12-12 Dts Llc Object-based audio system using vector base amplitude panning
JP2016518049A (ja) 2013-03-28 2016-06-20 ドルビー ラボラトリーズ ライセンシング コーポレイション 任意n角形のメッシュとして編成されたスピーカーを用いたオーディオレンダリング

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB394325A (en) 1931-12-14 1933-06-14 Alan Dower Blumlein Improvements in and relating to sound-transmission, sound-recording and sound-reproducing systems
US2298618A (en) 1940-07-31 1942-10-13 Walt Disney Prod Sound reproducing system
CN1937854A (zh) * 2005-09-22 2007-03-28 三星电子株式会社 用于再现双声道虚拟声音的装置和方法
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
US8059837B2 (en) * 2008-05-15 2011-11-15 Fortemedia, Inc. Audio processing method and system
KR101953279B1 (ko) 2010-03-26 2019-02-28 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
JP5740531B2 (ja) * 2011-07-01 2015-06-24 ドルビー ラボラトリーズ ライセンシング コーポレイション オブジェクトベースオーディオのアップミキシング
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
EP2645748A1 (en) 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
GB201211512D0 (en) 2012-06-28 2012-08-08 Provost Fellows Foundation Scholars And The Other Members Of Board Of The Method and apparatus for generating an audio output comprising spartial information
US9826328B2 (en) * 2012-08-31 2017-11-21 Dolby Laboratories Licensing Corporation System for rendering and playback of object based audio in various listening environments
BR112015018352A2 (pt) * 2013-02-05 2017-07-18 Koninklijke Philips Nv aparelho de áudio e método para operar um sistema de áudio
US9913064B2 (en) * 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
KR20230144652A (ko) 2013-03-28 2023-10-16 돌비 레버러토리즈 라이쎈싱 코오포레이션 임의적 라우드스피커 배치들로의 겉보기 크기를 갖는 오디오 오브젝트들의 렌더링
EP2809088B1 (en) * 2013-05-30 2017-12-13 Barco N.V. Audio reproduction system and method for reproducing audio data of at least one audio object
JP6369465B2 (ja) * 2013-07-24 2018-08-08 ソニー株式会社 情報処理装置および方法、並びにプログラム
US9712939B2 (en) 2013-07-30 2017-07-18 Dolby Laboratories Licensing Corporation Panning of audio objects to arbitrary speaker layouts
KR102484214B1 (ko) 2013-07-31 2023-01-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱
US9807538B2 (en) * 2013-10-07 2017-10-31 Dolby Laboratories Licensing Corporation Spatial audio processing system and method
DK3089477T3 (en) * 2015-04-28 2018-09-17 L Acoustics Uk Ltd AN APPARATUS FOR REPRESENTING A MULTI CHANNEL SIGNAL AND A METHOD FOR MAKING A MULTI CHANNEL SIGNAL

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130329922A1 (en) 2012-05-31 2013-12-12 Dts Llc Object-based audio system using vector base amplitude panning
JP2016518049A (ja) 2013-03-28 2016-06-20 ドルビー ラボラトリーズ ライセンシング コーポレイション 任意n角形のメッシュとして編成されたスピーカーを用いたオーディオレンダリング

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Novel Multichannel Panning Method for Standard and Arbitrary Loudspeaker Configurations,Audio Engineering Society Convention Paper,Audio Engineering Society,2004年
UNIFORM SPREADING OF AMPLITUDE PANNED VIRTUAL SOURCES,1999 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics,IEEE,1999年

Also Published As

Publication number Publication date
CN110383856B (zh) 2021-12-10
CN113923583A (zh) 2022-01-11
EP3574661B1 (en) 2021-08-11
US20190373394A1 (en) 2019-12-05
CA3054237A1 (en) 2018-08-02
US11012803B2 (en) 2021-05-18
CN110383856A (zh) 2019-10-25
WO2018138353A1 (en) 2018-08-02
EP3574661A1 (en) 2019-12-04
JP2020505860A (ja) 2020-02-20

Similar Documents

Publication Publication Date Title
US20230254657A1 (en) Audio processing device and method therefor
US10674301B2 (en) Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
JP2020025310A (ja) 見かけのサイズをもつオーディオ・オブジェクトの任意のラウドスピーカー・レイアウトへのレンダリング
US11943605B2 (en) Spatial audio signal manipulation
JP6513703B2 (ja) 辺フェージング振幅パンニングのための装置および方法
RU2655994C2 (ru) Устройство обработки звука и система обработки звука
JP2020099093A (ja) 音声処理装置および方法、並びにプログラム
KR20220044973A (ko) 다중-층 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념
JP7140766B2 (ja) オーディオオブジェクトをパンする処理方法及び処理システム
US9338552B2 (en) Coinciding low and high frequency localization panning
Jeon et al. Virtual source panning using multiple-wise vector base in the multispeaker stereo format
Ge et al. Improvements to the matching projection decoding method for ambisonic system with irregular loudspeaker layouts
JP2024507945A (ja) オーディオオブジェクトをレンダリングするための装置及び方法
CN115244501A (zh) 音频对象的表示和渲染
Zhu et al. The design of ambisonics decoders for irregular speaker array conforming to subjective perception
Trevino Lopez et al. Evaluation of different spatial windows for a multi-channel audio interpolation system
Romanov et al. Manipulations improving amplitude panning on small standard loudspeaker arrangements for surround with height (Manipulative Verbesserung von Amplitudenpanning auf kleinen Lautsprecheranordnungen für Surround mit Deckenlautsprechern)

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201116

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211130

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220908

R150 Certificate of patent or registration of utility model

Ref document number: 7140766

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350