JP2020522189A

JP2020522189A - インコヒーレント冪等アンビソニックスレンダリング

Info

Publication number: JP2020522189A
Application number: JP2019566090A
Authority: JP
Inventors: バスティアンクレイン、ウィレム; アレン、アンドリュー; スコグランド、ジャン; チエリム、ジー
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2017-08-01
Filing date: 2018-07-03
Publication date: 2020-07-27
Anticipated expiration: 2038-07-03
Also published as: CN110583030A; KR20200003051A; JP6985425B2; CN110583030B; US10015618B1; EP3625975B1; EP3625975A1; KR102284811B1; WO2019027613A1

Abstract

リスナーにサウンドをレンダリングする技術は、ソース駆動信号の各々の振幅として、２つの項の合計を生成することを含み、第１の項は、方程式ｂ＝Ａ・ｓに対する解ｓ^†に基づき、第２の項は、方程式ｂ＝Ａ・ｓに対する解ではない指定されたベクトル
【数１】

のＡのヌル空間への投影に基づく。これらの方針に沿って、一例では、第１の項は、ムーア・ペンローズの擬似逆行列、例えば、Ａ^Ｈ（ＡＡ^Ｈ）^−１・ｂと等価である。一般に、方程式ｂ＝Ａ・ｓに対する任意の解は満たしている。Ａのヌル空間に投影される指定されたベクトルは、正味の音場のコヒーレンスを低減するように定義される。有利なことに、得られた演算子は線形時不変かつ冪等であるので、音場は、人間の頭部をカバーするために、ＲＳＦの内側およびＲＳＦの外側の十分な範囲の両方で忠実に再現され得る。

Description

本説明は、仮想現実（ＶＲ）および類似環境における音場のレンダリングに関する。

アンビソニックスは、全球サラウンドサウンド技術であり、水平面に加え、リスナーの上方および下方の音源をカバーする。他のマルチチャンネルサラウンドフォーマットとは異なり、その伝送チャンネルは、スピーカ信号を搬送しない。代わりに、それらは、Ｂ−フォーマットと呼ばれる音場のスピーカから独立した表現を含み、この表現が、リスナーのスピーカセットアップに対してデコードされる。この追加の工程は、ラウドスピーカの位置よりはむしろソースの方向に関してプロデューサが考えることを可能とし、再生のために用いられるスピーカのレイアウトおよび数に関して相当程度の柔軟性をリスナーに対して提供する。

アンビソニックスでは、リスナーを取り囲む仮想的なラウドスピーカのアレイが、等方的に記録された音源から、Ｂ−フォーマットとして知られるスキームでエンコードされたサウンドファイルをデコードすることによって、音場を生成する。仮想的なラウドスピーカのアレイで生成された音場は、リスナーに対する任意の地点から音源の効果を再現することが可能である。そのようなデコーディングは、一組の頭部伝達関数（ＨＲＴＦ）を介して仮想現実（ＶＲ）システムにおけるヘッドフォンスピーカを通じた音声の伝達に用いられ得る。バイノーラルにレンダリングされた高次アンビソニックス（ｈｉｇｈ−ｏｒｄｅｒａｍｂｉｓｏｎｉｃｓ：ＨＯＡ）は、１対の信号を左右のヘッドフォンスピーカに提供するように組み合わさった多くの仮想的なラウドスピーカの生成を指す。

ひとつの概略的態様では、方法は、リスナーに対し指向性音場をレンダリングするように構成されたサウンドレンダリングコンピュータの制御回路により、幾何学的環境における音場から生じるサウンドデータを受信することを含み、サウンドデータは、幾何学的環境に基づく複数の直交角度モード関数における展開として表される。方法は、制御回路により、サウンドデータに対するモード整合演算と、複数の直交角度モード関数における展開として表されるラウドスピーカの複数の振幅の加重和の展開とから生じる線形演算子を生成することも含む。方法は、制御回路により、線形演算子およびサウンドデータに対する逆演算を実行して、第１の複数のラウドスピーカ重みを生成することをさらに含む。方法は、制御回路により、線形演算子のヌル空間上で投影演算を実行して、第２の複数のラウドスピーカ重みを生成することをさらに含む。方法は、制御回路により、第１の複数のラウドスピーカ重みと第２の複数のラウドスピーカ重みとの合計を生成して、第３の複数のラウドスピーカ重みを生成することをさらに含み、第３の複数のラウドスピーカ重みは、リスナーに対し音場の再現を提供する。

この概略的態様によれば、方法は、本明細書でより詳細に説明されるように、リスナーに対しより自然な音場を提供することを可能にする改善された技術を含む。本明細書に記載されている改善された技術によって提供される他の利点は、音場に対する改善された性能および改善されたスペクトル忠実性である。

１つまたは複数の実装形態の詳細は、添付の図面および以下の説明において示されている。他の特徴は、本説明および図面から、並びに特許請求の範囲から明らかとなるだろう。

本明細書に記載される改良された技術を実装するための例示的な電子環境を示す図である。本明細書に記載される改良された技術による、マイクに対する例示的なラウドスピーカおよび観察者の位置を示す図である。図１に示される電子環境内において改良された技術を実施する例示的な方法を示すフローチャートである。本明細書に記載される回路とともに用いられ得るコンピュータデバイスおよびモバイルコンピュータデバイスの一例を示す図である。

ＨＯＡ音場のいくつかのレンダリングは、各ＨＯＡチャンネルからの成分の重み付けされたシーケンスおよび各ソース方向からの振幅を合計して、マイクで正味の音場を生成することを含む。球面調和関数展開で表現される場合、音場の各成分は、球面座標における波動方程式によって決定される時間、角度、およびラジアル係数を有する。角度係数は、球面調和関数であり、ラジアル係数は、球ベッセル関数に比例する。

多くの場合、各ソース方向からの寄与の振幅は不明である。むしろ、知られているのは、マイクにおける正味の音場である。上記のように、このような音場は、一連の球面調和関数モードに展開され得る。さらに、各ソース方向からの寄与も、点ソースとしてモデル化された場合、一連の球面調和関数モードに展開され得る。球面調和関数モードは直交集合であるため、振幅は、球面調和関数モードを一致させることにより決定され得る。

一連の成分の切り捨てにより、特定の半径（十分な忠実性の領域、またはＲＳＦ）内で特定の周波数を下回る音場を正確に記述することができる。多くのアプリケーションでは、ＲＳＦは、人間の頭ほどのサイズであるべきである。

それにもかかわらず、ＲＳＦのサイズは周波数に反比例するため、Ｎ次の球面調和関数までの所与の切り捨て長さに対して、低周波数はより大きな到達範囲を有し、従って、信号の音質は、一般にその起点から離れるにつれて変化する。成分の数Ｔ＝（Ｎ＋１）^２を増やすことは、所与の周波数に対して、ＲＳＦのサイズが成分の数の平方根にほぼ比例するため、パフォーマンスを改善するには非効率的な方法である。多くの場合、このサイズは、人間の頭のサイズよりも小さい。

アンビソニックスをレンダリングする目的は、ＲＳＦにおいて、測定された音場のＴ個の成分ｂを生成するＱ個のソース駆動信号ｓのセットを決定することである。ソース駆動信号ｓの強度または重みは、測定された音場の成分ｂ、すなわち、ｂ＝Ａ・ｓに適用される線形変換Ａの反転を介して決定され得、ｂ＝Ａ・ｓからｓを決定する。（線形変換Ａは、不均一なヘルムホルツ方程式および境界条件から生じる。）Ａは、Ｔ×Ｑ行列であり、ここで、Ｑ＞Ｔであり、すなわち、成分よりも多くのソースが存在するため、得られた線形システムは劣決定であり、ＲＳＦにおける同じ音場を生成する複数セットのソース駆動信号ｓが存在する。

従って、ＲＳＦの外側の音場を最もよく再現するソース駆動信号の振幅を一意に決定するために、線形システムに制約を課すことができる。ＨＯＡ音場をレンダリングするための従来のアプローチは、駆動信号ｓのエネルギーを最小化することによって、すなわち、条件ｂ＝Ａ・ｓを課されるＬ^２ノルム（すなわち、ｓの成分の二乗和）に従って、ソース分布を決定することを含んでいる。そのような従来のアプローチによれば、結果として生じるソース分布

は、その行列のムーア・ペンローズ（Ｍｏｏｒｅ−Ｐｅｎｒｏｓｅ：ＭＰ）擬似逆行列に重みベクトルを掛けたもの、例えば、Ａ^Ｈ（ＡＡ^Ｈ）^−１・ｂであり、Ａ^Ｈは、Ａのエルミート共役である。ＭＰ擬似逆行列は、ソース配置のいくつかの選択によってはＡ^Ｈに等しい線形時不変演算子の基底を形成する。

しかしながら、このような従来のアプローチでは、ＲＳＦの外側のスペクトル障害のために不自然な音場を生成するソリューションとなる。この理由は、Ｌ^２ノルムなどの最小分散目標は、そのような目標が方向に対する音の振幅の変動性を最小化する傾向にあるため、ソースの方向性を記述するデコーダの能力も最小化するからである。さらに、結果として生じる音場は、音場のコヒーレンスを課す。ＲＳＦのサイズは時間周波数によって変化するため、このようなコヒーレンスは、マイクから離れて消える。

一次音源とそれらの反射とによって生成される自然の音場では、異なる方向からの音波が、任意の場所でコヒーレントに追加されない傾向にある。従って、自然の音場では、音質は、概して空間上で急速に変化しない。対照的に、目的が音場を再構築することである場合、多数の実際のまたは仮想のラウドスピーカからの音波が、共に振る舞うるように構成される。多くのそのようなラウドスピーカが使用される場合、この共に振る舞うことにより、通常、空間全体で音質が急速に変化する音場を生じる。不自然な音場のような急速な変化のある音場を参照し得る。不自然な音場の例としては、ムーア・ペンローズの擬似逆行列を用いたラウドスピーカの重み計算によって作成される音場がある。この例では、前述のように、音場の振幅は、ＲＳＦの外側で急速に減少し、ＲＳＦは周波数に依存する半径を有するため、音場の音質は空間で急速に変化する。

Ｌ^１ノルム（すなわち、ｓの成分の絶対値の合計）による最小化、または、最大−ｒ_Ｅ手法（すなわち、エネルギー局在化ベクトルの最大化）など、より多くのソース指向性をもたらす他のフレームワークを検討し得る。それにもかかわらず、Ｌ^１ノルムは、線形時不変演算子にはならないが、最大−ｒ_Ｅ手法は冪等ではない（すなわち、ＲＳＦにおける音場が推定される場合、オリジナルのＨＯＡ記述は回復可能であるべきである）。Ｌ^１２ノルムの最小化のようなより複雑な手法は、線形時不変であるが、非常にリソースを消費し得るため、仮想現実ゲームのようなリアルタイム設定で使用するにはコストがかかる。

本明細書で説明される実装形態によれば、ＨＯＡ音場をレンダリングする上記の従来のアプローチとは対照的に、改善された手法は、ソース駆動信号の各々の振幅として、２つの項の合計を生成することを含み、第１の項は、方程式ｂ＝Ａ・ｓに対する解ｓ^†に基づき、第２の項は、方程式ｂ＝Ａ・ｓに対する解ではない指定されたベクトル

のＡのヌル空間への投影に基づく。これらの方針に沿って、一例では、第１の項は、ムーア・ペンローズの擬似逆行列、例えば、Ａ^Ｈ（ＡＡ^Ｈ）^−１・ｂと等価である。一般に、方程式ｂ＝Ａ・ｓに対する任意の解は満たしている。Ａのヌル空間に投影される指定されたベクトルは、正味の音場のコヒーレンスを低減するように定義される。有利なことに、得られた演算子は線形時不変かつ冪等であるので、音場は、人間の頭部をカバーするために、ＲＳＦの内側およびＲＳＦの外側の十分な範囲の両方で忠実に再現され得る。さらに、計算は、リアルタイム環境で実行するのに十分なほど単純である。

図１は、上記の改良された技術を実施することができる例示的な電子環境１００を示す。示されるように、図１において、例示的な電子環境１００は、サウンドレンダリングコンピュータ１２０を含む。

サウンドレンダリングコンピュータ１２０は、リスナーに対し音場をレンダリングするように構成されている。サウンドレンダリングコンピュータ１２０は、ネットワークインタフェース１２２、１つまたは複数の処理ユニット１２４、およびメモリ１２６を含む。ネットワークインタフェース１２２は、サウンドレンダリングコンピュータ１２０による使用のために、ネットワーク１７０から受信された電子および／または光信号を電子形式に変換するための、例えば、イーサネット（登録商標）アダプタ、トークンリングアダプタなどを含む。一組の処理ユニット１２４は、１つまたは複数の処理チップおよび／またはアセンブリを含む。メモリ１２６は、揮発性メモリ（例えば、ＲＡＭ）および１つまたは複数のＲＯＭなどの不揮発性メモリの両方、ディスクドライブ、ソリッドステートドライブなどを含む。一組の処理ユニット１２４とメモリ１２６とは共に制御回路を形成し、制御回路は、本明細書に記載されるように様々な方法および機能を実行するように構成および配置されている。

いくつかの実施形態では、サウンドレンダリングコンピュータ１２０のコンポーネントの１つまたは複数は、メモリ１２６に記憶された命令を処理するように構成されたプロセッサ（例えば、処理ユニット１２４）であるか、またはそれを含み得る。図１に示すような命令の例は、サウンド取得マネージャ１３０、ラウドスピーカ取得マネージャ１４０、擬似逆行列マネージャ１５０、ストラテジー生成マネージャ１６０、ヌル空間投影マネージャ１７０、および指向性フィールド生成マネージャ１８０を含む。さらに、図１に示されるように、メモリ１２６は、そうしたデータを使用するそれぞれのマネージャに関して記載される様々なデータを記憶するように構成されている。

サウンド取得マネージャ１３０は、録音またはソフトウェア生成音声を介してサウンドデータ１３２を取得するように構成されている。例えば、サウンド取得マネージャ１３０は、光学ドライブから、またはネットワークインタフェース１２２を介して、サウンドデータ１３２を取得することができる。サウンドデータ１３２を入手すると、サウンド取得マネージャは、そのサウンドデータ１３２をメモリ１２６に保存するようにも構成されている。いくつかの実装形態では、サウンド取得マネージャ１３０は、ネットワークインタフェース１２２を介してサウンドデータ１３２をストリーミングする。

通常、サウンドデータを複数の直交角度モード関数における展開として表すと便利である。直交角度モード関数へのこのような展開は、マイクが配置されている幾何学的環境に依存する。例えば、球形のマイクを使用して球にわたって音をキャプチャするいくつかの実装形態では、直交角度モード関数は、球面調和関数である。一部の実装形態では、幾何学的環境は円筒形であり、直交角度モード関数は三角関数である。以下の説明では、直交角度モード関数は、球面調和関数であることが想定される。

いくつかの実装形態では、サウンドデータ１３２は、４つの成分またはアンビソニックスチャンネルを有するＢ−フォーマットまたは１次アンビソニックスでエンコードされる。いくつかの実装形態では、サウンドデータ１３２は、より高次のアンビソニックス、例えば、Ｎ次まで、でエンコードされる。この場合、Ｔ＝（Ｎ＋１）^２のアンビソニックスチャンネルが存在し、各チャンネルは、一組のラウドスピーカから生じる音場の球面調和関数（ＳＨ）展開の項に対応する。いくつかの実装形態では、サウンドデータ１３２は、圧力場ｐ_Ｎの球面調和関数への切り捨てられた展開として次のように表される。

ここで、ωは時間（角度）周波数、ｋ＝ω／ｃは波数、ｃは音波の速度、ｊ_ｎは第１種球ベッセル関数、Ｙ_ｎ ^ｍは球面調和関数、

は単位球上の点（θ，φ）、およびｂ_ｎ ^ｍは圧力（すなわち音）場の球面調和関数展開の（周波数依存）係数である。従って、サウンド取得マネージャ１３０によって取得されたサウンドデータ１３２は、係数ｂ_ｎ ^ｍのベクトルｂの形をとることができ、係数ベクトルｂはＴ＝（Ｎ＋１）^２個の成分を有する。いくつかの実装形態では、係数ベクトルｂの成分には、上記の球面調和関数展開の球ベッセル関数部分が組み込まれている。

なお、球面形状は必要ない。例えば、円筒形状では、球ベッセル関数ｊ_ｎを円筒ベッセル関数Ｊ_ｎに置き換えることができる。球面調和関数Ｙ_ｎ ^ｍを三角関数に置き換えることもできる。

ソース取得マネージャ１４０は、振幅ｓを有するＱ個のラウドスピーカの各々の方向

を取得するように構成されている。ラウドスピーカの各々は、二次ソースと見なされる。従って、方向

の各々は、与えられているか、または何らかのアルゴリズムによって推定されていると仮定される。

いくつかの実装形態では、各ラウドスピーカ（すなわち、ラウドスピーカ振幅ベクトルｓの各成分に対応する）は、３次元の点ソースとしてモデル化され得る。そのため、位置

にあるそのようなソースは、グリーンの関数

に比例する、観測点ｘ’における振幅プロファイルを有する。

いくつかの実装形態では、サウンドデータ１３２が録音の結果である場合、振幅ｓを有するラウドスピーカは、サウンドデータ１３２を録音するために使用されるマイクから同じ距離にあると見なされる。方向

は、ラウドスピーカデータ１４２として格納される。いくつかの実装形態では、サウンドデータ１３２が機械によって生成される場合、振幅ｓを有するラウドスピーカは、サウンドデータ１３２を記録するために使用されるマイクから同じ距離にあるともみなされ、方向

（別々に推定されるか、または与えられる）はラウドスピーカデータ１４２として格納される。

ラウドスピーカ取得マネージャ１４０は、線形モード整合方程式ｂ＝Ａ・ｓを表す線形変換データ１４４としてＴ×Ｑ行列として線形演算子Ａを構築するようにも構成されている。すなわち、（未知の）振幅ｓを有する方向

における点ソースによる集合音場の球面調和関数展開のモードが、マイクで取得された音場ｂの球面調和関数拡張のモードと同等である場合、結果は、線形モード整合方程式ｂ＝Ａ・ｓである。いくつかの実装形態では、Ｑ＞Ｔおよび線形システムは、劣決定である。従って、このような場合、線形モード整合方程式には多くの可能な解がある。ラウドスピーカの配置に関するさらなる詳細は、図２に関して説明される。

擬似逆行列マネージャ１５０は、線形モード整合方程式ｂ＝Ａ・ｓの解を生成するように構成されている。この解は、本明細書で開示される改善された技術による音場の第１の項である。いくつかの実装形態では、線形モード整合方程式の解は、線形演算子Ａの擬似ムーア・ペンローズの擬似逆行列に関して表現され得る。線形演算子Ａのムーア・ペンローズの擬似逆行列

は、

と記載することができ、ここでＡ^Ｈは、Ａのエルミート共役である。この擬似逆行列は、擬似逆行列データ１５２としてサウンドレンダリングコンピュータ１２０で生成される。この場合、線形モード整合方程式ｂ＝Ａ・ｓの解ｓ^†は次の通りである。

この解を生成するために、擬似逆行列マネージャ１５０は、擬似逆行列データ１５２で生成された行列に球面調和関数データ１３２で生成された係数を乗算するように構成されている。

ストラテジー生成マネージャ１６０は、線形モード整合方程式ｂ＝Ａ・ｓを満たさないかもしれないが、異なる基準を満たすストラテジーベクトル

をストラテジーベクトルデータ１６２として生成するように構成されている。改善された手法の利点を実現するために、ストラテジーベクトル

は、ＲＳＦの外側で望ましい動作を有するサウンドレンダリング手法に対応する。いくつかの実装形態では、ストラテジー生成マネージャ１６０は、音場をレンダリングするために使用される球にわたる最適な連続的なモノポール密度に従ってストラテジーベクトル

を定義する。

これらの方針に沿って、単位球上の連続的なモノポール密度関数と、球面調和関数におけるその展開を検討する。

モノポールソースのグリーン関数は、上記の式（２）で説明したとおりである。それにもかかわらず、上記で開示したように、そのようなグリーン関数は、次のように球面調和関数展開でも表現できる。

ここで、ｈ_ｎ ^（１）は、ｎ次の球ハンケル関数である。音場は、式（６）におけるこのグリーン関数に関して以下のように表され得る。

ここで、積分は単位球上である。式（１）におけるｐ_Ｎの球面調和関数展開とのモード整合は、モノポール密度関数の球面調和関数展開の係数の式を生成する。

ここで、ｒ’は、ソースからの観測点の距離である。

ストラテジーベクトル

は、上記のモノポール密度関数の観点から定義できる。

ここで、

は、ストラテジーベクトル

のｑ番目の成分であり、κは正規化定数であり、α≧０は指向性の強さを設定するパラメータである。例えば、α＝０の場合、ストラテジーベクトルは、音場の単純な正則化を取得する。α＞０の場合、場は指向性が強化されて正則化される。

ヌル空間投影マネージャ１７０は、ヌル空間投影データ１７２として、線形演算子Ａのヌル空間Ｎ_Ａへのストラテジーベクトル

の投影

を生成するように構成されている。いくつかの実装形態では、線形演算子Ａのヌル空間Ｎ_Ａの列に射影する行列

は

により与えられる。
ここで、Ｉは、単位行列であり、

は線形演算子Ａのエルミート共役であるＡ^Ｈの列への投影である。従って、線形演算子Ａのヌル空間Ｎ_Ａへのストラテジーベクトル

の投影

は、線形演算子Ａに関して次のように明示的に表現され得る。

指向性フィールド生成マネージャ１８０は、指向性フィールドデータ１８２として、線形モード整合方程式ｂ＝Ａ・ｓの解ｓ^†と線形演算子Ａのヌル空間Ｎ_Ａへのストラテジーベクトル

の投影

との組み合わせに関して指向性音場ｓを生成するように構成されている。いくつかの実装形態では、指向性フィールド生成マネージャ１８０は、指向性フィールドデータ１８２として、疑似逆行列データ１５２の成分ｓ^†とヌル空間投影データ１７２の

の成分との合計を生成する。すなわち、指向性音場は、

である。このような合計により、結果として得られる全体的な線形演算子が、冪等であることが保証されるため、ＲＳＦの内側の音場が忠実に再現される。さらに、従来のアプローチにおけるような擬似逆演算子のみとは対照的に、式（１２）に表されるような改良された技術に従って指向性音場をもたらす演算子は、ＲＳＦの外側にも妥当な音場を生成する。

いくつかの実装形態では、メモリ１２６は、ランダムアクセスメモリ、ディスクドライブメモリ、フラッシュメモリなどのうちの少なくとも１つのような任意の種類のメモリであり得る。いくつかの実装形態では、メモリ１２６は、サウンドレンダリングコンピュータ１２０のコンポーネントに関連付けられている２つ以上のメモリコンポーネント（例えば、２つ以上のＲＡＭコンポーネントまたはディスクドライブメモリ）として実装され得る。いくつかの実装形態では、メモリ１２６は、データベースメモリであり得る。いくつかの実装形態では、メモリ１２６は、非ローカルメモリであるか、またはそれを含み得る。例えば、メモリ１２６は、複数のデバイス（図示せず）によって共有されるメモリであるか、またはそれを含み得る。いくつかの実装形態では、メモリ１２６は、ネットワーク内のサーバデバイス（図示せず）に関連付けられることが可能であり、サウンドレンダリングコンピュータ１２０のコンポーネントのために動作するように構成されることが可能である。

サウンドレンダリングコンピュータ１２０のコンポーネント（例えば、マネージャ、処理ユニット１２４）は、１つまたは複数の種類のハードウェア、ソフトウェア、ファームウェア、オペレーティングシステム、ランタイムライブラリなどのうちの少なくとも１つを含むことが可能な１つまたは複数のプラットフォーム（例えば、１つまたは複数の類似または異なるプラットフォーム）に基づいて動作するように構成され得る。

サウンドレンダリングコンピュータ１２０のコンポーネントは、属性を処理するように構成された任意の種類のハードウェアおよび／またはソフトウェアであるか、またはそれを含み得る。いくつかの実装形態では、図１におけるサウンドレンダリングコンピュータ１２０のコンポーネントに示されるコンポーネントの１つまたは複数の部分は、ハードウェアベースのモジュール（例えば、デジタルシグナルプロセッサ（ＤＳＰ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、メモリ）、ファームウェアモジュール、および／またはソフトウェアベースのモジュール（例えば、コンピュータコードのモジュール、コンピュータで実行可能な一組のコンピュータ可読命令）であるか、またはそれらを含み得る。例えば、いくつかの実装形態では、サウンドレンダリングコンピュータ１２０のコンポーネントの１つまたは複数の部分は、少なくとも１つのプロセッサ（図示せず）による実行のために構成されたソフトウェアモジュールであるか、それを含み得る。いくつかの実装形態では、コンポーネントの機能は、図１に示されたものとは異なるモジュールおよび／または異なるコンポーネントに含まれ得る。

いくつかの実装形態では、サウンドレンダリングコンピュータ１２０のコンポーネント（またはその一部）は、ネットワーク内で動作するように構成され得る。従って、サウンドレンダリングコンピュータ１２０のコンポーネント（またはその一部）は、１つまたは複数のデバイス、および／または１つまたは複数のサーバデバイスを含み得る様々な種類のネットワーク環境内で機能するように構成され得る。例えば、ネットワークは、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）などのうちの少なくとも１つであるか、それらを含み得る。ネットワークは、無線ネットワークおよび／または例えば、ゲートウェイデバイス、ブリッジ、スイッチなどのうちの少なくとも１つを用いて実装される無線ネットワークであるか、またはそれを含み得る。ネットワークは、１つまたは複数のセグメントを含むことが可能であり、および／または、インターネットプロトコル（ＩＰ）および／またはプロプライエタリプロトコルのような様々なプロトコルに基づく部分を有することが可能である。ネットワークは、インターネットの少なくとも一部を含み得る。

いくつかの実施形態では、サウンドレンダリングコンピュータ１２０の１つまたは複数のコンポーネントは、メモリに記憶された命令を処理するように構成されたプロセッサであるか、またはそれを含み得る。例えば、サウンド取得マネージャ１３０（および／またはその一部）、ラウドスピーカ取得マネージャ１４０（および／またはその一部）、擬似逆行列マネージャ１５０（および／またはその一部）、ストラテジー生成マネージャ１６０（および／またはその一部）、ヌル空間投影マネージャ（および／またはその部分）、および指向性フィールド生成マネージャ１８０（および／またはその一部）は、１つまたは複数の機能を実装するためのプロセスに関連する命令を格納するメモリの組み合わせを含み、命令を実行するように構成され得る。

図２は、改良された技術に係る、例示的な音場環境２００を示す。この環境２００内には、マイク２１０を中心とする球２３０上に分布する、例えばラウドスピーカ２４０（１）、…、２４０（Ｑ）（黒ディスク）のような現実のまたは仮想のラウドスピーカのセットの中心にリスナーが位置する起点２１０（白ディスク）がある。各ラウドスピーカ、例えばラウドスピーカ２４０（１）は、方向

などに沿って配置されている。いくつかの構成では、リスナーが起点で聞くために、起点から離れる方向の関数として音場振幅を測定および記録する、球状のマイクが起点２１０にあり得る。

サウンドレンダリングコンピュータ１２０は、起点２１０で記録された音場データ１３２に基づいて、観測点２２０（灰色ディスク）に存在するだろう音場を忠実に再現するように構成されている。これを行う際に、サウンドレンダリングコンピュータ１２０は、上述のように、ラウドスピーカ２４０（１）、…、２４０（Ｑ）のセットの各々において音場の振幅を決定することにより、観測点２２０で音場の指向性を提供するように構成されている。音場の指向性は、特定の音がどの方向から発生しているように思われるかをリスナーが識別できるようにするプロパティである。この意味で、第１の時間ウィンドウ（例えば、１秒）にわたる音場の第１のサンプルは、ラウドスピーカのセット２４０（１）、…、２４０（Ｑ）の第１の重みをもたらし、第２の時間ウィンドウにわたる音場の第２のサンプルは、第２の重みをもたらす。時間ウィンドウにわたる音場の各サンプルについて、式（１）で表されるような周波数にわたる音場の係数は、時間での音場の球面調和関数展開の係数のフーリエ変換である。

図２に示されるように、観測点２２０は、マイク２１０に対して位置

にある。観測点２２０の位置ｘ’は、十分な忠実性の領域（ｒｅｇｉｏｎｏｆｓｕｆｆｉｃｉｅｎｔｆｉｄｅｌｉｔｙ：ＲＳＦ）２５０の領域の外側であるが、ラウドスピーカ２４０（１）、…、２４０（Ｑ）のセットによって定義される領域２３０の内側にある。ＲＳＦ２５０のサイズは、周波数に依存するが、関心のあるほとんどの周波数では、観測点２２０はＲＳＦ２５０の内部にある。いくつかの実装形態では、ＲＳＦ２５０のサイズＲは、

のように定義される。一般的な状況では、リスナーの耳はＲＳＦ２５０の外側にある。

従って、音場が異なる周波数のスペクトルを含む場合、ＲＳＦ２５０のサイズは変化する可能性があり、すなわち、

であるため、ＲＳＦ２５０のサイズＲは、周波数に反比例する。例えば、式（４）におけるような単一周波数のコヒーレントな音場は、線形モード整合方程式ｂ＝Ａ・ｓの解によって記述される。それにもかかわらず、ＲＳＦ２５０のサイズの周波数依存性のために、そのようなコヒーレントな音場は、ＲＳＦの外側の観測点２２０で聞かれる複数の周波数を含む実際の音場に対する十分な忠実性を提供しない。むしろ、式（１２）におけるような線形演算子Ａのヌル空間へのストラテジーベクトルの投影が、音場をインコヒーレントにしていることがわかった。このようなインコヒーレンスは、式（４）のみにおけるような線形モード整合方程式ｂ＝Ａ・ｓの解によって提供されるものよりも音場に対するより良い忠実性を提供する。この理由は、音場のインコヒーレンスが、ＲＳＦ２５０のサイズの周波数依存性を除去し、それにより音場へのスペクトル忠実性を改善するからである。さらに、音場のインコヒーレント部分の大きさを累乗に高めることにより、線形モード整合方程式だけの解に欠ける指向性が提供される。

図３は、音のバイノーラルレンダリングを行う例示的な方法３００を示すフローチャートである。方法３００は、サウンドレンダリングコンピュータ１２０のメモリ１２６に存在し１組の処理ユニット１２４により実行される、図１に関連して記載されたソフトウェア構成により実行され得る。

３０２において、リスナーに対し指向性音場をレンダリングするように構成されたサウンドレンダリングコンピュータの制御回路は、幾何学的環境における音場から生じるサウンドデータを受信し、サウンドデータは、幾何学的環境に基づく複数の直交角度モード関数における展開として表される。これらの方針に沿って、サウンド取得マネージャ１３０は、ディスクからの入力として、またはネットワーク（後者は、リアルタイムで指向性音場を処理する仮想現実環境などの環境の場合）を介して、現実または仮想のマイクにおける音場を表すデータを受信する。この音場は、式（１）のように球面調和関数展開に分解され、球面調和関数データ１３２として格納される係数ベクトルｂをもたらす。

３０４において、制御回路は、サウンドデータに対するモード整合演算と、複数の直交角度モード関数における展開として表されるラウドスピーカの複数の振幅の加重和の展開とから生じる線形演算子を生成する。これらの方針に沿って、ラウドスピーカ取得マネージャ１４０は、ラウドスピーカ位置データ１４２として、Ｑ個のラウドスピーカの各々のラウドスピーカ方向

を（例えば、別個の手順または仕様から）取得する。これらの方向が与えられると、ラウドスピーカ取得マネージャ１４０は、次に、各ラウドスピーカについて式（６）の球面調和関数展開を、式（１）の球面調和関数展開とモード整合させることによって、線形変換データ１４４として線形演算子Ａを生成することができる。

３０６において、制御回路は、線形演算子およびサウンドデータに対して擬似逆演算（逆演算とも呼ばれる）を実行して、第１の複数のラウドスピーカ重みを生成し、第１の複数のラウドスピーカ重みは、周波数閾値を下回る周波数におけるリスナーに対する音場の再現を提供する。いくつかの実装形態では、擬似逆行列マネージャ１５０は、式（３）で指定されるムーア・ペンローズの擬似逆行列を生成し、この擬似逆行列に球面調和関数データ１３２として格納された係数ベクトルｂを乗算して、擬似逆行列データ１５２として、線形モード整合方程式ｂ＝Ａ・ｓに対する解ｓ^†を生成する。

３０８において、制御回路は、線形演算子のヌル空間上で投影演算を実行して、第２の複数のラウドスピーカ重みを生成する。これらの方針に沿って、制御回路は、方程式ｂ＝Ａ・ｓの解ではない第２の音場の項

を生成することができ、第２の音場の項

はＱ個の成分を有する。例えば、上述した強化されたモノポール密度ストラテジーでは、ストラテジー生成マネージャ１６０は、式（５）および式（８）のモノポール密度の式を用いて、ストラテジーベクトルデータ１６２のＱ個の成分の各々として、式（９）による成分値を生成する。いくつかの実装形態では、ストラテジー生成マネージャ１６０は、最適な指向性強度のためにパラメータαを調整する。次に、制御回路は、第２の音場の項

に投影演算を実行して、指定されたＴ×Ｑ行列Ａのヌル空間への第２の音場の項

の投影を生成し得る。これらの方針に沿って、ヌル空間投影マネージャ１７０は、線形変換データ１４４、およびいくつかの実装形態では、擬似逆行列データ１５２を使用して、エルミート共役Ａ^Ｈの列への投影を生成し、単位行列と、この投影との間の差に、式（１１）によるストラテジーベクトル

を乗算して、ヌル空間投影データ１７２を生成する。

３１０において、制御回路は、第１の複数のラウドスピーカ重みと第２の複数のラウドスピーカ重みとの合計を生成して、第３の複数のラウドスピーカ重みを生成し、第３の複数のラウドスピーカ重みは、周波数閾値を下回る、および上回る周波数において、リスナーに対し音場の再現を提供する。これらの方針に沿って、指向性フィールドマネージャ１８０は、擬似逆行列データ１５２に格納されている線形モード整合方程式ｂ＝Ａ・ｓに対する解ｓ^†と、ヌル空間投影データ１７２に格納されている線形演算子Ａのヌル空間Ｎ_Ａへのストラテジーベクトル

の投影

とを合計して、式（１２）による指向性フィールドデータ１８２を生成する。この指向性フィールドデータ１８２は、サウンドレンダリングコンピュータ１２０によって使用され、マイク位置２１０（図２）、または音声がどの方向から発生しているように思われるかをリスナーが知りたいと望む仮想現実環境などの環境内の任意の他の位置（複数のラウドスピーカの位置によって定義される凸包内のウェル）でリスナーに指向性音声を提供する。

図４は、本明細書に記載される技術とともに用いられ得る一般的なコンピュータデバイス４００および一般的なモバイルコンピュータデバイス４５０の一例を示す。コンピューティングデバイス４００は、ラップトップ、デスクトップ、タブレット、ワークステーション、個人用情報端末、テレビ、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピューティングデバイスのような様々な形態のデジタルコンピュータを表すように意図されている。コンピューティングデバイス４５０は、個人用情報端末、携帯電話、スマートフォン、および他の類似のコンピューティングデバイスのような様々な形態のモバイルデバイスを表すように意図されている。本明細書に示されるコンポーネントと、それらの接続および関係と、それらの機能とは、例示として意図されるに過ぎず、本明細書に記載された、および／または特許請求の範囲に記載された発明の実装形態を限定するようには意図されていない。

コンピューティングデバイス４００は、プロセッサ４０２と、メモリ４０４と、記憶デバイス４０６と、メモリ４０４および高速拡張ポート４１０に接続する高速インタフェース４０８と、低速バス４１４および記憶デバイス４０６に接続する低速インタフェース４１２とを含む。プロセッサ４０２は、半導体ベースのプロセッサであり得る。メモリ４０４は、半導体ベースのメモリであり得る。コンポーネント４０２，４０４，４０６，４０８，４１０，４１２の各々は、様々なバスを用いて相互接続されており、共通のマザーボードに、または必要に応じて他の態様により取り付けられ得る。プロセッサ４０２は、高速インタフェース４０８に結合されているディスプレイ４１６などの外部の入力／出力デバイス上にＧＵＩのためのグラフィカル情報を表示するためのメモリ４０４または記憶デバイス４０６に記憶されている命令を含む、コンピューティングデバイス４００内での実行のための命令を処理可能である。他の実装形態では、複数のプロセッサおよび／または複数のバスは、必要に応じて、複数のメモリおよび複数の種類のメモリとともに使用され得る。さらに、複数のコンピューティングデバイス４００が接続されて、各デバイスが必要な動作のうちの部分（例えば、サーババンク、ブレードサーバのグループ、またはマルチプロセッサシステム）を提供してもよい。

メモリ４０４は、コンピューティングデバイス４００内に情報を格納する。１つの実装形態では、メモリ４０４は、１つまたは複数の揮発性メモリユニットである。別の実装形態では、メモリ４０４は、１つまたは複数の不揮発性メモリユニットである。メモリ４０４は、磁気ディスクまたは光学ディスクのような別の形態のコンピュータ可読媒体であってもよい。

記憶デバイス４０６は、コンピューティングデバイス４００のための大容量のストレージを提供できる。１つの実装形態では、記憶デバイス４０６は、フロッピー（登録商標）ディスクデバイス、ハードディスクデバイス、光ディスクデバイス、テープデバイス、フラッシュメモリもしくは他の同様のソリッドステートメモリデバイス、またはストレージエリアネットワークまたは他の構成のデバイスを含むデバイスのアレイのようなコンピュータ可読媒体であってよく、または、それを含み得る。コンピュータプログラム製品は、情報キャリアに有形に具現化されることが可能である。コンピュータプログラム製品は、実行される際に、上述したような１つまたは複数の方法を実施する命令を含んでもよい。情報キャリアは、メモリ４０４、記憶デバイス４０６、またはプロセッサ４０２上のメモリのような、コンピュータまたは機械可読媒体である。

高速コントローラ４０８は、コンピューティングデバイス４００のための帯域集約型の動作を管理する一方、低速コントローラ４１２は、より低い帯域集約型の動作を管理する。機能のそのような割り当ては、例示にすぎない。１つの実装形態では、高速コントローラ４０８は、メモリ４０４と、ディスプレイ４１６（例えば、グラフィクスのプロセッサまたはアクセラレータを通じて）と、様々な拡張カード（図示せず）を受容し得る高速拡張ポートＰ１０とに結合されている。その実装形態では、低速コントローラ４１２は、記憶デバイス４０６と低速拡張ポート４１４とに結合されている。様々な通信ポート（例えば、ＵＳＢ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、イーサネット（登録商標）、無線イーサネット）を含み得る低速拡張ポートは、キーボード、ポインティングデバイス、スキャナなどの１または複数の入出力デバイス、またはスイッチもしくはルータなどのネットワーキングデバイスに、例えば、ネットワークアダプタを通じて結合され得る。

コンピューティングデバイス４００は、図に示されるように、複数の異なる形態で実装され得る。例えば、それは、スタンダードサーバ４２０として、またはそのようなサーバのグループにおいて複数回にわたって実装され得る。それは、ラックサーバシステム４２４の一部として実装されてもよい。加えて、それは、ラップトップコンピュータ４２２のようなパーソナルコンピュータにおいて実装され得る。あるいは、コンピューティングデバイス４００からのコンポーネントは、デバイス４５０などのモバイルデバイス（図示せず）における他のコンポーネントと組み合わされてよい。そのようなデバイスの各々は、コンピューティングデバイス４００，４５０のうちの１つまたは複数を含んでよく、システム全体が、互いに通信する複数のコンピューティングデバイス４００，４５０から構成されてよい。

コンピューティングデバイス４５０は、プロセッサ４５２と、メモリ４６４と、ディスプレイ４５４などの入出力デバイスと、通信インタフェース４６６と、送受信機４６８とをコンポーネントとして特に備える。デバイス４５０には、追加のストレージを提供するように、マイクロドライブまたは他のデバイスのような記憶デバイスがさらに提供されてもよい。コンポーネント４５０，４５２，４６４，４５４，４６６および４６８の各々は、様々なバスを用いて相互接続されており、コンポーネントのうちのいくつかは、共通のマザーボードに取り付けられているか、必要に応じて他の態様により取り付けられてよい。

プロセッサ４５２は、コンピューティングデバイス４５０内で、メモリ４６４に記憶されている命令を含む命令を実行可能である。プロセッサは、別個の複数のアナログおよびデジタルプロセッサを含むチップのチップセットとして実装され得る。プロセッサは、例えば、ユーザインタフェースの制御、デバイス４５０により動作するアプリケーション、デバイス４５０による無線通信のような、デバイス４５０の他のコンポーネントの協働を提供し得る。

プロセッサ４５２は、ディスプレイ４５４に結合された制御インタフェース４５８およびディスプレイインタフェース４５６を通じてユーザと通信することができる。ディスプレイ４５４は、例えば、ＴＦＴＬＣＤ（薄膜トランジスタ液晶ディスプレイ）もしくはＯＬＥＤ（有機発光ダイオード）ディスプレイ、または他の適切なディスプレイ技術であってよい。ディスプレイインタフェース４５６は、グラフィカル情報および他の情報をユーザに提示するためにディスプレイ４５４を駆動するための適切な回路を備え得る。制御インタフェース４５８は、ユーザからコマンドを受信し、プロセッサ４５２に渡すためにそのコマンドを変換し得る。加えて、外部インタフェース４６２は、他のデバイスとのデバイス４５０の近領域通信を可能にするように、プロセッサ４５２との通信に提供され得る。外部インタフェース４６２は、例えば、いくつかの実装形態における有線通信または他の実装形態における無線通信を提供することが可能であり、複数のインタフェースが用いられてもよい。

メモリ４６４は、コンピューティングデバイス４５０内に情報を格納する。メモリ４６４は、１つまたは複数のコンピュータ可読媒体と、１または複数の揮発性メモリユニットと、１または複数の不揮発性メモリユニットと、のうちの１または複数として実装され得る。拡張メモリ４７４も提供されて、例えば、ＳＩＭＭ（シングルインラインメモリモジュール）カードインタフェースを含み得る拡張インタフェース４７２を通じてデバイス４５０に接続されてもよい。そのような拡張メモリ４７４は、デバイス４５０のための追加のストレージスペースを提供し、またはデバイス４５０のためのアプリケーションまたは他の情報を格納し得る。具体的には、拡張メモリ４７４は、上述した処理を実行または補完するための命令を含んでよく、またセキュア情報も含んでよい。従って、例えば、拡張メモリ４７４は、デバイス４５０のためのセキュリティモジュールとして提供されてよく、デバイス４５０のセキュアな使用を可能にする命令でプログラムされ得る。加えて、ハッキング不可能な態様により識別情報をＳＩＭＭカード上に配置するようなセキュアアプリケーションは、追加の情報とともにＳＩＭＭカードを介して提供され得る。

メモリは、例えば、下記のように、フラッシュメモリおよび／またはＮＶＲＡＭメモリを含み得る。１つの実装形態では、コンピュータプログラム製品は、情報キャリアに有形に具現化される。コンピュータプログラム製品は、実行される際に、上述したような１つまたは複数の方法を実施する命令を含む。情報キャリアは、例えば、送受信機４６８または外部インタフェース４６２を介して受信され得る、メモリ４６４、拡張メモリ４７４、またはプロセッサ４５２上のメモリなどのコンピュータまたは機械可読媒体である。

デバイス４５０は、必要な場合には、デジタル信号処理回路を含み得る通信インタフェース４６６を通じて無線により通信し得る。通信インタフェース４６６は、特に、ＧＳＭ（登録商標）ボイスコール、ＳＭＳ、ＥＭＳ、またはＭＭＳメッセージング、ＣＤＭＡ、ＴＤＭＡ、ＰＤＣ、ＷＣＤＭＡ（登録商標）、ＣＤＭＡ２０００、またはＧＰＲＳなど、様々なモードまたはプロトコルの下、通信を提供することが可能である。そのような通信は、例えば、無線周波数送受信機４６８を通じて行われ得る。加えて、Ｂｌｕｅｔｏｏｔｈ、Ｗｉ−Ｆｉ（登録商標）、または他のそのような送受信機（図示せず）を用いるなどの狭域通信が起こり得る。加えて、ＧＰＳ（全地球測位システム）受信機モジュール４７０は、航行および場所に関係する追加の無線データをデバイス４５０に提供し、その無線データは、必要に応じて、デバイス４５０上にて動作するアプリケーションにより用いられ得る。

デバイス４５０は、ユーザから音声情報を受信し、これを使用可能なデジタル情報に変換できる音声コーデック４６０を用いて可聴の通信を行ってもよい。音声コーデック４６０は、例えば、デバイス４５０のハンドセットにおけるスピーカを通じてなどによりユーザに対する可聴音を同様に生成し得る。そのような音は、音声通話からの音を含んでよく、記録された音（例えば、ボイスメッセージ、音楽ファイルなど）を含んでよく、デバイス４５０上で動作するアプリケーションにより生成される音を含んでもよい。

コンピューティングデバイス４５０は、図に示されるように、複数の異なる形態により実装されてよい。例えば、それは、携帯電話４８０として実装され得る。それは、スマートフォン４８２、個人用情報端末、または他の同様のモバイルデバイスの一部として実装されてもよい。

本明細書に記載されたシステムおよび技術の様々な実装形態は、デジタル電子回路、集積回路、特別に設計されたＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、および／またはそれらの組み合わせにより実現され得る。これらの様々な実装形態は、記憶システム、少なくとも１つの入力デバイス、および少なくとも１つの出力デバイスからデータおよび命令を受信し、それらへデータおよび命令を送信するように結合された、特別または汎用の少なくとも１つのプログラム可能なプロセッサを含むプログラマブルシステム上で実行可能および／または解釈可能な１つまたは複数のコンピュータプログラムにおける実装を含み得る。

これらのコンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとしても知られている）は、プログラム可能なプロセッサのためのマシン命令を含み、高度な手続き型および／またはオブジェクト指向プログラミング言語および／またはアセンブリ言語／機械語により実装されることも可能である。本明細書にて用いられる「機械可読媒体」、「コンピュータ可読媒体」という用語は、機械可読信号として機械命令を受信する機械可読媒体を含むプログラマブルプロセッサに、機械命令および／またはデータを提供するために用いられる任意のコンピュータプログラム製品、装置および／またはデバイス（例えば、磁気ディスク、光ディスク、メモリ、プログラマブル論理デバイス（ＰＬＤ））を指す。「機械可読信号」という用語は、機械命令および／またはデータをプログラマブルプロセッサに提供するために用いられる任意の信号を指す。

ユーザとの対話を提供するために、本明細書に記載されたシステムおよび技術は、情報をユーザに表示するためのディスプレイデバイス（例えば、ＣＲＴ（陰極線管）またはＬＣＤ（液晶ディスプレイ）モニタ）と、ユーザがそれによって入力をコンピュータに提供することが可能なキーボードおよびポインティングデバイス（例えば、マウスまたはトラックボール）とを有するコンピュータ上に実装され得る。他の種類のデバイスも、ユーザとの対話を提供するために用いられてよく、例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってよく、ユーザからの入力は、音響入力、音声入力、または触覚入力を含む任意の形態により受信され得る。

本明細書に記載されたシステムおよび技術は、バックエンドコンポーネント（例えば、データサーバとしての）を含むコンピューティングシステム、ミドルウェアコンポーネント（例えば、アプリケーションサーバ）を含むコンピューティングシステム、フロントエンドコンポーネント（例えば、ユーザが本明細書に記載されたシステムおよび技術の実装と対話可能なグラフィカルユーザインタフェースまたはウェブブラウザを有するクライアントコンピュータ）を含むコンピューティングシステム、またはそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、もしくはフロントエンドコンポーネントの任意の組み合わせで実装され得る。システムのコンポーネントは、デジタルデータ通信の任意の形態または媒体（例えば、通信ネットワーク）によって相互接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク（「ＬＡＮ」）、ワイドエリアネットワーク（「ＷＡＮ」）、およびインターネットを含む。

コンピューティングシステムは、クライアントおよびサーバを含み得る。クライアントおよびサーバは、一般に、互いに遠く離れており、典型的には、通信ネットワークを介して対話する。クライアントとサーバとの関係は、それぞれのコンピュータ上で動作し、かつ互いにクライアント−サーバ関係を有するコンピュータプログラムにより生じる。

本明細書および添付の特許請求の範囲において、単数形「１つの（ａ，ａｎ）」および「その（ｔｈｅ）」は、文脈において明示する場合を除き、複数の参照を排除するものではない。さらに、「および（ａｎｄ）」、「または（ｏｒ）」および「および／または（ａｎｄ／ｏｒ）」などの接続詞は、文脈において明示する場合を除き、包括的なものである。例えば、「Ａおよび／またはＢ」は、Ａのみ、Ｂのみ、およびＡとＢと、を含む。さらに、提示される様々な図面に示される接続線およびコネクタは、例示的な機能の関係および／または様々な要素間の物理的結合か論理的結合を表すことが意図されている。多くの代替または追加の機能の関係、物理的接続または論理的接続が、実際のデバイスに存在し得る。さらに、要素が「必須（ｅｓｓｅｎｔｉａｌ）」または「重要（ｃｒｉｔｉｃａｌ）」と特に記載されていない限り、本明細書に開示される実施形態の実施にとってアイテムまたはコンポーネントは必須ではない。

これに限られないが、約、実質的に、一般になどの用語は、その正確な値または範囲が要求されておらず、特定される必要がないことを示すように、本明細書において用いられる。本明細書で用いられるように、上記の用語は、当業者にとって迅速かつ即座に意味を有する。

さらに、本明細書において上方、下方、頂部、底部、側方、端部、前方、後方などといった用語の使用は、現在考えられているか示されている配向を参照して用いられる。別の配向に関して考えられる場合には、そうした用語は対応して修正される必要があると理解される。

さらに、本明細書および添付の特許請求の範囲において、単数形「１つの（ａ，ａｎ）」および「その（ｔｈｅ）」は、文脈において明示する場合を除き、複数の参照を排除するものではない。さらに、「および（ａｎｄ）」、「または（ｏｒ）」および「および／または（ａｎｄ／ｏｒ）」などの接続詞は、文脈において明示する場合を除き、包括的なものである。例えば、「Ａおよび／またはＢ」は、Ａのみ、Ｂのみ、およびＡとＢと、を含む。

特定の例としての製造の方法、装置および物が本明細書に記載されているが、この特許の適用範囲はそれらに限定されない。本明細書に用いられる専門用語は、特定の側面を説明するためであり、限定することを意図するものではないことが理解されるべきである。これに反して、この特許は、この特許の特許請求の範囲内に該当する製造の全ての方法、装置および物をカバーする。

Claims

方法であって、
リスナーに対し指向性音場をレンダリングするように構成されたサウンドレンダリングコンピュータの制御回路により、幾何学的環境における音場から生じるサウンドデータを受信することであって、前記サウンドデータは、前記幾何学的環境に基づく複数の直交角度モード関数における展開として表される、前記受信すること、
前記制御回路により、前記サウンドデータに対するモード整合演算と、前記複数の直交角度モード関数における展開として表される複数のラウドスピーカの振幅の加重和の展開とから生じる線形演算子を生成すること、
前記制御回路により、前記線形演算子および前記サウンドデータに対する逆演算を実行して、第１の複数のラウドスピーカ重みを生成すること、
前記制御回路により、前記線形演算子のヌル空間上で投影演算を実行して、第２の複数のラウドスピーカ重みを生成すること、
前記制御回路により、前記第１の複数のラウドスピーカ重みと前記第２の複数のラウドスピーカ重みとの合計を生成して、第３の複数のラウドスピーカ重みを生成すること
を含み、前記第３の複数のラウドスピーカ重みは、前記リスナーに対し前記音場の再現を提供する、方法。
前記線形演算子および前記サウンドデータに対する前記逆演算を実行することは、前記線形演算子のムーア・ペンローズの擬似逆行列を生成することを含む、請求項１に記載の方法。
前記幾何学的環境は、球形であり、前記複数の直交角度モード関数は、球面調和関数を含む、請求項１に記載の方法。
前記複数のラウドスピーカにおけるラウドスピーカの数は、前記複数の直交角度モード関数における直交角度モード関数の数よりも多い、請求項１に記載の方法。
前記線形演算子の前記ヌル空間に前記投影演算を実行することは、
ストラテジーベクトルを生成することであって、前記ストラテジーベクトルの各成分は、前記複数のラウドスピーカのそれぞれのラウドスピーカに対応する、前記ストラテジーベクトルを生成すること、
単位行列と前記線形演算子のエルミート共役のヌル空間の列への投影との間の差を生成して投影行列を生成すること、
前記第２の複数のラウドスピーカ重みとして、前記投影行列と前記ストラテジーベクトルとの積を生成すること
を含む、請求項１に記載の方法。
前記ストラテジーベクトルを生成することは、前記複数のラウドスピーカの各々について、
前記幾何学的環境内におけるそのラウドスピーカのそれぞれの角度座標で評価される連続的なモノポール密度関数を定義すること、
前記ストラテジーベクトルとして、前記幾何学的環境内におけるそのラウドスピーカの前記それぞれの角度座標で評価される前記連続的なモノポール密度関数の大きさの冪乗を生成すること
を含み、前記冪乗は、１より大きい、請求項５に記載の方法。
前記幾何学的環境内における前記複数のラウドスピーカの各々の、それぞれの角度座標で評価される前記連続的なモノポール密度関数を定義することは、
前記幾何学的環境内におけるそのラウドスピーカの角度座標で評価される前記連続的なモノポール密度関数として、前記複数の直交角度モード関数における前記連続的なモノポール密度関数の展開を生成すること
を含み、前記展開の係数は、前記連続的なモノポール密度関数のグリーン関数表現を有するモード整合演算の結果として生成される、請求項６に記載の方法。
非一時的な記憶媒体を備えるコンピュータプログラム製品であって、リスナーに対し指向性音場をレンダリングするように構成されたサウンドレンダリングコンピュータの処理回路により実行されると、前記処理回路に、
幾何学的環境における音場から生じるサウンドデータを受信することであって、前記サウンドデータは、前記幾何学的環境に基づく複数の直交角度モード関数における展開として表される、前記受信すること、
前記サウンドデータに対するモード整合演算と、複数の直交角度モード関数における展開として表される複数のラウドスピーカの振幅の加重和の展開とから生じる線形演算子を生成すること、
前記線形演算子および前記サウンドデータに対する逆演算を実行して、第１の複数のラウドスピーカ重みを生成すること、
前記線形演算子のヌル空間上で投影演算を実行して、第２の複数のラウドスピーカ重みを生成すること、
前記第１の複数のラウドスピーカ重みと前記第２の複数のラウドスピーカ重みとの合計を生成して、第３の複数のラウドスピーカ重みを生成すること
を含む方法を実行させ、前記第３の複数のラウドスピーカ重みは、前記リスナーに対し前記音場の再現を提供する、コンピュータプログラム製品。
前記線形演算子および前記サウンドデータに対する前記逆演算を実行することは、前記線形演算子のムーア・ペンローズの擬似逆行列を生成することを含む、請求項８に記載のコンピュータプログラム製品。
前記幾何学的環境は、球形であり、前記複数の直交角度モード関数は、球面調和関数を含む、請求項８に記載のコンピュータプログラム製品。
前記複数のラウドスピーカにおけるラウドスピーカの数は、前記複数の直交角度モード関数における直交角度モード関数の数よりも多い、請求項８に記載のコンピュータプログラム製品。
前記線形演算子の前記ヌル空間に前記投影演算を実行することは、
ストラテジーベクトルを生成することであって、前記ストラテジーベクトルの各成分は、前記複数のラウドスピーカのそれぞれのラウドスピーカに対応する、前記ストラテジーベクトルを生成すること、
単位行列と前記線形演算子のエルミート共役のヌル空間の列への投影との間の差を生成して投影行列を生成すること、
前記第２の複数のラウドスピーカ重みとして、前記投影行列と前記ストラテジーベクトルとの積を生成すること
を含む、請求項８に記載のコンピュータプログラム製品。
前記ストラテジーベクトルを生成することは、前記複数のラウドスピーカの各々について、
前記幾何学的環境内におけるそのラウドスピーカのそれぞれの角度座標で評価される連続的なモノポール密度関数を定義すること、
前記ストラテジーベクトルとして、前記幾何学的環境内におけるそのラウドスピーカの前記それぞれの角度座標で評価される前記連続的なモノポール密度関数の大きさの冪乗を生成すること
を含み、前記冪乗は、１より大きい、請求項１２に記載のコンピュータプログラム製品。
前記幾何学的環境内における前記複数のラウドスピーカの各々の、それぞれの角度座標で評価される前記連続的なモノポール密度関数を定義することは、
前記幾何学的環境内におけるそのラウドスピーカの角度座標で評価される前記連続的なモノポール密度関数として、前記複数の直交角度モード関数における前記連続的なモノポール密度関数の展開を生成すること
を含み、前記展開の係数は、前記連続的なモノポール密度関数のグリーン関数表現を有するモード整合演算の結果として生成される、請求項１３に記載のコンピュータプログラム製品。
リスナーに対し指向性音場をレンダリングするように構成されている電子装置であって、
メモリと、
前記メモリに結合されている制御回路と
を備え、該制御回路は、
幾何学的環境における音場から生じるサウンドデータを受信することであって、前記サウンドデータは、前記幾何学的環境に基づく複数の直交角度モード関数における展開として表される、前記受信すること、
前記サウンドデータに対するモード整合演算と、複数の直交角度モード関数における展開として表される複数のラウドスピーカの振幅の加重和の展開とから生じる線形演算子を生成すること、
前記線形演算子および前記サウンドデータに対する逆演算を実行して、第１の複数のラウドスピーカ重みを生成すること、
前記線形演算子のヌル空間上で投影演算を実行して、第２の複数のラウドスピーカ重みを生成すること、
前記第１の複数のラウドスピーカ重みと前記第２の複数のラウドスピーカ重みとの合計を生成して、第３の複数のラウドスピーカ重みを生成すること
を行うように構成されており、前記第３の複数のラウドスピーカ重みは、前記リスナーに対し前記音場の再現を提供する、電子装置。
前記線形演算子および前記サウンドデータに対する擬似逆演算を実行することは、前記線形演算子のムーア・ペンローズの擬似逆行列を生成することを含む、請求項１５に記載の電子装置。
前記幾何学的環境は、球形であり、前記複数の直交角度モード関数は、球面調和関数を含む、請求項１５に記載の電子装置。
前記複数のラウドスピーカにおけるラウドスピーカの数は、前記複数の直交角度モード関数における直交角度モード関数の数よりも多い、請求項１５に記載の電子装置。
前記線形演算子の前記ヌル空間に前記投影演算を実行することは、
ストラテジーベクトルを生成することであって、前記ストラテジーベクトルの各成分は、前記複数のラウドスピーカのそれぞれのラウドスピーカに対応する、前記ストラテジーベクトルを生成すること、
単位行列と前記線形演算子のエルミート共役のヌル空間の列への投影との間の差を生成して投影行列を生成すること、
前記第２の複数のラウドスピーカ重みとして、前記投影行列と前記ストラテジーベクトルとの積を生成すること
を含む、請求項１５に記載の電子装置。
前記ストラテジーベクトルを生成することは、前記複数のラウドスピーカの各々について、
前記幾何学的環境内におけるそのラウドスピーカのそれぞれの角度座標で評価される連続的なモノポール密度関数を定義すること、
前記ストラテジーベクトルとして、前記幾何学的環境内におけるそのラウドスピーカの前記それぞれの角度座標で評価される前記連続的なモノポール密度関数の大きさの冪乗を生成すること
を含み、前記冪乗は、１より大きい、請求項１９に記載の電子装置。