JP6764490B2

JP6764490B2 - 媒介現実

Info

Publication number: JP6764490B2
Application number: JP2018566588A
Authority: JP
Inventors: ラッセラークソネン; ミッカヴィレルモ; ミッコタンミ; アルトレフティニエミ
Original assignee: ノキアテクノロジーズオーユー
Priority date: 2016-06-21
Filing date: 2017-06-02
Publication date: 2020-09-30
Anticipated expiration: 2037-06-02
Also published as: WO2017220852A1; US10764705B2; US20190166448A1; KR102126162B1; EP3261367B1; CN109314834A; EP3261367A1; JP2019522420A; KR20190020766A

Description

本発明の実施形態は、例えば、拡張現実または仮想現実のような媒介現実に関する。

背景

本明細書において、媒介現実とは、ユーザが完全または部分的な人工環境を体験することを指す。

拡張現実は、媒介現実の一形態であって、ユーザが部分的に人工で、部分的に現実の環境を体験することを指す。仮想現実は、媒介現実の一形態であって、ユーザが完全人工環境を体験することを指す。

摘要

本発明の様々な、ただし必ずしもすべてではない実施形態によれば、方法が提供される。前記方法は、レンダリングされた仮想空間内の音響オブジェクトを、前記仮想空間内でのユーザの記録された動作に応じて、音響オブジェクトの第１群または音響オブジェクトの第２群に分類することと、前記第１群に属する１つまたは複数の音響オブジェクトを、少なくとも第１の規則に応じてレンダリングすることと、前記第２群に属する１つまたは複数の音響オブジェクトを、少なくとも、前記第１の規則とは異なる第２の規則と、前記仮想空間内の前記ユーザの現在位置とに応じてレンダリングすることと、を含む。

本発明の様々な、ただし必ずしもすべてではない実施形態によれば、添付の特許請求の範囲に記載されるような例が提供される。

詳細な説明の理解に有用な様々な例をより良く理解するために、単なる例として添付の図面を参照する。
図１Ａ〜図１Ｃは、媒介現実の例を示し、同一の仮想視覚空間とは異なる視点を示す。図２Ａ〜図２Ｃは、媒介現実の例を示し、異なる視点からの仮想視覚シーンを示す。図３Ａは、現実空間の例を示し、図３Ｂは、図１Ｂの仮想視覚シーンに部分的に対応する現実視覚シーンの例を示す。図４は、媒介現実、および／または拡張現実、および／または仮想現実を実現するように動作可能な装置の例を示す。図５Ａは、媒介現実、および／または拡張現実、および／または仮想現実を実現するための方法の例を示し、図５Ｂは、拡張現実のために仮想視覚空間のモデルを更新する方法の例を示す。図６Ａおよび図６Ｂは、ユーザに仮想視覚シーンを少なくとも部分的に表示可能とする装置の例を示す。図７Ａは、現実空間におけるジェスチャの例を示し、図７Ｂは、現実空間におけるジェスチャに対応する描写が、仮想視覚シーン内においてレンダリングされることを示す。図８は、レンダリングされた音響シーンを修正するためのシステムの例を示す。図９は、例えばシステムの位置決めブロック、配向ブロック、距離ブロックの機能を実行するために使用されうるモジュールの例を示す。図１０は、装置を使用して実現されるシステム／モジュールの例を示す。図１１は、音響オブジェクトのレンダリングを制御する方法の例を示す。図１２Ａ〜図１２Ｆは、図１１の方法の例示的な適用を示す。図１３は、音響オブジェクトの分類を第１群に変えるために、ユーザが仮想空間内で実行する「起動」動作の一例を示す。図１４は、第１群に属する音響オブジェクトのレンダリングを制御するために、どのように第１の規則が使用されうるかの一例を示す。図１５は、第１群に属する複数の音響オブジェクトの同時レンダリングを制御するために、どのように第１の規則が使用されうるかの一例を示す。図１１の方法の一例の効果を示す状態図である。図１１の方法の別の例の効果を示す状態図である。

定義

「仮想視覚空間」は、視覚可能な完全または部分的な人工環境を指す。これは３次元でありうる。
「仮想視覚シーン」は、仮想視覚空間内の特定の視点から見た仮想視覚空間を表す。

「現実空間」は、現実環境を指す。これは３次元でありうる。
「現実視覚シーン」は、現実空間内の特定の視点から見た現実空間を表す。

本明細書における「媒介現実」は、完全または部分的な人工環境（仮想視覚空間）を、装置によってユーザに対して少なくとも部分的に表示された仮想視覚シーンとして、ユーザが視覚的に体験することを指す。仮想視覚シーンは、仮想視覚空間内の視点および視野によって決定される。仮想視覚シーンの表示は、ユーザが見ることができる形式で仮想視覚シーンを提示することを意味する。
本明細書における「拡張現実」は、媒介現実の一形式を指し、ユーザは、部分的な人工環境（仮想視覚空間）を、装置によってユーザに対して表示された１つまたは複数の視覚要素によって補足された、物理的現実世界の環境（現実空間）の現実視覚シーンを含む仮想視覚シーンとして視覚的に体験する。
本明細書における「仮想現実」は、媒介現実の一形式を指し、ユーザは、完全な人工環境（仮想視覚空間）を、装置によってユーザに対して表示された仮想視覚シーンとして視覚的に体験する。

媒介現実、拡張現実、または仮想現実に適用される「視点媒介」は、ユーザの動作が、仮想視覚空間内の視点を決定し、仮想視覚シーンを変更することを意味する。
媒介現実、拡張現実、または仮想現実に適用される「一人称視点媒介」は、ユーザの実際の視点が、仮想視覚空間内の視点を決定するという制約が追加された視点媒介を意味する。
媒介現実、拡張現実、または仮想現実に適用される「三人称視点媒介」は、ユーザの実際の視点が、仮想視覚空間内の視点を決定しないという制約が追加された視点媒介を意味する。
媒介現実、拡張現実、または仮想現実に適用される「ユーザインタラクティブ媒介」は、ユーザの動作が、仮想視覚空間内で起こることを少なくとも部分的に決定することを意味する。

「表示」は、ユーザによって視覚的に知覚される（見られる）形式で提示することを意味する。
「レンダリング」は、ユーザによって知覚される形式で提示することを意味する。

「音響空間」は、３次元空間内の音源の配置を指す。音響空間は、音響の録音（録音された音響空間）に関連して、および音響のレンダリング（レンダリングされた音響空間）に関連して、定義される場合がある。
「音響シーン」は、音響空間内の特定の視点から聴いた音響空間を表す。
「音響オブジェクト」は、音響空間内に配置されうる音源を指す。音源オブジェクトは、音響空間内の音源を表す。録音された音響オブジェクトは、特定のマイクで録音された音響を表す。

「対応」または「対応する」は、音響空間および仮想視覚空間と関連して用いられる場合、音響空間と仮想視覚空間との時間および空間が一致している、すなわちそれらが同じ時間の同じ空間であることを意味する。
「対応」または「対応する」は、音響シーンおよび仮想視覚シーンと関連して用いられる場合、音響空間と仮想視覚空間とが対応しており、音響シーンを定める視点を有する概念的リスナーと、仮想視覚シーンを定める視点を有する概念的ビューアとが、同じ場所に同じ向きでおり、すなわち、当該リスナーと当該ビューアの視点は同じであることを意味する。

「仮想空間」は、仮想視覚空間を意味する場合も、音響空間を意味する場合も、仮想視覚空間と対応する音響空間との組合せを意味する場合もある。

詳細説明

現実世界における、点音源からの音の伝播を、反射や反響なしで単純にモデル化すれば、音響パワーが球面上に広がり、逆二乗則に応じて、音の強さ（単位面積当たりのパワー）が減衰することが示される。したがって、音源からの距離に合わせて、パワーは急速に低下する。

人が音響を騒音として知覚するか否かは、音の強さだけではなく、強さと周波数に対して非線形依存な、耳の音の強さへの反応に依存する。

人の耳は、一般的に、２ｋＨｚから５ｋＨｚの周波数領域において、あらゆる強さの音に対して感度が高くなる。

また、人の耳は飽和効果を示す。多数の臨界周波数帯の内の同一周波数帯の複数の音は、内耳の基底膜の神経終末を奪い合うため、飽和効果が生じる。

現実世界（または仮想世界）において、話している人で混雑した部屋では、人は異なる様々な音源（音響オブジェクト）を、たとえその近くにいても聴き分けることが難しいかもしれない。

以下に説明するいくつかの実施形態では、ユーザが仮想空間における特定の音響オブジェクトに耳を澄ます能力が向上する。仮想世界は、必ずしも物理または人間性理学により限定されることはなく、ユーザに「超人間的」な聴覚を与えることも可能である。

これは、例えば、レンダリングされた仮想空間内の音響オブジェクトを、仮想空間内でのユーザの記録された動作に応じて、音響オブジェクトの第１群または音響オブジェクトの第２群に分類し、その後、少なくとも第１の規則に応じて、第１群に属する音響オブジェクトの１つまたは複数をレンダリングし、少なくとも、第１の規則とは異なる第２の規則と、仮想空間内のユーザの現在位置に応じて、第２群に属する音響オブジェクトの１つまたは複数をレンダリングすることで実現される。

図１Ａ〜１Ｃおよび２Ａ〜２Ｃは、媒介現実の例を示す。媒介現実は、拡張現実または仮想現実であってもよい。

図１Ａ、１Ｂ、１Ｃは、複数の同じ仮想オブジェクト２１を含む同一の仮想視覚空間２０を示す。各図は、異なる視点２４を示す。視点２４の位置および方向は、それぞれ独立して変わりうる。図１Ａと図１Ｂとでは、視点２４の方向が異なるが、位置は同一である。図１Ｂと図１Ｃとでは、視点２４の方向および位置が異なっている。

図２Ａ、２Ｂ、２Ｃは、それぞれ図１Ａ、１Ｂ、１Ｃの異なる視点２４からの仮想視覚シーン２２を示す。仮想視覚シーン２２は、仮想視覚空間２０内の視点２４と、視野２６とにより決定される。仮想視覚シーン２２は、少なくとも部分的にユーザに表示される。

図示の仮想視覚シーン２２は、媒介現実シーン、仮想現実シーン、または拡張現実シーンであってもよい。仮想現実シーンは、完全人工仮想視覚空間２０を表示する。拡張現実シーンは、部分的に人工、部分的に現実の仮想視覚空間２０を表示する。

媒介現実、拡張現実、または仮想現実は、ユーザインタラクティブ媒介であってもよい。この場合、仮想視覚空間２０で何が起きるかが、ユーザ動作により少なくとも部分的に決定される。これにより、仮想視覚空間２０内の、視覚的要素２８などの仮想オブジェクト２１との相互作用が可能となりうる。

媒介現実、拡張現実、または仮想現実は、視点媒介であってもよい。この場合、ユーザ動作により仮想視覚空間２０内の視点２４が決まり、仮想視覚シーン２２が変化する。例えば、図１Ａ、１Ｂ、１Ｃに示すように、仮想視覚空間２０内の視点２４の位置２３が変化し、さらに／あるいは仮想視覚空間２０内の視点２４の方向または向き２５が変化しうる。仮想視覚空間２０が三次元であれば、視点２４の位置２３は、３自由度（例えば上下、前後、左右）を有し、仮想視覚空間２０内の視点２４の方向２５は、３自由度（例えばロール、ピッチ、ヨー）を有する。視点２４の位置２３および／または方向２５は、連続的に変化しうる。その場合、ユーザ動作によって視点２４の位置および／または方向を連続的に変化させる。あるいは、視点２４は、離散量子化位置２３および／または離散量子化方向２５を有しうる。その場合、ユーザ動作によって視点２４の複数の取りうる位置２３および／または方向２５間を離散的に跳躍して切り替える。

図３Ａは、実際のオブジェクト１１を有し、部分的に図１Ａの仮想視覚空間２０に対応する現実空間１０を示す。この例では、現実空間１０内の実際のオブジェクト１１はそれぞれ、対応する仮想オブジェクト２１が仮想視覚空間２０内に存在するが、仮想視覚空間２０内の仮想オブジェクト２１がそれぞれ、対応する実際のオブジェクト１１が現実空間１０に存在するわけではない。この例では、仮想オブジェクト２１の１つがコンピュータにより作り出された視覚的要素２８であり、現実空間１０内に対応する実際のオブジェクト１１を持たない人工仮想オブジェクト２１である。

現実空間１０と、仮想視覚空間２０との間には線形対応関係があり、現実空間１０内の各実際のオブジェクト１１と、その対応する仮想オブジェクト２１との間には同じ対応関係が存在する。したがって、現実空間１０内の実際のオブジェクト１１の相対関係は、仮想視覚空間２０内の対応する仮想オブジェクト２１間の相対関係と同じである。

図３Ｂは、図１Ｂの仮想視覚シーン２２に部分的に対応する現実視覚シーン１２を示し、実際のオブジェクト１１を含むが、人工仮想オブジェクトは含まない。現実視覚シーンは、図１Ａの仮想視覚空間２０における視点２４に対応する視点から見たものである。現実視覚シーン１２の中身は、対応する視点２４および視野２６により決まる。

図２Ａは、図３Ｂに示す現実視覚シーン１２の拡張現実版であってもよい。仮想視覚シーン２２は、装置によりユーザに表示された１つまたは複数の視覚的要素２８により補足された現実空間１０の現実視覚シーン１２を含む。視覚的要素２８は、コンピュータが生成した視覚的要素であってもよい。シースルー構成においては、仮想視覚シーン２２は、（１つまたは複数の）補足用視覚的要素２８の表示を通して見える、現実視覚シーン１２を含む。ビデオ視聴構成では、仮想視覚シーン２２は、表示された現実視覚シーン１２と、表示された（１つまたは複数の）補足用視覚的要素２８とを含む。表示された現実視覚シーン１２は、単一の視点２４から見た画像、または同時に異なる複数の視点２４から見た複数の画像が処理されて生成された単一の視点２４から見た画像に基づいてもよい。

図４は、媒介現実、および／または拡張現実、および／または仮想現実を実現するように動作可能な装置３０の一例を示す。

装置３０は、仮想視覚シーン２２の少なくとも各部分を、ユーザに視覚的に知覚可能な形態でユーザに提供するディスプレイ３２を有する。ディスプレイ３２は、仮想視覚シーン２２の少なくとも各部分を、ユーザに表示する光を提供する表示装置であってもよい。表示装置の例としては、液晶表示装置、有機発光表示装置、発光型、反射型、透過型・半透過型表示装置、網膜直接投影表示装置、ニアアイディスプレイなどが挙げられる。

この例では、ディスプレイ３２はコントローラ４２により制御されるが、すべての例で必ずしもそのようになるわけではない。

コントローラ４２の実装は、コントローラ回路構成としてなされてもよい。コントローラ４２は、ハードウェアのみとして実装されてもよく、特定の側面をファームウェアのみを含めソフトウェアとして有してもよく、またはハードウェアとソフトウェア（ファームウェアを含む）との組合せとすることもできる。

図４に示されているとおり、コントローラ４２は、ハードウェアの機能性を使用可能にする命令を使用して実装されてもよい。例えばコントローラ４２は、汎用または専用プロセッサ４０においてコンピュータプログラム４８の実行可能な命令を使用して実装されてもよい。これらの命令は、そのようなプロセッサ４０により実行されるよう、コンピュータ可読記憶媒体（ディスク、メモリなど）に記憶されてもよい。

プロセッサ４０は、メモリ４６に対し読取りおよび書込みを行うように構成される。プロセッサ４０は、出力インタフェースと入力インタフェースを備えてもよい。データおよび／またはコマンドは、プロセッサ４０によって出力インタフェースを介して出力され、入力インタフェースを介してプロセッサ４０に入力される。

メモリ４６は、プロセッサ４０にロードされると装置３０の動作を制御するコンピュータプログラム命令（コンピュータプログラムコード）を備えるコンピュータプログラム９８を記憶する。コンピュータプログラム４８のコンピュータプログラム命令は、装置が図５Ａおよび５Ｂに示されている方法を実行できるようにするロジックおよびルーチンを提供する。プロセッサ４０は、メモリ４６を読み取ることによってコンピュータプログラム４８をロードし実行することができる。

図５Ａおよび５Ｂに示されたブロックは、方法のステップおよび／またはコンピュータプログラム４８のコードのセクションを表現しうる。示されたブロックの特定の順序は、それらのブロックに対して必要な順序または好ましい順序が存在することを必ずしも意味するものではなく、ブロックの順序および配置は変更されてもよい。さらに、いくつかのブロックを省略することも可能である。

装置３０は、例えば図５Ａに示す方法６０または同様の方法により、媒介現実、および／または拡張現実、および／または仮想現実を実現してもよい。コントローラ４２は、仮想視覚空間２０のモデル５０を記憶および保持する。モデルは、コントローラ４２に提供されてもよいし、コントローラ４２により決定されてもよい。例えば、入力回路構成４４のセンサを利用して、異なる複数の視点からの、仮想視覚空間の重複する距離画像を生成して、３次元モデルを生成するようにしてもよい。

距離画像の生成に使用可能な異なる様々な技術が存在する。Ｋｉｎｅｃｔ（商標）デバイスで用いられる受動システムの一例としては、赤外線によりオブジェクトがシンボルの不均一パターンで塗り分けられ、その反射光が複数のカメラを用いて測定、処理され、視差効果を用いることで、オブジェクトの位置を決定する場合が挙げられる。

ブロック６２では、仮想視覚空間２０のモデルが変化した否かが判定される。仮想視覚空間２０のモデルが変化していれば、方法はブロック６６に進む。仮想視覚空間２０のモデルが変化していなければ、方法はブロック６４に進む。

ブロック６４では、仮想視覚空間２０の視点２４が変化したか否かが判定される。視点２４が変化していれば、方法はブロック６６に進む。視点２４が変化していなければ、方法はブロック６２に戻る。

ブロック６６では、三次元仮想視覚空間２０の二次元投影が、現在の視点２４により定義される場所２３および方向２５で取られる。その後、投影は、視野２６により限定されて、仮想視覚シーン２２が生成される。次に方法は、ブロック６２に戻る。

装置３０が拡張現実を実現すると、仮想視覚空間２０は、現実空間１０のオブジェクト１１と、現実空間１０には存在しない視覚的要素２８とを含む。このように視覚的要素２８を組み合わせることを、人工仮想視覚空間と称しうる。図５Ｂは、拡張現実のために仮想視覚空間２０のモデルを更新する方法７０を示す。

ブロック７２では、現実空間１０が変化したか否かが判定される。現実空間１０が変化していれば、方法はブロック７６に進む。現実空間１０が変化していなければ、方法はブロック７４に進む。現実空間１０の変化の検出は、差分を利用して、画素単位で実現されてもよいし、移動するオブジェクトを追跡するコンピュータ視覚を利用して、オブジェクト単位で実行されてもよい。

ブロック７４では、人工仮想視覚空間が変化したかが判定される。人工仮想視覚空間が変化している場合、方法はブロック７６に進む。人工仮想視覚空間が変化していない場合、方法はブロック７２に戻る。人工仮想視覚空間はコントローラ４２により生成されるため、視覚的要素２８への変化は容易に検出できる。

ブロック７６において、仮想視覚空間２０のモデルが更新される。

装置３０は、媒介現実、および／または拡張現実、および／または仮想現実用の、ユーザインタラクティブ媒介を実現してもよい。ユーザ入力回路構成４４は、ユーザ入力４３を使用してユーザ動作を検出する。これらのユーザ動作を使用して、コントローラ４２は仮想視覚空間２０内で何が起きるか判定する。これにより、仮想視覚空間２０内で、視覚的要素２８との相互作用が実現されうる。

装置３０は、媒介現実、および／または拡張現実、および／または仮想現実用の、視点媒介を実現してもよい。ユーザ入力回路構成４４は、ユーザ動作を検出する。これらのユーザ動作を使用して、コントローラ４２は仮想視覚空間２０内の視点２４を判定して、仮想視覚シーン２２を変化させる。視点２４の位置および／または方向は、連続的に変化しうる。その場合、ユーザ動作によって視点２４の位置および／または方向を変化させる。あるいは、視点２４は、離散量子化位置および／または離散量子化方向を有しうる。その場合、ユーザ動作によって視点２４の次の位置および／または方向へと跳躍して切り替える。

装置３０は、媒介現実、拡張現実、または仮想現実用の、一人称視点を実現してもよい。ユーザ入力回路構成４４は、ユーザ視点センサ４５を使用して、ユーザの実際の視点１４を検出する。ユーザの実際の視点を使用して、コントローラ４２は、仮想視覚空間２０内の視点２４を判定して、仮想視覚シーン２２を変化させる。再度図３Ａを参照すると、ユーザ１８は、実際の視点１４を有する。ユーザ１８は、実際の視点を変化させうる。例えば、実際の視点１４の実際の場所１３は、ユーザ１８の場所であって、ユーザ１８の物理的場所１３を変えることで、変化させられる。例えば、実際の視点１４の実際の方向１５は、ユーザ１８が向いている方向であって、ユーザ１８の実際の方向を変えることで、変化させられる。実際の方向１５は、例えば、ユーザ１８がその頭部または視点の向きを変えるか、さらに／あるいはユーザがその視線方向を変えることで、変化させられる。頭部装着型装置３０は、ユーザの頭部の向きの変化、および／またはユーザの視線方向の変化を測定することで、一人称視点媒介を実現するように使用されてもよい。

様々な、ただし必ずしもすべてではない実施例によれば、装置３０は、入力回路構成４４の部位として、実際の視点の変化を判定する視点センサ４５を有する。

例えば、ユーザ１８の新たな物理的場所１３および実際の視点１４は、多数の受信機への送信、さらに／あるいは多数の送信機からの受信によるＧＰＳ、三角測量（三辺測量）のような測位技術、加速度検出と統合を利用して判定できる。

例えば、加速度計、電子ジャイロスコープ、または電子コンパスを使用して、ユーザの頭部または視点の向きの変化と、それに伴う実際の視点１４の実際の方向１５の変化を判定してもよい。

例えば、コンピュータビジョンに基づいた瞳孔追跡技術を使用して、ユーザの片目または両目の動きを追跡し、それによりユーザの視線の方向と、それに伴う実際の視点１４の実際の方向１５の変化を判定してもよい。

装置３０は、入力回路構成４４の部位として、現実空間１０を撮像する撮像素子４７を有してもよい。

撮像素子４７の例としては、カメラとして動作するように構成された、デジタル撮像素子が挙げられる。当該カメラは、静止画および／または動画を撮影するように動作してもよい。様々な、ただし必ずしもすべてではない実施形態によれば、カメラは、現実空間１０が様々な異なる視点からみられるよう、立体視またはその他空間分散配置されるように構成されてもよい。これにより、三次元画像の生成、さらに／あるいは例えば視差効果により奥行きを画定するような処理が可能となりうる。

様々な、ただし必ずしもすべてではない実施形態によれば、入力回路構成４４は奥行きセンサ４９を有する。奥行きセンサ４９は、送信機および受信機を有してもよい。送信機は、信号（例えば超音波や赤外線のような人間が感知できない信号）を送信し、受信機は反射した信号を受信する。単一の送信機と、単一の受信機を使用して、送信、受信間の飛行時間を測定することで、何らかの奥行き情報が得られる。より多くの送信機、および／またはより多くの受信機を使用して、解像度を上げることもできる（空間的多様性）。一例では、送信機は、現実空間１０を、光（好ましくは赤外線のような不可視光）で、空間依存パターンにより「塗り分け」るように構成される。受信機による所定のパターンの検出により、現実空間１０が空間的に分解できる。現実空間１０の空間的分解位置への距離は、飛行時間および／または立体視（受信機が送信機に対して立体視位置にある場合）により判定しうる。

様々な、ただし必ずしもすべてではない実施形態によれば、入力回路構成４４は、撮像素子４７および奥行きセンサ４９の１つまたは複数に加えてまたは代えて、通信回路構成４１を有してもよい。この通信回路構成４１は、現実空間１０における１つまたは複数の遠隔撮像素子４７、および／または現実空間１０における遠隔奥行きセンサ４９と通信してもよい。

図６Ａおよび６Ｂは、ユーザに仮想視覚シーン２２を少なくとも部分的に表示可能とする装置３０の例を示す。

図６Ａは、ユーザに対して画像を表示し、ユーザに対して仮想視覚シーン２２を表示するために用いられるディスプレイ３２としての表示画面を備えたハンドヘルド装置３１を示す。装置３０は、上述の６自由度のうちの１つまたは複数において、ユーザの手で故意に移動されうる。ハンドヘルド装置３１は、装置３０の向きの変化から実際の視点の変化を決定するための複数のセンサ４５を内蔵してもよい。

ハンドヘルド装置３１は、拡張現実用のビデオ視聴構成であってもよいし、そのように動作するものであってもよい。すなわち、現実視覚シーン１２の生映像または録画を、ユーザによる視聴ためのディスプレイ３２に表示可能とし、その際に１つまたは複数の視覚的要素２８が同時に、ユーザによる視聴ためのディスプレイ３２に表示されることを可能とするものである。表示された現実視覚シーン１２と表示された１つまたは複数の視覚的要素２８との組合せにより、仮想視覚シーン２２がユーザに提供される。

ハンドヘルド装置３１は、ディスプレイ３２の反対の面にカメラが装着されている場合、現実視覚シーン１２の生映像を見られるようにしつつ、１つまたは複数の視覚的要素２８をユーザに表示することで、これらの組合せにより仮想視覚シーン２２を提供することを可能とする、ビデオ視聴構成として動作してもよい。

図６Ｂは、ユーザに画像を表示するディスプレイ３２を有する頭部装着装置３３を示す。頭部装着装置３３は、ユーザの頭部の動きに合わせて、自動的に動いてもよい。頭部装着装置３３は、視線方向検出および／または選択ジェスチャ検出用のセンサ４５を内蔵してもよい。

頭部装着装置３３は、拡張現実用のシースルー構成であってもよい。すなわち、現実視覚シーン１２の生映像を見ることを可能としながら、ユーザに１つまたは複数の視覚的要素２８をディスプレイ３２により表示することで、これらの組合せにより仮想視覚シーン２２が提供されるものである。ここで、バイザー３４が存在すれば、それは透明または半透明で、現実視覚シーン１２の生映像をバイザー３４を通して見ることができる。

頭部装着装置３３は、ユーザによる視聴のためのディスプレイ３２によって１つまたは複数の視覚的要素２８を同時に表示しつつ、ユーザによる視聴のためのディスプレイ３２によって現実視覚シーン１２の生映像または録画を見られるようにする、拡張現実用のビデオ視聴構成として動作してもよい。表示された現実視覚シーン１２と表示された１つまたは複数の視覚的要素２８の組合せにより、仮想視覚シーン２２がユーザに提供される。この場合、バイザー３４は不透明で、ディスプレイ３２として利用できる。

ユーザに仮想視覚シーン２２を少なくとも部分的に表示可能とする装置３０の別の例も利用可能である。

例えば、１つまたは複数の視覚的要素を投影する１つまたは複数のプロジェクタを使用して、物理的現実世界の環境（現実空間）の現実視覚シーンを補足することにより、拡張現実を提供してもよい。

例えば、多数のプロジェクタまたはディスプレイでユーザを囲んで、完全人工環境（仮想視覚空間）を仮想視覚シーンとしてユーザに提供することで、仮想現実を提供してもよい。

再度図４を参照して、装置３０は、媒介現実、および／または拡張現実、および／または仮想現実用の、ユーザインタラクティブ媒介を可能としてもよい。ユーザ入力回路構成４４は、ユーザ入力４３によるユーザ動作を検出する。コントローラ４２はユーザ動作を使用して、仮想視覚空間２０で何が起きるかを決定する。これにより、仮想視覚空間２０内での視覚的要素２８との相互作用が実現されうる。

検出されるユーザ動作の例としては、現実空間１０内で実行されるジェスチャが挙げられる。ジェスチャは、多様な方法で検出されうる。例えば、奥行きセンサ４９を利用して、ユーザ１８の一部の動きを検出してもよいし、さらに／あるいは撮像素子４７を利用して、ユーザ１８の一部の動きを検出してもよいし、さらに／あるいはユーザ１８の腕や脚に取り付けた位置／動きセンサを使用して、当該腕や脚の動きを検出してもよい。

オブジェクト追跡を利用して、オブジェクトまたはユーザが変化したときを判定できる。例えば、オブジェクトを大きくマクロな規模で追跡すれば、オブジェクトとともに動く参照フレームを生成できる。この参照フレームを使用すれば、オブジェクトに対する時間的差分を利用して、オブジェクトの経時的形状変化を追跡できる。これは、ジェスチャ、手の動き、指の動き、および／または顔の動きのような小規模な人の動きを検出するのに利用できる。これらは、ユーザに関するシーン独立ユーザ（のみの）動きである。

装置３０は、ユーザの身体、例えばユーザの身体の１つまたは複数の関節に対して、複数のオブジェクトおよび／または点を追跡してもよい。様々な実施例において、装置３０はユーザの身体の全身骨格追跡を実行してもよい。様々な実施例において、装置３０はユーザの手指の追跡を実行してもよい。

ユーザの身体に対する１つまたは複数のオブジェクトおよび／または点の追跡を利用して、装置３０はジェスチャ認識を行ってもよい。

図７Ａを参照にすると、現実空間１０における特定のジェスチャ８０が、コントローラ４２による「ユーザ制御」イベントとして使用されるジェスチャユーザ入力となる。これにより、仮想視覚空間２０内で何が起きるかが決定される。ジェスチャユーザ入力は、装置３０にとって、ユーザ入力としての意味を持つジェスチャ８０である。

図７Ｂは、様々な、ただし必ずしもすべてではない実施例において、装置３０により現実空間におけるジェスチャ８０に対応する描写が、仮想視覚シーン２２内においてレンダリングされることを示す。この描写は、仮想視覚シーン２２において、１つまたは複数の視覚的要素２８がジェスチャ８０をなぞるまたは示すように動くこと８２を伴う。

ジェスチャ８０は静的であってもよいし、動くものであってもよい。動きジェスチャは、動き、または一連の動きを含む動きパターンを含んでもよい。例えば、円を描く動き、左右の動き、上下の動き、または空間内のサインをなぞるものであってもよい。動きジェスチャは、装置から独立したジェスチャであってもよいし、装置に依存したジェスチャであってもよい。動きジェスチャは、センサに対する、例えば１つまたは複数のユーザの体の部位またはさらなる装置のようなユーザ入力オブジェクトの動きを伴うものであってもよい。身体の部位は、ユーザの手、または１つまたは複数の指および親指のような、ユーザの手の一部を含んでもよい。別の例では、ユーザ入力オブジェクトは、頭部または腕のような、ユーザの身体の別の部位を含んでもよい。三次元の動きは、ユーザ入力オブジェクトの６自由度のうちの任意のものを含んでもよい。動きは、ユーザ入力オブジェクトがセンサに近づくまたは遠ざかることや、センサに対して平行な平面上での動き、またはそのような動きの任意の組合せを含んでもよい。

ジェスチャ８０は、非接触ジェスチャであってもよい。非接触ジェスチャとは、その最中に、センサに一切触れないものである。

ジェスチャ８０は、センサに対する絶対変位により定義される絶対ジェスチャであってもよい。そのようなジェスチャは、現実空間１０の精確な場所で実行されるという点で、限定的でありうる。あるいは、ジェスチャ８０は相対的ジェスチャでありうる。これは、ジェスチャ中の相対的変位により定義されるものである。当該ジェスチャは、現実空間１０の精確な場所で実行される必要はなく、数多くの任意の場所にて実行できるという点で、非限定的でありうる。

ジェスチャ８０は、原点に対する追跡点の変位の、経時的進行とも定義することができ、変位、速度のような時間変数パラメータ、またはその他運動パラメータを使用して、動きに関して定義されうる。非限定的ジェスチャは、相対変位Δｄの、時間Δｔに対する進行と定義されうる。

ジェスチャ８０は、一空間次元（１Ｄジェスチャ）、二空間次元（２Ｄジェスチャ）、または三空間次元（３Ｄジェスチャ）で実行されてもよい。

図８は、システム１００の例と、方法２００の例とを示す。システム１００と、方法２００とは、音響空間を記録し、録音された音響空間を処理して、録音された音響空間を、音響空間における特定の位置（原点）および向きのリスナーに対して、レンダリングされた音響シーンとしてレンダリングすることを可能とするものである。

音響空間とは、三次元空間に音源を配置したものである。音響空間は、音響の録音に関して定義されてもよいし（録音された音響空間）、音響のレンダリングに関して定義されてもよいし（レンダリングされた音響空間）。レンダリングされた音響空間は、音響オブジェクトの追加、除去、または適用により、録音された音響空間と異なっていてもよい。追加された音響オブジェクトは、例えば、スタジオで、例えばライブラリのサンプリング、音響を独立して録音、またはサウンドミキシングによりスタジオサウンドを生成することで、録音または生成されたものであってもよい。

システム１００は、１つまたは複数の可動マイク１１０を含み、１つまたは複数の固定マイク１２０を含んでもよい。

必ずしもすべてではないこの例によれば、音響空間の原点がマイクに存在する。この例では、原点に存在するマイクは固定マイク１２０であり、１つまたは複数のチャネルを録音でき、例えばマイクアレイであってもよい。ただし、原点はいかなる任意の位置にあってもよい。

この例では、単一の固定マイク１２０が示されている。しかし、別の例では、多数の固定マイク１２０が独立して使用されてもよい。

システム１００は、１つまたは複数の可動マイク１１０を含む。可動マイク１１０は、例えば、録音された音響空間内の音源と共に移動してもよい。可動マイクは、例えば、音源の近くにとどまる、「近接」マイクであってもよい。これは、例えばブームマイクを使用する、または例えばＬａｖａｌｉｅｒ小型マイクを使うなどして、マイクを音源に取り付けることで実現されうる。可動マイク１１０は、１つまたは複数の録音チャネルを録音してもよい。

原点に対する可動マイクＰＭ１１０の相対的位置は、ベクトルｚにより示されてもよい。したがって、ベクトルｚは録音された音響空間の概念的リスナーに対して、可動マイク１１０を位置決めするものである。

原点における概念的リスナーの相対的向きは、値Δで示されてもよい。向き値Δは、音響シーンを定義する、概念的リスナーの「視点」を定義する。音響シーンは、音響空間内の特定の視点で聴いた音響空間を表すものである。

図１のシステム１００により、録音された音響空間がユーザ（リスナー）にレンダリングされる場合、当該空間は、リスナーが録音された音響空間の原点に位置し、特定の向きを向いているものとして、リスナーにレンダリングされる。したがって、可動マイク１１０が録音された音響空間内で移動する場合、その録音された音響空間の原点に対する位置ｚが追跡され、レンダリングされた音響空間において正しく描写されることが重要である。システム１００は、これを実現するように構成される。

固定マイク１２０から出力された音響信号１２２は、音響コーダ１３０により、マルチチャンネル音響信号１３２に符号化される。複数の固定マイクが存在する場合、それぞれの出力が音響コーダにより個別にマルチチャンネル音響信号に符号化される。

音響コーダ１３０は、マルチチャンネル音響信号１３２が固定マイク１２０により録音された音響空間を示し、空間的音響効果を提供するようにレンダリングできるように、空間音響コーダであってもよい。例えば、音響コーダ１３０は、バイノーラルコーディング、５．１サラウンドサウンドコーディング、７．１サラウンドサウンドコーディングなどの、既存の標準に応じてマルチチャンネル音響信号１３２を生成するように構成されてもよい。複数の固定マイクが存在する場合、各固定マイクのマルチチャンネル信号が、同じ既存の標準（バイノーラルコーディング、５．１サラウンドサウンドコーディング、７．１サラウンドサウンドコーディングなど）に応じて、同一の、共通なレンダリングされた音響空間に対して生成される。

１つまたは複数の固定マイク１２０からのマルチチャンネル音響信号１３２は、ミキサー１０２により、１つまたは複数の可動マイク１１０からのマルチチャンネル音響信号１４２とミキシングされ、マルチマイクマルチチャンネル音響信号１０３が生成される。この信号は、原点に対する録音された音響シーンを示し、録音された音響シーンに対応するリスナーが原点にいる際に、当該リスナーにレンダリングされた音響シーンを再生するように、音響コーダ１３０に対応するオーディオデコーダによりレンダリングされる。

可動マイク１１０から、またそのそれぞれからのマルチチャンネル音響信号１４２は、ミキシング前に処理されて、原点における固定マイク１２０に対する可動マイク１１０のあらゆる動きが考慮される。

可動マイク１１０からの音響信号１１２は、位置決めブロック１４０により処理されて、原点に対する可動マイク１１０の動きが調整される。位置決めブロック１４０には、ベクトルｚ、またはベクトルｚに依存する１つまたは複数のパラメータが入力される。ベクトルｚは、原点に対する可動マイク１１０の相対的位置を表す。

位置決めブロック１４０は、可動マイク１１０により録音された音響信号１１２と、固定マイク１２０により録音された音響信号１２２との間のあらゆる時間的ずれを調整するように構成されてもよい。これにより、これら信号が共通時間参照フレームを共有する。これは、例えば、自然発生した、または人工的に導入された、可動マイク１１０からの音響信号１１２内に存在する（非可聴）音響信号と、固定マイク１２０からの音響信号１２２内のものとの相関を取ることで実現されうる。当該相関により特定されたあらゆる時間のずれは、可動マイク１１０からの音響信号１１２を、位置決めブロック１４０により処理前に遅らせる／進めるために使用されうる。

位置決めブロック１４０は、可動マイク１１０からの音響信号１１２を、当該可動マイク１１０の、固定マイク１２０が存在する原点に対する相対的向き（Ａｒｇ（ｚ））を考慮して処理する。

マルチチャンネル音響信号１３２を生成するための、固定マイク音響信号１２２のオーディオコーディングは、録音された音響空間の向きに対するレンダリングされた音響空間の特定の向きを想定したもので、音響信号１２２は、それに応じてマルチチャンネル音響信号１３２に符号化される。

録音された音響空間における可動マイク１１０の相対的向きＡｒｇ（ｚ）が決定され、音響オブジェクトを示す音響信号１１２がオーディオコーディング１３０により定義されるマルチチャンネルに符号化される。これにより、レンダリングされた音響空間内で、音響オブジェクトがリスナーからの相対的向きＡｒｇ（ｚ）に正しく配向されるようになる。例えば、音響信号１１２はまず、ミキシング、符号化されて、マルチチャンネル信号１４２となり、その後変形Ｔにより、音響オブジェクトの移動を示すマルチチャンネル音響信号１４２をＡｒｇ（ｚ）だけ、対応する複数のチャンネルにより定義された空間内で回転してもよい。

配向ブロック１５０を利用して、必要に応じてΔだけマルチチャンネル音響信号１４２を回転してもよい。同様に、配向ブロック１５０を利用して、必要に応じてΔだけマルチチャンネル音響信号１３２を回転してもよい。

配向ブロック１５０の機能は、位置決めブロック１４０の配向機能に非常に類似しているが、回転量はＡｒｇ（ｚ）ではなくΔとなる。

状況によっては、例えばバイノーラルオーディオコーディングを利用するヘッドフォンのような頭部装着音響出力装置３００を介してリスナーに対して音響シーンがレンダリングされる場合、リスナーがその頭部３３０を空間内で回しても、空間３２０内にレンダリングされた音響空間３１０がとどまることが好ましくありうる。そのためには、頭部の回転に対して反対側に、同じ分だけ音響出力装置３００に対してレンダリングされた音響空間３１０を回転させる必要がある。レンダリングされた音響空間３１０の向きは、リスナーの頭部の回転を追跡する。したがって、レンダリングされた音響空間３１０の向きが、リスナーの頭部３３０とともに動くのではなく、空間３２０内に固定された状態でとどまる。

可動マイク信号１１２をさらに処理して、レンダリングされた音響シーンにおいてリスナーから音響オブジェクトへの距離Ｄの感覚を制御する。例えば、録音された音響空間における、原点から音響オブジェクトへの距離｜ｚ｜に一致するように制御される。これは、例えばバイノーラルコーディングが使用されて、音響オブジェクトがユーザの外部にあり、ユーザの耳の間のユーザの頭部内ではなく、離れているような場合に有効となりうる。距離ブロック１６０は、距離の感覚を修正するようにマルチチャンネル音響信号１４２を処理する。

図９は、例えば、方法２００、および／または図８の位置決めブロック１４０、配向ブロック１５０、距離ブロック１６０の機能を実行するために使用されうるモジュール１７０を示す。モジュール１７０は、回路構成および／またはプログラムされたプロセッサを使用して実現されうる。

マルチマイクマルチチャンネル音響信号１０３を形成するように、マルチチャンネル音響信号１３２とミキシングされる前の、マルチチャンネル音響信号１４２の単一チャンネルの処理が図示されている。マルチチャンネル信号１４２の単一入力チャンネルは、信号１８７として入力される。

入力信号１８７は、「直接」経路と、１つまたは複数の「間接」経路とを平行に通過して、それら経路からの出力がミキサー１９６によりマルチチャンネル信号としてミキシングされて、出力マルチチャンネル信号１９７が生成される。各入力チャンネルについての出力マルチチャンネル信号１９７がミキシングされて、マルチチャンネル音響信号１４２が形成され、これがマルチチャンネル音響信号１３２とミキシングされる。

直接経路は、リスナーにとって、音源から直接受信したように捉えられる音響信号を示し、間接経路は、リスナーにとって、音源から、多経路、反射経路、または屈折経路などの間接経路を介して受信したように捉えられる音響信号を示す。

距離ブロック１６０は、直接経路と間接経路との間の相対利得を修正することで、レンダリングされた音響空間３１０におけるリスナーから音響オブジェクトへの距離Ｄの感覚を変化させる。

平行経路はそれぞれ、距離ブロック１６０により制御される可変利得装置１８１、１９１を有する。

距離の感覚は、直接および間接（非相関）経路間の相対利得を制御することで制御できる。間接経路利得を、直接経路利得に対して増やすと、距離の感覚も増える。

直接経路では、入力信号１８７は距離ブロック１６０の制御の下、可変利得装置１８１により増幅され、利得調整信号１８３が生成される。利得調整信号１８３は、直接処理モジュール１８２により処理されて、直接マルチチャンネル音響信号１８５が生成される。

間接経路では、入力信号１８７は距離ブロック１６０の制御の下、可変利得装置１９１により増幅され、利得調整信号１９３が生成される。利得調整信号１９３は、間接処理モジュール１９２により処理されて、間接マルチチャンネル音響信号１９５が生成される。

直接マルチチャンネル音響信号１８５と、１つまたは複数の間接マルチチャンネル音響信号１９５とが、ミキサー１９６によりミキシングされ、出力マルチチャンネル音響信号１９７が生成される。

直接処理ブロック１８２と、間接処理ブロック１９２とは両方、到来方向信号１８８を受信する。到来方向信号１８８により、録音された音響空間における可動マイク１１０（可動音響オブジェクト）の向きＡｒｇ（ｚ）と、概念的リスナー／音響出力装置３００に対するレンダリングされた音響空間３１０の向きΔとが与えられる。

録音された音響空間内で可動マイク１１０が動くと、可動音響オブジェクトの位置が変化し、音響空間をレンダリングする頭部装着音響出力装置が回転すると、レンダリングされた音響空間の向きが変化する。

例えば、直接処理ブロック１８２は、適切なマルチチャンネル空間における、単一のチャンネル音響信号、利得調整入力信号１８３を回転して、直接マルチチャンネル音響信号１８５を生成するシステム１８４を有する。システムは、到来方向信号１８８により定義されたＡｒｇ（ｚ）およびΔだけ、マルチチャンネル信号を、対応する複数のチャンネルについて定義された空間内で、回転する変換Ｔを実行するために伝達関数を利用する。例えば、頭部伝達関数（ＨＲＴＦ）補間器を、バイノーラル音響に使用してもよい。別の例では、ラウドスピーカ（例えば５．１）オーディオ用にベクトル・ベースのアンプリチュード・パンニング（ＶＢＡＰ）が用いられてもよい。

間接処理ブロック１９２は、例えば、可変利得装置１９４を使用して、単一のチャンネル音響信号、利得調整入力信号１９３の利得を制御するために、到来方向信号１８８を使用してもよい。増幅された信号は次に、固定相関除去部１９６と、固定変換Ｔを使用して処理されて、間接マルチチャンネル音響信号１９５が生成される。本例での固定相関除去部は、少なくとも２ｍｓの事前遅延を利用する。変換Ｔにより、マルチチャンネル信号が対応する多数のチャンネルに対して定義された空間内で回転される。これは直接系と同様にして実行されるが、固定量で行われる。例えば、固定頭部伝達関数（ＨＲＴＦ）補間器を、バイノーラル音響に使用してもよい。

したがって、モジュール１７０が可動マイク信号１１２の処理および次の機能の実行に使用可能であることが理解されよう。
（ｉ）レンダリングされた音響空間における、リスナーからの音響オブジェクトの相対的位置（向きＡｒｇ（ｚ）および／または距離｜ｚ｜）を変化させる
（ｉｉ）レンダリングされた音響空間（（ｉ）による音響オブジェクト位置）の向きを変化させる

また、モジュール１７０はさらに、固定マイク１２０により提供された音響信号１２２を処理するにあたって、配向ブロック１５０のみの機能を実行するために使用されうる。ただし、到来方向信号はΔのみを含み、Ａｒｇ（ｚ）を含まない。様々な、ただし必ずしもすべてではない実施例によれば、間接経路に対する利得を修正する可変利得装置１９１の利得をゼロにし、直接経路に対する可変利得装置１８１の利得を固定としてもよい。この場合、モジュール１７０は、Δのみを含み、Ａｒｇ（ｚ）を含まない到来方向信号に応じてレンダリングされた音響空間を生成するように録音された音響空間を回転するシステムにまで省略される。

図１０は、装置４００を使用して実現されるシステム１００の例を示す。装置４００は例えば、固定電子装置、可搬性電子装置、またはユーザの掌または上着のポケットに収まるサイズの携帯電子装置であってもよい。

この例では、装置４００は、一体的マイクとして固定マイク１２０を有し、距離を置いて設けられる１つまたは複数の可動マイク１１０を有さない。必ずしもすべてではないこの例では、固定マイク１２０はマイクアレイである。別の例では、装置４００は固定マイク１２０を有さない。

装置４００は、例えば、（１つまたは複数の）遠隔可動マイク１１０のような外部マイクと外部通信するための外部通信インタフェース４０２を有する。これは、例えば無線送受信機であってもよい。

測位システム４５０は、システム１００の一部として示されている。測位システム４５０は、音響空間の原点、例えば固定マイク１２０に対する（１つまたは複数の）可動マイク１１０の測位に使用される。この例では、測位システム４５０は可動マイク１１０および装置４００の両方の外部に存在するものとして示されている。これは、音響空間の原点に対する可動マイク１１０の位置ｚに依存した情報を装置４００に提供する。この例では、当該情報は外部通信インタフェース４０２を介して提供されるが、別の例では、別のインタフェースが使用されてもよい。また、別の例では、測位システムは全体的または部分的に可動マイク１１０および／または装置４００内に位置してもよい。

位置システム４５０は、特定の周波数により、可動マイク１１０の位置更新を提供する。音響オブジェクトの「正確」および「不正確」な測位という表現は、位置更新の周波数による制約下での正確、不正確であることが理解されよう。すなわち、正確、不正確とは、絶対的表現というよりも相対的表現である。

位置システム４５０は、可動マイク１１０の位置を判定可能とする。位置システム４５０は、測位信号を受信し、位置を判定し、プロセッサ４１２に提供するか、プロセッサ４１２が可動マイク１１０の位置を判定できるように、測位信号に応じた測位信号またはデータを提供してもよい。

位置システム４５０が、オブジェクトを測位するために使用できる数多くの異なる技術が存在する。当該技術としては、測位オブジェクトが受動的で、測位信号を生成しない、受動的システムと、測位オブジェクトが１つまたは複数の測位信号を生成する、能動的システムとを含む。Ｋｉｎｅｃｔ（商標）デバイスで用いられるシステムの一例としては、赤外線によりオブジェクトがシンボルの不均一パターンで塗り分けられ、その反射光が複数のカメラを用いて測定、処理され、視差効果を用いることで、オブジェクトの位置を決定する場合が挙げられる。能動的な無線測位システムの例は、オブジェクトが送信機を有し、それが無線測位信号を複数の受信機に送信することで、オブジェクトが例えば三辺測量または三角測量により測位可能とする場合が挙げられる。受動的無線測位システムの例としては、オブジェクトが受信機を有し、それが無線測位信号を複数の送信機から受信することで、オブジェクトが例えば三辺測量または三角測量により測位可能とする場合が挙げられる。三辺測量では、既知の位置にある複数の、非整列な送信機／受信機からの、オブジェクトの距離を推測することが求められる。距離は、例えば飛行時間または信号減衰を利用して推測できる。三角測量では、既知の位置にある複数の、非整列な送信機／受信機からの、オブジェクトの方角を推測することが求められる。方角は、例えば、可変狭開口から送信を行う送信機と、可変狭開口から受信を行う受信機を使用するか、ダイバーシティ受信機で位相差を検出することで推測できる。

別の測位システムは、推測航法および慣性運動または磁気測位を利用してもよい。

測位対象オブジェクトは、可動マイク１１０であってもよいし、または可動マイク１１０に対応付けられた人が装着または携帯するオブジェクトであってもよいし、または可動マイク１１０に対応付けられた人そのものであってもよい。

装置４００は、全体的または部分的に上述のシステム１００および方法２００を動作して、マルチマイクマルチチャンネル音響信号１０３を生成する。

装置４００は、出力通信インタフェース４０４を介してマルチマイクマルチチャンネル音響信号１０３を、レンダリングのために音響出力装置３００に提供する。

様々な、ただし必ずしもすべてではない実施例によれば、音響出力装置３００はバイノーラルコーディングを利用してもよい。さらに／あるいは、様々な、ただし必ずしもすべてではない実施例によれば、音響出力装置３００は頭部装着音響出力装置であってもよい。

この例では、装置４００は、固定マイク１２０、可動マイク１１０、測位システム４５０が提供する信号を処理するように構成されたコントローラ４１０を備える。いくつかの例では、コントローラ４１０は、マイク１１０、１２０から受信された信号のアナログ−デジタル変換を行うことが求められ、さらに／あるいはマイク１１０、１２０および音響出力装置３００の機能によっては音響出力装置３００への信号のデジタル−アナログ変換を行うことが求められうる。しかし、図を見やすくするために、図９ではコンバータは示されていない。

コントローラ４１０の実装は、コントローラ回路構成としてなされてもよい。コントローラ４１０は、ハードウェアのみとして実装されてもよく、特定の側面をファームウェアのみを含めソフトウェアとして有してもよく、またはハードウェアとソフトウェア（ファームウェアを含む）との組合せとすることもできる。

図１０に示されているとおり、コントローラ４１０は、ハードウェアの機能性を使用可能にする命令を使用して実装されてもよい。例えばコントローラ４１０は、汎用または専用プロセッサ４１２においてコンピュータプログラム４１６の実行可能な命令を使用して実装されてもよい。これらの命令は、そのようなプロセッサ４１２により実行されるよう、コンピュータ可読記憶媒体（ディスク、メモリなど）に記憶されてもよい。

プロセッサ４１２は、メモリ４１４に対し読取りおよび書込みを行うように構成される。プロセッサ４１２は、出力インタフェースと入力インタフェースを備えてもよい。データおよび／またはコマンドは、プロセッサ４１２によって出力インタフェースを介して出力され、入力インタフェースを介してプロセッサ４１２に入力される。

メモリ４１４は、プロセッサ４１２にロードされると装置４００の動作を制御するコンピュータプログラム命令（コンピュータプログラムコード）を備えるコンピュータプログラム４１６を記憶する。コンピュータプログラム４１６のコンピュータプログラム命令は、装置が図１から図１２に示されている方法を実行できるようにするロジックおよびルーチンを提供する。プロセッサ４１２は、メモリ４１４を読み取ることによってコンピュータプログラム４１６をロードし実行することができる。

図８および９に示すブロックは、方法のステップおよび／またはコンピュータプログラム４１６のコードのセクションを表現しうる。示されたブロックの特定の順序は、それらのブロックに対して必要な順序または好ましい順序が存在することを必ずしも意味するものではなく、ブロックの順序および配置は変更されてもよい。さらに、いくつかのブロックを省略することも可能である。

図１から７を参照した先行する記載では、仮想視覚空間２０と、仮想視覚空間２０に依存した仮想視覚シーン２６の制御を可能とするシステム、装置３０、方法６０、コンピュータプログラム４８が説明されている。

図８から１０を参照した先行する記載では、音響空間と、音響空間に依存した音響シーンの制御を可能とするシステム１００、装置４００、方法２００、コンピュータプログラム４１６が説明されている。

様々な、ただし必ずしもすべてではない実施例によれば、仮想視覚空間２０と音響空間とは対応していてもよい。「対応」または「対応する」は、音響空間や仮想視覚空間と関連して用いられる場合、音響空間と仮想視覚空間との時間および空間が一致している、すなわちそれらが同じ時間の同じ空間にあることを意味する。

仮想視覚空間と音響空間との対応により、仮想視覚シーンと音響シーンとが対応する。「対応」または「対応する」は、音響シーンや仮想視覚シーンと関連して用いられる場合、音響空間と仮想視覚空間とが対応しており、音響シーンを定める視点を有する概念的リスナーと、仮想視覚シーンを定める視点を有する概念的ビューアとが、同じ位置に同じ向きでおり、すなわち当該リスナーと当該ビューアの視点は同じであることを意味する。

以下の図１１から１６を参照した記載では、ユーザの過去の動作に基づいて、音響オブジェクトを制御可能にする方法５００が説明される。方法５００は、上述のシステム、上述の装置、および／または上述のコンピュータプログラムにより実行されうる。

図１１は、音響オブジェクトのレンダリングを制御する方法５００の例を示す。

方法のブロック５０２において、レンダリングされた仮想空間内の音響オブジェクトが音響オブジェクトの第１群（ブロック５０４）または音響オブジェクトの第２群（ブロック５１４）に分類される。分類は、ユーザの仮想空間内での記録された動作に応じて実行される。

ブロック５０６において、第１群に分類された１つまたは複数の音響オブジェクトは、仮想空間内で少なくとも第１の規則に応じてレンダリングされる。

ブロック５１６において、第２群に分類された１つまたは複数の音響オブジェクトは、少なくとも第２の規則と、仮想空間内のユーザの現在位置とに応じてレンダリングされる。

ユーザの記録された動作は、現在ではなく過去に行われた動作である。したがって、音響オブジェクトの分類は「記憶効果」、すなわち過去に起きたことに基づく。ユーザの記録された動作に応じて分類が可能となるように、ユーザの過去の動作を記録するため、データを記憶してもよい。

ユーザの記録された動作に応じた分類による「記憶効果」により、仮想空間内のユーザの記録された動作に応じて、少なくともいくつかの音響オブジェクト（第１群および／または第２群）のレンダリングが実現される。すなわち、記憶効果は仮想空間内の動作に基づく。

ただし、レンダリングはユーザの記録された動作に応じた音響オブジェクトの分類のみに依存するものではない。レンダリングはさらに、仮想空間内のユーザの現在位置にも依存する。したがって、レンダリングには、仮想空間内のユーザの位置に基づいた、リアルタイム動的側面が存在する。

これにより、仮想空間内の別々の場所に配置された音響オブジェクトを含むレンダリングされた音響シーンが、その時点での仮想空間内のユーザ（リスナー）の位置に依存する（リアルタイム効果）のみではなく、仮想空間内のユーザの記録された動作にも依存する（記憶効果）、仮想空間および空間記憶効果が実現される。したがって、仮想空間内でのユーザの動作が、仮想空間内のユーザのリアルタイム位置に基づくレンダリングによるリアルタイム効果と、仮想空間内でのユーザの記録された動作に依存した差分レンダリングに基づくレンダリングによる記憶効果とを備える。

方法５００は、例えば第２群に属する１つまたは複数の音響オブジェクトに対する、第１群に属する１つまたは複数の音響オブジェクトのユーザによる認知を向上するために利用されうる。この例では、第１の規則と、第２の規則との間の差分が、レンダリングされる音響オブジェクトの差分に帰結する。

さらに／あるいは、方法５００は、例えば記録された第１群に属する１つまたは複数の音響オブジェクトに対する、レンダリングされた第１群に属する１つまたは複数の音響オブジェクトのユーザによる認知を向上するために利用されうる。この例では、第１の規則により、記録された音響オブジェクトが修正される。

少なくともいくつかの例において、第１群に属する音響オブジェクトのレンダリングは、音響オブジェクトをレンダリングする際に、記録された音響オブジェクトの少なくとも１つの特性を適用することを含む。

第１の規則と、第２の規則との間の差分により、第１群に属する１つまたは複数の音響オブジェクトと、第２群に属する１つまたは複数の音響オブジェクトとの間の１つまたは複数の特性値の相対的なずれが生じる。

音響オブジェクト特性の例としては、以下のものが挙げられるが、必ずしもこれらに限定されない。
音響オブジェクトの周波数（ピッチ）である、周波数特性
音響オブジェクトの強さ（単位面積当たりのパワー）である強さ特性
反射／残響量などの環境特性
仮想空間内の音響オブジェクトの位置である位置特性

例えば、音響オブジェクトの周波数特性の変化により、レンダリングされた音響オブジェクトが、記録された音響オブジェクトとは異なる臨界帯域に含まれうる。この周波数多様性により、ユーザの第１群に属する音響オブジェクトを聴く能力を向上し、第２群に属する音響オブジェクトを聴く能力を抑制しうる。

例えば、音響オブジェクトの強さ特性の変化により、第１群に属する音響オブジェクトの音の大きさを、その音響オブジェクトが録音された状態よりも人工的に大きく、または第２群に属する音響オブジェクトの音の大きさを、その音響オブジェクトが録音された状態よりも人工的に小さくしうる。これにより、ユーザの第１群に属する音響オブジェクトを聴く能力を向上し、第２群に属する音響オブジェクトを聴く能力を抑制しうる。

音響オブジェクトの環境特性の変化により、例えば、残響（直接経路に対する間接経路の利得）を増加または低減しうる。これにより、ユーザの第１群に属する音響オブジェクトを聴く能力を向上し、第２群に属する音響オブジェクトを聴く能力を抑制しうる。

音響オブジェクトの位置特性の変化により、例えば、仮想空間内での音響オブジェクトの位置が変更されうる。これにより、ユーザの第１群に属する音響オブジェクトを聴く能力を向上し（例えば、他の音響オブジェクトから空間的に離す、またはユーザに近づけることによる）、第２群に属する音響オブジェクトを聴く能力を抑制しうる。

様々な、ただし必ずしもすべてではない実施例によれば、第２の規則に応じて第２群に属する音響オブジェクトをレンダリングすることで、録音された音響オブジェクトの特性が、第２群に属する音響オブジェクトがレンダリングされる際に適用せずに利用される。

図１２Ａから１２Ｆは、方法５００の例示的な適用を示す。

上述のように、音響オブジェクト６２０のレンダリングは、ユーザ６３０（概念的リスナー）に対する音響オブジェクト６２０の位置に依存する。音響オブジェクト６２０が固定されている場合、音響オブジェクト６２０のレンダリングは、録音された音響オブジェクトの特性と、ユーザ６３０の位置に依存する。音響オブジェクト６２０が動く場合、音響オブジェクト６２０のレンダリングは、録音された音響オブジェクト６２０の特性と、ユーザ６３０の位置と、音響オブジェクト６２０の位置とに依存する。以下の例では、ユーザ６３０が固定された音響オブジェクト６２０に対して動くものと仮定される。ただし、これは単に方法５００の適用を説明しやすくするためのものである。別の例では、方法５００は、単純な範囲で動くすべてまたは一部の音響オブジェクト６２０に適用されてもよい。

二次元仮想空間６００が図示されているが、方法５００は、三次元空間を含むあらゆる仮想空間６００に適用できる。

図１２Ａから１２Ｆの例では、仮想空間６００は、音響空間６１０のみであってもよいし、対応する仮想視覚空間２０と、音響空間６１０との合成仮想空間であってもよい。以下の説明では、仮想空間６００は合成仮想空間である仮定する。いくつかの例では、仮想視覚空間２０内で、音響オブジェクト６２０は、仮想オブジェクト２１、例えばコンピュータにより生成された仮想オブジェクト２８により描写されてもよい。

図１２Ａは、非修正仮想空間６００（音響空間６１０）Ｖ内の、異なる様々な位置Ｐに配置された異なる様々な複数の音響オブジェクト６２０を示す。ユーザ６３０は、仮想空間６１０内を移動可能である。ユーザ６１０は、概念的リスナーの位置Ｐを示す。

方法５００の動作がなければ、仮想空間６００内のユーザ６３０の現在位置に応じて、音響オブジェクト６２０がレンダリングされる。各音響オブジェクト６２０は、ユーザが位置Ｐを変えると変化する、ユーザ６３０の相対位置を有する。音響オブジェクト６２０は、正しい相対的位置から、ユーザ６３０に対してレンダリングされる。したがって、ユーザ６３０に対してレンダリングされた音響空間６１０は、記録された音響空間６１０と等しくなる。

図１２Ａから１２Ｆの例では、説明をしやすくするため、すべての音響オブジェクト６２０が、記録されたとおりにレンダリングされるような初期状態にあるものと仮定する。方法５００は、音響オブジェクト６２０の少なくとも一部の状態を変えて、記録されたとおりにはレンダリングされないようにする。記録されたとおりにはレンダリングされない音響オブジェクト６２０は、音響オブジェクトの第１群に分類され、記録されたとおりにレンダリングされる音響オブジェクトは、音響オブジェクトの第２群に分類される。

図１２Ａにおいて、ユーザ６３０は、音響オブジェクト６２０_１に対して仮想空間６００内で「起動」動作を実行する。この起動動作は、音響オブジェクト６２０_１の状態変化を生じさせ、その第２群から第１群への再分類を生じさせるのに足るものである。

図１２Ｂにおいて、音響オブジェクト６２０_１は、第１群に属する音響オブジェクトとして、標示６２２により示されている。この標示６２２は、コンピュータが生成した仮想オブジェクト２８であってもよい。ただし、別の例では、標示６２２は使用されない。

図１２Ｂは、図１２Ａの仮想空間６００の時間が経過した状態を示す。ユーザ６３０は、音響オブジェクト６２０_１から離れるように動いている。

この方法は、レンダリングされた仮想空間内の音響オブジェクトを、音響オブジェクトの第１群（音響オブジェクト６２０_１）、または音響オブジェクトの第２群（その他の音響オブジェクト６２０）に分類する。この分類は、仮想空間６００内での、ユーザ６３０の記録された動作（図１２Ａにおいて過去に実行されていた起動動作）に依存する。

第２群に分類された音響オブジェクト６２０は、少なくとも第２の規則と、仮想空間内でのユーザの現在位置に応じてレンダリングされる。これらの音響オブジェクトは、録音された音響空間を正確に再生するように、記録されたとおりにレンダリングされてもよい。

第１群に分類された音響オブジェクト６２０_１は、仮想空間内で第１の規則に応じてレンダリングされる。

第１の規則は、１つまたは複数の規則により定義されてもよい。第２の規則は、１つまたは複数の規則により定義されてもよい。様々な、ただし必ずしもすべてではない実施例によれば、ユーザは第１の規則の少なくとも一部をプログラムできる。様々な、ただし必ずしもすべてではない実施例によれば、ユーザは第２の規則の少なくとも一部をプログラムできる。

第１の規則は、第１群に属する音響オブジェクト６２０_１に対するユーザの認知を向上するために利用できる。これは、例えば、第１群に属する音響オブジェクト６２０_１を同様の位置／距離である同様の第２群に属する音響オブジェクトに対して、より聴きやすくしうる。また、例えば、第１群に属する音響オブジェクト６２０_１を第２群に属する同じ音響オブジェクトに対して、より聴きやすくしうる。

第１の規則は、例えば、仮想空間６１０内においてユーザ６３０が第１群に属する音響オブジェクト６２０_１から離れても、第１群に属する音響オブジェクト６２０_１に対する認知維持を実現するものであってもよい。第１群に属する音響オブジェクト６２０_１の「聴取性」が、物理法則によりなるべきレベルよりも高くなり、なるべきレベルに対して人工的に維持されるのである。これにより、ユーザ６３０は仮想空間６００を動き回っても、第１群に属する音響オブジェクト６２０_１を聴くことができる。

様々な、ただし必ずしもすべてではない実施例によれば、第１群に属する音響オブジェクト６２０_１は、仮想空間６００内の少なくとも第１の規則と、ユーザの現在位置とに応じてレンダリングされる。これらの例において、第１群に属する音響オブジェクト６２０_１のレンダリングは、ユーザ６３０の現在の（リアルタイム）位置に応じてユーザインタラクティブとなる。

すべての例ではないが、ある例において、１つまたは複数の音響オブジェクト６２０にはそれぞれ、ユーザ６３０への音響オブジェクト６２０の相対的距離Ｄに基づいた、分類に応じたレンダリングがされる。例えば、第２群に属する音響オブジェクトは、物理的現実を伴ってレンダリングされ、ユーザ６３０への音響オブジェクトの相対的距離Ｄに対して、逆二乗則関係となる強さによりレンダリングされる（Ｉ＝ｋ_１Ｄ^−２）。一方で、第１群に属する音響オブジェクトは、物理的現実を伴わずにレンダリングされ、ユーザ６３０への音響オブジェクトの相対的距離Ｄに対して異なる関係となる強さによりレンダリングされる（例えば、Ｉ＝ｋ_２Ｄ^−ｎであって、０≦ｎ＜２、例えばｎ＝１または１／２となる）。第１群に属する音響オブジェクトは、音響オブジェクトとユーザの現在のリアルタイム相対的位置の変化に対する依存性がより低い。

したがって、第１の規則は、レンダリングされた音響オブジェクト６２０の強さの変化と、仮想空間６００における音響オブジェクトとユーザ６３０との間の距離Ｄの変化との間に、第１の関係を定義できる。第２の規則は、レンダリングされた音響オブジェクト６２０の強さの変化と、仮想空間６００における音響オブジェクトとユーザ６３０との間の距離Ｄの変化との間に、異なる第２の関係を定義できる。

図１２Ｃは、図１２Ｂの仮想空間６００の時間が経過した状態を示す。ユーザ６３０は、音響オブジェクト６２０_１からさらに離れ、異なる音響オブジェクト６２０_２に近付くように動いている。

ユーザは、第２群に属する異なる音響オブジェクト６２０_２の隣にいるため、ユーザ６３０には音響オブジェクト６２０_２が明確に聴こえる。ユーザ６３０は、第２群に属するその他の音響オブジェクト６２０および第１群に属する音響オブジェクト６２０_１から離れている。ただし、第１群に属する音響オブジェクト６２０_１は第１の規則に応じてレンダリングされ、第２群に属するその他の音響オブジェクト６２０は第２の規則に応じてレンダリングされる。これにより、第１群に属する音響オブジェクト６２０_１をユーザが聴く能力が向上する。したがって、ユーザは、近くの音響オブジェクト６２０_２と、離れている第１群に属する音響オブジェクト６２０_１とを同時に聴くことができる。

方法５００により、仮想空間内のユーザ６３０は、超人間的、または聴力補助が与えられるため、実際には聴こえなくなる、または聴こえにくくなるはずの状況でも、第１群に属する音響オブジェクト６２０_１を聴くことができるようになる。

図１２Ｃにおいて、ユーザ６３０は、音響オブジェクト６２０_２に対して仮想空間６００内での「起動」動作を実行する。この起動動作は、音響オブジェクト６２０_２の状態変化を生じさせ、その第２群から第１群への再分類を生じさせるのに足るものである。

図１２Ｄにおいて、音響オブジェクト６２０_２は、第１群に属する音響オブジェクトとして、標示６２２により示されている。この標示は、コンピュータが生成した仮想オブジェクト２８であってもよい。ただし、別の例では、標示６２２は使用されない。

図１２Ｄは、図１２Ｃの仮想空間６００の時間が経過した状態を示す。ユーザ６３０は、音響オブジェクト６２０_２から離れるように動いている。

方法は、レンダリングされた仮想空間６００内の音響オブジェクトを、音響オブジェクトの第１群（音響オブジェクト６２０_１、６２０_２）、または音響オブジェクトの第２群（その他の音響オブジェクト６２０）に分類する。この分類は、仮想空間内での、ユーザの記録された動作（図１２Ａおよび図１２Ｃにおいて過去に実行されていた起動動作）に依存する。

第２群に分類された音響オブジェクト６２０は、少なくとも第２の規則と、仮想空間６００内でのユーザ６３０の現在位置に応じてレンダリングされる。これら音響オブジェクトは、録音された音響空間を正確に再生するように、記録されたとおりにレンダリングされてもよい。

第１群に分類された音響オブジェクト６２０_１、６２０_２は、仮想空間６００内で第１の規則に応じてレンダリングされる。

様々な、ただし必ずしもすべてではない実施例によれば、ユーザは、第１群に属する異なる音響オブジェクト６２０_１、６２０_２に対して少なくとも部分的に異なる第１の規則をプログラムできる。別の例では、ユーザによって部分的にプログラムされたものであってもそうでなくてもよい同一の第１の規則が、第１群に属するすべての音響オブジェクト６２０_１、６２０_２に対して用いられる。

第１の規則は、図１２Ｂを参照して先に述べたように、第１群に属する音響オブジェクト６２０_１、６２０_２に対するユーザの認知を向上するために利用できる。これは、例えば、第１群に属する音響オブジェクト６２０_１、６２０_２を同様の位置／距離である同様の第２群に属する音響オブジェクトに対して、より聴きやすくしうる。また、例えば、第１群に属する音響オブジェクト６２０_１、６２０_２を第２群に属する同じ音響オブジェクトに対して、より聴きやすくしうる。

第２の規則は、例えば、仮想空間６００内においてユーザ６３０が第１群に属する音響オブジェクト６２０_１、６２０_２から離れても、第１群に属する音響オブジェクト６２０_１、６２０_２に対する認知維持を実現するものであってもよい。第１群に属する音響オブジェクト６２０_１、６２０_２の「聴取性」が、物理法則によりなるべきレベルよりも高くなり、なるべきレベルに対して人工的に維持されるのである。これにより、ユーザ６３０は仮想空間６００を動き回っても、第１群に属する音響オブジェクト６２０_１、６２０_２を聴くことができる。

様々な、ただし必ずしもすべてではない実施例によれば、図１２Ｂを参照して先に述べたように、第１群に属する音響オブジェクト６２０_１、６２０_２は、仮想空間内の少なくとも第１の規則と、ユーザの現在位置とに応じてレンダリングされる。

図１２Ｅは、図１２Ｄの仮想空間６００の時間が経過した状態を示す。ユーザ６３０は、音響オブジェクト６２０_２からさらに離れ、異なる音響オブジェクト６２０_３に近付くように動いている。

ユーザは、第２群に属する異なる音響オブジェクト６２０_３の隣にいるため、ユーザ６３０には音響オブジェクト６２０_３が明確に聴こえる。ユーザ６３０は、第２群に属するその他の音響オブジェクト６２０および第１群に属する音響オブジェクト６２０_２から離れている。ユーザは、第１群に属する音響オブジェクト６２０_１から遠く離れている。ただし、第１群に属する音響オブジェクト６２０_１、６２０_２は第１の規則に応じてレンダリングされ、第２群に属するその他の音響オブジェクト６２０は第２の規則に応じてレンダリングされる。これにより、第１群に属する音響オブジェクト６２０_１、６２０_２をユーザが聴く能力が向上する。したがって、ユーザは、近くの音響オブジェクト６２０_３と、離れている第１群に属する音響オブジェクト６２０_２と、遠く離れている第１群に属する音響オブジェクト６２０_１とを同時に聴くことができる。

方法５００により、仮想空間６００内のユーザ６３０は、超人間的、または聴力補助が与えられるため、実際には聴こえなくなる、または聴こえにくくなるはずの状況でも、第１群に属する音響オブジェクト６２０_１、６２０_２を聴くことができるようになる。

さらに方法５００により、ユーザ６３０は、第１群に属する音響オブジェクト６２０_１と６２０_２を区別可能となる。図１２Ｅの例では、第１群に属する音響オブジェクト６２０_１と６２０_２は、空間的に分離されていない（ユーザから見て並んでいる）ため、仮想空間６００における実際の方向（方角）に応じてレンダリングされると、ユーザにとって第１群に属する音響オブジェクト６２０_１と６２０_２が区別するのが困難でありうる。

したがって、第１の規則では、第１群に属する音響オブジェクト６２０_１と６２０_２の１つまたは複数を、修正された位置特性、および／または周波数特性（空間および／または周波数チャンネルの多様化）によりレンダリングされるようにしてもよい。第１の規則は例えば、第１群に属する複数の音響オブジェクト６２０_１、６２０_２による、位置チャンネル（方向／方角）の冗長化（二重配置）を防ぐものでありうる。さらに／あるいは、第１の規則は例えば、第１群に属する複数の音響オブジェクト６２０_１、６２０_２による、周波数チャンネル（臨界帯域）の冗長化（二重配置）を防ぐものでありうる。

図１２Ｅにおいて、ユーザ６３０は、仮想空間６００内で、音響オブジェクト６２０_３に対して「起動」動作を実行しない。図１２Ｅでは、第１群に属する音響オブジェクトとしての、音響オブジェクト６２０_３の標示６２２が存在しない。

図１２Ｆは、図１２Ｅの仮想空間６００の時間が経過した状態を示す。ユーザ６３０は、音響オブジェクト６２０_３からさらに離れるように動いている。

ユーザ６３０は、第２群に属する音響オブジェクト６２０_３からより離れているため、ユーザはこの音響オブジェクトを明瞭に聴くことはできない。ユーザは、第２群に属するその他の音響オブジェクト６２０とも、第１群に属する音響オブジェクト６２０_２とも離れている。ユーザは、第１群に属する音響オブジェクト６２０_１から遠く離れている。ただし、第１群に属する音響オブジェクト６２０_１、６２０_２は第１の規則に応じてレンダリングされ、第２群に属するその他の音響オブジェクト６２０は第２の規則に応じてレンダリングされる。これにより、第１群に属する音響オブジェクト６２０_１、６２０_２をユーザが聴く能力が向上する。したがって、ユーザは、離れている第１群に属する音響オブジェクト６２０_２と、遠く離れている第１群に属する音響オブジェクト６２０_１とを同時に聴くことができる。

図１３は、ユーザ６３０が仮想空間６００内で実行する「起動」動作の例を示す。ユーザは、レンダリングされた音響オブジェクト６２０を、空間的にレンダリングされた音響として聴きながら、一人称視点媒介、ユーザインタラクティブ媒介現実を使用して、仮想空間６００内を探索している。媒介現実は、仮想現実、または拡張現実であってもよい。ユーザは、対応する音響空間６１０の対応する音響シーンを聴きながら、同時に仮想視覚空間２０の仮想視覚シーン２２を見ることができる。

ユーザによって、その視点から見た仮想空間６００（仮想視覚空間２０）の仮想視覚シーン２２が図示されている。

仮想視覚シーン２２は、複数の仮想オブジェクト２１を含む。この例では、仮想オブジェクト２１はテーブルに着いて会話する二人の人間を表す。

この会話は、対応する仮想視覚空間２０のテーブルの位置に対応する、音響空間６１０における特定の位置での音響オブジェクト６２０として、音響空間６１０内に存在する。

必ずしもすべての例ではないが、この例では、会話音響オブジェクト６２０は、コンピュータが生成した仮想オブジェクト２８を使用して、仮想視覚空間２０内で視覚的に描写される。

ユーザは、会話音響オブジェクト６２０の視覚的描写６５０と相互作用することで、会話音響オブジェクト６２０を起動してもよい。

会話音響オブジェクト６２０は起動されると、例えば図１２Ｂおよび１２Ｄを参照して説明したように示されてもよい。

起動は、例えば、最小閾値期間の間、描写６５０を見るか、描写６５０の近くにいることで暗示されうる（自動）。頷くなどのジェスチャが、暗示された起動の確認に必要となり、頭を振るなどのジェスチャが、暗示された起動のキャンセルに必要となりうる。

起動は、例えば、描写６５０に対して直接相互作用することで明示されてもよい（手動）。例えば、仮想空間６００内で、ユーザ６３０が描写６５０に対してジェスチャを実行する、または仮想空間６００内で、ユーザ６３０が描写６５０を触れることで明示されてもよい。

図１４は、図示の例において、第１群に属する音響オブジェクト６２０のレンダリングを制御するために、どのように第１の規則が使用されるかの例を示す。

この例では、記録された音響オブジェクトの１つまたは複数の特性が、音響オブジェクトのレンダリングの際に適用される。この適用は、第１の規則に応じて音響オブジェクトのレンダリングが開始してから、蓄積された基準値ｍに依存する。基準ｍにより、音響オブジェクトが第１群に属する音響オブジェクトに分類されてから蓄積された値が測定される。

音響オブジェクトの１つまたは複数の特性が、図１４のグラフのｙ軸に沿って描かれ、基準ｍがｘ軸として描かれる。

基準ｍは、例えば、経過した時間またはユーザが移動した距離であってもよい。

図示の具体例では、時間に対する音響オブジェクトの強さ（単位面積当たりのパワー）が描かれている。

この例では、最初に起動された（または起動し直された）第１群に属する音響オブジェクトの強さは、経時変化しない固定された一定値を有する。閾値期間後、ユーザ６３０により音響オブジェクト６２０が再起動されない限り、またはユーザ６３０が起動をキャンセルしない限り、第１群に属する音響オブジェクトの強さは、時間と共に直線的に（例えば、ゼロまで、または物理的に現実的な値にまで）減少する。

図１５は、この例において、第１群に属する複数の音響オブジェクト６２０のレンダリングを制御するために、どのように第１の規則が使用されるかの例を示す。

この例では、記録された音響オブジェクトの１つまたは複数の特性が、特定の音響オブジェクトのレンダリングの際に適用される。この特定の音響オブジェクトへの特性の適用は、第１の規則に応じて当該特定の音響オブジェクトのレンダリングが開始してから、蓄積された基準値ｍに依存する。基準ｍにより、当該特定の音響オブジェクトが第１群に属する音響オブジェクトに分類されてから蓄積された値が測定される。

基準ｍは、例えば、経過した時間または仮想空間６００内をユーザ６３０が移動した距離であってもよい。具体的な例では、第１群に属する音響オブジェクトそれぞれについて、当該音響オブジェクトの時間に対する強さがプロットされる。

この例では、最初に起動された（または起動し直された）第１群に属する音響オブジェクトの強さは、経時変化しない固定された一定値を有する。閾値期間後、ユーザにより音響オブジェクトが再起動されない限り、またはユーザが起動をキャンセルしない限り、第１群に属する音響オブジェクトの強さは、時間と共に直線的に、例えば、ゼロまで、または物理的に現実的な値にまで、減少する。

この例では、第１群に属する２つの音響オブジェクトは、異なる時点で起動されている。

図で最も上の音響オブジェクトは、長い間第１群に属する音源として分類されている。ユーザは、既にこの音響オブジェクトを再起動している。再度消え入っており、ユーザが再起動しない限り、第２群に属する音響オブジェクトに戻っている。

図で最も下の音響オブジェクトは、第１群に属する音響オブジェクトに分類されたばかりである。

図１６Ａは、音響オブジェクト６２０の状態図として、方法５００の効果を示す。この例では、音響オブジェクト６２０は、２つの状態６７２のいずれかであって、状態遷移６７３により、これら状態間の遷移が生じる。１つの状態（第１状態６７２_１）は、第１群に属する音響オブジェクトに対する状態である。第１の規則は、音響オブジェクトが第１状態６７２_１にある際にそのレンダリングを制御するものである。別の状態（第２状態６７２_２）は、第２群に属する音響オブジェクトに対する状態である。第２の規則は、音響オブジェクトが第２状態６７２_２にある際にそのレンダリングを制御するものである。

音響オブジェクトを分類するステップにより、音響オブジェクトが第１群に属する音響オブジェクトに分類される場合、第２状態６７２_２から第１状態６７２_１への状態遷移６７３_１が生じうる。

音響オブジェクトの再分類により、音響オブジェクトが第２群に属する音響オブジェクトに再分類される場合、第１状態６７２_１から第２状態６７２_２への状態遷移６７３_２が生じうる。これは、第１状態６７２_１が、例えば図１４、１５を参照して先に述べたようにユーザによる再起動がない限り、終了してしまう一時的状態であるために生じうるのである。第１状態６７２_１の再起動は、第１状態６７２_１を再開する状態遷移６７３_３により示される。

トリガイベントが生じると、状態遷移６７３が起きる。トリガイベントは、１つまたは複数のトリガ条件が満たされると生じる。

第１状態６７２_１は維持状態である。この状態は、トリガイベントが生じた後に続く。

第１状態６７２_１から脱するには、更なるトリガイベントが必要となる。いくつかの例では、更なるトリガイベントは自動的に生じて、第１状態６７２_１が、更新（再起動）６７３_３されない限り、所定の条件が満たされた（例えば、基準値ｍが閾値を超えた）後に、例えば一時的なものとして終了６７３_２してもよい。

トリガイベント／トリガ条件（複数可）が、第２状態６７２_２から第１状態６７３_１への状態遷移を生じる場合、それはユーザの記録された動作に基づく。

図１６Ｂは、図１６Ａに類似した状態図として、方法５００の効果を示す。

ただし、この例では、第２状態６７２_２は複数のサブ状態で示される。

この例では、第２状態にある音響オブジェクト６２０は、複数のサブ状態２（ｉ）、２（ｉｉ）、２（ｉｉｉ）のいずれかとなる。

複数のサブ状態のいずれかが、第２群に属する音響オブジェクトに対する状態であってもよい。第２の規則は、音響オブジェクトが第２状態６７２_２のサブ状態にある際に、音響オブジェクトのレンダリングを制御するものである。

音響オブジェクトを分類するステップは、音響オブジェクトが第１群に属する音響オブジェクトに分類される場合、第２状態６７２_２のサブ状態２（ｉ）から第１状態６７２_１への状態遷移６７３_１を生じさせてもよい。

音響オブジェクトが第２群に属する音響オブジェクトに再分類される場合、音響オブジェクトの再分類により、第１状態６７２_１から第２状態６７２_２の１つへの状態遷移６７３_２が生じうる。これは、第１状態６７２_１が、例えば図１４、１５を参照して先に述べたようにユーザによる再起動がない限り、終了してしまう一時的状態であるために生じうるのである。第１状態の再起動は、第１状態６７２_１を再開する状態遷移６７３_３により示される。

トリガイベントが生じると、状態遷移６７３が起きる。トリガイベントは、１つまたは複数のトリガ条件が満たされると生じる。第１状態６７２_１は維持状態である。この状態は、トリガイベントが生じた後に続く。

トリガイベント／トリガ条件（複数可）が、第２状態６７２_２のサブ状態の１つから第１状態６７３_１への状態遷移を生じる場合、それはユーザの記録された動作に基づく。

音響オブジェクト６２０が第２状態６７２_２にあり、音響オブジェクト６２０と、ユーザ６３０との間に現在相互作用が生じていると、第２状態の第１サブ状態２（ｉ）となる。例えば、現在の相互作用により起動が生じると、この状態から第１状態６７２_１への遷移６７３_１が可能となる。

音響オブジェクト６２０が第２状態６７２_２にあり、音響オブジェクト６２０とユーザ６３０との間の相互作用の可能性がある（しかし、音響オブジェクトとユーザとの間に現在相互作用がない）場合、第２状態６７２_２の第２サブ状態２（ｉｉ）となる。この例では、サブ状態２（ｉｉ）から第１状態６７２_１への遷移は不可能であるが、他の状態図では可能でありうる。第１状態６７２_１からこの状態への遷移６７３_２は可能である。第２状態６７２_２の第１サブ状態２（ｉ）から／への遷移６７３_４は可能である。

音響オブジェクト６２０が第２状態６７２_２にあり、音響オブジェクト６２０とユーザ６３０との間の相互作用の可能性がない（音響オブジェクトとユーザとの間に現在相互作用がなく、音響オブジェクトとユーザとの間の相互作用の可能性もない）場合、第２状態６７２_２の第３サブ状態２（ｉｉｉ）となる。この例では、サブ状態２（ｉｉｉ）から第１状態６７２_１への遷移は不可能であるが、他の状態図では可能でありうる。第１状態６７２_１からこのサブ状態２（ｉｉｉ）への遷移６７３_２は可能である。第２状態６７２_２の第２サブ状態２（ｉｉ）から／への遷移６７３_５は可能である。

第２状態６７２_２のサブ状態２（ｎ）にある音響オブジェクト６２０（第２群に属する）には、第１状態６７２_１にある音響オブジェクト６２０（第１群に属する）とは異なるレンダリングが施される。

第２状態６７２_２の各サブ状態２（ｎ）にある互いに異なる音響オブジェクト６２０は、第２状態６７２_２の別のサブ状態２（ｍ）にある音響オブジェクト６２０とは異なるレンダリングが施されるが、第２状態６７２_２の同じサブ状態２（ｎ）にある音響オブジェクト６２０とは同じレンダリングが施される。

例えば、第２状態６７２_２の第１サブ状態２（ｉ）にある音響オブジェクト６２０は、記録されたとおりにレンダリングされうる。

例えば、第２状態６７２_２の第２サブ状態２（ｉｉ）にある音響オブジェクト６２０は、仮想空間６００において、音響オブジェクト６２０の位置に、ユーザ６３０が直接対面している場合にのみ、音響オブジェクト６２０を強調するようにレンダリングされてもよい。

例えば、第２状態６７２_２の第３サブ状態２（ｉｉｉ）にある音響オブジェクト６２０は、音響オブジェクト６２０の強調を解除するようにレンダリングされてもよい。

音響オブジェクト６２０の強調／強調解除は、音響オブジェクト６２０の特性を修正することで実現されてもよい。

例えば強調は、固有の空間および／または周波数チャンネルを使用する、さらに／あるいは強さを上げることで実現されうる。

例えば、強調解除は、共通空間および／またはスペクトルチャンネルを使用する、さらに／あるいは強さを下げて背景の会話をエミュレートするように残響を使用することで実現されうる。

１つの使用例として、ユーザは仮想現実または拡張現実でありうる媒介現実により、仮想空間６００におけるカクテルパーティーに参加する。このユーザは、第１テーブル（Ａ）での会話を、空間音響を介して聴く。例えば、閾値時間だけ、会話の音響オブジェクト６２０を示すコンピュータが生成した仮想オブジェクトを見るまたはその近くにいることで、ユーザは音響オブジェクト６２０を起動する。コンピュータが生成した仮想オブジェクト２８は、起動されたことを示すような外観６２２に変化する。ユーザ６３０は、頷くことで起動を確認し、頭を振ることで起動をキャンセルしてもよい。ユーザ６３０は、ジェスチャにより、第１の規則の属性をプログラム可能であってもよい。起動後の音響オブジェクト６２０は、第１状態となり（第１群に分類）、ユーザ６３０は、テーブルＡから離れても、更には別のテーブルであるテーブルＢの会話を聴きながら、テーブルＡからの会話として音響オブジェクト６２０を聴くことができる。

上述の例では、１つまたは複数のコンピュータプログラムについて言及されている。例えば、コンピュータプログラム４８、４１６の一方またはコンピュータプログラム４８、４１６の組合せであるコンピュータプログラムは、方法５００を実行するように構成されてもよい。

さらに、例えば、装置３０、４００は、
少なくとも１つのプロセッサ４０、４１２と、
コンピュータプログラムコードを含む、少なくとも１つのメモリ４６、４１４と、を有し、
少なくとも１つのメモリ４６、４１４と、コンピュータプログラムコードとは、少なくとも１つのプロセッサ４０、４１２により、装置４３０、００に少なくとも、
レンダリングされた仮想空間内の音響オブジェクトを、仮想空間内でのユーザの記録された動作に応じて、音響オブジェクトの第１群または音響オブジェクトの第２群に分類することと、
第１群に属する１つまたは複数の音響オブジェクトを、少なくとも第１の規則に応じてレンダリングすることと、
第２群に属する１つまたは複数の音響オブジェクトを、少なくとも、第１の規則とは異なる第２の規則と、仮想空間内のユーザの現在位置とに応じてレンダリングすることと、を実行させる。

コンピュータプログラム４８、４１６は、任意の適切な配信メカニズムを介して装置３０、４００に送られてもよい。配信メカニズムは、例えば、非一時的コンピュータ可読記憶媒体、コンピュータプログラム製品、メモリデバイス、コンパクトディスク読取り専用メモリ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄ−ＯｎｌｙＭｅｍｏｒｙ：ＣＤ−ＲＯＭ）またはデジタルバーサタイルディスク（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ：ＤＶＤ）などの記録媒体、コンピュータプログラム４８、４１６を有形に体現する製品であってもよい。配信メカニズムは、コンピュータプログラム４８、４１６を確実に伝送するよう構成された信号であってもよい。装置３０、４００は、コンピュータプログラム４８、４１６をコンピュータデータ信号として伝搬または送信してもよい。図１０は、コンピュータプログラム４１６に対する配信メカニズム４３０を示す。

記載された各種方法５００は、装置３０、４００、例えば電子装置３０、４００によって実行されてもよいことが上述より明らかであろう。

いくつかの例では電子装置４００は、頭部装着音響出力装置などの音響出力装置３００、または音響出力装置３００用モジュールの一部であってもよい。これに加えて、またはこれに代えて、いくつかの例では電子装置４００は、画像をユーザに表示するディスプレイ３２を備える頭部装着装置３３の一部であってもよい。

いくつかの例では、頭部装着装置３３をユーザの頭部に配置することにより、図１１に示す方法５００をシステムに実施させる、またはシステムにより実施可能にしてもよい。すなわち、頭部装着装置３３がユーザの頭部に配置されていない間は、方法５００は作動していない。頭部装着装置がユーザの頭部に配置されると、方法５００が作動し、第１の視点、ユーザインタラクティブ、媒介現実（仮想現実または拡張現実）を用いて音響シーンの制御が可能になる。

「コンピュータ可読記憶媒体」、「コンピュータプログラム製品」、「有形に体現されたコンピュータプログラム」など、または「コントローラ」、「コンピュータ」、「プロセッサ」などへの言及は、シングル／マルチプロセッサアーキテクチャおよび順次（ノイマン型）／並列アーキテクチャなどの種々のアーキテクチャを有するコンピュータのみでなく、フィールドプログラマブルゲートアレイ（Field-Programmable Gate Array：ＦＰＧＡ）、特定用途向け集積回路（Application Specific Circuit：ＡＳＩＣ）、信号処理デバイス、およびその他の処理回路構成などの特殊回路も含むと理解すべきである。コンピュータプログラム、命令、コードなどへの言及は、プログラマブルプロセッサのソフトウェア、または例えばプロセッサのための命令であるか、固定機能デバイス、ゲートアレイ、もしくはプログラマブル論理デバイスなどの構成設定であるかを問わない、ハードウェアデバイスのプログラマブルコンテンツなどのファームウェア、を含むと理解されるべきである。

本願において使用される「回路構成」という用語は、以下のすべてを指す：
（ａ）ハードウェアのみの回路実装（アナログおよび／またはデジタル回路構成のみでの実装など）、
（ｂ）回路とソフトウェア（および／またはファームウェア）との組合せ、例えば（該当する場合）、（ｉ）プロセッサ（複数可）の組合せ、または（ｉｉ）携帯電話またはサーバなどの装置に様々な機能を実行させるべく協働する、プロセッサ（複数可）／ソフトウェア（デジタル信号プロセッサ（複数可）を含む）、ソフトウェア、およびメモリ（複数可）の一部、
（ｃ）回路、例えばソフトウェアまたはファームウェアが物理的に存在しなくても動作のためにソフトウェアまたはファームウェアを必要とするマイクロプロセッサ（複数可）またはマイクロプロセッサ（複数可）の一部。

「回路構成」のこの定義は、任意の請求項を含め本願におけるこの用語の使用すべてに当てはまる。さらなる例として、本願において使用される「回路構成」という用語は、プロセッサ（または複数のプロセッサ）のみ、またはプロセッサの一部およびその（もしくはそれらの）付随するソフトウェアおよび／またはファームウェアの実装も対象とするであろう。「回路構成」という用語は、該当する場合、例えば特定の請求項の要素、携帯電話のベースバンド集積回路もしくはアプリケーションプロセッサ集積回路、またはサーバ、セルラネットワークデバイス、もしくはその他ネットワークデバイス内の同様の集積回路も対象とするであろう。

図１１から図１６Ｂに示されたブロック、ステップ、プロセスは、方法のステップおよび／またはコンピュータプログラムのコードのセクションを表現しうる。示されたブロックの特定の順序は、それらのブロックに対して必要な順序または好ましい順序が存在することを必ずしも意味するものではなく、ブロックの順序および配置は変更されてもよい。さらに、いくつかのブロックを省略することも可能である。

構造的特徴が記載されている場合、その構造的特徴は、構造的特徴の機能のうちの１つまたは複数を実行する手段で置き換えられてもよく、その１つまたは複数の機能が明示的に記載されているか黙示的に記載されているかを問わない。

本文書内の「モジュール」という用語は、ユニットまたは装置であって、エンドメーカーやユーザによって追加される部品／コンポーネントを除いたものを表す。コントローラ４２やコントローラ４１０は、モジュールであってもよい。装置は、モジュールであってもよい。ディスプレイ３２は、モジュールであってもよい。

本文書内の「含む、備える（ｃｏｍｐｒｉｓｅ）」という用語は、限定的な意味ではなく、非限定的な意味で使用される。したがって、「Ｙを含むＸ」に関してはすべて、「Ｘは１つのＹを含んでもよい」と「複数のＹを含んでもよい」の両方を意味する。限定的な意味を有する「含む、備える（ｃｏｍｐｒｉｓｅ）」を意図する場合は、「〜を１つのみ含む」などと言及することにより、文脈内で明確にするであろう。

本発明の簡単な説明では、様々な例について言及した。例に関する特徴または機能の説明は、これらの特徴または機能が、その例に存在することを示す。本明細書中で「例（ｅｘａｍｐｌｅ）」、「例えば（ｆｏｒｅｘａｍｐｌｅ）」、「〜てもよい、〜できる、〜場合がある（ｍａｙ）」として明確に言及されている場合でも、明確に言及されていない場合でも、このような特徴および機能が、少なくとも記載された例には存在することを意味する。すなわち、例として記載されている、記載されていないにかかわらず、これら特徴および機能が、他のいくつかの例またはすべての例に存在する可能性があり、また必ずしもそうではないことを意味する。このように、「例」、「例えば」、「〜てもよい、〜できる、〜の場合がある」は、ある例示群における特定の例であることを指す。上記特定の例の特性は、その特定の例のみの特性、上記例示群の特性、または上記例示群に属する一群の特性である場合がある。ここで、この上記例示群に属する一群は、上記例示群に属する全例示ではなく、一部の例示を含む。したがって、黙示に開示されているのは、一例を参照して記載されたが別の例を参照しては記載されなかった特徴は、可能であればその別の例において使用できるが、その別の例で必ずしも使用される必要はないということである。

本発明の実施形態を、様々な例を参照して上記の各段落に記載したが、請求される本発明の範囲から逸脱することなく、与えられた例に対して変更を加えうることを理解されたい。

先行する記載において説明された特徴は、明示的に記載された組合せ以外の組合せで用いられてもよい。

特定の特徴を参照して種々の機能を記述してきたが、こうした機能は、記述の有無を問わずその他の特徴によって実行される場合がある。

特定の実施形態を参照して種々の特徴を記述してきたが、こうした特徴は、記述の有無を問わずその他の実施形態にも含まれる場合がある。

前述のように本明細書において、とりわけ重要であると考えられる本発明の特徴に注目を集めるように努めてきた。しかし、前述の記載にて言及され、さらに／あるいは添付の図面に示された特許されうるすべての特徴およびそれらの組合せに対して、そうした特徴が特段強調されていたかどうかにかかわらず、本出願人はその保護を求めるものである点を理解されたい。

Claims

レンダリングされた仮想空間内の音響オブジェクトを、前記仮想空間内でのユーザの記録された動作に応じて、音響オブジェクトの第１群または音響オブジェクトの第２群に分類することと、
前記第２群に属する１つまたは複数の音響オブジェクトに対する、前記第１群に属する１つまたは複数の音響オブジェクトのユーザによる認知が向上するように、前記第１群に属する１つまたは複数の音響オブジェクトを、少なくとも第１の規則に応じてレンダリングし、前記第２群に属する１つまたは複数の音響オブジェクトを、少なくとも、前記第１の規則とは異なる第２の規則と、前記仮想空間内の前記ユーザの現在位置とに応じてレンダリングすることと、
を含む、方法。
レンダリングされた仮想空間内の音響オブジェクトを、前記仮想空間内でのユーザの記録された動作に応じて、音響オブジェクトの第１群または音響オブジェクトの第２群に分類することと、
前記第１群に属する複数の音響オブジェクトを、多様な空間および／または周波数チャンネルにおいて、前記仮想空間で共通の第１の規則に応じてレンダリングすることと、
前記第２群に属する１つまたは複数の音響オブジェクトを、少なくとも、前記第１の規則とは異なる第２の規則と、前記仮想空間内の前記ユーザの現在位置とに応じてレンダリングすることと、
を含む、方法。
レンダリングされた仮想空間内の音響オブジェクトを、前記仮想空間内でのユーザの記録された動作に応じて、音響オブジェクトの第１群または音響オブジェクトの第２群に分類することと、
前記第１群に属する１つまたは複数の音響オブジェクトを、少なくとも第１の規則に応じてレンダリングすることと、
前記第２群に属する１つまたは複数の音響オブジェクトを、少なくとも、前記第１の規則とは異なる第２の規則と、前記仮想空間内の前記ユーザの現在位置とに応じてレンダリングすることと、
を含む、方法であって、更に、
レンダリングされた仮想空間内の音響オブジェクトを、前記音響オブジェクトと前記ユーザとの間の記録された相互作用に依存する、音響オブジェクトの第１群に分類することと、
レンダリングされた仮想空間内の音響オブジェクトを、音響オブジェクトの第２群のサブ分類に分類することであって、当該サブ分類は、
前記音響オブジェクトと前記ユーザとの現在の相互作用、
前記音響オブジェクトと前記ユーザとの間に相互作用の可能性がないこと、
前記音響オブジェクトと前記ユーザとの間に相互作用の可能性があること、
に依存することと、
前記第２群に属する音響オブジェクトを、前記サブ分類に依存した規則に応じてレンダリングすることと、
を含む、方法。
前記第１群に属する１つまたは複数の音響オブジェクトを、少なくとも前記第１の規則に応じてレンダリングすることにより、前記第２群に属する１つまたは複数の音響オブジェクトに対して、および／または前記第１群に属する１つまたは複数の音響オブジェクトの記録された状態に対して、ユーザの前記第１群に属する１つまたは複数の音響オブジェクトに対する認知を向上させる、請求項１から３のいずれかに記載の方法。
前記第１群に属する１つまたは複数の音響オブジェクトを、少なくとも前記第１の規則に応じてレンダリングすることにより、前記仮想空間内で、前記ユーザと前記第１群に属する１つまたは複数の音響オブジェクトとが離れたとしても、前記第１群に属する１つまたは複数の音響オブジェクトの認知が維持される、請求項１から４のいずれかに記載の方法。
前記第１群に属する１つまたは複数の音響オブジェクトを、少なくとも前記第１の規則に応じてレンダリングすることと、前記第２群に属する１つまたは複数の音響オブジェクトを、前記第１の規則とは異なる前記第２の規則と、前記ユーザの現在位置に応じてレンダリングすることにより、前記第１群に属する１つまたは複数の音響オブジェクトがそれぞれ、ユーザに対する前記第１群に属する音響オブジェクトの相対距離に対する第１依存性によりレンダリングされ、前記第２群に属する１つまたは複数の音響オブジェクトがそれぞれ、ユーザに対する前記第２群に属する音響オブジェクトの相対距離に対する、前記第１依存性とは異なる第２依存性によりレンダリングされ、
前記第１群に属する音響オブジェクトは、音響オブジェクトと前記ユーザの現在のリアルタイム相対位置の変化に対する依存性がより低い、
請求項１から５のいずれかに記載の方法。
前記第１群に属する１つまたは複数の音響オブジェクトを、少なくとも前記第１の規則に応じてレンダリングすることは、前記音響オブジェクトがレンダリングされる際に、前記音響オブジェクトが録音された状態の少なくとも１つの特性が適用するように実施され、
前記第１群に属する１つまたは複数の音響オブジェクトが、前記第１の規則に応じてレンダリングされ始めてから蓄積された基準値に依存して、前記適用が行われる、
請求項１から６のいずれかに記載の方法。
前記第１群に属する１つまたは複数の音響オブジェクトを、前記第１の規則に応じてレンダリングすることは、前記音響オブジェクトがレンダリングされる際に、前記音響オブジェクトが録音された状態の少なくとも１つの特性を適用することを含む、請求項１から７のいずれかに記載の方法。
前記第１の規則と、前記第２の規則との差分により、前記第１群に属する１つまたは複数の音響オブジェクトと、前記第２群に属する１つまたは複数の音響オブジェクトとの間で、１つまたは複数の音響特性値の相対的ずれが生じる、請求項１から８のいずれかに記載の方法。
前記第１の規則は、レンダリングされた音響オブジェクトの強さの変動と、前記仮想空間における前記音響オブジェクトと前記ユーザとの間の距離の変動との間の第１の関係を定義し、
前記第２の規則は、レンダリングされた音響オブジェクトの強さの変動と、前記仮想空間における前記音響オブジェクトと前記ユーザとの間の距離の変動との間の第２の関係を定義する、
請求項１から９のいずれかに記載の方法。
トリガイベントが、ユーザの記録された動作により満たされたことに依存して、維持状態への変化をトリガすることで、音響オブジェクトを音響オブジェクトの第１群に分類することを含み、
当該状態は、前記トリガイベントが終了した後にも維持される、
請求項１から１０のいずれかに記載の方法。
前記維持状態は、更新されない限り、所定の条件が満たされると一時的に終了する、請求項１１に記載の方法。
ユーザの記録された動作に応じて、レンダリングされた仮想空間内の音響オブジェクトを音響オブジェクトの第１群または音響オブジェクトの第２群に分類することは、音響オブジェクトを、前記ユーザと前記音響オブジェクトとの過去の相互作用に依存して、音響オブジェクトの第１群または音響オブジェクトの第２群に分類することを含む、請求項１から１２のいずれかに記載の方法。
前記ユーザは、前記レンダリングされた音響オブジェクトを、空間的にレンダリングされた音響として聴きながら、ユーザ視点媒介現実を介して、前記仮想空間を見ている、請求項１から１３のいずれかに記載の方法。
処理手段及び記憶手段を備える装置であって、前記記憶手段はプログラム命令を格納し、前記プログラム命令は、前記処理手段に実行されると、前記装置に、請求項１から１４のいずれかに記載の方法を遂行させるように構成される、装置。
装置の処理手段に実行されると、前記装置に、請求項１から１４のいずれかに記載の方法を遂行させるように構成されるプログラム命令を備える、コンピュータプログラム。