JP7526169B2

JP7526169B2 - クロスリアリティシステム

Info

Publication number: JP7526169B2
Application number: JP2021518528A
Authority: JP
Inventors: アヌシュモハン，; ロバートブレイクテイラー，; ジェレミードウェインミランダ，; ラファエルドミンゴストーレス，; ダニエルオルシャンスキー，; アリシャーロクニー，; エランゲンデルマン，; ニッククラマー，; ケントッセル，; サミュエルエー．ミラー，; ジェハンギールタジク，; アシュウィンスワミナサン，; ロメシュアガルワル，; プラティークシンガル，; ジョエルデイビッドホルダー，; シュアンジャオ，; シッダルタチョーダリー，; ヘルダートシロウスズキ，; ヒラルホナルバロット，; クリスチャンイヴァンロバートムーア，
Original assignee: Magic Leap Inc
Current assignee: Magic Leap Inc
Priority date: 2018-10-05
Filing date: 2019-10-04
Publication date: 2024-07-31
Anticipated expiration: 2039-10-04
Also published as: EP3861533A4; EP3861533A1; JP2022509731A; JP2024103610A; WO2020072972A1; WO2020072972A8; CN113544748A

Description

（関連出願の相互参照）
本特許出願は、参照することによってその全体として本明細書に組み込まれる、２０１８年１０月５日に出願され、「ＣＯＯＲＤＩＮＡＴＥＦＲＡＭＥＰＲＯＣＥＳＳＩＮＧＡＵＧＭＥＮＴＥＤＲＥＡＬＩＴＹ」と題された、米国仮特許出願第６２／７４２，２３７号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、２０１９年３月１日に出願され、「ＭＥＲＧＩＮＧＡＰＬＵＲＡＬＩＴＹＯＦＩＮＤＩＶＩＤＵＡＬＬＹＭＡＰＰＥＤＥＮＶＩＲＯＮＭＥＮＴＳ」と題された、米国仮特許出願第６２／８１２，９３５号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、２０１９年３月８日に出願され、「ＶＩＥＷＩＮＧＤＥＶＩＣＥＯＲＶＩＥＷＩＮＧＤＥＶＩＣＥＳＨＡＶＩＮＧＯＮＥＯＲＭＯＲＥＣＯＯＲＤＩＮＡＴＥＦＲＡＭＥＴＲＡＮＳＦＯＲＭＥＲＳ」と題された、米国仮特許出願第６２／８１５，９５５号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、２０１９年６月２８日に出願され、「ＲＡＮＫＩＮＧＡＮＤＭＥＲＧＩＮＧＡＰＬＵＲＡＬＩＴＹＯＦＥＮＶＩＲＯＮＭＥＮＴＭＡＰＳ」と題された、米国仮特許出願第６２／８６８，７８６号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、２０１９年７月５日に出願され、「ＲＡＮＫＩＮＧＡＮＤＭＥＲＧＩＮＧＡＰＬＵＲＡＬＩＴＹＯＦＥＮＶＩＲＯＮＭＥＮＴＭＡＰＳ」と題された、米国仮特許出願第６２／８７０，９５４号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、２０１９年８月７日に出願され、「ＡＶＩＥＷＩＮＧＳＹＳＴＥＭ」と題された、米国仮特許出願第６２／８８４，１０９号の優先権および利益を主張する。

本願は、概して、クロスリアリティシステムに関する。

コンピュータは、ヒューマンユーザインターフェースを制御し、ユーザによって知覚されるにつれて、ＸＲ環境の一部または全部がコンピュータによって生成される、Ｘリアリティ（ＸＲまたはクロスリアリティ）環境を作成し得る。これらのＸＲ環境は、ＸＲ環境の一部または全部が、部分的に、環境を説明するデータを使用して、コンピュータによって生成され得る、仮想現実（ＶＲ）、拡張現実（ＡＲ）、および複合現実（ＭＲ）環境であり得る。本データは、例えば、ユーザが、物理的世界の一部として、感知または知覚し、仮想オブジェクトと相互作用し得るようにレンダリングされ得る、仮想オブジェクトを説明し得る。ユーザは、例えば、頭部搭載型ディスプレイデバイス等のユーザインターフェースデバイスを通してレンダリングおよび提示されているデータの結果として、これらの仮想オブジェクトを体験し得る。データは、ユーザに見えるように表示され得る、またはユーザに聞こえるように再生される、オーディオを制御し得る、または触知的（または触覚的）インターフェースを制御し、ユーザが、仮想オブジェクトを感じるにつれて、ユーザが感知または知覚する、タッチ感覚を体験することを可能にし得る。

ＸＲシステムは、科学的可視化、医療訓練、工学設計、およびプロトタイプ化、遠隔操作およびテレプレゼンス、および個人的娯楽の分野に及ぶ、多くの用途のために有用であり得る。ＡＲおよびＭＲは、ＶＲと対照的に、物理的世界の実オブジェクトと関連して、１つ以上のオブジェクトを含む。実オブジェクトと相互作用する、仮想オブジェクトの体験は、概して、ＸＲシステムを使用する際、ユーザの享受を向上させ、また、物理的世界が改変され得る様子についての現実的かつ容易に理解可能な情報を提示する、種々の用途のための可能性を広げる。

仮想コンテンツを現実的にレンダリングするために、ＸＲシステムは、システムのユーザの周囲の物理的世界の表現を構築し得る。本表現は、例えば、ＸＲシステムの一部を形成する、ウェアラブルデバイス上のセンサを用いて入手された処理画像によって構築されてもよい。そのようなシステムでは、ユーザは、システムがその環境の表現を構築するために十分な情報を入手するまで、ユーザがＸＲシステムを使用することを意図する部屋または他の物理的環境を見て回ることによって、初期化ルーチンを実施し得る。システムが動作し、ユーザが環境の周囲を、または他の環境へと動き回るにつれて、ウェアラブルデバイス上のセンサは、付加的情報を入手し、物理的世界の表現を拡張または更新し得る。

本願の側面は、Ｘリアリティ（クロスリアリティまたはＸＲ）場面を提供するための方法および装置に関する。本明細書に説明される技法は、ともに、別個に、または任意の好適な組み合わせにおいて、使用されてもよい。

いくつかの実施形態は、３次元（３Ｄ）環境についての情報を捕捉するように構成される、１つ以上のセンサを含む、電子システムに関する。捕捉された情報は、複数の画像を含む。電子システムは、コンピュータ実行可能命令を実行し、複数の画像に基づいて、３Ｄ環境の少なくとも一部のマップを生成するように構成される、少なくとも１つのプロセッサを含む。コンピュータ実行可能命令はさらに、複数の画像内の複数の特徴を識別するステップと、少なくとも部分的に、選択されたキーフレームの複数の特徴に基づいて、複数のキーフレームを複数の画像の中から選択するステップと、少なくとも部分的に、選択されたキーフレームの識別された特徴に基づいて、１つ以上の座標フレームを生成するステップと、３Ｄ環境のマップと関連付けて、１つ以上の座標フレームを１つ以上の持続的座標フレームとして記憶するステップとのための命令を含む。

いくつかの実施形態では、１つ以上のセンサは、複数の画像の各画像が複数のピクセルを備えるように２次元アレイで配列される、複数のピクセル回路を備える。各特徴は、複数のピクセルに対応する。

いくつかの実施形態では、複数の画像内の複数の特徴を識別するステップは、識別された特徴として、持続的オブジェクトの部分を描写するピクセルの群との類似性の測定値に基づいて、ピクセルの群の所定の最大値未満の数を選択するステップを含む。

いくつかの実施形態では、１つ以上の座標フレームを記憶するステップは、１つ以上の座標フレーム毎に、そこから座標フレームが生成された、選択されたキーフレーム内の特徴の少なくともサブセットを表す、記述子を記憶するステップを含む。

いくつかの実施形態では、１つ以上の座標フレームを記憶するステップは、１つ以上の座標フレーム毎に、そこから座標フレームが生成された、選択されたキーフレーム内の特徴の少なくともサブセットを記憶するステップを含む。

いくつかの実施形態では、１つ以上の座標フレームを記憶するステップは、１つ以上の座標フレーム毎に、３Ｄ環境のマップの座標フレームと持続的座標フレームとの間の変換と、そこから座標フレームが生成された、選択されたキーフレームの３Ｄ環境内の場所を示す、地理的情報とを記憶するステップを含む。

いくつかの実施形態では、地理的情報は、その場所のＷｉＦｉフィンガプリントを備える。

いくつかの実施形態では、コンピュータ実行可能命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える。

いくつかの実施形態では、第１の人工ニューラルネットワークは、第１の人工ニューラルネットワークである。コンピュータ実行可能命令は、少なくとも部分的に、キーフレーム内の識別された特徴のための算出された特徴記述子に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成される、第２の人工ニューラルネットワークを実装するための命令を備える。

いくつかの実施形態では、コンピュータ実行可能命令はさらに、ポータブル電子システム上で実行されるアプリケーションに、１つ以上の持続的座標フレームの持続的座標フレームを特徴付ける、情報を提供するように構成される、アプリケーションプログラミングインターフェースと、第２の複数の画像に基づいて、３Ｄ環境のマップを精緻化するための命令と、少なくとも部分的に、第２の複数の画像に基づいて、持続的座標フレームのうちの１つ以上のものを調節するための命令と、アプリケーションプログラミングインターフェースを通して調節された持続的座標フレームの通知を提供するための命令とを備える。

いくつかの実施形態では、１つ以上の持続的座標フレームを調節するステップは、３Ｄ環境のマップの原点に対する１つ以上の持続的座標フレームの平行移動および回転を調節するステップを含む。

いくつかの実施形態では、電子システムは、ウェアラブルデバイスを備え、１つ以上のセンサは、ウェアラブルデバイス上に搭載される。マップは、ウェアラブルデバイス上で算出された追跡マップである。マップの原点は、デバイスが電源投入された場所に基づいて決定される。

いくつかの実施形態では、電子システムは、ウェアラブルデバイスを備え、１つ以上のセンサは、ウェアラブルデバイス上に搭載される。コンピュータ実行可能命令はさらに、ポータブルデバイスの運動を追跡するステップと、閾値距離を超えるウェアラブルデバイスの運動を示す、追跡された運動に基づいて、１つ以上の座標フレームを生成するための命令および／または１つ以上の持続的座標フレームを記憶するための命令の実行のタイミングを制御するステップであって、閾値距離は、２～２０メートルである、ステップとのための命令を備える。

いくつかの実施形態は、電子システムを動作させ、ポータブルデバイスを備える、３Ｄ環境内に仮想コンテンツをレンダリングする方法に関する。本方法は、１つ以上のプロセッサを用いて、ポータブルデバイス上に、ポータブルデバイス上の１つ以上のセンサの出力に基づいて、ポータブルデバイスにローカルの座標フレームを維持するステップと、記憶された座標フレームを３Ｄ環境についての記憶された空間情報から取得するステップと、ポータブルデバイスにローカルの座標フレームと取得された記憶された座標フレームとの間の変換を算出するステップと、仮想オブジェクトにローカルの座標フレームを有する、仮想オブジェクトの仕様と、選択された記憶された座標フレームに対する仮想オブジェクトの場所とを受信するステップと、少なくとも部分的に、算出された変換および仮想オブジェクトの受信された場所に基づいて、決定された場所において、仮想オブジェクトをポータブルデバイスのディスプレイ上にレンダリングするステップとを含む。

いくつかの実施形態では、記憶された座標フレームを取得するステップは、アプリケーションプログラミングインターフェース（ＡＰＩ）を通して、座標フレームを取得するステップを含む。

いくつかの実施形態では、ポータブルデバイスは、１つ以上のプロセッサの第１のプロセッサを備える、第１のポータブルデバイスを備える。本システムはさらに、１つ以上のプロセッサの第２のプロセッサを備える、第２のポータブルデバイスを備える。第１および第２のデバイスのそれぞれ上のプロセッサは、同一の記憶された座標フレームを取得し、個別のデバイスにローカルの座標フレームと取得された同一記憶された座標フレームとの間の変換を算出し、仮想オブジェクトの仕様を受信し、仮想オブジェクトを個別のディスプレイ上にレンダリングする。

いくつかの実施形態では、第１および第２のデバイスはそれぞれ、複数のカメラ画像を出力するように構成される、カメラと、複数のカメラ画像を複数のキーフレームに変換するように構成される、キーフレーム生成器と、複数のキーフレームを平均することによって、持続的姿勢を生成するように構成される、持続的姿勢計算機と、追跡マップを持続的姿勢に変換し、追跡マップの原点に対する持続的姿勢を決定するように構成される、追跡マップおよび持続的姿勢変換器と、持続的姿勢をＰＣＦに変換するように構成される、持続的姿勢および持続的座標フレーム（ＰＣＦ）変換器と、ＰＣＦを含む空間情報をサーバに伝送するように構成される、マップ発行器とを備える。

いくつかの実施形態では、本方法はさらに、アプリケーションを実行し、仮想オブジェクトの仕様および選択された記憶された座標フレームに対する仮想オブジェクトの場所を生成するステップを含む。

いくつかの実施形態では、ポータブルデバイス上に、ポータブルデバイスにローカルの座標フレームを維持するステップは、第１および第２のポータブルデバイス毎に、ポータブルデバイスの１つ以上のセンサから、３Ｄ環境についての複数の画像を捕捉するステップと、少なくとも部分的に、複数の画像に基づいて、１つ以上の持続的姿勢を算出するステップと、少なくとも部分的に、算出された１つ以上の持続的姿勢に基づいて、３Ｄ環境についての空間情報を生成するステップとを含む。本方法はさらに、第１および第２のポータブルデバイス毎に、遠隔サーバに、生成された空間情報を伝送するステップを含み、記憶された座標フレームを取得するステップは、記憶された座標フレームを遠隔サーバから受信するステップを含む。

いくつかの実施形態では、少なくとも部分的に、複数の画像に基づいて、１つ以上の持続的姿勢を算出するステップは、１つ以上の特徴を複数の画像のそれぞれから抽出するステップと、１つ以上の特徴毎に、記述子を生成するステップと、複数の画像毎に、少なくとも部分的に、記述子に基づいて、キーフレームを生成するステップと、少なくとも部分的に、１つ以上のキーフレームに基づいて、１つ以上の持続的姿勢を生成するステップとを含む。

いくつかの実施形態では、１つ以上の持続的姿勢を生成するステップは、他の持続的姿勢の場所から所定の距離だけ進行するポータブルデバイスに基づいて、持続的姿勢を選択的に生成するステップを含む。

いくつかの実施形態では、第１および第２のデバイスはそれぞれ、記憶された座標フレームをサーバからダウンロードするように構成される、ダウンロードシステムを備える。

いくつかの実施形態は、仮想コンテンツを複数のポータブルデバイスのそれぞれ上にレンダリングするために、３Ｄ環境についての持続的空間情報を維持するための電子システムに関する。電子システムは、ネットワーク化されたコンピューティングデバイスを含む。ネットワーク化されたコンピューティングデバイスは、少なくとも１つのプロセッサと、プロセッサに接続される、少なくとも１つの記憶デバイスと、少なくとも１つのプロセッサを用いて実行可能であって、複数のポータブルデバイスのポータブルデバイスから、複数のマップを受信し、少なくとも１つの記憶デバイス上にマップ情報を記憶する、マップ記憶ルーチンであって、複数の受信されたマップはそれぞれ、少なくとも１つの座標フレームを備える、マップ記憶ルーチンと、少なくとも１つのプロセッサを用いて実行可能であって、複数のポータブルデバイスのポータブルデバイスから、場所情報を受信し、記憶されたマップの中から、１つ以上のマップを選択し、複数のポータブルデバイスのポータブルデバイスに、選択された１つ以上のマップからの情報を伝送し、伝送される情報は、選択された１つ以上のマップのマップの座標フレームを備える、ためのマップ伝送機とを含む。

いくつかの実施形態では、座標フレームは、コンピュータデータ構造を備える。コンピュータデータ構造は、３Ｄ環境内のオブジェクトの複数の特徴を特徴付ける、情報を備える、座標フレームを備える。

いくつかの実施形態では、複数の特徴を特徴付ける、情報は、３Ｄ環境の領域を特徴付ける、記述子を備える。

いくつかの実施形態では、少なくとも１つの座標フレームの各座標フレームは、３Ｄ環境を表すセンサデータ内で検出された特徴によって特徴付けられる、持続的点を備える。

いくつかの実施形態では、少なくとも１つの座標フレームの各座標フレームは、持続的姿勢を備える。

いくつかの実施形態では、少なくとも１つの座標フレームの各座標フレームは、持続的座標フレームを備える。

前述の説明は、例証として提供され、限定することを意図するものではない。
本発明は、例えば、以下を提供する。
（項目１）
電子システムであって、
３次元（３Ｄ）環境についての情報を捕捉するように構成される１つ以上のセンサであって、前記捕捉された情報は、複数の画像を備える、センサと、
コンピュータ実行可能命令を実行し、前記複数の画像に基づいて、前記３Ｄ環境の少なくとも一部のマップを生成するように構成される少なくとも１つのプロセッサであって、前記コンピュータ実行可能命令はさらに、
前記複数の画像内の複数の特徴を識別することと、
少なくとも部分的に、選択されたキーフレームの複数の特徴に基づいて、複数のキーフレームを前記複数の画像の中から選択することと、
少なくとも部分的に、前記選択されたキーフレームの識別された特徴に基づいて、１つ以上の座標フレームを生成することと、
前記３Ｄ環境のマップと関連付けて、前記１つ以上の座標フレームを１つ以上の持続的座標フレームとして記憶することと
を行うための命令を備える、少なくとも１つのプロセッサと
を備える、電子システム。
（項目２）
前記１つ以上のセンサは、前記複数の画像の各画像が複数のピクセルを備えるように２次元アレイで配列される複数のピクセル回路を備え、
各特徴は、複数のピクセルに対応する、
項目１に記載の電子システム。
（項目３）
前記複数の画像内の複数の特徴を識別することは、前記識別された特徴として、持続的オブジェクトの部分を描写するピクセルの群との類似性の測定値に基づいて、前記ピクセルの群の所定の最大値未満の数を選択することを含む、項目１に記載の電子システム。
（項目４）
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレーム毎に、
そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセットを表す記述子
を記憶することを含む、項目１に記載の電子システム。
（項目５）
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレーム毎に、
そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセット
を記憶することを含む、項目１に記載の電子システム。
（項目６）
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレーム毎に、
前記３Ｄ環境のマップの座標フレームと前記持続的座標フレームとの間の変換と、
そこから前記座標フレームが生成された選択されたキーフレームの前記３Ｄ環境内の場所を示す地理的情報と
を記憶することを含む、項目１に記載の電子システム。
（項目７）
前記地理的情報は、前記場所のＷｉＦｉフィンガプリントを備える、項目６に記載の電子システム。
（項目８）
前記コンピュータ実行可能命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える、項目１に記載の電子システム。
（項目９）
前記第１の人工ニューラルネットワークは、第１の人工ニューラルネットワークであり、
前記コンピュータ実行可能命令は、少なくとも部分的に、前記キーフレーム内の前記識別された特徴のための前記算出された特徴記述子に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成される第２の人工ニューラルネットワークを実装するための命令を備える、
項目８に記載の電子システム。
（項目１０）
前記コンピュータ実行可能命令はさらに、
アプリケーションプログラミングインターフェースであって、前記アプリケーションプログラミングインターフェースは、ポータブル電子システム上で実行されるアプリケーションに、前記１つ以上の持続的座標フレームの持続的座標フレームを特徴付ける情報を提供するように構成される、アプリケーションプログラミングインターフェースと、
第２の複数の画像に基づいて、前記３Ｄ環境のマップを精緻化するための命令と、
少なくとも部分的に、前記第２の複数の画像に基づいて、前記持続的座標フレームのうちの１つ以上のものを調節することと、
前記アプリケーションプログラミングインターフェースを通して前記調節された持続的座標フレームの通知を提供するための命令と
を備える、項目１に記載の電子システム。
（項目１１）
前記１つ以上の持続的座標フレームを調節することは、前記３Ｄ環境のマップの原点に対する前記１つ以上の持続的座標フレームの平行移動および回転を調節することを含む、項目１０に記載の電子システム。
（項目１２）
前記電子システムは、ウェアラブルデバイスを備え、前記１つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記マップは、前記ウェアラブルデバイス上で算出された追跡マップであり、
前記マップの原点は、前記デバイスが電源投入された場所に基づいて決定される、
項目１１に記載の電子システム。
（項目１３）
前記電子システムは、ウェアラブルデバイスを備え、前記１つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記コンピュータ実行可能命令はさらに、
前記ポータブルデバイスの運動を追跡することと、
閾値距離を超える前記ウェアラブルデバイスの運動を示す前記追跡された運動に基づいて、１つ以上の座標フレームを生成するための命令および／または１つ以上の持続的座標フレームを記憶するための命令の実行のタイミングを制御することであって、前記閾値距離は、２～２０メートルである、ことと
を行うための命令を備える、項目１に記載の電子システム。
（項目１４）
電子システムを動作させ、ポータブルデバイスを備える３Ｄ環境内に仮想コンテンツをレンダリングする方法であって、前記方法は、１つ以上のプロセッサを用いて、
前記ポータブルデバイス上に、前記ポータブルデバイス上の１つ以上のセンサの出力に基づいて、前記ポータブルデバイスにローカルの座標フレームを維持することと、
記憶された座標フレームを前記３Ｄ環境についての記憶された空間情報から取得することと、
前記ポータブルデバイスにローカルの座標フレームと前記取得された記憶された座標フレームとの間の変換を算出することと、
仮想オブジェクトにローカルの座標フレームを有する仮想オブジェクトの仕様と、前記選択された記憶された座標フレームに対する前記仮想オブジェクトの場所とを受信することと、
少なくとも部分的に、前記算出された変換および前記仮想オブジェクトの前記受信された場所に基づいて、決定された場所において、前記仮想オブジェクトを前記ポータブルデバイスのディスプレイ上にレンダリングすることと
を含む、方法。
（項目１５）
前記記憶された座標フレームを取得することは、アプリケーションプログラミングインターフェース（ＡＰＩ）を通して、前記座標フレームを取得することを含む、項目１４に記載の方法。
（項目１６）
前記ポータブルデバイスは、前記１つ以上のプロセッサの第１のプロセッサを備える第１のポータブルデバイスを備え、
前記システムはさらに、前記１つ以上のプロセッサの第２のプロセッサを備える第２のポータブルデバイスを備え、
前記第１および第２のデバイスのそれぞれ上のプロセッサは、
同一の記憶された座標フレームを取得することと、
個別のデバイスにローカルの座標フレームと前記取得された同一の記憶された座標フレームとの間の変換を算出することと、
前記仮想オブジェクトの仕様を受信することと、
前記仮想オブジェクトを個別のディスプレイ上にレンダリングすることと
を行う、項目１４に記載の方法。
（項目１７）
前記第１および第２のデバイスはそれぞれ、
複数のカメラ画像を出力するように構成されるカメラと、
複数のカメラ画像を複数のキーフレームに変換するように構成されるキーフレーム生成器と、
前記複数のキーフレームを平均することによって、持続的姿勢を生成するように構成される持続的姿勢計算機と、
追跡マップを前記持続的姿勢に変換し、前記追跡マップの原点に対する前記持続的姿勢を決定するように構成される追跡マップおよび持続的姿勢変換器と、
前記持続的姿勢をＰＣＦに変換するように構成される持続的姿勢および持続的座標フレーム（ＰＣＦ）変換器と、
前記ＰＣＦを含む空間情報をサーバに伝送するように構成されるマップ発行器と
を備える、項目１６に記載の方法。
（項目１８）
アプリケーションを実行し、前記仮想オブジェクトの仕様および前記選択された記憶された座標フレームに対する前記仮想オブジェクトの場所を生成することをさらに含む、項目１６に記載の方法。
（項目１９）
前記ポータブルデバイス上に、前記ポータブルデバイスにローカルの座標フレームを維持することは、前記第１および第２のポータブルデバイス毎に、
前記ポータブルデバイスの１つ以上のセンサから、前記３Ｄ環境についての複数の画像を捕捉することと、
少なくとも部分的に、前記複数の画像に基づいて、１つ以上の持続的姿勢を算出することと、
少なくとも部分的に、前記算出された１つ以上の持続的姿勢に基づいて、前記３Ｄ環境についての空間情報を生成することと
を含み、
前記方法はさらに、前記第１および第２のポータブルデバイス毎に、遠隔サーバに、前記生成された空間情報を伝送することを含み、
前記記憶された座標フレームを取得することは、前記記憶された座標フレームを前記遠隔サーバから受信することを含む、
項目１６に記載の方法。
（項目２０）
少なくとも部分的に、前記複数の画像に基づいて、前記１つ以上の持続的姿勢を算出することは、
１つ以上の特徴を前記複数の画像のそれぞれから抽出することと、
前記１つ以上の特徴毎に、記述子を生成することと、
前記複数の画像毎に、少なくとも部分的に、前記記述子に基づいて、キーフレームを生成することと、
少なくとも部分的に、前記１つ以上のキーフレームに基づいて、前記１つ以上の持続的姿勢を生成することと
を含む、項目１９に記載の方法。
（項目２１）
前記１つ以上の持続的姿勢を生成することは、
他の持続的姿勢の場所から所定の距離だけ進行する前記ポータブルデバイスに基づいて、持続的姿勢を選択的に生成すること
を含む、項目２０に記載の方法。
（項目２２）
前記第１および第２のデバイスはそれぞれ、
前記記憶された座標フレームをサーバからダウンロードするように構成されるダウンロードシステム
を備える、項目１６に記載の方法。
（項目２３）
仮想コンテンツを複数のポータブルデバイスのそれぞれ上にレンダリングするために、３Ｄ環境についての持続的空間情報を維持するための電子システムであって、前記電子システムは、
ネットワーク化されたコンピューティングデバイスであって、
少なくとも１つのプロセッサと、
前記プロセッサに接続される少なくとも１つの記憶デバイスと、
マップ記憶ルーチンであって、前記マップ記憶ルーチンは、前記複数のポータブルデバイスのポータブルデバイスから、複数のマップを受信し、前記少なくとも１つの記憶デバイス上にマップ情報を記憶するように、前記少なくとも１つのプロセッサを用いて実行可能であり、前記複数の受信されたマップはそれぞれ、少なくとも１つの座標フレームを備える、マップ記憶ルーチンと、
マップ伝送機であって、前記マップ伝送機は、
前記複数のポータブルデバイスのポータブルデバイスから、場所情報を受信することと、
前記記憶されたマップの中から、１つ以上のマップを選択することと、
前記複数のポータブルデバイスのポータブルデバイスに、前記選択された１つ以上のマップからの情報を伝送することであって、前記伝送される情報は、前記選択された１つ以上のマップの、マップの座標フレームを備える、ことと
を行うように、前記少なくとも１つのプロセッサを用いて実行可能である、マップ伝送機と
を備える、ネットワーク化されたコンピューティングデバイス
を備える、電子システム。
（項目２４）
前記座標フレームは、
前記３Ｄ環境内のオブジェクトの複数の特徴を特徴付ける情報を備える座標フレーム
を備えるコンピュータデータ構造を備える、項目２３に記載の電子システム。
（項目２５）
前記複数の特徴を特徴付ける情報は、前記３Ｄ環境の領域を特徴付ける記述子を備える、項目２３に記載の電子システム。
（項目２６）
前記少なくとも１つの座標フレームの各座標フレームは、前記３Ｄ環境を表すセンサデータ内で検出された特徴によって特徴付けられる持続的点を備える、項目２３に記載の電子システム。
（項目２７）
前記少なくとも１つの座標フレームの各座標フレームは、持続的姿勢を備える、項目２６に記載の電子システム。
（項目２８）
前記少なくとも１つの座標フレームの各座標フレームは、持続的座標フレームを備える、項目２６に記載の電子システム。

添付の図面は、縮尺通りに描かれることを意図していない。図面では、種々の図に図示される、各同じまたはほぼ同じコンポーネントは、同様の数字で表される。明確性の目的のために、全てのコンポーネントが、全ての図面において標識されているわけではない。

図１は、いくつかの実施形態による、簡略化された拡張現実（ＡＲ）場面の実施例を図示する、スケッチである。

図２は、いくつかの実施形態による、ＸＲシステムの例示的ユースケースを示す、例示的簡略化されたＡＲ場面のスケッチである。

図３は、いくつかの実施形態による、物理的世界と相互作用するＡＲコンテンツの体験をユーザに提供するように構成される、ＡＲシステム内の単一ユーザのためのデータフローを図示する、概略図である。

図４は、いくつかの実施形態による、単一ユーザのための仮想コンテンツを表示する、例示的ＡＲディスプレイシステムを図示する、概略図である。

図５Ａは、いくつかの実施形態による、ユーザが物理的世界環境を通して移動するにつれてＡＲコンテンツをレンダリングする、ＡＲディスプレイシステムを装着しているユーザを図示する、概略図である。

図５Ｂは、いくつかの実施形態による、視認光学系アセンブリおよび付帯コンポーネントを図示する、概略図である。

図６Ａは、いくつかの実施形態による、世界再構築システムを使用するＡＲシステムを図示する、概略図である。

図６Ｂは、いくつかの実施形態による、パス可能世界のモデルを維持する、ＡＲシステムのコンポーネントを図示する、概略図である。

図７は、物理的世界を通した経路をトラバースするデバイスによって形成される、追跡マップの概略図である。

図８は、いくつかの実施形態による、仮想コンテンツを知覚する、クロスリアリティ（ＸＲ）システムのユーザを図示する、概略図である。

図９は、いくつかの実施形態による、座標系間で変換する、図８のＸＲシステムの第１のＸＲデバイスのコンポーネントのブロック図である。

図１０は、いくつかの実施形態による、ローカルＸＲコンテンツを正しくレンダリングするための目的地座標フレームへの原点座標フレームの例示的変換を図示する、概略図である。

図１１は、いくつかの実施形態による、瞳孔ベースの座標フレームを図示する、上部平面図である。

図１２は、いくつかの実施形態による、全ての瞳孔位置を含む、カメラ座標フレームを図示する、上部平面図である。

図１３は、いくつかの実施形態による、図９のディスプレイシステムの概略図である。

図１４は、いくつかの実施形態による、持続的座標フレーム（ＰＣＦ）の作成およびＸＲコンテンツのＰＣＦへの結付を図示する、ブロック図である。

図１５は、いくつかの実施形態による、ＰＣＦを確立および使用する方法を図示する、フローチャートである。

図１６は、いくつかの実施形態による、第２のＸＲデバイスを含む、図８のＸＲシステムのブロック図である。

図１７は、いくつかの実施形態による、部屋と、部屋内の種々のエリアのために確立される、キーフレームとを図示する、概略図である。

図１８は、いくつかの実施形態による、キーフレームに基づく、持続的姿勢の確立を図示する、概略図である。

図１９は、いくつかの実施形態による、持続的姿勢に基づく、持続座標フレーム（ＰＣＦ）の確立を図示する、概略図である。

図２０Ａ－２０Ｃは、いくつかの実施形態による、ＰＣＦを作成する実施例を図示する、概略図である。

図２１は、いくつかの実施形態による、個々の画像および／またはマップのためのグローバル記述子を生成するためのシステムを図示する、ブロック図である。

図２２は、いくつかの実施形態による、画像記述子を算出する方法を図示する、フローチャートである。

図２３は、いくつかの実施形態による、画像記述子を使用した位置特定の方法を図示する、フローチャートである。

図２４は、いくつかの実施形態による、ニューラルネットワークを訓練する方法を図示する、フローチャートである。

図２５は、いくつかの実施形態による、ニューラルネットワークを訓練する方法を図示する、ブロック図である。

図２６は、いくつかの実施形態による、複数の環境マップをランク付けおよびマージするように構成される、ＡＲシステムを図示する、概略図である。

図２７は、いくつかの実施形態による、遠隔記憶媒体上に記憶された複数の規準マップを図示する、簡略化されたブロック図である。

図２８は、いくつかの実施形態による、規準マップを選択し、例えば、１つ以上の規準マップ内で新しい追跡マップを位置特定する、および／またはＰＣＦを規準マップから取得する方法を図示する、概略図である。

図２９は、いくつかの実施形態による、複数のランク付けされた環境マップを選択する方法を図示する、フローチャートである。

図３０は、いくつかの実施形態による、図２６のＡＲシステムの例示的マップランク付け部分を図示する、概略図である。

図３１Ａは、いくつかの実施形態による、データベース内の追跡マップ（ＴＭ）および環境マップのエリア属性の実施例を図示する、概略図である。

図３１Ｂは、いくつかの実施形態による、図２９の地理的場所フィルタリングのための追跡マップ（ＴＭ）の地理的場所を決定する実施例を図示する、概略図である。

図３２は、いくつかの実施形態による、図２９の地理的場所フィルタリングの実施例を図示する、概略図である。

図３３は、いくつかの実施形態による、図２９のＷｉ－ＦｉＢＳＳＩＤフィルタリングの実施例を図示する、概略図である。

図３４は、いくつかの実施形態による、図２９の位置特定の実施例を図示する、概略図である。

図３５および３６は、いくつかの実施形態による、複数の環境マップをランク付けおよびマージするように構成される、ＸＲシステムのブロック図である。図３５および３６は、いくつかの実施形態による、複数の環境マップをランク付けおよびマージするように構成される、ＸＲシステムのブロック図である。

図３７は、いくつかの実施形態による、規準形態において、物理的世界の環境マップを作成する方法を図示する、ブロック図である。

図３８Ａおよび３８Ｂは、いくつかの実施形態による、図７の追跡マップを新しい追跡マップで更新することによって規準形態において作成された環境マップを図示する、概略図である。図３８Ａおよび３８Ｂは、いくつかの実施形態による、図７の追跡マップを新しい追跡マップで更新することによって規準形態において作成された環境マップを図示する、概略図である。

図３９Ａ－３９Ｆは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。図３９Ａ－３９Ｆは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。図３９Ａ－３９Ｆは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。図３９Ａ－３９Ｆは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。図３９Ａ－３９Ｆは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。図３９Ａ－３９Ｆは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。

図４０は、いくつかの実施形態による、３次元の第１のローカル追跡マップ（マップ１）の２次元表現であって、これは、図９の第１のＸＲデバイスによって生成され得る。

図４１は、いくつかの実施形態による、マップ１を第１のＸＲデバイスから図９のサーバにアップロードするステップを図示する、ブロック図である。

図４２は、いくつかの実施形態による、図１６のＸＲシステムを図示する、概略図であって、第２のユーザが、第１のユーザが第１のセッションを終了した後、ＸＲシステムの第２のＸＲデバイスを使用して、第２のセッションを開始したことを示す。

図４３Ａは、いくつかの実施形態による、図４２の第２のＸＲデバイスのための新しいセッションを図示する、ブロック図である。

図４３Ｂは、いくつかの実施形態による、図４２の第２のＸＲデバイスのための追跡マップの作成を図示する、ブロック図である。

図４３Ｃは、いくつかの実施形態による、規準マップをサーバから図４２の第２のＸＲデバイスにダウンロードするステップを図示する、ブロック図である。

図４４は、いくつかの実施形態による、規準マップに対して、図４２の第２のＸＲデバイスによって生成され得る、第２の追跡マップ（マップ２）を位置特定するように試みる、位置特定を図示する、概略図である。

図４５は、いくつかの実施形態による、規準マップに対して、さらに展開され得、マップ２のＰＣＦと関連付けられるＸＲコンテンツを伴う、図４４の第２の追跡マップ（マップ２）を位置特定するように試みる、位置特定を図示する、概略図である。

図４６Ａ－４６Ｂは、いくつかの実施形態による、規準マップに対する図４５のマップ２の位置特定成功を図示する、概略図である。図４６Ａ－４６Ｂは、いくつかの実施形態による、規準マップに対する図４５のマップ２の位置特定成功を図示する、概略図である。

図４７は、いくつかの実施形態による、図４６Ａの規準マップからの１つ以上のＰＣＦを図４５のマップ２の中に含めることによって生成された、規準マップを図示する、概略図である。

図４８は、いくつかの実施形態による、第２のＸＲデバイス上のマップ２のさらなる拡張を伴う、図４７の規準マップを図示する、概略図である。

図４９は、いくつかの実施形態による、マップ２を第２のＸＲデバイスからサーバにアップロードするステップを図示する、ブロック図である。

図５０は、いくつかの実施形態による、マップ２と規準マップをマージするステップを図示する、ブロック図である。

図５１は、いくつかの実施形態による、サーバから第１および第２のＸＲデバイスへの新しい規準マップの伝送を図示する、ブロック図である。

図５２は、いくつかの実施形態による、マップ２の２次元表現と、マップ２に参照される、第２のＸＲデバイスの頭部座標フレームとを図示する、ブロック図である。

図５３は、いくつかの実施形態による、２次元において、６自由度で生じ得る、頭部座標フレームの調節を図示する、ブロック図である。

図５４は、いくつかの実施形態による、音がマップ２のＰＣＦに対して位置特定される、第２のＸＲデバイス上の規準マップを図示する、ブロック図である。

図５５および５６は、いくつかの実施形態による、第１のユーザが第１のセッションを終了し、第１のユーザがＸＲシステムを使用して第２のセッションを開始したときの、ＸＲシステムの使用を図示する、斜視図およびブロック図である。図５５および５６は、いくつかの実施形態による、第１のユーザが第１のセッションを終了し、第１のユーザがＸＲシステムを使用して第２のセッションを開始したときの、ＸＲシステムの使用を図示する、斜視図およびブロック図である。

図５７および５８は、いくつかの実施形態による、３人のユーザが同一セッション内でＸＲシステムを同時に使用するときの、ＸＲシステムの使用を図示する、斜視図およびブロック図である。図５７および５８は、いくつかの実施形態による、３人のユーザが同一セッション内でＸＲシステムを同時に使用するときの、ＸＲシステムの使用を図示する、斜視図およびブロック図である。

図５９は、いくつかの実施形態による、頭部姿勢を復元およびリセットする方法を図示する、フローチャートである。

図６０は、いくつかの実施形態による、本発明のシステム内でアプリケーションを見出し得る、コンピュータの形態における機械のブロック図である。

本明細書に説明されるものは、Ｘリアリティ（ＸＲまたはクロスリアリティ）場面を提供するための方法および装置である。現実的ＸＲ体験を複数のユーザに提供するために、ＸＲシステムは、実オブジェクトに関連して仮想オブジェクトの場所を正しく相関させるために、ユーザの物理的周囲を把握しなければならない。ＸＲシステムは、場面の環境マップを構築し得、これは、ＸＲシステムのユーザによって装着されるＸＲデバイスの一部であるセンサを用いて収集された、画像および／または深度情報から作成され得る。

本発明者らは、ある時点での走査の間に収集された１つ以上の画像からの情報を統合することによって、各ＸＲデバイスがその物理的環境のローカルマップを展開する、ＸＲシステムを有することが有益であり得ることを実現し、その真価を認めた。いくつかの実施形態では、そのマップの座標系は、走査が開始されたときのデバイスの配向に結び付けられる。その配向は、異なる瞬間が、異なるユーザ、それぞれ環境を走査するセンサを伴うその独自のウェアラブルデバイス、または異なる時間において同一デバイスを使用する同一ユーザと関連付けられるかどうかにかかわらず、ユーザがＸＲシステムと相互作用するにつれて、瞬間毎に変化し得る。本発明者らは、各ユーザデバイスが、異なるユーザインスタンス（例えば、時間単位のスナップショット）またはシステムのセッション（例えば、オンとオフとの間の時間）に関して異なる、配向に対して収集される、空間情報のみに依拠する、ＸＲシステムの限界を克服する、持続的空間情報に基づいてＸＲシステムを動作させるための技法を実現し、その真価を認めた。本技法は、例えば、持続的空間情報が、ＸＲシステムの複数のユーザのいずれかによって、作成され、記憶され、読み出されることを可能にすることによって、単一または複数のユーザのためのより算出上効率的および没入型の体験のためのＸＲ場面を提供し得る。

持続的空間情報は、ＸＲ体験を向上させる、１つ以上の機能を有効にし得る、持続的マップによって表されてもよい。持続的マップは、遠隔記憶媒体（例えば、クラウド）内に記憶されてもよい。例えば、ユーザによって装着されるウェアラブルデバイスは、オンにされた後、クラウド記憶装置等の持続記憶装置から、以前に作成および記憶された、適切な記憶されたマップを読み出してもよい。その以前に記憶されたマップは、以前のセッションの間に、ユーザのウェアラブルデバイス上のセンサを用いて収集された環境についてのデータに基づき得る。記憶されたマップを読み出すことは、ウェアラブルデバイス上のセンサを用いた物理的世界の走査を伴わずに、ウェアラブルデバイスの使用を有効にし得る。代替として、または加えて、システム／デバイスは、物理的世界の新しい領域に進入することに応じて、同様に、適切な記憶されたマップを読み出してもよい。

記憶されたマップは、各ＸＲデバイスがそのローカル基準フレームに関連し得る、規準形態において表されてもよい。マルチデバイスＸＲシステムでは、１つのデバイスによってアクセスされる記憶されたマップは、別のデバイスによって作成および記憶されていてもよく、および／または記憶されたマップによって表される物理的世界の少なくとも一部内に以前に存在した、複数のウェアラブルデバイス上のセンサによって収集された物理的世界についてのデータを集約することによって、構築されていてもよい。

さらに、物理的世界についてのデータを複数のデバイス間で共有することは、仮想コンテンツの共有ユーザ体験を有効にし得る。同一の記憶されたマップへのアクセスを有する、２つのＸＲデバイスは両方とも、例えば、記憶されたマップに対して位置特定されてもよい。いったん位置特定されると、ユーザデバイスは、基準によって規定された場所を有する、仮想コンテンツを、その場所をユーザデバイスによって維持されるフレームまたは基準に平行移動させることによって、記憶されたマップにレンダリングしてもよい。ユーザデバイスは、本ローカル基準フレームを使用して、ユーザデバイスのディスプレイを制御し、仮想コンテンツを規定された場所内にレンダリングしてもよい。

これらおよび他の機能をサポートするために、ＸＲシステムは、ユーザデバイス上のセンサを用いて収集された物理的世界についてのデータに基づいて、１つ以上の記憶されたマップを含む、持続的空間情報を展開、維持、および使用する、コンポーネントを含んでもよい。これらのコンポーネントは、ＸＲシステムを横断して分散されてもよく、一部は、例えば、ユーザデバイスの頭部搭載型部分上で動作する。他のコンポーネントは、ローカルまたはパーソナルエリアネットワークを経由して頭部搭載型部分に結合される、ユーザと関連付けられるコンピュータ上で動作してもよい。さらにその他は、広域ネットワークを経由してアクセス可能な１つ以上のサーバ等、遠隔場所で動作してもよい。

これらのコンポーネントは、例えば、１つ以上のユーザデバイスによって収集された物理的世界についての情報から、持続的マップとして、または持続的マップ内に記憶されるために十分な品質である情報を識別し得る、コンポーネントを含んでもよい。下記により詳細に説明される、そのようなコンポーネントの実施例は、マップマージコンポーネントである。そのようなコンポーネントは、例えば、ユーザデバイスからの入力を受信し、持続的マップを更新するために使用される入力の部分の好適性を決定してもよい。マップマージコンポーネントは、例えば、ユーザデバイスによって作成されたローカルマップを部分に分裂させ、部分のうちの１つ以上のものと持続的マップのマージ可能性を決定し、認定されたマージ可能性基準を満たす部分を持続的マップにマージしてもよい。マップマージコンポーネントはまた、例えば、持続的マップとマージされない部分が別個の持続的マップとなるようにプロモートしてもよい。

別の実施例として、これらのコンポーネントは、ユーザデバイスによって読み出され、使用され得る、適切な持続的マップを決定することを補助し得る、コンポーネントを含んでもよい。下記により詳細に説明される、そのようなコンポーネントの実施例は、マップランク付けコンポーネントである。そのようなコンポーネントは、例えば、入力をユーザデバイスから受信し、その中でデバイスが動作中である、物理的世界の領域を表す可能性が高い、１つ以上の持続的マップを識別してもよい。マップランク付けコンポーネントは、例えば、仮想コンテンツをレンダリングする、環境についてのデータを集める、または他のアクションを実施する際、そのローカルデバイスによって使用されるべき持続的マップを選択することを補助し得る。マップランク付けコンポーネントは、代替として、または加えて、物理的世界についての付加的情報が１つ以上のユーザデバイスによって収集されるにつれて、更新されるべき持続的マップを識別することを補助し得る。

さらに他のコンポーネントは、１つの基準フレームに関連して捕捉または説明される情報を別の基準フレームに変換する、変換を決定してもよい。例えば、センサは、そのセンサから読み取られたデータが、装着者の頭部姿勢に対する物理的世界内のオブジェクトの場所を示すように、頭部搭載型ディスプレイに取り付けられてもよい。１つ以上の変換が、その場所情報を持続環境マップと関連付けられる座標フレームに関連させるように適用されてもよい。同様に、持続環境マップの座標フレーム内に表されるとき、仮想オブジェクトがレンダリングされるべき場所を示す、データは、ユーザの頭部上のディスプレイの基準フレーム内にあるように１つ以上の変換を受けてもよい。下記により詳細に説明されるように、複数のそのような変換が存在してもよい。これらの変換は、それらが分散型システム内で効率的に更新および／または適用され得るように、ＸＲシステムのコンポーネントを横断してパーティション化されてもよい。

いくつかの実施形態では、持続的マップは、複数のユーザデバイスによって収集された情報から構築されてもよい。ＸＲデバイスは、種々の場所および時間においてＸＲデバイスのそれぞれのセンサによって収集された情報を用いて、ローカル空間情報を捕捉し、別個の追跡マップを構築してもよい。各追跡マップは、それぞれ、複数の特徴を含み得る、実オブジェクトの特徴と関連付けられ得る、点を含んでもよい。潜在的に、入力を供給し、持続的マップを作成および維持するステップに加え、追跡マップは、場面内のユーザの運動を追跡するために使用され、ＸＲシステムが、追跡マップに基づいて、個別のユーザの頭部姿勢を推定することを可能にしてもよい。

マップの作成と頭部姿勢の推定との間の本共依存性は、有意な課題を構成する。実質的処理が、同時に、マップを作成し、頭部姿勢を推定するために要求され得る。待ち時間は、ＸＲ体験をユーザにとってあまり現実的ではないものにするため、処理は、オブジェクトが場面内を移動する（例えば、カップをテーブル上で移動させる）につれて、かつユーザが場面内を移動するにつれて、迅速に遂行されなければならない。他方では、ＸＲデバイスの重量は、ユーザが快適に装着するために軽量であるべきであるため、ＸＲデバイスは、限定された算出リソースを提供し得る。算出リソースの欠如は、望ましくないことに、重量もまた追加するであろう、センサの追加のため、より多くのセンサを用いて補償されることができない。さらに、より多くのセンサまたはより多くの算出リソースのいずれかは、熱につながり、これは、ＸＲデバイスの変形を生じさせ得る。

本発明者らは、１ｋＨｚの周波数における頭部姿勢の推定、例えば、３０Ｈｚで動作する４つのビデオグラフィックアレイ（ＶＧＡ）カメラとともに構成され得る、ＸＲデバイスと関連する算出リソースの低使用量、１ｋＨｚで動作する１つの慣性測定ユニット（ＩＭＵ）、単一の高度ＲＩＳＣ機械（ＡＲＭ）コアの算出パワー、１ＧＢ未満のメモリ、および１００Ｍｂｐ未満のネットワーク帯域幅等、より没入型のユーザ体験のために、ＸＲシステムを動作させ、ＸＲ場面を提供するための技法を実現し、その真価を認めた。これらの技法は、マップを生成および維持し、頭部姿勢を推定するために要求される処理を低減させ、かつ低算出オーバーヘッドを伴ってデータを提供および消費するステップに関する。

これらの技法は、ＸＲシステムが、（１）環境の連続画像間の区別可能な点のパッチベースの追跡（例えば、フレーム／フレーム追跡）と、（２）現在の画像の着目点と対応する着目点の既知の実世界場所の記述子ベースのマップのマッチング（例えば、マップ／フレーム追跡）との両方を活用し得るように、ハイブリッド追跡を含んでもよい。フレーム／フレーム追跡では、ＸＲシステムは、実世界環境の捕捉された画像間の角等の特定の着目点（例えば、顕著な点）を追跡してもよい。例えば、ディスプレイシステムは、前の画像内に含まれていた（例えば、その中に位置していた）、現在の画像内の視覚的着目点の場所を識別してもよい。本識別は、例えば、測光誤差最小限化プロセスを使用して遂行されてもよい。マップ／フレーム追跡では、ＸＲシステムは、着目点の実世界場所を示す、マップ情報にアクセスし、現在の画像内に含まれる着目点をマップ情報に示される着目点にマッチングさせてもよい。着目点に関する情報は、記述子としてマップデータベース内に記憶されてもよい。ＸＲシステムは、マッチングされた視覚的特徴に基づいて、その姿勢を計算してもよい。米国特許第出願第１６／２２１，０６５号は、ハイブリッド追跡を説明し、参照することによってその全体として本明細書に組み込まれる。

これらの技法は、マッピングされた点の集合およびキーフレームを用いて疎マップを構築する、および／またはマップをブロックに分割し、ブロックによる更新を有効にすること等によって、マップを構築するときに処理される、データの量を低減させるステップを含み得る。マッピングされた点は、環境内の着目点と関連付けられてもよい。キーフレームは、カメラ捕捉データから選択された情報を含んでもよい。米国特許第出願第１６／５２０，５８２号は、位置特定マップを決定および／または評価するステップを説明し、参照することによってその全体として本明細書に組み込まれる。

いくつかの実施形態では、持続的空間情報は、ユーザ間およびアプリケーションを含む分散型コンポーネント間で容易に共有され得る、方法で表されてもよい。物理的世界についての情報は、例えば、持続的座標フレーム（ＰＣＦ）として表されてもよい。ＰＣＦは、物理的世界内で認識される特徴を表す、１つ以上の点に基づいて定義されてもよい。特徴は、それらがＸＲシステムのユーザセッション毎に同一である可能性が高いように選択されてもよい。ＰＣＦは、それらが効率的に処理および転送され得るように、疎らに存在し、物理的世界についての利用可能な情報の全て未満を提供してもよい。持続的空間情報を処理するための技法は、１つ以上のセッションを横断して、実空間内の１つ以上の座標系に基づいて動的マップを作成するステップと、例えば、アプリケーションプログラミングインターフェース（ＡＰＩ）を介して、ＸＲアプリケーションにエクスポーズされ得る、持続座標フレーム（ＰＣＦ）を疎マップにわたって生成するステップとを含んでもよい。これらの能力は、１つ以上のＸＲデバイスによって作成された複数のマップをランク付けおよびマージするための技法によってサポートされてもよい。持続的空間情報はまた、算出上効率的方法において、１つ以上のＸＲデバイスのそれぞれ上に頭部姿勢を迅速に復元およびリセットすることを可能にし得る。

さらに、本技法は、空間情報の効率的比較を有効にし得る。いくつかの実施形態では、画像フレームは、数値記述子によって表されてもよい。その記述子は、画像内で識別された特徴のセットを記述子にマッピングする、変換を介して算出されてもよい。その変換は、訓練されたニューラルネットワーク内で実施されてもよい。いくつかの実施形態では、ニューラルネットワークへの入力として供給される、特徴のセットは、例えば、持続的である可能性が高い特徴を優先的に選択する、技法を使用して画像から抽出された、特徴のフィルタリングされたセットであってもよい。

記述子としての画像フレームの表現は、例えば、新しい画像情報と記憶された画像情報の効率的マッチングを有効にする。ＸＲシステムは、持続的マップと併せて、１つ以上のフレームの記述子を持続的マップの下層に記憶してもよい。ユーザデバイスによって入手されたローカル画像フレームも同様に、そのような記述子に変換されてもよい。ローカル画像フレームのものに類似する記述子を伴う記憶されたマップを選択することによって、ユーザデバイスと同一物理的空間を表す可能性が高い１つ以上の持続的マップが、比較的に少量の処理を伴って選択され得る。いくつかの実施形態では、記述子は、ローカルマップおよび持続的マップ内のキーフレームに関して算出され、マップを比較するとき、処理をさらに低減させてもよい。そのような効率的比較は、例えば、ローカルデバイスを用いて入手された画像情報に基づいて、ローカルデバイス内にロードする、または更新するための持続的マップを見出すためための持続的マップを見出すことを簡略化するために使用されてもよい。

本明細書に説明される技法は、拡張または複合現実場面を提供する、限定された算出リソースを伴う、ウェアラブルまたはポータブルデバイスを含む、多くのタイプのデバイスとともに、かつ多くのタイプの場面のために、ともにまたは別個に使用されてもよい。いくつかの実施形態では、技法は、ＸＲシステムの一部を形成する、１つ以上のサービスによって実装されてもよい。

ＡＲシステム概要

図１および２は、物理的世界の一部と併せて表示される、仮想コンテンツを伴う場面を図示する。例証目的のために、ＡＲシステムが、ＸＲシステムの実施例として使用される。図３－６Ｂは、本明細書に説明される技法に従って動作し得る、１つ以上のプロセッサと、メモリと、センサと、ユーザインターフェースとを含む、例示的ＡＲシステムを図示する。

図１を参照すると、屋外ＡＲ場面３５４が、描写されており、ＡＲ技術のユーザには、人々、木々、背景における建物、およびコンクリートプラットフォーム３５８を特徴とする、物理的世界公園状設定３５６が見える。これらのアイテムに加え、ＡＲ技術のユーザはまた、物理的世界コンクリートプラットフォーム３５８上に立っているロボット像３５７と、それによってマルハナバチの擬人化のように見える、飛んでいる漫画のようなアバタキャラクタ３５２とが「見える」と知覚するが、これらの要素（例えば、アバタキャラクタ３５２およびロボット像３５７）は、物理的世界内には存在しない。ヒト視知覚および神経系の極端な複雑性に起因して、他の仮想または物理的世界画像要素の中で仮想画像要素の快適で、自然な感覚で、かつ豊かな提示を促進する、ＡＲ技術を生産することは、困難である。

そのようなＡＲ場面は、ユーがＡＲコンテンツを物理的世界内に設置することを可能にし、ＡＲコンテンツが設置された物理的世界のマップ内の場所を決定し、設置されたＡＲコンテンツが、例えば、異なるＡＲ体験セッションの間、物理的世界内に表示するために再ロードされ得るように、ＡＲ場面を保存し、複数のユーザがＡＲ体験を共有することを可能にする、追跡情報に基づいて物理的世界のマップを構築するシステムを用いて、達成され得る。本システムは、ユーザの周囲の物理的世界表面のデジタル表現を構築および更新し得る。本表現は、仮想オブジェクトを設置するため、物理学ベースの相互作用において、および仮想キャラクタ経路計画およびナビゲーションのため、またはその中で物理的世界についての情報が使用される、他の動作のために、完全または部分的に、ユーザと仮想コンテンツのレンダリングされた場所との間で物理的オブジェクトによってオクルードされるように現れるように、仮想コンテンツをレンダリングするために使用されてもよい。

図２は、いくつかの実施形態による、屋内ＡＲ場面４００の別の実施例を描写し、ＸＲシステムの例示的ユースケースを示す。例示的場面４００は、壁と、壁の片側上の本棚と、部屋の角における床置きランプと、床と、ソファと、床上のコーヒーテーブルとを有する、居間である。これらの物理的アイテムに加え、ＡＲ技術のユーザはまた、ソファの背後の壁上の画像、ドアを通して飛んで来た鳥、本棚から外を覗いているシカ、およびコーヒーテーブル上に設置された風車の形態における装飾品等の仮想オブジェクトを知覚する。

壁上の画像に関して、ＡＲ技術は、壁の表面だけではなく、また、仮想オブジェクトを正しくレンダリングするために画像をオクルードする、ランプ形状等の部屋内のオブジェクトおよび表面についての情報も要求する。飛んで来た鳥に関して、ＡＲ技術は、オブジェクトおよび表面を回避する、または鳥が衝突する場合、跳ね返るように、現実的物理学を用いて鳥をレンダリングするために、部屋の周囲の全てのオブジェクトおよび表面についての情報を要求する。シカに関して、ＡＲ技術は、シカを設置すべき場所を算出するために、床またはコーヒーテーブル等の表面についての情報を要求する。風車に関して、システムは、テーブルと別個のオブジェクトであることを識別し得、それが移動可能であることを決定し得る一方、棚の角または壁の角は、定常であると決定され得る。そのような特異性は、種々の動作のそれぞれにおいて使用または更新される場面の部分に関する決定において使用されてもよい。

仮想オブジェクトは、前のＡＲ体験セッション内に設置されてもよい。新しいＡＲ体験セッションが、居間で開始すると、ＡＲ技術は、仮想オブジェクトが、以前に設置された場所に正確に表示され、異なる視点から現実的に可視であることを要求する。例えば、風車は、書籍を伴わない異なる場所においても、テーブルの上方に漂流しているのではなく、書籍上に立っているように表示されるべきである。そのような漂流は、新しいＡＲ体験セッションのユーザの場所が居間内で正確に位置特定されない場合に起こり得る。別の実施例として、ユーザが、風車が設置されたときの視点と異なる視点から風車を視認している場合、ＡＲ技術は、表示されている風車の対応する側を要求する。

場面は、視覚、聴覚、および／または触覚等、１つ以上のユーザ感知を刺激し得る、ユーザインターフェースを含む、複数のコンポーネントを含む、システムを介して、ユーザに提示されてもよい。加えて、システムは、場面の物理的部分内のユーザの位置および／または運動を含む、場面の物理的部分のパラメータを測定し得る、１つ以上のセンサを含んでもよい。さらに、システムは、メモリ等の関連付けられるコンピュータハードウェアを伴う、１つ以上のコンピューティングデバイスを含んでもよい。これらのコンポーネントは、単一デバイスの中に統合されてもよい、または複数の相互接続されるデバイスを横断して分散されてもよい。いくつかの実施形態では、これらのコンポーネントのいくつかまたは全ては、ウェアラブルデバイスの中に統合されてもよい。

図３は、いくつかの実施形態による、物理的世界５０６と相互作用するＡＲコンテンツの体験を提供するように構成される、ＡＲシステム５０２を描写する。ＡＲシステム５０２は、ディスプレイ５０８を含んでもよい。図示される実施形態では、ディスプレイ５０８は、ユーザが、一対のゴーグルまたは眼鏡のように、ディスプレイをその眼にわたって装着し得るように、ヘッドセットの一部としてユーザによって装着されてもよい。ディスプレイの少なくとも一部は、ユーザがシースルー現実５１０を観察し得るように、透明であってもよい。シースルー現実５１０は、ＡＲシステム５０２の現在の視点内の物理的世界５０６の部分に対応し得、これは、ユーザが、ＡＲシステムのディスプレイおよびセンサの両方を組み込む、ヘッドセットを装着し、物理的世界についての情報を入手している場合のユーザの視点に対応し得る。

ＡＲコンテンツはまた、シースルー現実５１０上にオーバーレイされる、ディスプレイ５０８上に提示されてもよい。ＡＲコンテンツとシースルー現実５１０との間の正確な相互作用をディスプレイ５０８上で提供するために、ＡＲシステム５０２は、物理的世界５０６についての情報を捕捉するように構成される、センサ５２２を含んでもよい。

センサ５２２は、深度マップ５１２を出力する、１つ以上の深度センサを含んでもよい。各深度マップ５１２は、それぞれ、深度センサに対する特定の方向における物理的世界５０６内の表面までの距離を表し得る、複数のピクセルを有してもよい。未加工深度データが、深度センサから生じ、深度マップを作成し得る。そのような深度マップは、深度センサが新しい画像を形成し得るほど高速に更新され得、これは、数百または数千回／秒であり得る。しかしながら、そのデータは、雑音が多くかつ不完全であって、図示される深度マップ上に黒色ピクセルとして示される、穴を有し得る。

システムは、画像センサ等の他のセンサを含んでもよい。画像センサは、他の方法において物理的世界を表すように処理され得る、単眼または立体視情報を入手してもよい。例えば、画像は、世界再構築コンポーネント５１６内で処理され、物理的世界内のオブジェクトの接続される部分を表す、メッシュを作成してもよい。例えば、色および表面テクスチャを含む、そのようなオブジェクトについてのメタデータも同様に、センサを用いて入手され、世界再構築物の一部として記憶されてもよい。

システムはまた、物理的世界に対するユーザの頭部姿勢（または「姿勢」）についての情報を入手してもよい。いくつかの実施形態では、システムの頭部姿勢追跡コンポーネントは、頭部姿勢をリアルタイムで算出するために使用されてもよい。頭部姿勢追跡コンポーネントは、例えば、３つの垂直軸における平行移動（例えば、前／後、上／下、左／右）および３つの垂直軸を中心とした回転（例えば、ピッチ、ヨー、およびロール）を含む、６自由度を伴って、座標フレーム内のユーザの頭部姿勢を表し得る。いくつかの実施形態では、センサ５２２は、頭部姿勢５１４を算出および／または決定するために使用され得る、慣性測定ユニットを含んでもよい。深度マップのための頭部姿勢５１４は、例えば、６自由度を伴う、深度マップを捕捉するセンサの現在の視点を示し得るが、頭部姿勢５１４は、画像情報を物理的世界の特定の部分に関連させる、またはユーザの頭部上に装着されるディスプレイの位置を物理的世界に関連させる等の他の目的のために使用されてもよい。

いくつかの実施形態では、頭部姿勢情報は、画像内のオブジェクトの分析から等、ＩＭＵ以外の方法で導出されてもよい。例えば、頭部姿勢追跡コンポーネントは、カメラによって捕捉された視覚的情報およびＩＭＵによって捕捉された慣性情報に基づいて、物理的オブジェクトに対するＡＲデバイスの相対的位置および配向を算出してもよい。頭部姿勢追跡コンポーネントは、次いで、例えば、物理的オブジェクトに対するＡＲデバイスの算出された相対的位置および配向と物理的オブジェクトの特徴を比較することによって、ＡＲデバイスの頭部姿勢を算出してもよい。いくつかの実施形態では、その比較は、経時的に捕捉された画像内のこれらの特徴の位置の変化がユーザの頭部姿勢の変化と関連付けられ得るように、経時的に安定する、センサ５２２のうちの１つ以上のものを用いて捕捉された画像内の特徴を識別することによって、行われてもよい。

いくつかの実施形態では、ＡＲデバイスは、ユーザがＡＲデバイスとともに物理的世界全体を通して移動するにつれて捕捉された一連の画像フレーム内の連続画像内で認識される、特徴点から、マップを構築してもよい。各画像フレームは、ユーザが移動するにつれて、異なる姿勢から得られ得るが、システムは、連続画像フレームの特徴と以前に捕捉された画像フレームをマッチングさせることによって、各連続画像フレームの特徴の配向を調節し、初期画像フレームの配向をマッチングさせてもよい。同一特徴を表す点が、以前に収集された画像フレームからの対応する特徴点にマッチングするであろうように、連続画像フレームの平行移動は、各連続画像フレームを整合させ、以前に処理された画像フレームの配向をマッチングさせるために使用されることができる。結果として生じるマップ内のフレームは、第１の画像フレームがマップに追加されたときに確立される共通配向を有し得る。本マップは、共通基準フレーム内の特徴点のセットとともに、現在の画像フレームからの特徴をマップにマッチングさせることによって、物理的世界内のユーザの姿勢を決定するために使用されてもよい。いくつかの実施形態では、本マップは、追跡マップと呼ばれ得る。

環境内のユーザの姿勢の追跡を有効にすることに加え、本マップは、世界再構築コンポーネント５１６等のシステムの他のコンポーネントがユーザに対する物理的オブジェクトの場所を決定することを可能にし得る。世界再構築コンポーネント５１６は、深度マップ５１２および頭部姿勢５１４およびセンサからの任意の他のデータを受信し、そのデータを再構築物５１８の中に統合してもよい。再構築物５１８は、センサデータより完全かつより雑音が少なくあり得る。世界再構築コンポーネント５１６は、経時的な複数の視点からのセンサデータの空間および時間的平均を使用して、再構築物５１８を更新してもよい。

再構築物５１８は、例えば、ボクセル、メッシュ、平面等を含む、１つ以上のデータフォーマットにおいて、物理的世界の表現を含んでもよい。異なるフォーマットは、物理的世界の同一部分の代替表現を表し得る、または物理的世界の異なる部分を表し得る。図示される実施例では、再構築物５１８の左側には、物理的世界の一部が、グローバル表面として提示され、再構築物５１８の右側には、物理的世界の一部が、メッシュとして提示される。

いくつかの実施形態では、頭部姿勢コンポーネント５１４によって維持されるマップは、物理的世界の維持され得る、他のマップに対して疎隔されてもよい。場所および可能性として表面の他の特性についての情報を提供するのではなく、疎マップは、角または縁等の着目点および／または構造の場所を示してもよい。いくつかの実施形態では、マップは、センサ５２２によって捕捉されるような画像フレームを含んでもよい。これらのフレームは、着目点および／または構造を表し得る、特徴に低減され得る。各フレームと併せて、そこからフレームが入手されたユーザの姿勢についての情報もまた、マップの一部として記憶されてもよい。いくつかの実施形態では、センサによって入手された全ての画像が、記憶される場合とそうではない場合がある。いくつかの実施形態では、システムは、それらがセンサによって収集されるにつれて、画像を処理し、さらなる算出のために、画像フレームのサブセットを選択してもよい。選択は、情報の追加を限定するが、マップが有用な情報を含有することを確実にする、１つ以上の基準に基づいてもよい。本システムは、例えば、マップにすでに追加されている以前の画像フレームとの重複に基づいて、または定常オブジェクトを表す可能性が高いと決定された十分な数の特徴を含有する、画像フレームに基づいて、新しい画像フレームをマップに追加してもよい。いくつかの実施形態では、選択された画像フレームまたは選択された画像フレームからの特徴の群は、マップのためのキーフレームとしての役割を果たし得、これは、空間情報を提供するために使用される。

ＡＲシステム５０２は、物理的世界の複数の視点からのセンサデータを経時的に統合してもよい。センサの姿勢（例えば、位置および配向）が、センサを含むデバイスが移動されるにつれて追跡されてもよい。センサのフレーム姿勢およびそれが他の姿勢とどのように関連するかが、把握されるにつれて、物理的世界のこれらの複数の視点はそれぞれ、物理的世界の単一の組み合わせられた再構築物の中にともに融合されてもよく、これは、マップのための抽象層としての役割を果たし、空間情報を提供し得る。再構築物は、空間および時間的平均（すなわち、経時的な複数の視点からのデータの平均）または任意の他の好適な方法を使用することによって、オリジナルセンサデータより完全かつ雑音が少なくなり得る。

図３に図示される実施形態では、マップは、その中に単一ウェアラブルデバイスのユーザが存在する、物理的世界の一部を表す。そのシナリオでは、マップ内のフレームと関連付けられる頭部姿勢は、セッションの開始時における単一デバイスに関する初期配向に対する配向を示す、ローカル頭部姿勢として表されてもよい。例えば、頭部姿勢は、デバイスが、オンにされた、または別様に、環境を走査し、その環境の表現を構築するように動作されたときの、初期頭部姿勢に対して追跡されてもよい。

物理的世界のその部分を特徴付けるコンテンツと組み合わせて、マップは、メタデータを含んでもよい。メタデータ、例えば、マップを形成するために使用されるセンサ情報の捕捉時間を示してもよい。メタデータは、代替として、または加えて、マップを形成するために使用される情報の捕捉時間におけるセンサの場所を示してもよい。場所は、直接、ＧＰＳチップからの情報等を用いて、または間接的に、センサデータが収集されていた間の１つ以上の無線アクセスポイントから受信された信号の強度を示す、Ｗｉ－Ｆｉシグネチャ等を用いて、および／またはセンサデータが収集された間にそれに対してユーザデバイスが接続した無線アクセスポイントのＢＳＳＩＤを用いて、表されてもよい。

再構築物５１８は、オクルージョン処理または物理学ベースの処理のための物理的世界の表面表現の生産等、ＡＲ機能のために使用されてもよい。本表面表現は、ユーザが移動する、または物理的世界内のオブジェクトが変化するにつれて、変化してもよい。再構築物５１８の側面は、例えば、他のコンポーネントによって使用され得る、世界座標内の変化するグローバル表面表現を生産する、コンポーネント５２０によって使用されてもよい。

ＡＲコンテンツは、本情報に基づいて、ＡＲアプリケーション５０４等によって生成されてもよい。ＡＲアプリケーション５０４は、例えば、視覚的オクルージョン、物理学ベースの相互作用、および環境推測等の物理的世界についての情報に基づいて、１つ以上の機能を実施する、ゲームプログラムであってもよい。これは、世界再構築コンポーネント５１６によって生産された再構築物５１８から異なるフォーマットにおけるデータにクエリすることによって、これらの機能を実施してもよい。いくつかの実施形態では、コンポーネント５２０は、物理的世界の着目領域内の表現が変化すると、更新を出力するように構成されてもよい。その着目領域は、例えば、ユーザの視野内の一部等、システムのユーザの近傍内の物理的世界の一部に近似するように設定される、またはユーザの視野内に入るように投影（予測／決定）されてもよい。

ＡＲアプリケーション５０４は、本情報を使用して、ＡＲコンテンツを生成および更新してもよい。ＡＲコンテンツの仮想部分は、シースルー現実５１０と組み合わせて、ディスプレイ５０８上に提示され、現実的ユーザ体験を作成してもよい。

いくつかの実施形態では、ＡＲ体験は、遠隔処理および／または遠隔データ記憶装置を含み得る、システムの一部であり得る、ウェアラブルディスプレイデバイス、および／または、いくつかの実施形態では、他のユーザによって装着される他のウェアラブルディスプレイデバイスであり得る、ＸＲデバイスを通して、ユーザに提供されてもよい。図４は、例証の便宜上、単一ウェアラブルデバイスを含む、システム５８０（以降、「システム５８０」と称される）の実施例を図示する。システム５８０は、頭部搭載型ディスプレイデバイス５６２（以降、「ディスプレイデバイス５６２」と称される）と、ディスプレイデバイス５６２の機能をサポートする、種々の機械および電子モジュールおよびシステムとを含む。ディスプレイデバイス５６２は、フレーム５６４に結合されてもよく、これは、ディスプレイシステムのユーザまたは視認者５６０（以降、「ユーザ５６０」と称される）によって装着可能であって、ディスプレイデバイス５６２をユーザ５６０の眼の正面に位置付けるように構成される。種々の実施形態によると、ディスプレイデバイス５６２は、シーケンシャルディスプレイであってもよい。ディスプレイデバイス５６２は、単眼または両眼であってもよい。いくつかの実施形態では、ディスプレイデバイス５６２は、図３におけるディスプレイ５０８の実施例であってもよい。

いくつかの実施形態では、スピーカ５６６が、フレーム５６４に結合され、ユーザ５６０の外耳道に近接して位置付けられる。いくつかの実施形態では、示されない、別のスピーカが、ユーザ５６０の別の外耳道に隣接して位置付けられ、ステレオ／調節可能音制御を提供する。ディスプレイデバイス５６２は、有線導線または無線コネクティビティ５６８等によって、ローカルデータ処理モジュール５７０に動作可能に結合され、これは、フレーム５６４に固定して取り付けられる、ユーザ５６０によって装着されるヘルメットまたは帽子に固定して取り付けられる、ヘッドホンに内蔵される、または別様にユーザ５６０に除去可能に取り付けられる（例えば、リュック式構成において、ベルト結合式構成において）等、種々の構成において搭載されてもよい。

ローカルデータ処理モジュール５７０は、プロセッサおよび不揮発性メモリ（例えば、フラッシュメモリ）等のデジタルメモリを含んでもよく、その両方とも、データの処理、キャッシュ、および記憶を補助するために利用され得る。データは、ａ）画像捕捉デバイス（カメラ等）、マイクロホン、慣性測定ユニット、加速度計、コンパス、ＧＰＳユニット、無線デバイス、および／またはジャイロスコープ等の（例えば、フレーム５６４に動作可能に結合される、または別様にユーザ５６０に取り付けられ得る）センサから捕捉されるデータ、および／またはｂ）可能性として、処理または読出後にディスプレイデバイス５６２への通過のために、遠隔処理モジュール５７２および／または遠隔データリポジトリ５７４を使用して入手および／または処理されるデータを含む。

いくつかの実施形態では、ウェアラブルデバイスは、遠隔コンポーネントと通信してもよい。ローカルデータ処理モジュール５７０は、それぞれ、有線または無線通信リンク等を介して、通信リンク５７６、５７８によって、遠隔処理モジュール５７２および遠隔データリポジトリ５７４に、これらの遠隔モジュール５７２、５７４が、相互に動作可能に結合され、ローカルデータ処理モジュール５７０へのリソースとして利用可能であるように、動作可能に結合されてもよい。いくつかの実施形態では、上記に説明される頭部姿勢追跡コンポーテントは、少なくとも部分的に、ローカルデータ処理モジュール５７０内に実装されてもよい。いくつかの実施形態では、図３における世界再構築コンポーネント５１６は、少なくとも部分的に、ローカルデータ処理モジュール５７０内に実装されてもよい。例えば、ローカルデータ処理モジュール５７０は、少なくとも部分的に、データの少なくとも一部に基づいて、コンピュータ実行可能命令を実行し、マップおよび／または物理的世界表現を生成するように構成されてもよい。

いくつかの実施形態では、処理は、ローカルおよび遠隔プロセッサを横断して分散されてもよい。例えば、ローカル処理が、そのユーザのデバイス上のセンサを用いて収集されたセンサデータに基づいて、マップ（例えば、追跡マップ）をユーザデバイス上に構築するために使用されてもよい。そのようなマップは、そのユーザのデバイス上のアプリケーションによって使用されてもよい。加えて、以前に作成されたマップ（例えば、規準マップ）は、遠隔データリポジトリ５７４内に記憶されてもよい。好適な記憶されたまたは持続的マップが、利用可能である場合、デバイス上にローカルで作成された追跡マップの代わりに、またはそれに加え、使用されてもよい。いくつかの実施形態では、追跡マップは、対応が、ユーザがシステムをオンにした時間におけるウェアラブルデバイスの位置に対して配向され得る、追跡マップと、１つ以上の持続的特徴に対して配向され得る、規準マップとの間に確立されるように、記憶されたマップに対して位置特定されてもよい。いくつかの実施形態では、持続的マップは、ユーザデバイス上にロードされ、ユーザデバイスが、走査の間に入手されたセンサデータからのユーザの完全な環境の追跡マップを構築するための場所の走査と関連付けられる遅延を伴わずに、仮想コンテンツをレンダリングすることを可能にし得る。いくつかの実施形態では、ユーザデバイスは、持続的マップをユーザデバイス上にダウンロードする必要なく、（例えば、クラウド上に記憶された）遠隔持続的マップにアクセスしてもよい。

代替として、または加えて、追跡マップは、以前に記憶されたマップとマージされ、それらのマップを拡張させる、またはその品質を改良してもよい。好適な以前に作成された環境マップが利用可能であるか、および／または追跡マップと１つ以上の記憶された環境マップをマージするかどうかを決定するための処理は、ローカルデータ処理モジュール５７０または遠隔処理モジュール５７２内で行われてもよい。

いくつかの実施形態では、ローカルデータ処理モジュール５７０は、データおよび／または画像情報を分析および処理するように構成される、１つ以上のプロセッサ（例えば、グラフィック処理ユニット（ＧＰＵ））を含んでもよい。いくつかの実施形態では、ローカルデータ処理モジュール５７０は、単一プロセッサ（例えば、シングルコアまたはマルチコアＡＲＭプロセッサ）を含んでもよく、これは、ローカルデータ処理モジュール５７０の算出予算を限定するが、より小型のデバイスを有効にするであろう。いくつかの実施形態では、世界再構築コンポーネント５１６は、単一ＡＲＭコアの残りの算出予算が、例えば、メッシュの抽出等の他の使用のためにアクセスされ得るように、単一高度ＲＩＳＣ機械（ＡＲＭ）コアより少ない算出予算を使用して、物理的世界表現をリアルタイムで非所定の空間上に生成してもよい。

いくつかの実施形態では、遠隔データリポジトリ５７４は、デジタルデータ記憶設備を含んでもよく、これは、インターネットまたは「クラウド」リソース構成における他のネットワーキング構成を通して利用可能であってもよい。いくつかの実施形態では、全てのデータが、記憶され、全ての算出が、ローカルデータ処理モジュール５７０において実施され、遠隔モジュールからの完全に自律的な使用を可能にする。いくつかの実施形態では、全てのデータが、記憶され、全てまたは大部分の算出は、遠隔データリポジトリ５７４内で実施され、より小さいデバイスを可能にする。世界再構築物は、例えば、全体または部分的に、本リポジトリ５７４内に記憶されてもよい。

その中にデータが、遠隔で記憶され、ネットワークを経由してアクセス可能である、実施形態では、データは、拡張現実システムの複数のユーザによって共有されてもよい。例えば、ユーザデバイスは、その追跡マップをアップロードし、環境マップのデータベース内に拡張されてもよい。いくつかの実施形態では、追跡マップのアップロードは、ウェアラブルデバイスとのユーザセッションの終了時に生じる。いくつかの実施形態では、追跡マップのアップロードは、持続的に、半持続的に、断続的に、事前に定義された時間において、前のアップロードから事前に定義された周期後、またはあるイベントによってトリガされると、生じ得る。任意のユーザデバイスによってアップロードされた追跡マップは、そのユーザデバイスまたは任意の他のユーザデバイスからのデータに基づくかどうかにかかわらず、以前に記憶されたマップを拡張または改良するために使用されてもよい。同様に、ユーザデバイスにダウンロードされた持続的マップは、そのユーザデバイスまたは任意の他のユーザデバイスからのデータに基づいてもよい。このように、高品質環境マップが、ＡＲシステムを用いたその体験を改良するために、ユーザに容易に利用可能であり得る。

いくつかの実施形態では、ローカルデータ処理モジュール５７０は、バッテリ５８２に動作可能に結合される。いくつかの実施形態では、バッテリ５８２は、市販のバッテリ等のリムーバブル電源である。他の実施形態では、バッテリ５８２は、リチウムイオンバッテリである。いくつかの実施形態では、バッテリ５８２は、ユーザ５６０が、電源に繋がれ、リチウムイオンバッテリを充電する必要なく、またはシステム５８０をシャットオフし、バッテリを交換する必要なく、より長い時間周期にわたってシステム５８０を動作させ得るように、システム５８０の非動作時間の間、ユーザ５６０によって充電可能な内部リチウムイオンバッテリと、リムーバブルバッテリとの両方を含む。

図５Ａは、ユーザ５３０が物理的世界環境５３２（以降、「環境５３２」と称される）を通して移動するにつれてＡＲコンテンツをレンダリングする、ＡＲディスプレイシステムを装着している、ユーザ５３０を図示する。ユーザの移動経路に沿ってＡＲシステムによって捕捉された情報は、１つ以上の追跡マップの中に処理されてもよい。ユーザ５３０は、ＡＲディスプレイシステムを位置５３４に位置付け、ＡＲディスプレイシステムは、位置５３４に対するパス可能世界（例えば、物理的世界内の実オブジェクトの変化に伴って記憶および更新され得る、物理的世界内の実オブジェクトのデジタル表現）の周囲情報を記録する。その情報は、画像、特徴、指向性オーディオ入力、または他の所望のデータと組み合わせて、姿勢として記憶されてもよい。位置５３４は、例えば、追跡マップの一部として、データ入力５３６に対して集約され、少なくともパス可能世界モジュール５３８によって処理され、これは、例えば、図４の遠隔処理モジュール５７２上の処理によって実装されてもよい。いくつかの実施形態では、パス可能世界モジュール５３８は、処理された情報が、レンダリング仮想コンテンツ内で使用される物理的オブジェクトについての他の情報と組み合わせて、物理的世界内のオブジェクトの場所を示し得るように、頭部姿勢コンポーネント５１４と、世界再構築コンポーネント５１６とを含んでもよい。

パス可能世界モジュール５３８は、データ入力５３６から決定されるように、少なくとも部分的に、ＡＲコンテンツ５４０が物理的世界内に設置され得る場所および方法を決定する。ＡＲコンテンツは、ユーザインターフェースを介して、物理的世界の表現およびＡＲコンテンツの両方を提示することによって、物理的世界内に「設置」され、ＡＲコンテンツは、物理的世界内のオブジェクトと相互作用しているかのようにレンダリングされ、物理的世界内のオブジェクトは、ＡＲコンテンツが、適切なとき、それらのオブジェクトのユーザのビューを不明瞭にしているかのように提示される。いくつかの実施形態では、ＡＲコンテンツは、固定要素５４２（例えば、テーブル）の一部を再構築物（例えば、再構築物５１８）から適切に選択し、ＡＲコンテンツ５４０の形状および位置を決定することによって、設置されてもよい。実施例として、固定要素は、テーブルであってもよく、仮想コンテンツは、そのテーブル上に現れるように位置付けられてもよい。いくつかの実施形態では、ＡＲコンテンツは、現在の視野または推定される将来的視野であり得る、視野５４４内の構造の中に設置されてもよい。いくつかの実施形態では、ＡＲコンテンツは、物理的世界のモデル５４６（例えば、メッシュ）に対して持続されてもよい。

描写されるように、固定要素５４２は、ユーザ５３０にそれが見える度に、システムが固定要素５４２にマッピングする必要なく、ユーザ５３０が固定要素５４２上にコンテンツを知覚し得るように、パス可能世界モジュール５３８内に記憶され得る、物理的世界内の任意の固定要素のためのプロキシ（例えば、デジタルコピー）としての役割を果たす。固定要素５４２は、したがって、前のモデル化セッションからの、または別個のユーザから決定されるものであるものの、複数のユーザによる将来的参照のためにパス可能世界モジュール５３８によって記憶される、メッシュモデルであってもよい。したがって、パス可能世界モジュール５３８は、環境５３２を以前にマッピングされた環境から認識し、ユーザ５３０のデバイスが環境５３２の全部または一部を最初にマッピングすることなく、ＡＲコンテンツを表示し、算出プロセスおよびサイクルを節約し、任意のレンダリングされたＡＲコンテンツの待ち時間を回避し得る。

物理的世界のメッシュモデル５４６は、ＡＲディスプレイシステムによって作成されてもよく、ＡＲコンテンツ５４０と相互作用し、表示するための適切な表面およびメトリックは、完全または部分的に、モデルを再作成する必要なく、ユーザ５３０または他のユーザによる将来的読出のために、パス可能世界モジュール５３８によって記憶されることができる。いくつかの実施形態では、データ入力５３６は、パス可能世界モジュール５３８に、１つ以上の固定要素のうちのどの固定要素５４２が利用可能であるかどうか、固定要素５４２上に最後に設置されたＡＲコンテンツ５４０、およびその同一コンテンツを表示すべきかどうか（そのようなＡＲコンテンツは、ユーザが特定のパス可能世界モデルを視認しているかどうかにかかわらず、「持続」コンテンツである）を示すための、地理的場所、ユーザ識別、および現在のアクティビティ等の入力である。

オブジェクトが固定されていると見なされる（例えば、台所のテーブル）、実施形態においてさえ、パス可能世界モジュール５３８は、物理的世界の変化の可能性を考慮するために、物理的世界のモデル内のそれらのオブジェクトを随時更新してもよい。固定されたオブジェクトのモデルは、非常に低頻度で更新されてもよい。物理的世界内の他のオブジェクトは、移動している、または別様に固定されていると見なされないものであり得る（例えば、台所の椅子）。ＡＲ場面を現実的感覚でレンダリングするために、ＡＲシステムは、これらの非固定オブジェクトの位置を、固定オブジェクトを更新するために使用されるものよりはるかに高い頻度で更新してもよい。物理的世界内のオブジェクトの全ての正確な追跡を有効にするために、ＡＲシステムは、１つ以上の画像センサを含む、複数のセンサから情報を引き出してもよい。

図５Ｂは、視認光学系アセンブリ５４８および付帯コンポーネントの概略例証である。いくつかの実施形態では、２つの眼追跡カメラ５５０が、ユーザの眼５４９に向かって指向され、眼形状、眼瞼オクルージョン、瞳孔方向、およびユーザの眼５４９上の閃光等、ユーザの眼５４９のメトリックを検出する。

いくつかの実施形態では、センサのうちの１つは、飛行時間センサ等の深度センサ５５１であって、信号を世界に放出し、近隣のオブジェクトからのそれらの信号の反射を検出し、所与のオブジェクトまでの距離を決定してもよい。深度センサは、例えば、オブジェクトが、それらのオブジェクトの運動またはユーザの姿勢の変化のいずれかの結果として、ユーザの視野に進入したかどうかを迅速に決定し得る。しかしながら、ユーザの視野内のオブジェクトの位置についての情報は、代替として、または加えて、他のセンサを用いて収集されてもよい。深度情報は、例えば、立体視的画像センサまたはプレノプティックセンサから取得されてもよい。

いくつかの実施形態では、世界カメラ５５２は、周辺より広いビューを記録し、マッピングし、および／または別様に、環境５３２のモデルを作成し、ＡＲコンテンツに影響を及ぼし得る、入力を検出する。いくつかの実施形態では、世界カメラ５５２および／またはカメラ５５３は、グレースケールおよび／またはカラー画像センサであってもよく、これは、グレースケールおよび／またはカラー画像フレームを固定される時間インターバルにおいて出力してもよい。カメラ５５３はさらに、ユーザの視野内の物理的世界画像を具体的時間において捕捉してもよい。フレームベースの画像センサのピクセルは、その値が不変である場合でも、反復的にサンプリングされてもよい。世界カメラ５５２、カメラ５５３、および深度センサ５５１はそれぞれ、５５４、５５５、および５５６の個別の視野を有し、図３４Ａに描写される物理的世界環境５３２等の物理的世界場面からのデータを収集および記録する。

慣性測定ユニット５５７は、視認光学系アセンブリ５４８の移動および配向を決定してもよい。いくつかの実施形態では、各コンポーネントは、少なくとも１つの他のコンポーネントに動作可能に結合される。例えば、深度センサ５５１は、ユーザの眼５４９が見ている実際の距離に対する測定された遠近調節の確認として、眼追跡カメラ５５０に動作可能に結合される。

視認光学系アセンブリ５４８は、図３４Ｂに図示されるコンポーネントのうちのいくつかを含んでもよく、図示されるコンポーネントの代わりに、またはそれに加え、コンポーネントを含んでもよいことを理解されたい。いくつかの実施形態では、例えば、視認光学系アセンブリ５４８は、４つの代わりに、２つの世界カメラ５５２を含んでもよい。代替として、または加えて、カメラ５５２および５５３は、その完全視野の可視光画像を捕捉する必要はない。視認光学系アセンブリ５４８は、他のタイプのコンポーネントを含んでもよい。いくつかの実施形態では、視認光学系アセンブリ５４８は、１つ以上の動的視覚センサ（ＤＶＳ）を含んでもよく、そのピクセルは、光強度の相対的変化が閾値を超えることに非同期して応答してもよい。

いくつかの実施形態では、視認光学系アセンブリ５４８は、飛行時間情報に基づく深度センサ５５１を含まなくてもよい。いくつかの実施形態では、例えば、視認光学系アセンブリ５４８は、１つ以上のプレノプティックカメラを含んでもよく、そのピクセルは、入射光の光強度および角度を捕捉してもよく、そこから深度情報が、決定されることができる。例えば、プレノプティックカメラは、透過性回折マスク（ＴＤＭ）でオーバーレイされた画像センサを含んでもよい。代替として、または加えて、プレノプティックカメラは、角度感知ピクセルおよび／または位相検出自動焦点ピクセル（ＰＤＡＦ）および／またはマイクロレンズアレイ（ＭＬＡ）を含有する、画像センサを含んでもよい。そのようなセンサは、深度センサ５５１の代わりに、またはそれに加え、深度情報源としての役割を果たし得る。

また、図５Ｂにおけるコンポーネントの構成は、実施例として提供されることを理解されたい。視認光学系アセンブリ５４８は、任意の好適な構成を伴うコンポーネントを含んでもよく、これは、ユーザに、特定のセットのコンポーネントのために実践的な最大視野を提供するように設定されてもよい。例えば、視認光学系アセンブリ５４８が、１つの世界カメラ５５２を有する場合、世界カメラは、側面の代わりに、視認光学系アセンブリの中心領域内に設置されてもよい。

視認光学系アセンブリ５４８内のセンサからの情報は、システム内のプロセッサのうちの１つ以上のものに結合されてもよい。プロセッサは、ユーザに仮想コンテンツが物理的世界内のオブジェクトと相互作用するように知覚させるようにレンダリングされ得る、データを生成してもよい。そのレンダリングは、物理的および仮想オブジェクトの両方を描写する、画像データを生成するステップを含め、任意の好適な方法において実装されてもよい。他の実施形態では、物理的および仮想コンテンツは、ユーザが物理的世界を透かし見る、ディスプレイデバイスの不透明度を変調させることによって、１つの場面に描写されてもよい。不透明度は、仮想オブジェクトの外観を作成し、ユーザに仮想オブジェクトによってオクルードされる物理的世界内のオブジェクトが見えないように遮断するように、制御されてもよい。いくつかの実施形態では、画像データは、仮想コンテンツがユーザインターフェースを通して視認されるとき、物理的世界と現実的に相互作用するように、ユーザによって知覚されるように修正され得る（例えば、コンテンツをクリッピングし、オクルージョンを考慮する）、仮想コンテンツのみを含んでもよい。

コンテンツが特定の場所におけるオブジェクトの印象を作成するために表示され得る、視認光学系アセンブリ５４８上の場所は、視認光学系アセンブリの物理学に依存し得る。加えて、物理的世界に対するユーザの頭部の姿勢およびユーザの眼が見ている方向は、コンテンツが現れるであろう視認光学系アセンブリ上の特定の場所に表示される、物理的世界コンテンツ内の場所に影響を及ぼすであろう。上記に説明されるようなセンサは、センサ入力を受信するプロセッサが、オブジェクトが、視認光学系アセンブリ５４８上にレンダリングされ、ユーザのために所望の外観を作成すべき場所を算出し得るように、本情報を収集し、および／またはそこから本情報が計算され得る、情報を供給してもよい。

コンテンツがユーザに提示される方法にかかわらず、物理的世界のモデルが、仮想オブジェクトの形状、位置、運動、および可視性を含む、物理的オブジェクトによって影響され得る、仮想オブジェクトの特徴が、正しく算出され得るように、使用され得る。いくつかの実施形態では、モデルは、物理的世界の再構築物、例えば、再構築物５１８を含んでもよい。

そのモデルは、ユーザのウェアラブルデバイス上のセンサから収集されたデータから作成されてもよい。但し、いくつかの実施形態では、モデルは、複数のユーザによって収集されたデータから作成されてもよく、これは、全てのユーザから遠隔のコンピューティングデバイス内に集約されてもよい（かつ「クラウド内」にあってもよい）。

モデルは、少なくとも部分的に、例えば、図６Ａにさらに詳細に描写される図３の世界再構築コンポーネント５１６等の世界再構築システムによって作成されてもよい。世界再構築コンポーネント５１６は、物理的世界の一部のための表現を生成、更新、および記憶し得る、知覚モジュール６６０を含んでもよい。いくつかの実施形態では、知覚モジュール６６０は、センサの再構築範囲内の物理的世界の一部を複数のボクセルとして表し得る。各ボクセルは、物理的世界内の所定の体積の３Ｄ立方体に対応し、表面情報を含み、ボクセルによって表される体積内に表面が存在するかどうかを示し得る。ボクセルは、その対応する体積が、物理的オブジェクトの表面を含むと決定されている、空であると決定されている、またはセンサを用いてまだ測定されていない、したがって、その値が未知であるかどうかを示す、値を割り当てられてもよい。空または未知であると決定されたボクセルを示す値は、明示的に記憶される必要はなく、ボクセルの値は、空または未知であると決定されたボクセルに関する情報を記憶しないことを含め、任意の好適な方法において、コンピュータメモリ内に記憶されてもよいことを理解されたい。

持続される世界表現のための情報を生成することに加え、知覚モジュール６６０は、ＡＲシステムのユーザの周囲の領域の変化のインジケーションを識別し、出力してもよい。そのような変化のインジケーションは、持続される世界の一部として記憶される立体データへの更新をトリガする、またはＡＲコンテンツを生成し、ＡＲコンテンツを更新する、コンポーネント６０４をトリガする等、他の機能をトリガしてもよい。

いくつかの実施形態では、知覚モジュール６６０は、符号付き距離関数（ＳＤＦ）モデルに基づいて、変化を識別してもよい。知覚モジュール６６０は、例えば、深度マップ６６０ａおよび頭部姿勢６６０ｂ等のセンサデータを受信し、次いで、センサデータをＳＤＦモデル６６０ｃに融合させるように構成されてもよい。深度マップ６６０ａは、直接、ＳＤＦ情報を提供してもよく、画像は、ＳＤＦ情報に到着するように処理されてもよい。ＳＤＦ情報は、その情報を捕捉するために使用されるセンサからの距離を表す。それらのセンサは、ウェアラブルユニットの一部であり得るため、ＳＤＦ情報は、ウェアラブルユニットの視点、したがって、ユーザの視点から物理的世界を表し得る。頭部姿勢６６０ｂは、ＳＤＦ情報が物理的世界内のボクセルに関連されることを可能にし得る。

いくつかの実施形態では、知覚モジュール６６０は、知覚範囲内にある、物理的世界の一部のための表現を生成、更新、および記憶してもよい。知覚範囲は、少なくとも部分的に、センサの再構築範囲に基づいて決定されてもよく、これは、少なくとも部分的に、センサの観察範囲の限界に基づいて決定されてもよい。具体的実施例として、アクティブＩＲパルスを使用して動作する、アクティブ深度センサは、ある距離の範囲にわたって確実に動作し、数センチメートルまたは数十センチメートル～数メートルであり得る、センサの観察範囲を作成し得る。

世界再構築コンポーネント５１６は、知覚モジュール６６０と相互作用し得る、付加的モジュールを含んでもよい。いくつかの実施形態では、持続される世界モジュール６６２は、知覚モジュール６６０によって入手されたデータに基づいて、物理的世界のための表現を受信してもよい。持続される世界モジュール６６２はまた、物理的世界の種々のフォーマットの表現を含んでもよい。例えば、ボクセル等の立体メタデータ６６２ｂが、メッシュ６６２ｃおよび平面６６２ｄとともに記憶されてもよい。いくつかの実施形態では、深度マップ等の他の情報も、保存され得る。

いくつかの実施形態では、図６Ａに図示されるもの等の物理的世界の表現は、上記に説明されるように、特徴点に基づく追跡マップ等の疎マップと比較して、物理的世界についての比較的に稠密情報を提供し得る。

いくつかの実施形態では、知覚モジュール６６０は、例えば、メッシュ６６０ｄ、平面、および意味論６６０ｅを含む、種々のフォーマットにおける、物理的世界のための表現を生成する、モジュールを含んでもよい。物理的世界のための表現は、ローカルおよび遠隔記憶媒体を横断して記憶されてもよい。物理的世界のための表現は、例えば、記憶媒体の場所に応じて、異なる座標フレーム内に説明されてもよい。例えば、デバイス内に記憶された物理的世界のための表現は、デバイスにローカルの座標フレーム内に説明されてもよい。物理的世界のための表現は、クラウド内に記憶された対応物を有してもよい。クラウド内の対応物は、ＸＲシステム内の全てのデバイスによって共有される座標フレーム内に説明されてもよい。

いくつかの実施形態では、これらのモジュールは、表現が生成された時点の１つ以上のセンサの知覚範囲内のデータおよび以前の時間に捕捉されたデータおよび持続される世界モジュール６６２内の情報に基づいて、表現を生成してもよい。いくつかの実施形態では、これらのコンポーネントは、深度センサを用いて捕捉された深度情報に作用してもよい。しかしながら、ＡＲシステムは、視覚センサを含んでもよく、単眼または両眼視覚情報を分析することによって、そのような表現を生成してもよい。

いくつかの実施形態では、これらのモジュールは、物理的世界の領域に作用してもよい。それらのモジュールは、物理的世界のサブ領域を、知覚モジュール６６０がそのサブ領域内の物理的世界の変化を検出すると、更新するようにトリガされてもよい。そのような変化は、例えば、ＳＤＦモデル６６０ｃ内の新しい表面を検出することによって、またはサブ領域を表す十分な数のボクセルの値の変化等の他の基準によって、検出されてもよい。

世界再構築コンポーネント５１６は、物理的世界の表現を知覚モジュール６６０から受信し得る、コンポーネント６６４を含んでもよい。物理的世界についての情報は、例えば、アプリケーションからの使用要求に従って、これらのコンポーネントによってプル配信されてもよい。いくつかの実施形態では、情報は、事前に識別された領域の変化または知覚範囲内の物理的世界表現の変化のインジケーション等を介して、使用コンポーネントにプッシュ配信されてもよい。コンポーネント６６４は、例えば、視覚的オクルージョン、物理学ベースの相互作用、および環境推測のための処理を実施する、ゲームプログラムおよび他のコンポーネントを含んでもよい。

コンポーネント６６４からのクエリに応答して、知覚モジュール６６０は、物理的世界のための表現を１つ以上のフォーマットにおいて送信してもよい。例えば、コンポーネント６６４が、使用が視覚的オクルージョンまたは物理学ベースの相互作用のためのものであることを示すとき、知覚モジュール６６０は、表面の表現を送信してもよい。コンポーネント６６４が、使用が環境推測のためのものであることを示すとき、知覚モジュール６６０は、物理的世界のメッシュ、平面、および意味論を送信してもよい。

いくつかの実施形態では、知覚モジュール６６０は、フォーマット情報をコンポーネント６６４に提供する、コンポーネントを含んでもよい。そのようなコンポーネントの実施例は、レイキャスティングコンポーネント６６０ｆであってもよい。使用コンポーネント（例えば、コンポーネント６６４）は、例えば、特定の視点からの物理的世界についての情報をクエリしてもよい。レイキャスティングコンポーネント６６０ｆは、その視点からの視野内の物理的世界データの１つ以上の表現から選択してもよい。

前述の説明から理解されるはずであるように、知覚モジュール６６０またはＡＲシステムの別のコンポーネントは、データを処理し、物理的世界の一部の３Ｄ表現を作成してもよい。処理されるべきデータは、少なくとも部分的に、カメラ錐台および／または深度画像に基づいて、３Ｄ再構築体積の一部を間引く、平面データを抽出および持続させる、近傍系の一貫性を維持しながらローカル更新を可能にするブロックにおいて、３Ｄ再構築データを捕捉し、持続させ、更新する、オクルージョンデータが１つ以上の深度データソースの組み合わせから導出される、オクルージョンデータをそのような場面を生成するアプリケーションに提供する、および／または多段階メッシュ簡略化を実施することによって、低減され得る。再構築物は、例えば、ライブ深度データ等の未加工データ、ボクセル等の融合された立体データ、およびメッシュ等の算出されたデータを含む、異なるレベルの精巧さのデータを含有してもよい。

いくつかの実施形態では、パス可能世界モデルのコンポーネントは、分散されてもよく、いくつかの部分は、ＸＲデバイス上でローカルで実行され、いくつかの部分は、サーバに接続されるネットワーク上または別様にクラウド内等の遠隔で実行される。ローカルＸＲデバイスとクラウドとの間の情報の処理および記憶の配分は、ＸＲシステムの機能性およびユーザ体験に影響を及ぼし得る。例えば、処理をクラウドに配分することによって、ローカルデバイス上の処理を低減させることは、より長いバッテリ寿命を有効にし、ローカルデバイス上に生成される熱を低減させ得る。しかし、はるかに多い処理をクラウドに配分することは、容認不可能なユーザ体験を引き起こす、望ましくない待ち時間を作成し得る。

図６Ｂは、いくつかの実施形態による、空間コンピューティングのために構成される、分散型コンポーネントアーキテクチャ６００を描写する。分散型コンポーネントアーキテクチャ６００は、パス可能世界コンポーネント６０２（例えば、図５ＡにおけるＰＷ５３８）と、ＬｕｍｉｎＯＳ６０４と、ＡＰＩ６０６と、ＳＤＫ６０８と、アプリケーション６１０とを含んでもよい。ＬｕｍｉｎＯＳ６０４は、ＸＲデバイスと互換性があるカスタムドライバを伴う、Ｌｉｎｕｘ（登録商標）ベースのカーネルを含んでもよい。ＡＰＩの６０６は、ＸＲアプリケーション（例えば、アプリケーション６１０）にＸＲデバイスの空間コンピューティング特徴へのアクセスを与える、アプリケーションプログラミングインターフェースを含んでもよい。ＳＤＫ６０８は、ＸＲアプリケーションの作成を可能にする、ソフトウェア開発キットを含んでもよい。

アーキテクチャ６００内の１つ以上のコンポーネントは、パス可能世界のモデルを作成および維持してもよい。本実施例では、センサデータは、ローカルデバイス上で収集される。そのセンサデータの処理は、部分的に、ＸＲデバイス上でローカルで、部分的に、クラウド内で実施されてもよい。ＰＷ５３８は、少なくとも部分的に、複数のユーザによって装着されるＡＲデバイスによって捕捉されたデータに基づいて作成される、環境マップを含んでもよい。ＡＲ体験のセッションの間、個々のＡＲデバイス（図４に関連して上記に説明されるウェアラブルデバイス等）は、マップの１つのタイプである、追跡マップを作成してもよい。

いくつかの実施形態では、デバイスは、疎マップおよび稠密マップの両方を構築する、コンポーネントを含んでもよい。追跡マップは、疎マップとしての役割を果たしてもよく、環境を走査するＡＲデバイスの頭部姿勢ならび各頭部姿勢においてその環境内で検出されたオブジェクトについての情報を含んでもよい。それらの頭部姿勢は、デバイス毎にローカルで維持されてもよい。例えば、各デバイス上の頭部姿勢は、デバイスがそのセッションのためにオンにされたときの初期頭部姿勢に対するものであり得る。結果として、各追跡マップは、それを作成するデバイスにローカルであり得る。稠密マップは、表面情報を含んでもよく、これは、メッシュまたは深度情報によって表されてもよい。代替として、または加えて、稠密マップは、平面および／または他のオブジェクトの場所および／または特性等の表面または深度情報から導出されるより高いレベルの情報を含んでもよい。

稠密マップの作成は、いくつかの実施形態では、疎マップの作成から独立してもよい。稠密マップおよび疎マップの作成は、例えば、ＡＲシステム内の別個の処理パイプライン内で実施されてもよい。処理を分離することは、例えば、異なるタイプのマップの生成または処理が異なるレートで実施されることを可能にし得る。疎マップは、例えば、稠密マップより高速のレートでリフレッシュされてもよい。しかしながら、いくつかの実施形態では、稠密および疎マップの処理は、異なるパイプライン内で実施される場合でも、関連し得る。疎マップ内で露見される物理的世界の変化は、例えば、稠密マップの更新をトリガし得る、またはその逆である。さらに、独立して作成される場合でも、マップは、ともに使用され得る。例えば、疎マップから導出される座標系は、稠密マップ内のオブジェクトの位置および／または配向を定義するために使用されてもよい。

疎マップおよび／または稠密マップは、同一デバイスによる再使用のために、および／または他のデバイスと共有するために、存続してもよい。そのような存続は、情報をクラウド内に記憶することによって達成されてもよい。ＡＲデバイスは、追跡マップをクラウドに送信し、例えば、クラウド内に以前に記憶された存続されるマップから選択された環境マップとマージしてもよい。いくつかの実施形態では、選択された存続されるマップは、マージするために、クラウドからＡＲデバイスに送信されてもよい。いくつかの実施形態では、存続されるマップは、１つ以上の持続的座標フレームに対して配向されてもよい。そのようなマップは、それらが複数のデバイスのいずれかによって使用され得るため、規準マップとしての役割を果たし得る。いくつかの実施形態では、パス可能世界のモデルは、１つ以上の規準マップを含む、または作成されてもよい。デバイスは、デバイスにローカルの座標フレームに基づいて、いくつかの動作を実施するものの、デバイスにローカルのその座標フレームと規準マップとの間の変換を決定することによって、規準マップを使用してもよい。

規準マップは、追跡マップ（ＴＭ）（例えば、図３１ＡにおけるＴＭ１１０２）として生じてもよく、これは、規準マップにプロモートされ得る。規準マップは、規準マップにアクセスするデバイスが、いったんそのローカル座標系と規準マップの座標系との間の変換を決定すると、規準マップ内の情報を使用して、デバイスの周囲の物理的世界内の規準マップ内に表されるオブジェクトの場所を決定し得るように、存続されてもよい。いくつかの実施形態では、ＴＭは、ＸＲデバイスによって作成された頭部姿勢疎マップであってもよい。いくつかの実施形態では、規準マップは、異なる時間においてＸＲデバイスによって、または他のＸＲデバイスによって、捕捉された付加的ＴＭとマージするために、ＸＲデバイスが１つ以上のＴＭをクラウドサーバに送信すると、作成されてもよい。

規準マップまたは他のマップは、個別のマップを作成するために処理されたデータによって表される物理的世界の一部についての情報を提供してもよい。図７は、いくつかの実施形態による、例示的追跡マップ７００を描写する。追跡マップ７００は、点７０２によって表される対応する物理的世界内の物理的オブジェクトの平面図７０６を提供してもよい。いくつかの実施形態では、マップ点７０２は、複数の特徴を含み得る、物理的オブジェクトの特徴を表し得る。例えば、テーブルの各角は、マップ上の点によって表される、特徴であり得る。特徴は、拡張現実システム内のウェアラブルデバイスのセンサを用いて入手され得るような処理画像から導出されてもよい。特徴は、例えば、センサによって出力された画像フレームを処理し、画像内の大勾配または他の好適な基準に基づいて、特徴を識別することによって導出されてもよい。さらなる処理は、各フレーム内の特徴の数を限定してもよい。例えば、処理は、持続的オブジェクトを表す可能性が高い、特徴を選択してもよい。１つ以上のヒューリスティックが、本選択のために適用されてもよい。

追跡マップ７００は、デバイスによって収集された点７０２に関するデータを含んでもよい。追跡マップ内に含まれるデータ点を伴う、画像フレーム毎に、姿勢が、記憶されてもよい。姿勢は、各画像フレーム内の特徴点が空間的に相関され得るように、そこから画像フレームが捕捉された配向を表し得る。姿勢は、ウェアラブルデバイス上のＩＭＵセンサ等のセンサから導出され得るような位置付け情報によって決定されてもよい。代替として、または加えて、姿勢は、画像フレームと、物理的世界の重複部分を描写する、他の画像フレームをマッチングさせることから決定されてもよい。２つのフレーム内の特徴点のサブセットをマッチングさせることによって遂行され得る、そのような位置相関を見出すことによって、２つのフレーム間の相対的姿勢が、算出され得る。相対的姿勢は、マップが、追跡マップの構築が開始されたときのデバイスの初期姿勢に基づいて確立されるデバイスにローカルの座標系に対するものであり得るため、追跡マップのために適正であり得る。

センサを用いて収集された情報の多くが冗長である可能性が高いため、デバイスによって収集された特徴点および画像フレームの全てが、追跡マップの一部として留保され得るわけではない。むしろ、あるフレームのみが、マップに追加されてもよい。それらのフレームは、すでにマップ内にある画像フレームとの重複度、それらが含有する新しい特徴の数、またはフレーム内の特徴に関する品質メトリック等の１つ以上の基準に基づいて選択されてもよい。追跡マップに追加されない画像フレームは、破棄されてもよい、または特徴の場所を改訂するために使用されてもよい。さらなる代替として、特徴のセットとして表される、画像フレームの全部または大部分が、留保されてもよいが、それらのフレームのサブセットは、キーフレームとして指定されてもよく、これは、さらなる処理のために使用される。

キーフレームは、処理され、キーリグ７０４を生産してもよい。キーフレームは、処理され、特徴点の３次元セットを生産し、キーリグ７０４として保存されてもよい。そのような処理は、例えば、２つのカメラから同時に導出される画像フレームを比較し、特徴点の３Ｄ位置を立体視的に決定するステップを伴ってもよい。姿勢等のメタデータが、これらのキーフレームおよび／またはキーリグと関連付けられてもよい。

環境マップは、例えば、ＡＲデバイスのローカル記憶装置および遠隔記憶装置を含む、例えば、環境マップの記憶場所に応じて、複数のフォーマットのいずれかを有してもよい。例えば、遠隔記憶装置内のマップは、メモリが限定されると、ウェアラブルデバイス上のローカル記憶装置内のマップより高い分解能を有してもよい。より高い分解能マップを遠隔記憶装置からローカル記憶装置に送信するために、マップは、マップ内に記憶される物理的世界のエリアあたりの姿勢の数および／または姿勢毎に記憶される特徴点の数を低減させること等によって、ダウンサンプリングまたは別様に適切なフォーマットに変換されてもよい。いくつかの実施形態では、遠隔記憶装置からの高分解能マップのスライスまたは一部が、ローカル記憶装置に送信されてもよく、スライスまたは一部は、ダウンサンプリングされない。

環境マップのデータベースは、新しい追跡マップが作成されるにつれて、更新されてもよい。データベース内の潜在的に非常に多数の環境マップのうちのどれが更新されるべきかを決定するために、更新するステップは、新しい追跡マップに関連するデータベース内に記憶される１つ以上の環境マップを効率的に選択するステップを含んでもよい。選択された１つ以上の環境マップは、関連性によってランク付けされてもよく、最高ランク付けマップのうちの１つ以上のものが、より高いランク付けされた選択された環境マップと新しい追跡マップをマージし、１つ以上の更新された環境マップを作成するために処理するために選択されてもよい。新しい追跡マップが、それにわたって更新するための既存の環境マップが存在しない、物理的世界の部分を表すとき、その追跡マップは、新しい環境マップとしてデータベース内に記憶されてもよい。

ビュー独立ディスプレイ

本明細書に説明されるものは、仮想コンテンツを視認する眼の場所から独立して、ＸＲシステムを使用して仮想コンテンツを提供するための方法および装置である。従来、仮想コンテンツは、表示システムの任意の運動に応じて、再レンダリングされる。例えば、ディスプレイシステムを装着しているユーザが、ディスプレイ上の３次元（３Ｄ）オブジェクトの仮想表現を視認し、３Ｄオブジェクトが現れるエリアの周囲を歩き回る場合、３Ｄオブジェクトは、ユーザが実空間を占有する、オブジェクトの周囲を歩き回っているという知覚を有するように、視点毎に再レンダリングされるべきである。しかしながら、再レンダリングは、システムの有意な算出リソースを消費し、待ち時間に起因して、アーチファクトを生じさせる。

本発明者らは、頭部姿勢（例えば、ＸＲシステムを装着しているユーザの場所および配向）が、ユーザの頭部における眼回転から独立して、仮想コンテンツをレンダリングするために使用され得ることを認識し、その真価を認めた。いくつかの実施形態では、場面の動的マップが、ユーザの頭部における眼回転から独立して、および／または、例えば、高速算出集約的動作の間に生成された熱によって生じるセンサ変形から独立して、動的マップと相互作用する仮想コンテンツが、ロバストにレンダリングされ得るように、１つ以上のセッションを横断して、実空間内の複数の座標フレームに基づいて生成されてもよい。いくつかの実施形態では、複数の座標フレームの構成は、第１のユーザによって装着される第１のＸＲデバイスおよび第２のユーザによって装着される第２のＸＲデバイスが、場面内の共通場所を認識することを可能にし得る。いくつかの実施形態では、複数の座標フレームの構成は、ＸＲデバイスを装着しているユーザが、仮想コンテンツを場面の同一場所内で視認することを可能にし得る。

いくつかの実施形態では、追跡マップが、世界座標フレーム内に構築されてもよく、これは、世界原点を有してもよい。世界原点は、ＸＲデバイスが電源投入されるときの、ＸＲデバイスの第１の姿勢であってもよい。世界原点は、ＸＲアプリケーションの開発者が余剰作業を伴わずに重力整合を得ることができるように、重力に整合されてもよい。異なる追跡マップが、追跡マップが、異なるセッションにおける同一ＸＲデバイスおよび／または異なるユーザによって装着される異なるＸＲデバイスによって捕捉され得るため、異なる世界座標フレーム内に構築されてもよい。いくつかの実施形態では、ＸＲデバイスのセッションは、デバイスを電源オンにしてから開始し、電源オフにするまで続いてもよい。いくつかの実施形態では、ＸＲデバイスは、頭部座標フレームを有してもよく、これは、頭部原点を有してもよい。頭部原点は、画像が撮影されるときの、ＸＲデバイスの現在の姿勢であってもよい。世界座標フレームおよび頭部座標フレームの頭部姿勢の間の差異は、追跡ルートを推定するために使用されてもよい。

いくつかの実施形態では、ＸＲデバイスは、カメラ座標フレームを有してもよく、これは、カメラ原点を有してもよい。カメラ原点は、ＸＲデバイスの１つ以上のセンサの現在の姿勢であってもよい。本発明者らは、カメラ座標フレームの構成が、ユーザの頭部における眼回転から独立して、仮想コンテンツのロバストな表示を有効にすることを認識し、その真価を認めた。本構成はまた、例えば、動作の間に生成された熱に起因するセンサ変形から独立して、仮想コンテンツのロバストな表示を有効にする。

いくつかの実施形態では、ＸＲデバイスは、ユーザが、その頭部に固着させ得、ユーザの各眼の正面に１つずつ、２つの導波管を含み得る、頭部搭載可能フレームを伴う、頭部ユニットを有してもよい。導波管は、実世界オブジェクトからの周囲光が、導波管を通して透過し得、ユーザに実世界オブジェクトが見え得るように、透明であり得る。各導波管は、プロジェクタから投影された光をユーザの個別の眼に透過させ得る。投影された光は、画像を眼の網膜上に形成し得る。眼の網膜は、したがって、周囲光および投影された光を受光する。ユーザには、同時に、実世界オブジェクトと、投影された光によって作成される、１つ以上の仮想オブジェクトとが見え得る。いくつかの実施形態では、ＸＲデバイスは、ユーザの周囲の実世界オブジェクトを検出する、センサを有してもよい。これらのセンサは、例えば、実世界オブジェクトの場所を識別するために処理され得る、画像を捕捉する、カメラであってもよい。

いくつかの実施形態では、ＸＲシステムは、仮想コンテンツを世界座標フレーム内に結び付けることとは対照的に、座標フレームを仮想コンテンツに割り当ててもよい。そのような構成は、ユーザのためにレンダリングされた場所にかかわらず、仮想コンテンツが説明されることを可能にするが、例えば、図１４－２０Ｃに関連して説明される持続的座標フレーム（ＰＣＦ）等のより持続的フレーム位置に結び付けられ、規定された場所にレンダリングされ得る。オブジェクトの場所が変化すると、ＸＲデバイスは、環境マップの変化を検出し、ユーザによって装着される頭部ユニットの移動を実世界オブジェクトに対して決定してもよい。

図８は、いくつかの実施形態による、ＸＲシステム１０によって物理的環境内にレンダリングされるような仮想コンテンツを体験するユーザを図示する。ＸＲシステムは、第１のユーザ１４．１によって装着される、第１のＸＲデバイス１２．１と、ネットワーク１８と、サーバ２０とを含んでもよい。ユーザ１４．１は、テーブル１６の形態における実オブジェクトを伴う、物理的環境内に存在する。

図示される実施例では、第１のＸＲデバイス１２．１は、頭部ユニット２２と、ベルトパック２４と、ケーブル接続２６とを含む。第１のユーザ１４．１は、頭部ユニット２２をその頭部に、頭部ユニット２２から遠隔のベルトパック２４をその腰部上に固着させる。ケーブル接続２６は、頭部ユニット２２をベルトパック２４に接続する。頭部ユニット２２は、第１のユーザ１４．１にテーブル１６等の実オブジェクトが見えることを可能にしたまま、仮想オブジェクトまたは複数のオブジェクトを第１のユーザ１４．１に表示するために使用される、技術を含む。ベルトパック２４は、主に、第１のＸＲデバイス１２．１の処理および通信能力を含む。いくつかの実施形態では、処理および通信能力は、ベルトパック２４が、除去され得る、またはリュック等の別のデバイス内に位置し得るように、全体的または部分的に、頭部ユニット２２内に常駐してもよい。

図示される実施例では、ベルトパック２４は、無線接続を介して、ネットワーク１８に接続される。サーバ２０は、ネットワーク１８に接続され、ローカルコンテンツを表すデータを保持する。ベルトパック２４は、ローカルコンテンツを表すデータをサーバ２０からネットワーク１８を介してダウンロードする。ベルトパック２４は、ケーブル接続２６を介して、データを頭部ユニット２２に提供する。頭部ユニット２２は、光源、例えば、レーザ光源または発光ダイオード（ＬＥＤ）光源と、光を誘導する、導波管とを有する、ディスプレイを含んでもよい。

いくつかの実施形態では、第１のユーザ１４．１は、頭部ユニット２２をその頭部に、ベルトパック２４をその腰部に搭載してもよい。ベルトパック２４は、仮想コンテンツを表す画像データをネットワーク１８を経由してサーバ２０からダウンロードしてもよい。第１のユーザ１４．１には、頭部ユニット２２のディスプレイを通して、テーブル１６が見え得る。頭部ユニット２２の一部を形成する、プロジェクタは、画像データをベルトパック２４から受信し、画像データに基づいて、光を生成してもよい。光は、頭部ユニット２２のディスプレイの一部を形成する導波管のうちの１つ以上のものを通して進行してもよい。光は、次いで、導波管から出射し、第１のユーザ１４．１の眼の網膜上に伝搬してもよい。プロジェクタは、第１のユーザ１４．１の眼の網膜上に複製される、パターンにおいて光を生成してもよい。第１のユーザ１４．１の眼の網膜上に当たる光は、第１のユーザ１４．１が画像を導波管の背後の事前に選択された深度において知覚するように、選択された被写界深度を有してもよい。加えて、第１のユーザ１４．１の両眼は、第１のユーザ１４．１の脳が３次元画像または複数の画像を頭部ユニット２２からの選択された距離において知覚するように、若干異なる画像を受信してもよい。図示される実施例では、第１のユーザ１４．１は、仮想コンテンツ２８をテーブル１６の上方において知覚する。仮想コンテンツ２８および第１のユーザ１４．１からのその場所および距離の割合は、仮想コンテンツ２８を表すデータと、仮想コンテンツ２８を第１のユーザ１４．１に表示するために使用される、種々の座標フレームとによって決定される。

図示される実施例では、仮想コンテンツ２８は、図面の視点から不可視であって、第１のＸＲデバイス１２．１の使用を通して第１のユーザ１４．１に可視である。仮想コンテンツ２８は、最初に、視覚データ内のデータ構造およびベルトパック２４内のアルゴリズムとして常駐し得る。データ構造は、次いで、頭部ユニット２２のプロジェクタがデータ構造に基づいて光を生成するとき、光として露見し得る。仮想コンテンツ２８は、第１のユーザ１４．１の正面の３次元空間内に存在しないが、仮想コンテンツ２８は、依然として、頭部ユニット２２の装着者が知覚する内容の例証目的のために、３次元空間内の図１において表されることを理解されたい。３次元空間内のコンピュータデータの可視化は、１人以上のユーザによって知覚されるレンダリングを促進するデータ構造が、ベルトパック２４内のデータ構造の中で相互に関連する方法を図示するために、本説明において使用され得る。

図９は、いくつかの実施形態による、第１のＸＲデバイス１２．１のコンポーネントを図示する。第１のＸＲデバイス１２．１は、頭部ユニット２２と、例えば、レンダリングエンジン３０と、種々の座標系３２と、種々の原点および目的地座標フレーム３４と、種々の原点／目的地座標フレーム変換器３６とを含む、視覚データおよびアルゴリズムの一部を形成する、種々のコンポーネントとを含んでもよい。種々の座標系は、ＸＲデバイスの固有性質に基づいてもよい、または本明細書に説明されるような持続的姿勢または持続的座標系等の他の情報を参照することによって決定されてもよい。

頭部ユニット２２は、頭部搭載可能フレーム４０と、ディスプレイシステム４２と、実オブジェクト検出カメラ４４と、移動追跡カメラ４６と、慣性測定ユニット４８とを含んでもよい。

頭部搭載可能フレーム４０は、図８における第１のユーザ１４．１の頭部に固着可能である、形状を有してもよい。ディスプレイシステム４２、実オブジェクト検出カメラ４４、移動追跡カメラ４６、および慣性測定ユニット４８は、頭部搭載可能フレーム４０に搭載され、したがって、頭部搭載可能フレーム４０とともに移動し得る。

座標系３２は、ローカルデータシステム５２と、世界フレームシステム５４と、頭部フレームシステム５６と、カメラフレームシステム５８とを含んでもよい。

ローカルデータシステム５２は、データチャネル６２と、ローカルフレーム決定ルーチン６４と、ローカルフレーム記憶命令６６とを含んでもよい。データチャネル６２は、内部ソフトウェアルーチン、外部ケーブルまたは無線周波数受信機等のハードウェアコンポーネント、または開放されるポート等のハイブリッドコンポーネントであってもよい。データチャネル６２は、仮想コンテンツを表す画像データ６８を受信するように構成されてもよい。

ローカルフレーム決定ルーチン６４は、データチャネル６２に接続されてもよい。ローカルフレーム決定ルーチン６４は、ローカル座標フレーム７０を決定するように構成されてもよい。いくつかの実施形態では、ローカルフレーム決定ルーチンは、実世界オブジェクトまたは実世界場所に基づいて、ローカル座標フレームを決定してもよい。いくつかの実施形態では、ローカル座標フレームは、ブラウザウィンドウの底部縁に対する上部縁、キャラクタの頭または足、仮想コンテンツを包囲する、プリズムまたは境界ボックスの外面上のノード、または仮想コンテンツの対面方向およびそれを用いて仮想コンテンツを設置すべき場所（例えば、設置ノードまたはアンカノード等のノード）を定義する、座標フレームを設置するための任意の他の好適な場所等に基づいてもよい。

ローカルフレーム記憶命令６６は、ローカルフレーム決定ルーチン６４に接続されてもよい。当業者は、ソフトウェアモジュールおよびルーチンが、サブルーチン、コール等を通して、相互に「接続」されることを理解するであろう。ローカルフレーム記憶命令６６は、ローカル座標フレーム７０をローカル座標フレーム７２として原点および目的地座標フレーム３４内に記憶してもよい。いくつかの実施形態では、原点および目的地座標フレーム３４は、仮想コンテンツがセッション間で持続するために、操作または変換され得る、１つ以上の座標フレームであってもよい。いくつかの実施形態では、セッションは、ＸＲデバイスのブートアップとシャットダウンとの間の時間周期であってもよい。２つのセッションは、単一ＸＲデバイスに関する２回の始動およびシャットダウン周期であってもよい、または２つの異なるＸＲデバイスに関する始動およびシャットダウンであってもよい。

いくつかの実施形態では、原点および目的地座標フレーム３４は、第１のユーザのＸＲデバイスおよび第２のユーザのＸＲデバイスが共通場所を認識するために要求される１つ以上の変換の際に関わる座標フレームであってもよい。いくつかの実施形態では、目的地座標フレームは、第１および第２のユーザが同一場所における仮想コンテンツを視認するために、標的座標フレームに適用される一連の算出および変換の出力であってもよい。

レンダリングエンジン３０は、データチャネル６２に接続されてもよい。レンダリングエンジン３０は、レンダリングエンジン３０が、少なくとも部分的に、画像データ６８に基づいて、仮想コンテンツをレンダリングし得るように、画像データ６８をデータチャネル６２から受信してもよい。

ディスプレイシステム４２は、レンダリングエンジン３０に接続されてもよい。ディスプレイシステム４２は、画像データ６８を可視光に変換する、コンポーネントを含んでもよい。可視光は、眼毎に１つの２つのパターンを形成してもよい。可視光は、図８における第１のユーザ１４．１の眼に入射し得、第１のユーザ１４．１の眼の網膜上で検出され得る。

実オブジェクト検出カメラ４４は、画像を頭部搭載可能フレーム４０の異なる側から捕捉し得る、１つ以上のカメラを含んでもよい。移動追跡カメラ４６は、画像を頭部搭載可能フレーム４０の側面上で捕捉する、１つ以上のカメラを含んでもよい。１つ以上のカメラの１つのセットが、実オブジェクト検出カメラ４４および移動追跡カメラ４６を表す、１つ以上のカメラの２つのセットの代わりに使用されてもよい。いくつかの実施形態では、カメラ４４、４６は、画像を捕捉してもよい。上記に説明されるように、これらのカメラは、追跡マップを構築するために使用される、データを収集してもよい。

慣性測定ユニット４８は、頭部ユニット２２の移動を検出するために使用される、いくつかのデバイスを含んでもよい。慣性測定ユニット４８は、重力センサと、１つ以上の加速度計と、１つ以上のジャイロスコープとを含んでもよい。慣性測定ユニット４８のセンサは、組み合わせて、少なくとも３つの直交方向および約少なくとも３つの直交軸において、頭部ユニット２２の移動を追跡する。

図示される実施例では、世界フレームシステム５４は、世界表面決定ルーチン７８と、世界フレーム決定ルーチン８０と、世界フレーム記憶命令８２とを含む。世界表面決定ルーチン７８は、実オブジェクト検出カメラ４４に接続される。世界表面決定ルーチン７８は、実オブジェクト検出カメラ４４によって捕捉された画像に基づいて、画像および／またはキーフレームを受信し、画像を処理し、画像内の表面を識別する。深度センサ（図示せず）は、表面までの距離を決定してもよい。表面は、したがって、そのサイズ、形状、および実オブジェクト検出カメラからの距離を含む、３次元におけるデータによって表される。

いくつかの実施形態では、世界座標フレーム８４は、頭部姿勢セッションの初期化時の原点に基づいてもよい。いくつかの実施形態では、世界座標フレームは、デバイスがブートアップされた場所に位置してもよい、またはブートセッションの間に頭部姿勢が喪失された場合、新しいある場所であり得る。いくつかの実施形態では、世界座標フレームは、頭部姿勢セッションの開始時の原点であってもよい。

図示される実施例では、世界フレーム決定ルーチン８０は、世界表面決定ルーチン７８に接続され、世界表面決定ルーチン７８によって決定されるような表面の場所に基づいて、世界座標フレーム８４を決定する。世界フレーム記憶命令８２は、世界フレーム決定ルーチン８０に接続され、世界座標フレーム８４を世界フレーム決定ルーチン８０から受信する。世界フレーム記憶命令８２は、世界座標フレーム８４を世界座標フレーム８６として原点および目的地座標フレーム３４内に記憶する。

頭部フレームシステム５６は、頭部フレーム決定ルーチン９０と、頭部フレーム記憶命令９２とを含んでもよい。頭部フレーム決定ルーチン９０は、移動追跡カメラ４６および慣性測定ユニット４８に接続されてもよい。頭部フレーム決定ルーチン９０は、移動追跡カメラ４６および慣性測定ユニット４８からのデータを使用して、頭部座標フレーム９４を計算してもよい。例えば、慣性測定ユニット４８は、頭部ユニット２２に対する重力の方向を決定する、重力センサを有してもよい。移動追跡カメラ４６は、頭部フレーム決定ルーチン９０によって使用され、頭部座標フレーム９４を精緻化する、画像を継続的に捕捉してもよい。頭部ユニット２２は、図８における第１のユーザ１４．１がその頭部を移動させると移動する。移動追跡カメラ４６および慣性測定ユニット４８は、頭部フレーム決定ルーチン９０が頭部座標フレーム９４を更新し得るように、データを頭部フレーム決定ルーチン９０に持続的に提供してもよい。

頭部フレーム記憶命令９２は、頭部フレーム決定ルーチン９０に接続され、頭部座標フレーム９４を頭部フレーム決定ルーチン９０から受信してもよい。頭部フレーム記憶命令９２は、頭部座標フレーム９４を頭部座標フレーム９６として原点および目的地座標フレーム３４の中に記憶してもよい。頭部フレーム記憶命令９２は、頭部フレーム決定ルーチン９０が頭部座標フレーム９４を再計算すると、更新された頭部座標フレーム９４を頭部座標フレーム９６として繰り返し記憶してもよい。いくつかの実施形態では、頭部座標フレームは、ローカル座標フレーム７２に対するウェアラブルＸＲデバイス１２．１の場所であってもよい。

カメラフレームシステム５８は、カメラ固有性質９８を含んでもよい。カメラ固有性質９８は、その設計および製造の特徴である、頭部ユニット２２の寸法を含んでもよい。カメラ固有性質９８は、原点および目的地座標フレーム３４内に記憶される、カメラ座標フレーム１００を計算するために使用されてもよい。

いくつかの実施形態では、カメラ座標フレーム１００は、図８における第１のユーザ１４．１の左眼の全ての瞳孔位置を含んでもよい。左眼が、左から右または上下に移動すると、左眼の瞳孔位置は、カメラ座標フレーム１００内に位置する。加えて、右眼の瞳孔位置は、右眼のためのカメラ座標フレーム１００内に位置する。いくつかの実施形態では、カメラ座標フレーム１００は、画像が撮影されると、ローカル座標フレームに対するカメラの場所を含んでもよい。

原点／目的地座標フレーム変換器３６は、ローカル／世界座標変換器１０４と、世界／頭部座標変換器１０６と、頭部／カメラ座標変換器１０８とを含んでもよい。ローカル／世界座標変換器１０４は、ローカル座標フレーム７２を受信し、ローカル座標フレーム７２を世界座標フレーム８６に変換してもよい。世界座標フレーム８６へのローカル座標フレーム７２の変換は、世界座標フレーム８６内で世界座標フレーム１１０に変換されるローカル座標フレームとして表され得る。

世界／頭部座標変換器１０６は、世界座標フレーム８６から頭部座標フレーム９６に変換してもよい。世界／頭部座標変換器１０６は、世界座標フレーム１１０に変換されるローカル座標フレームを頭部座標フレーム９６に変換してもよい。変換は、頭部座標フレーム９６内の頭部座標フレーム１１２に変換されるローカル座標フレームとして表され得る。

頭部／カメラ座標変換器１０８は、頭部座標フレーム９６からカメラ座標フレーム１００に変換してもよい。頭部／カメラ座標変換器１０８は、頭部座標フレーム１１２に変換されるローカル座標フレームをカメラ座標フレーム１００内のカメラ座標フレーム１１４に変換されるローカル座標フレームに変換してもよい。カメラ座標フレーム１１４に変換されるローカル座標フレームは、レンダリングエンジン３０の中に取り込まれてもよい。レンダリングエンジン３０は、カメラ座標フレーム１１４に変換されるローカル座標フレームに基づいて、ローカルコンテンツ２８を表す画像データ６８をレンダリングしてもよい。

図１０は、種々の原点および目的地座標フレーム３４の空間表現である。ローカル座標フレーム７２、世界座標フレーム８６、頭部座標フレーム９６、およびカメラ座標フレーム１００が、図内に表される。いくつかの実施形態では、ＸＲコンテンツ２８と関連付けられるローカル座標フレームは、仮想コンテンツが実世界内に設置され、したがって、仮想コンテンツがユーザによって視認され得るとき、ローカルおよび／または世界座標フレームおよび／またはＰＣＦに対する位置および回転を有し得る（例えば、ノードおよび対面方向を提供し得る）。各カメラは、片眼の全ての瞳孔位置を包含する、その独自のカメラ座標フレーム１００を有してもよい。参照番号１０４Ａおよび１０６Ａは、それぞれ、図９におけるローカル／世界座標変換器１０４、世界／頭部座標変換器１０６、および頭部／カメラ座標変換器１０８によって行われる、変換を表す。

図１１は、いくつかの実施形態による、頭部座標フレームからカメラ座標フレームに変換するためのカメラレンダリングプロトコルを描写する。図示される実施例では、片眼に関する瞳孔は、位置ＡからＢに移動する。定常として現れることが意図される仮想オブジェクトは、瞳孔の位置に応じて、２つの位置ＡまたはＢのうちの１つにおける深度平面上に投影されるであろう（カメラが瞳孔ベースの座標フレームとして使用するように構成されると仮定して）。その結果、頭部座標フレームに変換される瞳孔座標フレームを使用することは、眼が位置Ａから位置Ｂに移動するにつれて、ジッタを定常仮想オブジェクト内に生じさせるであろう。本状況は、ビュー依存ディスプレイまたは投影と称される。

図１２に描写されるように、カメラ座標フレーム（例えば、ＣＲ）が、位置付けられ、全ての瞳孔位置を包含するが、オブジェクト投影は、ここでは、瞳孔位置ＡおよびＢにかかわらず、一貫するであろう。頭部座標フレームは、ＣＲフレームに変換し、これは、ビュー独立ディスプレイまたは投影と称される。画像再投影が、仮想コンテンツに適用され、眼位置の変化を考慮してもよいが、しかしながら、レンダリングは、依然として、同一位置にあるため、ジッタは、最小限にされる。

図１３は、ディスプレイシステム４２をさらに詳細に図示する。ディスプレイシステム４２は、レンダリングエンジン３０に接続され、視覚データおよびアルゴリズムの一部を形成する、立体視分析器１４４を含む。

ディスプレイシステム４２はさらに、左および右プロジェクタ１６６Ａおよび１６６Ｂと、左および右導波管１７０Ａおよび１７０Ｂとを含む。左および右プロジェクタ１６６Ａおよび１６６Ｂは、電力供給源に接続される。各プロジェクタ１６６Ａおよび１６６Ｂは、画像データが個別のプロジェクタ１６６Ａまたは１６６Ｂに提供されるための個別の入力を有する。個別のプロジェクタ１６６Ａまたは１６６Ｂは、給電されると、２次元パターンにおける光を生成し、光をそこから発出する。左および右導波管１７０Ａおよび１７０Ｂは、それぞれ、光を左および右プロジェクタ１６６Ａおよび１６６Ｂから受光するように位置付けられる。左および右導波管１７０Ａおよび１７０Ｂは、透明導波管である。

使用時、ユーザは、頭部搭載可能フレーム４０をその頭部に搭載する。頭部搭載可能フレーム４０のコンポーネントは、例えば、ユーザの頭部の背面の周囲に巻着する、ストラップ（図示せず）を含んでもよい。左および右導波管１７０Ａおよび１７０Ｂは、次いで、ユーザの左および右眼２２０Ａおよび２２０Ｂの正面に位置する。

レンダリングエンジン３０は、それが受信する画像データを立体視分析器１４４の中に取り込む。画像データは、図８におけるローカルコンテンツ２８の３次元画像データである。画像データは、複数の仮想平面上に投影される。立体視分析器１４４は、画像データを分析し、各深度平面上への投影のために、画像データに基づいて、左および右画像データセットを決定する。左および右画像データセットは、３次元において投影され、ユーザに深度の知覚を与える、２次元画像を表す、データセットである。

立体視分析器１４４は、左および右画像データセットを左および右プロジェクタ１６６Ａおよび１６６Ｂに取り込む。左および右プロジェクタ１６６Ａおよび１６６Ｂは、次いで、左および右光パターンを作成する。ディスプレイシステム４２のコンポーネントは、平面図に示されるが、左および右パターンは、正面立面図に示されるとき、２次元パターンであることを理解されたい。各光パターンは、複数のピクセルを含む。例証目的のために、ピクセルのうちの２つからの光線２２４Ａおよび２２６Ａが、左プロジェクタ１６６Ａから出射し、左導波管１７０Ａに入射するように示される。光線２２４Ａおよび２２６Ａは、左導波管１７０Ａの側から反射する。光線２２４Ａおよび２２６Ａは、左導波管１７０Ａ内で左から右に内部反射を通して伝搬することが示されるが、光線２２４Ａおよび２２６Ａはまた、屈折性および反射性システムを使用して、紙面に向かう方向にも伝搬することを理解されたい。

光線２２４Ａおよび２２６Ａは、左光導波管１７０Ａから瞳孔２２８Ａを通して出射し、次いで、左眼２２０Ａの瞳孔２３０Ａを通して左眼２２０Ａに入射する。光線２２４Ａおよび２２６Ａは、次いで、左眼２２０Ａの網膜２３２Ａ上に当たる。このように、左光パターンは、左眼２２０Ａの網膜２３２Ａ上に当たる。ユーザは、網膜２３２Ａ上に形成されるピクセルが、ユーザが左眼２２０Ａに対向する左導波管１７０Ａの側上のある距離にあるように知覚する、ピクセル２３４Ａおよび２３６Ａであるという知覚を与えられる。深度知覚は、光の焦点距離を操作することによって作成される。

同様に、立体視分析器１４４は、右画像データセットを右プロジェクタ１６６Ｂに取り込む。右プロジェクタ１６６Ｂは、右光パターンを伝送し、これは、光線２２４Ｂおよび２２６Ｂの形態におけるピクセルによって表される。光線２２４Ｂおよび２２６Ｂは、右導波管１７０Ｂ内で反射し、瞳孔２２８Ｂを通して出射する。光線２２４Ｂおよび２２６Ｂは、次いで、右眼２２０Ｂの瞳孔２３０Ｂを通して入射し、右眼２２０Ｂの網膜２３２Ｂ上に当たる。光線２２４Ｂおよび２２６Ｂのピクセルは、右導波管１７０Ｂの背後のピクセル１３４Ｂおよび２３６Ｂとして知覚される。

網膜２３２Ａおよび２３２Ｂ上に作成されたパターンは、左および右画像として個々に知覚される。左および右画像は、立体視分析器１４４の機能に起因して、相互に若干異なる。左および右画像は、ユーザの脳内で３次元レンダリングとして知覚される。

述べられたように、左および右導波管１７０Ａおよび１７０Ｂは、透明である。眼２２０Ａおよび２２０Ｂに対向する左および右導波管１７０Ａおよび１７０Ｂ側上のテーブル１６等の実在のオブジェクトからの光は、左および右導波管１７０Ａおよび１７０Ｂを通して投影され、網膜２３２Ａおよび２３２Ｂ上に当たることができる。

持続的座標フレーム（ＰＣＦ）

本明細書に説明されるものは、共有空間内のユーザインスタンスを横断して空間存続を提供するための方法および装置である。空間存続がなければ、セッション内にユーザによって物理的世界内に設置された仮想コンテンツは、異なるセッション内のユーザのビュー内に存在し得ない、または誤設置され得る。空間存続がなければ、１人のユーザによって物理的世界内に設置された仮想コンテンツは、第２のユーザが第１のユーザと同一物理的空間の体験を共有するように意図する場合でも、第２のユーザのビュー内に、存在し得ない、または場所がずれ得る。

本発明者らは、空間存続が持続的座標フレーム（ＰＣＦ）を通して提供され得ることを認識および理解している。ＰＣＦは、物理的世界内で認識される特徴（例えば、角、縁）を表す、１つ以上の点に基づいて定義されてもよい。特徴は、それらがユーザインスタンスからＸＲシステムの別のユーザインスタンスと同一である可能性が高いように選択されてもよい。

さらに、算出された追跡経路（例えば、カメラ軌道）を実際の追跡経路から逸脱させ得る、追跡の間のドリフトは、仮想コンテンツの場所を、追跡マップのみに基づく、ローカルマップに対してレンダリングされるとき、場所からずれて現れさせ得る。空間のための追跡マップは、ＸＲデバイスが経時的に場面のさらなる情報を収集するにつれて、精緻化され、ドリフトを補正してもよい。しかしながら、仮想コンテンツが、マップ精緻化の前に、実オブジェクト上に設置され、追跡マップから導出されるデバイスの世界座標フレームに対して保存される場合、仮想コンテンツは、実オブジェクトがマップ精緻化の間に移動したかのように変位されて現れ得る。ＰＣＦは、ＰＣＦが、特徴に基づいて定義され、特徴がマップ精緻化の間に移動するにつれて、更新されるため、マップ精緻化に従って更新されてもよい。

ＰＣＦは、マップ座標系に対する平行移動および回転を伴う、６自由度を備えてもよい。ＰＣＦは、ローカルおよび／または遠隔記憶媒体内に記憶されてもよい。ＰＣＦの平行移動および回転は、例えば、記憶場所に応じて、マップ座標系に対して算出されてもよい。例えば、デバイスによってローカルで使用されるＰＣＦは、デバイスの世界座標フレームに対する平行移動および回転を有してもよい。クラウド内のＰＣＦは、規準マップの規準座標フレームに対する平行移動および回転を有してもよい。

ＰＣＦは、それらが効率的に処理および転送され得るように、物理的世界の疎表現を提供し、物理的世界についての利用可能な情報の全て未満を提供してもよい。持続的空間情報を処理するための技法は、１つ以上のセッションを横断して、実空間内の１つ以上の座標系に基づいて、動的マップを作成し、例えば、アプリケーションプログラミングインターフェース（ＡＰＩ）を介して、ＸＲアプリケーションにエクスポーズされ得る、疎マップにわたる持続的座標フレーム（ＰＣＦ）を生成するステップを含んでもよい。

図１４は、いくつかの実施形態による、持続的座標フレーム（ＰＣＦ）の作成およびＸＲコンテンツとＰＣＦの結付を図示する、ブロック図である。各ブロックは、コンピュータメモリ内に記憶されたデジタル情報を表し得る。アプリケーション１１８０の場合、データは、コンピュータ実行可能命令を表し得る。仮想コンテンツ１１７０の場合、デジタル情報は、例えば、アプリケーション１１８０によって規定されるような仮想オブジェクトを定義し得る。他のボックスの場合、デジタル情報は、物理的世界のいくつかの側面を特徴付けし得る。

図示される実施形態では、１つ以上のＰＣＦは、ウェアラブルデバイス上のセンサを用いて捕捉された画像から作成される。図１４の実施形態では、センサは、視覚的画像カメラである。これらのカメラは、追跡マップを形成するために使用される、同一カメラであってもよい。故に、図１４によって提案される処理のうちのいくつかは、追跡マップを更新するステップの一部として実施されてもよい。しかしながら、図１４は、存続を提供する情報が追跡マップに加えて生成されることを図示する。

３ＤＰＣＦを導出するために、立体視画像分析を有効にする構成においてウェアラブルデバイスに搭載される、２つのカメラからの２つの画像１１１０は、ともに処理される。図１４は、画像１および画像２を図示し、それぞれ、カメラのうちの１つから導出される。各カメラからの単一画像が、便宜上、図示される。しかしながら、各カメラは、画像フレームのストリームを出力してもよく、図１４に図示される処理は、ストリーム内の複数の画像フレームのために実施されてもよい。

故に、画像１および画像２はそれぞれ、画像フレームのシーケンス内の１つのフレームであってもよい。図１４に描写されるような処理は、そこから持続的空間情報を形成する、好適な画像を提供する特徴点を含有する画像フレームが処理されるまで、シーケンスにおいて連続画像フレーム上で繰り返されてもよい。代替として、または加えて、図１４の処理は、ユーザがもはや以前に識別されたＰＣＦに十分に近接しておらず、物理的世界に対する位置を決定するためにそのＰＣＦを確実に使用することができないほど、ユーザが移動するにつれて、繰り返され得る。例えば、ＸＲシステムは、ユーザのために、現在のＰＣＦを維持してもよい。その距離が、閾値を超えると、システムは、ユーザの現在の場所において入手された画像フレームを使用して図１４のプロセスに従って生成され得る、ユーザにより近い新しい現在のＰＣＦに切り替えてもよい。

単一ＰＣＦを生成するときでも、画像フレームのストリームが、安定する可能性が高く、画像フレームに描写される物理的世界の領域の近傍におけるデバイスによって容易に識別され得る、物理的世界内のコンテンツを描写する画像フレームを識別するように処理されてもよい。図１４の実施形態では、本処理は、画像内の特徴１１２０の識別から開始する。特徴は、例えば、オブジェクトの角に対応し得る、例えば、閾値を上回る画像内の勾配の場所または他の特性を見出すことによって、識別されてもよい。図示される実施形態では、特徴は、点であるが、縁等の他の認識可能特徴も、代替として、または加えて、使用されてもよい。

図示される実施形態では、固定数Ｎの特徴１１２０が、さらなる処理のために選択される。それらの特徴点は、勾配の大きさまたは他の特徴点との近接度等の１つ以上の基準に基づいて選択されてもよい。代替として、または加えて、特徴点は、特徴点が持続的であることを示唆する、特性に基づいて等、ヒューリスティックに選択されてもよい。例えば、ヒューリスティックは、窓またはドアまたは大型家具の角に対応する可能性が高い、特徴点の特性に基づいて定義されてもよい。そのようなヒューリスティックは、特徴点自体およびそれを囲繞するものを考慮してもよい。具体的実施例として、画像あたり特徴点の数は、２００等の１００～５００または１５０～２５０であってもよい。

選択された特徴点の数にかかわらず、記述子１１３０が、特徴点に関して算出されてもよい。本実施例では、記述子は、選択された特徴点毎に算出されるが、記述子は、特徴点の群に関して、または特徴点のサブセットに関して、または画像内の全ての特徴に関して算出されてもよい。記述子は、物理的世界内の同一オブジェクトを表す特徴点が類似記述子を割り当てられるように、特徴点を特徴付ける。記述子は、１つのマップが別のマップに対して位置特定されるときに生じ得るような２つのフレームの整合を促進し得る。２つの画像の特徴点間の距離を最小限にする、フレームの相対的配向を検索するのではなく、２つのフレームの初期整合は、類似記述子を伴う特徴点を識別することによって行われてもよい。画像フレームの整合は、類似記述子を伴う点を整合させるステップに基づいてもよく、これは、画像内の全ての特徴点の整合を算出する、より少ない処理を伴い得る。

記述子は、記述子への特徴点のマッピング、またはいくつかの実施形態では、特徴点の周囲の画像のパッチのマッピングとして算出されてもよい。記述子は、数値量であってもよい。米国特許出願第１６／１９０，９４８号は、特徴点に関する記述子を算出するステップを説明しており、参照することによってその全体として本明細書に組み込まれる。

図１４の実施例では、記述子１１３０は、各画像フレーム内の特徴点毎に算出される。記述子および／または特徴点および／または画像自体に基づいて、画像フレームは、キーフレーム１１４０として識別されてもよい。図示される実施形態では、キーフレームは、次いで、さらなる処理のために選択される、ある基準を満たす、画像フレームである。追跡マップを作成する際、例えば、有意義な情報をマップに追加する、画像フレームが、マップの中に統合される、キーフレームとして選択されてもよい。他方では、それにわたって画像フレームがすでにマップの中に統合されている、領域に実質的に重複する、画像フレームは、それらがキーフレームとならないように破棄されてもよい。代替として、または加えて、キーフレームは、画像フレーム内の特徴点の数および／またはタイプに基づいて選択されてもよい。図１４の実施形態では、追跡マップ内への含有のために選択されたキーフレーム１１５０はまた、ＰＣＦを決定するためのキーフレームとして処理されてもよいが、ＰＣＦの生成のためのキーフレームを選択するための異なるまたは付加的基準が、使用されてもよい。

図１４は、キーフレームがさらなる処理のために使用されることを示すが、画像から入手された情報は、他の形態で処理されてもよい。例えば、キーリグ内等の特徴点が、代替として、または加えて、処理されてもよい。さらに、キーフレームは、単一画像フレームから導出されるように説明されるが、キーフレームと入手された画像フレームとの間の１対１の関係が存在することが必要であるわけではない。キーフレームは、例えば、複数の画像内に現れる特徴のみがキーフレーム内に留保されるように、画像フレームをともにスティッチングまたは集約すること等によって、複数の画像フレームから入手されてもよい。

キーフレームは、画像情報および／または画像情報と関連付けられるメタデータを含んでもよい。いくつかの実施形態では、カメラ４４、４６（図９）によって捕捉された画像が、１つ以上のキーフレーム（例えば、キーフレーム１、２）の中に算出されてもよい。いくつかの実施形態では、キーフレームは、カメラ姿勢を含んでもよい。いくつかの実施形態では、キーフレームは、カメラ姿勢において捕捉された１つ以上のカメラ画像を含んでもよい。いくつかの実施形態では、ＸＲシステムは、カメラ姿勢において捕捉されたカメラ画像の一部を有用ではないと決定し、したがって、その部分をキーフレーム内に含まなくてもよい。したがって、キーフレームを使用して、新しい画像と場面のより早期の知識を整合させることは、ＸＲシステムの算出リソースの使用を低減させる。いくつかの実施形態では、キーフレームは、ある方向／角度を伴う場所における画像および／または画像データを含んでもよい。いくつかの実施形態では、キーフレームは、そこから１つ以上のマップ点が観察され得る、場所および方向を含んでもよい。いくつかの実施形態では、キーフレームは、あるＩＤを伴う、座標フレームを含んでもよい。米国特許第出願第１５／８７７，３５９号は、キーフレームを説明しており、参照することによってその全体として本明細書に組み込まれる。

キーフレーム１１４０のいくつかまたは全てが、キーフレームのための持続的姿勢１１５０の生成等のさらなる処理のために選択されてもよい。選択は、画像フレーム内の特徴点の全てまたはサブセットの特性に基づいてもよい。それらの特性は、記述子、特徴、および／または画像フレーム自体を処理することから決定されてもよい。具体的実施例として、選択は、持続的オブジェクトに関連する可能性が高いと識別された特徴点のクラスタに基づいてもよい。

各キーフレームは、キーフレームが入手された、カメラの姿勢と関連付けられる。持続的姿勢に処理するために選択されたキーフレームに関して、その姿勢情報は、入手時および／または入手の場所におけるＷｉＦｉフィンガプリントおよび／またはＧＰＳ座標等のキーフレームについての他のメタデータとともに保存されてもよい。

持続的姿勢は、デバイスがそれ自体を物理的世界についての以前に入手された情報に対して配向するために使用し得る、情報源である。例えば、そこから持続的姿勢が作成された、キーフレームが、物理的世界のマップの中に組み込まれる場合、デバイスは、持続的姿勢と関連付けられる、キーフレーム内の十分な数の特徴点を使用して、それ自体をその持続的姿勢に対して配向し得る。デバイスは、その周囲の得られた現在の画像と持続的姿勢を整合させ得る。本整合は、現在の画像と、持続的姿勢を生じさせた画像１１１０、特徴１１２０、および／または記述子１１３０、またはその画像またはそれらの特徴または記述子の任意のサブセットのマッチングに基づいてもよい。いくつかの実施形態では、持続的姿勢にマッチされた現在の画像フレームは、デバイスの追跡マップの中に組み込まれている、別のキーフレームであってもよい。

持続的姿勢についての情報は、同一または異なるデバイス上で実行され得る、複数のアプリケーション間の共有を促進する、フォーマットで記憶されてもよい。図１４の実施例では、持続的姿勢のいくつかまたは全てが、持続的座標フレーム（ＰＣＦ）１１６０として反映され得る。持続的姿勢のように、ＰＣＦも、マップと関連付けられてもよく、デバイスがそのＰＣＦに対するその配向を決定するために使用し得る、特徴のセットまたは他の情報を備えてもよい。ＰＣＦは、その位置をＰＣＦに相関させることによって、デバイスがマップ内に反映される物理的世界内の任意のオブジェクトに対するその位置を決定し得るように、そのマップの原点に対するその変換を定義する、変換を含んでもよい。

ＰＣＦが、物理的オブジェクトに対する場所を決定するための機構を提供するため、アプリケーション１１８０等のアプリケーションが、仮想コンテンツ１１７０のためのアンカとしての役割を果たす、１つ以上のＰＣＦに対する仮想オブジェクトの位置を定義し得る。図１４は、例えば、アプリ１が、その仮想コンテンツ２とＰＣＦ１、２を関連付けていることを図示する。同様に、アプリ２は、その仮想コンテンツ３とＰＣＦ１、２を関連付けている。アプリ１はまた、その仮想コンテンツ１とＰＣＦ４、５を関連付けていることが示され、アプリ２は、その仮想コンテンツ４とＰＣＦ３を関連付けていることが示される。いくつかの実施形態では、ＰＣＦ１、２が画像１および画像２に基づく方法と同様に、ＰＣＦ３は、画像３（図示せず）に基づいてもよく、ＰＣＦ４、５は、画像４および画像５（図示せず）に基づいてもよい。本仮想コンテンツをレンダリングするとき、デバイスは、１つ以上の変換を適用し、デバイスのディスプレイに対する仮想コンテンツの場所および／または仮想コンテンツの所望の場所に対する物理的オブジェクトの場所等の情報を算出してもよい。ＰＣＦを基準として使用することは、そのような算出を簡略化し得る。

いくつかの実施形態では、持続的姿勢は、１つ以上の関連付けられるキーフレームを有する、座標場所および／または方向であってもよい。いくつかの実施形態では、持続的姿勢は、ユーザが、ある距離、例えば、３メートル進行した後、自動的に作成されてもよい。いくつかの実施形態では、持続的姿勢は、位置特定の間、基準点として作用してもよい。いくつかの実施形態では、持続的姿勢は、パス可能世界（例えば、パス可能世界モジュール５３８）内に記憶されてもよい。

いくつかの実施形態では、新しいＰＣＦは、隣接するＰＣＦ間で許容される、事前に定義された距離に基づいて決定されてもよい。いくつかの実施形態では、１つ以上の持続的姿勢は、ユーザが、所定の距離、例えば、５メートル進行すると、ＰＣＦの中に算出されてもよい。いくつかの実施形態では、ＰＣＦは、例えば、パス可能世界内において、１つ以上の世界座標フレームおよび／または規準座標フレームと関連付けられてもよい。いくつかの実施形態では、ＰＣＦは、例えば、セキュリティ設定に応じて、ローカルおよび／または遠隔データベース内に記憶されてもよい。

図１５は、いくつかの実施形態による、持続座標フレームを確立および使用する方法４７００を図示する。方法４７００は、ＸＲデバイスの１つ以上のセンサを使用して、場面に関する画像（例えば、図１４における画像１および画像２）を捕捉するステップ（行為４７０２）から開始してもよい。複数のカメラが、使用されてもよく、１つのカメラが、例えば、ストリームにおいて、複数の画像を生成してもよい。

方法４７００は、着目点（例えば、図７におけるマップ点７０２、図１４における特徴１１２０）を捕捉された画像から抽出するステップ（４７０４）と、抽出された着目点に関する記述子（例えば、図１４における記述子１１３０）を生成するステップ（行為４７０６）と、記述子に基づいて、キーフレーム（例えば、キーフレーム１１４０）を生成するステップ（行為４７０８）とを含んでもよい。いくつかの実施形態では、本方法は、キーフレーム内の着目点を比較し、所定の量の着目点を共有する、対のキーフレームを形成してもよい。本方法は、個々の対のキーフレームを使用して、物理的世界の一部を再構築してもよい。物理的世界のマッピングされた部分は、３Ｄ特徴（例えば、図７におけるキーリグ７０４）として保存されてもよい。いくつかの実施形態では、対のキーフレームの選択された部分は、３Ｄ特徴を構築するために使用されてもよい。いくつかの実施形態では、マッピングの結果は、選択的に保存されてもよい。３Ｄ特徴を構築するために使用されない、キーフレームは、例えば、キーフレームの姿勢間に共分散行列を伴う、キーフレーム間の距離を表す、姿勢を通して、３Ｄ特徴と関連付けられてもよい。いくつかの実施形態では、対のキーフレームは、構築される３Ｄ特徴のそれぞれ間の距離が、必要とされる算出の量および結果として生じるモデルの正確度のレベルを平衡させるように決定され得る、所定の距離内にあるように、３Ｄ特徴を構築するように選択されてもよい。そのようなアプローチは、ＸＲシステムを用いた効率的および正確な算出のために好適なデータの量を伴う、物理的世界のモデルを提供することを可能にする。いくつかの実施形態では、２つの画像の共分散行列は、２つの画像の姿勢（例えば、６自由度）間の共分散を含んでもよい。

方法４７００は、キーフレームに基づいて持続的姿勢を生成するステップ（行為４７１０）を含んでもよい。いくつかの実施形態では、本方法は、対のキーフレームから再構成された３Ｄ特徴に基づいて、持続的姿勢を生成するステップを含んでもよい。いくつかの実施形態では、持続的姿勢は、３Ｄ特徴に結び付けられてもよい。いくつかの実施形態では、持続的姿勢は、３Ｄ特徴を構築するために使用される、キーフレームの姿勢を含んでもよい。いくつかの実施形態では、持続的姿勢は、３Ｄ特徴を構築するために使用される、キーフレームの平均姿勢を含んでもよい。いくつかの実施形態では、持続的姿勢は、近傍の持続的姿勢の間の距離が、所定の値、例えば、１つのメートル～５メートルの範囲内、その間の任意の値、または任意の他の好適な値内であるように生成されてもよい。いくつかの実施形態では、近傍の持続的姿勢間の距離は、近傍の持続的姿勢の共分散行列によって表されてもよい。

方法４７００は、持続的姿勢に基づいてＰＣＦを生成するステップ（行為４７１２）を含んでもよい。いくつかの実施形態では、ＰＣＦは、３Ｄ特徴に結び付けられてもよい。いくつかの実施形態では、ＰＣＦは、１つ以上の持続的姿勢と関連付けられてもよい。いくつかの実施形態では、ＰＣＦは、関連付けられる持続的姿勢のうちの１つの姿勢を含んでもよい。いくつかの実施形態では、ＰＣＦは、関連付けられる持続的姿勢の姿勢の平均姿勢を含んでもよい。いくつかの実施形態では、ＰＣＦは、近傍のＰＣＦ間の距離が、所定の値、例えば、３メートル～１０メートルの範囲、その間の任意の値、または任意の他の好適な値内にあるように生成されてもよい。いくつかの実施形態では、近傍のＰＣＦ間の距離は、近傍のＰＣＦの共分散行列によって表されてもよい。いくつかの実施形態では、ＰＣＦは、ＸＲアプリケーションが、モデル自体にアクセスせずに、ＰＣＦを通して、物理的世界のモデルにアクセスし得るように、例えば、アプリケーションプログラミングインターフェース（ＡＰＩ）を介して、ＸＲアプリケーションにエクスポーズされてもよい。

方法４７００は、ＸＲデバイスによって表示されるための仮想オブジェクトの画像データとＰＣＦのうちの少なくとも１つを関連付けるステップ（行為４７１４）を含んでもよい。いくつかの実施形態では、本方法は、関連付けられるＰＣＦに対する仮想オブジェクトの平行移動および配向を算出するステップを含んでもよい。仮想オブジェクトと仮想オブジェクトを設置するデバイスによって生成されたＰＣＦを関連付けることは、必要とされないことを理解されたい。例えば、デバイスは、クラウド内の規準マップ内の保存されたＰＣＦを読み出し、仮想オブジェクトと読み出されたＰＣＦを関連付けてもよい。仮想オブジェクトは、ＰＣＦが経時的に調節されるにつれて、関連付けられるＰＣＦとともに移動し得ることを理解されたい。

図１６は、いくつかの実施形態による、第１のＸＲデバイス１２．１と、第２のＸＲデバイス１２．２の視覚データおよびアルゴリズムと、サーバ２０とを図示する。図１６に図示されるコンポーネントは、本明細書に説明されるような持続的姿勢、持続的座標フレーム、追跡マップ、または規準マップ等の空間情報を生成、更新、および／または使用するステップと関連付けられる、動作のいくつかまたは全てを実施するように動作し得る。図示されないが、第１のＸＲデバイス１２．１は、第２のＸＲデバイス１２．２と同一に構成されてもよい。サーバ２０は、マップ記憶ルーチン１１８と、規準マップ１２０と、マップ伝送機１２２と、マップマージアルゴリズム１２４とを有してもよい。

第１のＸＲデバイス１２．１と同一場面にあり得る、第２のＸＲデバイス１２．２は、持続的座標フレーム（ＰＣＦ）統合ユニット１３００と、仮想オブジェクトをレンダリングするために使用され得る画像データ６８を生成する、アプリケーション１３０２と、フレーム埋込生成器３０８（図２１参照）とを含んでもよい。いくつかの実施形態では、マップダウンロードシステム１２６、ＰＣＦ識別システム１２８、マップ２、位置特定モジュール１３０、規準マップ組込器１３２、規準マップ１３３、およびマップ発行器１３６は、パス可能世界ユニット１３０４の中に群化されてもよい。ＰＣＦ統合ユニット１３００は、パス可能世界ユニット１３０４および第２のＸＲデバイス１２．２の他のコンポーネントに接続され、ＰＣＦの読出、生成、使用、アップロード、およびダウンロードを可能にしてもよい。

ＰＣＦを備える、マップは、変化する世界内のより多くの存続を有効にし得る。いくつかの実施形態では、例えば、画像のためのマッチング特徴を含む、追跡マップを位置特定するステップは、ＰＣＦによって構成されるマップから、持続的コンテンツを表す特徴を選択するステップを含んでもよく、これは、高速マッチングおよび／または位置特定を有効にする。例えば、人々が場面の内外に移動し、ドア等のオブジェクトが場面に対して移動する、世界は、より少ない記憶空間および伝送レートを要求し、場面をマッピングするために個々のＰＣＦおよび相互に対するその関係（例えば、ＰＣＦの統合されたコンステレーション）の使用を有効にする。

いくつかの実施形態では、ＰＣＦ統合ユニット１３００は、第２のＸＲデバイス１２．２の記憶ユニット上のデータ記憶内に以前に記憶されたＰＣＦ１３０６と、ＰＣＦ追跡器１３０８と、持続的姿勢入手器１３１０と、ＰＣＦ確認器１３１２と、ＰＣＦ生成システム１３１４と、座標フレーム計算機１３１６と、持続的姿勢計算機１３１８と、追跡マップおよび持続的姿勢変換器１３２０と、持続的姿勢およびＰＣＦ変換器１３２２と、ＰＣＦおよび画像データ変換器１３２４とを含む、３つの変換器とを含んでもよい。

いくつかの実施形態では、ＰＣＦ追跡器１３０８は、アプリケーション１３０２によって選択可能である、オンプロンプトおよびオフプロンプトを有してもよい。アプリケーション１３０２は、第２のＸＲデバイス１２．２のプロセッサによって実行可能であって、例えば、仮想コンテンツを表示してもよい。アプリケーション１３０２は、オンプロンプトを介して、ＰＣＦ追跡器１３０８をオンに切り替える、コールを有してもよい。ＰＣＦ追跡器１３０８は、ＰＣＦ追跡器１３０８がオンに切り替えられると、ＰＣＦを生成してもよい。アプリケーション１３０２は、オフプロンプトを介して、ＰＣＦ追跡器１３０８をオフに切り替え得る、後続コールを有してもよい。ＰＣＦ追跡器１３０８は、ＰＣＦ追跡器１３０８がオフに切り替えられると、ＰＣＦ生成を終了する。

いくつかの実施形態では、サーバ２０は、規準マップ１２０と関連付けられて以前に保存されている、複数の持続的姿勢１３３２と、複数のＰＣＦ１３３０とを含んでもよい。マップ伝送機１２２は、規準マップ１２０を持続的姿勢１３３２および／またはＰＣＦ１３３０とともに、第２のＸＲデバイス１２．２に伝送してもよい。持続的姿勢１３３２およびＰＣＦ１３３０は、規準マップ１３３と関連付けて第２のＸＲデバイス１２．２上に記憶されてもよい。マップ２が、規準マップ１３３に対して位置特定すると、持続的姿勢１３３２およびＰＣＦ１３３０は、マップ２と関連付けて記憶されてもよい。

いくつかの実施形態では、持続的姿勢入手器１３１０は、マップ２のための持続的姿勢を入手してもよい。ＰＣＦ確認器１３１２は、持続的姿勢入手器１３１０に接続されてもよい。ＰＣＦ確認器１３１２は、持続的姿勢入手器１３１０によって読み出された持続的姿勢に基づいて、ＰＣＦをＰＣＦ１３０６から読み出してもよい。ＰＣＦ確認器１３１２によって読み出されたＰＣＦは、ＰＣＦに基づいて、画像ディスプレイのために使用される、ＰＣＦの初期群を形成してもよい。

いくつかの実施形態では、アプリケーション１３０２は、付加的ＰＣＦが生成されることを要求し得る。例えば、ユーザが、以前にマッピングされていないエリアに移動する場合、アプリケーション１３０２は、ＰＣＦ追跡器１３０８をオンに切り替えてもよい。ＰＣＦ生成システム１３１４は、ＰＣＦ追跡器１３０８に接続され、マップ２が拡張し始めるにつれて、マップ２に基づいて、ＰＣＦの生成を開始してもよい。ＰＣＦ生成システム１３１４によって生成されたＰＣＦは、ＰＣＦベースの画像表示のために使用され得る、ＰＣＦの第２のグループを形成してもよい。

座標フレーム計算機１３１６は、ＰＣＦ確認器１３１２に接続されてもよい。ＰＣＦ確認器１３１２がＰＣＦを読み出した後、座標フレーム計算機１３１６は、頭部座標フレーム９６を呼び出し、第２のＸＲデバイス１２．２の頭部姿勢を決定してもよい。座標フレーム計算機１３１６はまた、持続的姿勢計算機１３１８を呼び出してもよい。持続的姿勢計算機１３１８は、フレーム埋込生成器３０８に直接または間接的に接続されてもよい。いくつかの実施形態では、画像／フレームは、前のキーフレームからの閾値距離、例えば、３メートルが、進行された後、キーフレームと指定されてもよい。持続的姿勢計算機１３１８は、複数の、例えば、３つのキーフレームに基づいて、持続的姿勢を生成してもよい。いくつかの実施形態では、持続的姿勢は、本質的に、複数のキーフレームの座標フレームの平均であってもよい。

追跡マップおよび持続的姿勢変換器１３２０は、マップ２および持続的姿勢計算機１３１８に接続されてもよい。追跡マップおよび持続的姿勢変換器１３２０は、マップ２を持続的姿勢に変換し、マップ２に対する原点における持続的姿勢を決定してもよい。

持続的姿勢およびＰＣＦ変換器１３２２は、追跡マップおよび持続的姿勢変換器１３２０およびさらにＰＣＦ確認器１３１２およびＰＣＦ生成システム１３１４に接続されてもよい。持続的姿勢およびＰＣＦ変換器１３２２は、持続的姿勢（それに対して追跡マップが変換された）をＰＣＦ確認器１３１２およびＰＣＦ生成システム１３１４からのＰＣＦに変換し、持続的姿勢に対するＰＣＦを決定してもよい。

ＰＣＦおよび画像データ変換器１３２４は、持続的姿勢およびＰＣＦ変換器１３２２およびデータチャネル６２に接続されてもよい。ＰＣＦおよび画像データ変換器１３２４は、ＰＣＦを画像データ６８に変換する。レンダリングエンジン３０は、ＰＣＦおよび画像データ変換器１３２４に接続され、ＰＣＦに対する画像データ６８をユーザに表示してもよい。

ＰＣＦ統合ユニット１３００は、ＰＣＦ１３０６内でＰＣＦ生成システム１３１４を用いて生成される、付加的ＰＣＦを記憶してもよい。ＰＣＦ１３０６は、持続的姿勢に対して記憶されてもよい。マップ発行器１３６は、マップ発行器１３６が、マップ２をサーバ２０に伝送し、マップ発行器１３６がまた、マップ２と関連付けられるＰＣＦおよび持続的姿勢をサーバ２０に伝送するとき、ＰＣＦ１３０６およびＰＣＦ１３０６と関連付けられる持続的姿勢を読み出し得る。サーバ２０のマップ記憶ルーチン１１８が、マップ２を記憶するとき、マップ記憶ルーチン１１８はまた、第２の視認デバイス１２．２によって生成された持続的姿勢およびＰＣＦを記憶してもよい。マップマージアルゴリズム１２４は、それぞれ、規準マップ１２０と関連付けられ、持続的姿勢１３３２およびＰＣＦ１３３０内に記憶される、マップ２の持続的姿勢およびＰＣＦとともに、規準マップ１２０を作成してもよい。

第１のＸＲデバイス１２．１は、第２のＸＲデバイス１２．２のＰＣＦ統合ユニット１３００に類似する、ＰＣＦ統合ユニットを含んでもよい。マップ伝送機１２２が、規準マップ１２０を第１のＸＲデバイス１２．１に伝送するとき、マップ伝送機１２２は、規準マップ１２０と関連付けられ、第２のＸＲデバイス１２．２から生じる、持続的姿勢１３３２およびＰＣＦ１３３０を伝送してもよい。第１のＸＲデバイス１２．１は、ＰＣＦおよび持続的姿勢を第１のＸＲデバイス１２．１の記憶デバイス上のデータ記憶装置内に記憶してもよい。第１のＸＲデバイス１２．１は、次いで、ＰＣＦに対する画像表示のために、第２のＸＲデバイス１２．２から生じる持続的姿勢およびＰＣＦを利用してもよい。加えて、または代替として、第１のＸＲデバイス１２．１は、上記に説明されるように、第２のＸＲデバイス１２．２に類似する様式において、ＰＣＦおよび持続的姿勢を読み出し、生成し、利用し、アップロードし、ダウンロードしてもよい。

図示される実施例では、第１のＸＲデバイス１２．１は、ローカル追跡マップ（以降、「マップ１」と称される）を生成し、マップ記憶ルーチン１１８は、マップ１を第１のＸＲデバイス１２．１から受信する。マップ記憶ルーチン１１８は、次いで、マップ１をサーバ２０の記憶デバイス上に規準マップ１２０として記憶する。

第２のＸＲデバイス１２．２は、マップダウンロードシステム１２６と、アンカ識別システム１２８と、位置特定モジュール１３０と、規準マップ組込器１３２と、ローカルコンテンツ位置付けシステム１３４と、マップ発行器１３６とを含む。

使用時、マップ伝送機１２２は、規準マップ１２０を第２のＸＲデバイス１２．２に送信し、マップダウンロードシステム１２６は、規準マップ１２０を規準マップ１３３としてサーバ２０からダウンロードし、記憶する。

アンカ識別システム１２８は、世界表面決定ルーチン７８に接続される。アンカ識別システム１２８は、世界表面決定ルーチン７８によって検出されたオブジェクトに基づいて、アンカを識別する。アンカ識別システム１２８は、アンカを使用して、第２のマップ（マップ２）を生成する。サイクル１３８によって示されるように、アンカ識別システム１２８は、アンカを識別し続け、マップ２を更新し続ける。アンカの場所は、世界表面決定ルーチン７８によって提供されるデータに基づいて、３次元データとして記録される。世界表面決定ルーチン７８は、画像を実オブジェクト検出カメラ４４から、深度データを深度センサ１３５から受信し、表面の場所および深度センサ１３５からのその相対的距離を決定する。

位置特定モジュール１３０は、規準マップ１３３およびマップ２に接続される。位置特定モジュール１３０は、マップ２を規準マップ１３３に対して位置特定するように繰り返し試みる。規準マップ組込器１３２は、規準マップ１３３およびマップ２に接続される。位置特定モジュール１３０が、マップ２を規準マップ１３３に対して位置特定すると、規準マップ組込器１３２は、規準マップ１３３をマップ２のアンカの中に組み込む。マップ２は、次いで、規準マップ内に含まれる欠測データで更新される。

ローカルコンテンツ位置付けシステム１３４は、マップ２に接続される。ローカルコンテンツ位置付けシステム１３４は、例えば、ユーザが世界座標フレーム内の特定の場所においてローカルコンテンツを位置特定し得る、システムであってもよい。ローカルコンテンツ自体が、次いで、マップ２の１つのアンカに結び付けられる。ローカル／世界座標変換器１０４は、ローカルコンテンツ位置付けシステム１３４の設定に基づいて、ローカル座標フレームを世界座標フレームに変換する。レンダリングエンジン３０、ディスプレイシステム４２、およびデータチャネル６２の機能は、図２を参照して説明されている。

マップ発行器１３６は、マップ２をサーバ２０にアップロードする。サーバ２０のマップ記憶ルーチン１１８は、次いで、マップ２をサーバ２０の記憶媒体内に記憶する。

マップマージアルゴリズム１２４は、マップ２と規準マップ１２０をマージする。物理的世界の同一または隣接する領域に関連する、２つを上回るマップ、例えば、３つまたは４つのマップが、記憶されているとき、マップマージアルゴリズム１２４は、全てのマップを規準マップ１２０にマージし、新しい規準マップ１２０をレンダリングする。マップ伝送機１２２は、次いで、新しい規準マップ１２０を、新しい規準マップ１２０によって表されるエリア内のあらゆるデバイス１２．１および１２．２に伝送する。デバイス１２．１および１２．２が、その個別のマップを規準マップ１２０に対して位置特定すると、規準マップ１２０は、プロモートされたマップとなる。

図１７は、いくつかの実施形態による、場面のマップのためのキーフレームを生成する実施例を図示する。図示される実施例では、第１のキーフレームＫＦ１は、部屋の左壁上のドアのために生成される。第２のキーフレームＫＦ２は、部屋の床、左壁、および右壁が出会う角内のエリアのために生成される。第３のキーフレームＫＦ３は、部屋の右壁上の窓のエリアのために生成される。第４のキーフレームＫＦ４は、壁の床上のラグの縁端におけるエリアのために生成される。第５のキーフレームＫＦ５は、ユーザに最も近いラグのエリアのために生成される。

図１８は、いくつかの実施形態による、図１７のマップのための持続的姿勢を生成する実施例を図示する。いくつかの実施形態では、新しい持続的姿勢が、デバイスが進行された閾値距離を測定すると、および／またはアプリケーションが新しい持続的姿勢（ＰＰ）を要求すると、作成される。いくつかの実施形態では、閾値距離は、３メートル、５メートル、２０メートル、または任意の他の好適な距離であってもよい。より小さい閾値距離（例えば、１ｍ）を選択することは、より多数のＰＰが、より大きい閾値距離と比較して、作成および管理され得るため、算出負荷の増加をもたらし得る。より大きい閾値距離（例えば、４０ｍ）を選択することは、より少数のＰＰが作成され、より少ないＰＣＦが作成される結果をもたらし、ＰＣＦに結び付けられた仮想コンテンツが、ＰＣＦから比較的に大距離（例えば、３０ｍ）離れ、ＰＣＦから仮想コンテンツまでの距離の増加に伴って誤差が増加し得ることを意味するため、仮想コンテンツ設置誤差の増加をもたらし得る。

いくつかの実施形態では、ＰＰは、新しいセッションの開始時に作成されてもよい。本初期ＰＰは、ゼロと見なされ得、閾値距離に等しい半径を有する、円形の中心として可視化され得る。デバイスが、円形の周に到達し、いくつかの実施形態では、アプリケーションが、新しいＰＰを要求すると、新しいＰＰは、デバイスの現在の場所（閾値距離）に設置されてもよい。いくつかの実施形態では、新しいＰＰは、デバイスが、既存のＰＰをデバイスの新しい位置からの閾値距離内に見出すことが可能である場合、閾値距離に作成されないであろう。いくつかの実施形態では、新しいＰＰ（図１４におけるＰＰ１１５０）が、作成されると、デバイスは、最も近いキーフレームのうちの１つ以上のものをＰＰに結び付ける。いくつかの実施形態では、キーフレームに対するＰＰの場所は、ＰＰが作成された時点でのデバイスの場所に基づいてもよい。いくつかの実施形態では、ＰＰは、アプリケーションがＰＰを要求しない限り、デバイスが閾値距離を進行しても作成されないであろう。

いくつかの実施形態では、アプリケーションは、アプリケーションがユーザに表示するための仮想コンテンツを有するとき、ＰＣＦをデバイスから要求してもよい。アプリケーションからのＰＣＦ要求は、ＰＰ要求をトリガしてもよく、新しいＰＰは、デバイスが閾値距離を進行した後に作成されるであろう。図１８は、例えば、キーフレームと持続的姿勢との間の相対的姿勢を算出することによっって、最も近いキーフレーム（例えば、ＫＦ１、ＫＦ２、およびＫＦ３）を結び付けさせ得る、第１の持続的姿勢ＰＰ１を図示する。図１８はまた、最も近いキーフレーム（例えば、ＫＦ４およびＫＦ５）を結び付けさせ得る、第２の持続的姿勢ＰＰ２を図示する。

図１９は、いくつかの実施形態による、図１７のマップのためのＰＣＦを生成する実施例を図示する。図示される実施例では、ＰＣＦ１は、ＰＰ１と、ＰＰ２とを含んでもよい。上記に説明されるように、ＰＣＦは、ＰＣＦに対する画像データを表示するために使用されてもよい。いくつかの実施形態では、各ＰＣＦは、別の座標フレーム（例えば、世界座標フレーム）内の座標と、例えば、ＰＣＦを一意に識別する、ＰＣＦ記述子とを有してもよい。いくつかの実施形態では、ＰＣＦ記述子は、ＰＣＦと関連付けられるフレーム内の特徴の特徴記述子に基づいて算出されてもよい。いくつかの実施形態では、ＰＣＦの種々のコンステレーションは、より少ないデータおよびより少ないデータの伝送を要求する、持続的様式において、組み合わせられ、実世界を表してもよい。

図２０Ａ－２０Ｃは、持続的座標フレームを確立および使用する実施例を図示する、概略図である。図２０Ａは、規準マップに対して位置特定されていない、個別のローカル追跡マップ４８０４Ａ、４８０４Ｂを伴う、２人のユーザ４８０２Ａ、４８０２Ｂを示す。個々のユーザに関する原点４８０６Ａ、４８０６Ｂは、その個別のエリア内の座標系（例えば、世界座標系）によって描写される。各追跡マップのこれらの原点は、原点が、追跡が開始されたときのその個別のデバイスの配向に依存するため、各ユーザにローカルであり得る。

ユーザデバイスのセンサが、環境を走査するにつれて、デバイスは、図１４に関連して上記に説明されるように、それらの画像が、そこから持続的姿勢が作成され得る、キーフレームとして分類され得るように、持続的オブジェクトを表す特徴を含有し得る、画像を捕捉してもよい。本実施例では、追跡マップ４８０２Ａは、持続的姿勢（ＰＰ）４８０８Ａを含み、追跡マップ４８０２Ｂは、ＰＰ４８０８Ｂを含む。

また、図１４に関連して上記に説明されるように、ＰＰのうちのいくつかは、ユーザにそれをレンダリングするために仮想コンテンツの配向を決定するために使用される、ＰＣＦとして分類されてもよい。図２０Ｂは、個別のユーザ４８０２Ａ、４８０２Ｂによって装着されるＸＲデバイスが、ＰＰ４８０８Ａ、４８０８Ｂに基づいて、ローカルＰＣＦ４８１０Ａ、４８１０Ｂを作成し得ることを示す。図２０Ｃは、持続的コンテンツ４８１２Ａ、４８１２Ｂ（例えば、仮想コンテンツ）が個別のＸＲデバイスによってＰＣＦ４８１０Ａ、４８１０Ｂに結び付けられ得ることを示す。

本実施例では、仮想コンテンツは、仮想コンテンツが表示されるべき方法にかかわらず、仮想コンテンツを生成するアプリケーションによって使用され得る、仮想コンテンツ座標フレームを有し得る。仮想コンテンツは、例えば、仮想コンテンツ座標フレームに対して特定の場所および角度における、メッシュの三角形等の表面として規定されてもよい。その仮想コンテンツをユーザにレンダリングするために、それらの表面の場所が、仮想コンテンツを知覚することになるユーザに対して決定されてもよい。

仮想コンテンツをＰＣＦに結び付けることは、ユーザに対する仮想コンテンツの場所を決定する際に関わる算出を簡略化し得る。ユーザに対する仮想コンテンツの場所は、一連の変換を適用することによって決定されてもよい。それらの変換のうちのいくつかは、変化し得、頻繁に更新されてもよい。それらの変換のその他は、安定し得、あまり頻繁にまたは全く更新されなくてもよい。それにもかかわらず、変換は、仮想コンテンツの場所が、ユーザに対して頻繁に更新され、現実的外観をレンダリングされた仮想コンテンツに提供し得るように、比較的に低算出負担を伴って適用され得る。

図２０Ａ－２０Ｃの実施例では、ユーザ１のデバイスは、変換ｒｉｇ１＿Ｔ＿ｗ１によってマップの原点を定義する、座標系に関連し得る、座標系を有する。ユーザ２のデバイスは、類似変換ｒｉｇ２＿Ｔ＿ｗ２を有する。これらの変換は、６度の変換として表され、デバイス座標系とマップ座標系を整合させるための平行移動および回転を規定し得る。いくつかの実施形態では、変換は、２つの別個の変換として表され得、一方は、平行移動を規定し、他方は、回転を規定する。故に、変換は、算出を簡略化する、または別様に利点を提供する形態で表され得ることを理解されたい。

追跡マップの原点と個別のユーザデバイスによって識別されるＰＣＦとの間の変換は、ｐｃｆ１＿Ｔ＿ｗ１およびｐｃｆ２＿Ｔ＿ｗ２として表される。本実施例では、ＰＣＦおよびＰＰは、同一変換がまたＰＰを特徴付けるように、同じである。

ＰＣＦに対するユーザデバイスの場所は、したがって、ｒｉｇ１＿Ｔ＿ｐｃｆ１＝（ｒｉｇ１＿Ｔ＿ｗ１）^＊（ｐｃｆ１＿Ｔ＿ｗ１）等のこれらの変換の連続適用によって算出されることができる。

図２０Ｃに示されるように、仮想コンテンツは、ｏｂｊ１＿Ｔ＿ｐｃｆ１の変換を用いて、ＰＣＦに対して位置特定される。本変換は、ＰＣＦに対する物理的オブジェクトを説明する世界再構築システムからの情報を受信し得る、仮想コンテンツを生成するアプリケーションによって設定されてもよい。仮想コンテンツをユーザにレンダリングするために、ユーザのデバイスの座標系への変換が、算出され、これは、変換ｏｂｊ１＿ｔ＿ｗ１＝（ｏｂｊ１＿Ｔ＿ｐｃｆ１）^＊（ｐｃｆ１＿Ｔ＿ｗ１）を通して、仮想コンテンツ座標フレームを追跡マップの原点に関連させることによって算出され得る。その変換は、次いで、さらなる変換ｒｉｇ１＿Ｔ＿ｗ１を通して、ユーザのデバイスに関連され得る。

仮想コンテンツの場所は、仮想コンテンツを生成するアプリケーションからの出力に基づいて変化し得る。それが変化すると、ソース座標系から目的地座標系へのエンドツーエンド変換が、再算出され得る。加えて、ユーザの場所および／または頭部姿勢も、ユーザが移動するにつれて変化し得る。結果として、変換ｒｉｇ１＿Ｔ＿ｗ１が、変化し得るのと同様に、ユーザの場所または頭部姿勢に依存する、任意のエンドツーエンド変換も変化するであろう。

変換ｒｉｇ１＿Ｔ＿ｗ１は、ユーザの位置を物理的世界内の定常オブジェクトに対して追跡することに基づいて、ユーザの運動に伴って更新されてもよい。そのような追跡は、上記に説明されるように、画像のシーケンスを処理するヘッドホン追跡コンポーネント、またはシステムの他のコンポーネントによって実施されてもよい。そのような更新は、ＰＰ等の定常基準フレームに対するユーザの姿勢を決定することによって行われてもよい。

いくつかの実施形態では、ユーザデバイスの場所および配向は、最も近くの持続的姿勢に対して決定されてもよい、または、本実施例では、ＰＰとしてのＰＣＦが、ＰＣＦとして使用される。そのような決定は、デバイス上のセンサを用いて捕捉された現在の画像内において、ＰＰを特徴付ける、特徴点を識別することによって、行われてもよい。立体視画像分析等の画像処理技法を使用して、それらの特徴点に対するデバイスの場所が、決定されてもよい。本データから、システムは、関係ｒｉｇ１＿Ｔ＿ｐｃｆ１＝（ｒｉｇ１＿Ｔ＿ｗ１）^＊（ｐｃｆ１＿Ｔ＿ｗ１）に基づいて、ユーザの運動と関連付けられる変換の変化を計算し得る。

システムは、算出上効率的である順序において、変換を決定および適用してもよい。例えば、ｒｉｇ１＿Ｔ＿ｐｃｆ１をもたらす測定からｒｉｇ１＿Ｔ＿ｗ１を算出する必要性は、ユーザ姿勢を追跡することと、持続的姿勢上に構築されるＰＰまたはＰＣＦに対する仮想コンテンツの場所を定義することとの両方によって、回避され得る。このように、仮想コンテンツのソース座標系からユーザのデバイスの目的地座標系への変換は、表現（ｒｉｇ１＿Ｔ＿ｐｃｆ１）^＊（ｏｂｊ１＿ｔ＿ｐｃｆ１）に従う測定された変換に基づいてもよく、第１の変換は、システムによって測定され、後者の変換は、レンダリングのための仮想コンテンツを規定するアプリケーションによって供給される。仮想コンテンツがマップの原点に対して位置付けられる、実施形態では、エンドツーエンド変換は、マップ座標とＰＣＦ座標との間のさらなる変換に基づいて、仮想オブジェクト座標系をＰＣＦ座標系に関連させ得る。仮想コンテンツが、それに対してユーザ位置が追跡されているものと異なるＰＰまたはＰＣＦに対して位置付けられる、実施形態では、２つの間の変換が、適用されてもよい。そのような変換は、固定されてもよく、例えば、両方が現れる、マップから決定されてもよい。

変換ベースのアプローチは、例えば、センサデータを処理し、追跡マップを構築する、コンポーネントを伴う、デバイス内に実装されてもよい。そのプロセスの一部として、それらのコンポーネントは、持続的姿勢として使用され得る、特徴点を識別してもよく、これは、ひいては、ＰＣＦに変えられてもよい。それらのコンポーネントは、図１７－１９に関連して上記に説明されるように、マップのために生成される持続的姿勢の数を限定し、持続的姿勢間の好適な間隔を提供する一方、ユーザが、物理的環境内の場所にかかわらず、持続的姿勢場所に十分に近接し、ユーザの姿勢を正確に算出することを可能にし得る。ユーザに最も近い持続的姿勢が、ユーザ移動、追跡マップに対する精緻化、または他の原因の結果として、更新されるにつれて、ＰＰ（または使用されている場合、ＰＣＦ）の場所に依存する、ユーザに対する仮想コンテンツの場所を算出するために使用される、変換のいずれかが、少なくとも、ユーザがその持続的姿勢から離れるように移動するまで、使用のために、更新および記憶されてもよい。なお、変換を算出および記憶することによって、仮想コンテンツの場所が更新される度の算出負担は、比較的に短待ち時間を伴って実施され得るほど比較的に低くなり得る。

図２０Ａ－２０Ｃは、追跡マップに対する位置付けを図示し、各デバイスがその独自の追跡マップを有する。しかしながら、変換は、任意のマップ座標系に対して生成されてもよい。ＸＲシステムのユーザセッションを横断したコンテンツの存続は、持続的マップを使用することによって達成され得る。ユーザの共有体験はまた、それに対して複数のユーザデバイスが配向され得る、マップを使用することによって促進され得る。

下記により詳細に説明される、いくつかの実施形態では、仮想コンテンツの場所は、複数のデバイスのいずれかがマップを使用し得るようにフォーマットされる、規準マップにおける座標に関連して規定されてもよい。各デバイスは、追跡マップを維持し得、追跡マップに対するユーザの姿勢の変化を決定してもよい。本実施例では、追跡マップと規準マップとの間の変換は、「位置特定」のプロセスを通して決定されてもよく、これは、追跡マップ内の構造（１つ以上の持続的姿勢等）と規準マップの１つ以上の構造（１つ以上のＰＣＦ等）をマッチングさせることによって実施されてもよい。

下記にさらに説明されるものは、このように規準マップを作成および使用するための技法である。

深層キーフレーム

本明細書に説明されるような技法は、画像フレームの比較に依拠する。例えば、追跡マップに対するデバイスの位置を確立するために、新しい画像が、ユーザによって装着されるセンサを用いて捕捉されてもよく、ＸＲシステムは、追跡マップを作成するために使用された画像のセット内において、少なくとも所定の量の着目点を新しい画像と共有する、画像を検索してもよい。画像フレームの比較を伴う、別のシナリオの実施例として、追跡マップが、最初に、規準マップ内のＰＣＦと関連付けられる画像フレームに類似する、追跡マップ内の持続的姿勢と関連付けられる画像フレームを見出すことによって、規準マップに対して位置特定され得る。代替として、２つの規準マップ間の変換が、最初に、２つのマップ内の類似画像フレームを見出すことによって、算出されてもよい。

深層キーフレームは、類似画像フレームを識別するために要求される処理の量を低減させるための方法を提供する。例えば、いくつかの実施形態では、比較は、新しい２Ｄ画像内の画像特徴（例えば、「２Ｄ特徴」）とマップ内の３Ｄ特徴との間で行われ得る。そのような比較は、３Ｄ画像を２Ｄ平面の中に投影すること等によって、任意の好適な方法において行われ得る。単語の袋（ＢｏＷ）等の従来の方法は、マップ内の全ての２Ｄ特徴を含む、データベース内の新しい画像の２Ｄ特徴を検索し、これは、特に、マップが大エリアを表すとき、有意な算出リソースを要求し得る。従来の方法は、次いで、２Ｄ特徴のうちの少なくとも１つを新しい画像と共有する、画像を位置特定し、これは、マップ内の有意義な３Ｄ特徴を位置特定するために有用ではない、画像を含み得る。従来の方法は、次いで、新しい画像内の２Ｄ特徴に対して有意義ではない、３Ｄ特徴を位置特定する。

本発明者らは、より少ないメモリリソース（例えば、ＢｏＷによって使用されるメモリリソースの４分の１）、より高い効率（例えば、キーフレーム毎に２．５ｍｓの処理時間、５００枚のキーフレームに対する比較のために１００μｓ）、およびより高い正確度（例えば、１，０２４次元モデルのためにＢｏＷより２０％良好な読出再生、２５６次元モデルのためにＢｏＷより５％良好な読出再生）を使用した、マップ内の画像を読み出すための技法を認識および理解している。

算出を低減させるために、画像フレームと他の画像フレームを比較するために使用され得る、記述子が、画像フレームのために算出されてもよい。記述子は、画像フレームおよび特徴点の代わりに、またはそれに加え、記憶されてもよい。持続的姿勢および／またはＰＣＦが画像フレームから生成され得る、マップでは、そこから各持続的姿勢またはＰＣＦが生成された画像フレームまたは複数のフレームの記述子が、持続的姿勢および／またはＰＣＦの一部として記憶されてもよい。

いくつかの実施形態では、記述子は、画像フレーム内の特徴点の関数として算出されてもよい。いくつかの実施形態では、ニューラルネットワークが、画像を表すための一意のフレーム記述子を算出するように構成される。画像は、ユーザによって装着されるデバイスの視野内の３Ｄ環境の十分な詳細が画像内で捕捉されるように、１メガバイトより高い分解能を有し得る。フレーム記述子は、数字の列、例えば、１２８バイト～５１２バイトの範囲内またはその間の任意の数等、はるかに小さくあり得る。

いくつかの実施形態では、ニューラルネットワークは、算出されたフレーム記述子が画像間の類似性を示すように訓練される。マップ内の画像は、マップを生成するために使用される画像を備えるデータベース内において、新しい画像のためのフレーム記述子に対して所定の距離内のフレーム記述子を有し得る、最も近くの画像を識別することによって位置特定され得る。いくつかの実施形態では、画像間の距離は、２つの画像のフレーム記述子間の差異によって表されてもよい。

図２１は、いくつかの実施形態による、個々の画像のための記述子を生成するためのシステムを図示する、ブロック図である。図示される実施例では、フレーム埋込生成器３０８が、示される。フレーム埋込生成器３０８は、いくつかの実施形態では、サーバ２０と併用されてもよいが、代替として、または加えて、全体または部分的に、ＸＲデバイス１２．１および１２．２、または他の画像との比較のための画像を処理する任意の他のデバイスのうちの１つ内で実行されてもよい。

いくつかの実施形態では、フレーム埋込生成器は、低減されたサイズにもかかわらず、それでもなお、画像内のコンテンツを示す、初期サイズ（例えば、７６，８００バイト）から最終サイズ（例えば、２５６バイト）に低減された画像のデータ表現を生成するように構成されてもよい。いくつかの実施形態では、フレーム埋込生成器は、他の方法において使用されるキーフレームまたはフレームであり得る、画像のためのデータ表現を生成するために使用されてもよい。いくつかの実施形態では、フレーム埋込生成器３０８は、特定の場所および配向における画像を一意の数字の列（例えば、２５６バイト）に変換するように構成されてもよい。図示される実施例では、ＸＲデバイスによって撮影される画像３２０は、画像３２０内の着目点３２２を検出するために特徴抽出器３２４によって処理されてもよい。着目点は、特徴１１２０（図１４）に関して上記に説明されるように、または本明細書に別様に説明されるように、識別された特徴点から導出される場合とそうではない場合がある。いくつかの実施形態では、着目点は、深層疎特徴方法を使用して生成され得る、記述子１１３０（図１４）に関して上記に説明されるように、記述子によって表されてもよい。いくつかの実施形態では、各着目点３２２は、数字の列（例えば、３２バイト）によって表されてもよい。例えば、ｎ個の特徴（例えば、１００）が存在してもよく、各特徴は、３２バイトの列によって表される。

いくつかの実施形態では、フレーム埋込生成器３０８は、ニューラルネットワーク３２６を含んでもよい。ニューラルネットワーク３２６は、多層パーセプトロンユニット３１２と、最大（ｍａｘ）プールユニット３１４とを含んでもよい。いくつかの実施形態では、多層パーセプトロン（ＭＬＰ）ユニット３１２は、多層パーセプトロンを備えてもよく、これは、訓練されてもよい。いくつかの実施形態では、着目点３２２（例えば、着目点のための記述子）は、多層パーセプトロン３１２によって低減され得、記述子の加重された組み合わせ３１０として出力され得る。例えば、ＭＬＰは、ｎ個の特徴を、ｎ個の特徴未満である、ｍ個の特徴に低減させ得る。

いくつかの実施形態では、ＭＬＰユニット３１２は、行列乗算を実施するように構成されてもよい。多層パーセプトロンユニット３１２は、画像３２０の複数の着目点３２２を受信し、各着目点を個別の数字の列（例えば、２５６）に変換する。例えば、１００個の特徴が存在してもよく、各特徴は、２５６の数字の列によって表され得る。行列は、本実施例では、１００の水平行および２５６の垂直列を有するように作成されてもよい。各行は、一部は、より小さく、一部は、より大きい、大きさが変動する、一連の２５６の数を有してもよい。いくつかの実施形態では、ＭＬＰの出力は、ｎ×２５６の行列であってもよく、ｎは、画像から抽出された特徴の数を表す。いくつかの実施形態では、ＭＬＰの出力は、ｍ×２５６行列であってもよく、ｍは、ｎから低減された着目点の数である。

いくつかの実施形態では、ＭＬＰ３１２は、その間にＭＬＰのためのモデルパラメータが決定される、訓練相と、使用相とを有してもよい。いくつかの実施形態では、ＭＬＰは、図２５に図示されるように、訓練されてもよい。入力訓練データは、３つのセット内にデータを備えてもよく、３つのセットは、１）クエリ画像と、２）正のサンプルと、３）負のサンプルとを備える。クエリ画像は、基準画像と見なされ得る。

いくつかの実施形態では、正のサンプルは、クエリ画像に類似する、画像を備えてもよい。例えば、いくつかの実施形態では、類似するとは、同一オブジェクトをクエリおよび正のサンプル画像の両方内に有することであるが、異なる角度から視認され得る。いくつかの実施形態では、類似するとは、同一オブジェクトをクエリおよび正のサンプル画像の両方内に有することであるが、他の画像に対して（例えば、左、右、上、下に）偏移されるオブジェクトを有し得る。

いくつかの実施形態では、負のサンプルは、クエリ画像と類似しない、画像を備えてもよい。例えば、いくつかの実施形態では、類似しない画像は、クエリ画像内で顕著な任意のオブジェクトを含有し得ない、またはクエリ画像内で顕著なオブジェクトの小部分のみ（例えば、＜１０％、１％）を含有し得る。類似画像は、対照的に、例えば、クエリ画像内でオブジェクトの大部分（例えば、＞５０％、または＞７５％）を有し得る。

いくつかの実施形態では、着目点は、入力訓練データ内の画像から抽出されてもよく、特徴記述子に変換されてもよい。これらの記述子は、図２５に示されるように、訓練画像のためと、図２１のフレーム埋込生成器３０８の動作時に抽出された特徴のためとの両方のために算出されてもよい。いくつかの実施形態では、深層疎特徴（ＤＳＦ）プロセスが、米国特許出願第１６／１９０，９４８号に説明されるように、記述子（例えば、ＤＳＦ記述子）を生成するために使用されてもよい。いくつかの実施形態では、ＤＳＦ記述子は、ｎ×３２寸法である。記述子は、次いで、モデル／ＭＬＰを通して通過され、２５６バイト出力を作成してもよい。いくつかの実施形態では、モデル／ＭＬＰは、いったんモデルパラメータが訓練を通して設定されると、結果として生じる訓練されたＭＬＰがＭＬＰ３１２として使用され得るように、ＭＬＰ３１２と同一構造を有してもよい。

いくつかの実施形態では、特徴記述子（例えば、ＭＬＰモデルから出力された２５６バイト）は、次いで、トリプレットマージン損失モジュール（ＭＬＰニューラルネットワークの訓練相の間にのみ使用され、使用相の間には使用され得ない）に送信されてもよい。いくつかの実施形態では、トリプレットマージン損失モジュールは、クエリ画像から出力された２５６バイトと正のサンプルから出力された２５６バイトとの間の差異を低減させ、クエリ画像から出力された２５６バイトと負のサンプルから出力された２５６バイトとの間の差異を増加させるように、モデルのためのパラメータを選択するように構成されてもよい。いくつかの実施形態では、訓練相は、複数のトリプレット入力画像を学習プロセスの中にフィードし、モデルパラメータを決定するステップを含んでもよい。本訓練プロセスは、例えば、正の画像に関する差異が最小限にされ、負の画像に関する差異が最大限にされるまで、または他の好適な終了基準に到達するまで、継続し得る。

図２１に戻って参照すると、フレーム埋込生成器３０８は、ここでは、最大（ｍａｘ）プールユニット３１４として図示される、プーリング層を含んでもよい。最大プールユニット３１４は、各列を分析し、個別の列内の最大数を決定してもよい。最大プールユニット３１４は、ＭＬＰ３１２の出力行列の数の各列の最大値を、例えば、２５６の数のグローバル特徴列３１６に組み合わせてもよい。ＸＲシステム内で処理された画像は、望ましくは、潜在的に数百万ピクセルを伴う、高分解能フレームを有し得ることを理解されたい。グローバル特徴列３１６は、比較的に少ないメモリを占有し、画像（例えば、１メガバイトより高い分解能を伴う）と比較して、容易に検索可能である、比較的に小数である。したがって、カメラからの各オリジナルフレームを分析せずに、画像を検索することが可能であって、また、完全フレームの代わりに、２５６バイトを記憶するようにより安価である。

図２２は、いくつかの実施形態による、画像記述子を算出する方法２２００を図示する、フローチャートである。方法２２００は、ユーザによって装着されるＸＲデバイスによって捕捉された複数の画像を受信するステップ（行為２２０２）から開始してもよい。いくつかの実施形態では、方法２２００は、１つ以上のキーフレームを複数の画像から決定するステップ（行為２２０４）を含んでもよい。いくつかの実施形態では、行為２２０４は、スキップされてもよい、および／または代わりに、ステップ２２１０後に生じてもよい。

方法２２００は、人工ニューラルネットワークを用いて、複数の画像内の１つ以上の着目点を識別するステップ（行為２２０６）と、人工ニューラルネットワークを用いて、個々の着目点のための特徴記述子を算出するステップ（行為２２０８）とを含んでもよい。本方法は、画像毎に、少なくとも部分的に、人工ニューラルネットワークを用いて、画像内の識別された着目点のための算出された特徴記述子に基づいて、画像を表すためのフレーム記述子を算出するステップ（行為２２１０）を含んでもよい。

図２３は、いくつかの実施形態による、画像記述子を使用した位置特定の方法２３００を図示する、フローチャートである。本実施例では、ＸＲデバイスの現在の場所を描写する、新しい画像フレームが、マップ内の点（上記に説明されるように、持続的姿勢またはＰＣＦ等）に関連して記憶された画像フレームと比較されてもよい。方法２３００は、ユーザによって装着されるＸＲデバイスによって捕捉された新しい画像を受信するステップ（行為２３０２）から開始してもよい。方法２３００は、１つ以上のマップを生成するために使用されるキーフレームを備える、データベース内の１つ以上の最も近くのキーフレームを識別するステップ（行為２３０４）を含んでもよい。いくつかの実施形態では、最も近くのキーフレームは、大まかな空間情報および／または以前に決定された空間情報に基づいて識別されてもよい。例えば、大まかな空間情報は、ＸＲデバイスがマップの５０ｍ×５０ｍエリアによって表される地理的領域内に存在することを示し得る。画像マッチングは、そのエリア内の点のみに関して実施されてもよい。別の実施例として、追跡に基づいて、ＸＲシステムは、ＸＲデバイスが、マップ内の第１の持続的姿勢に以前に近接しており、マップ内の第２の持続的姿勢の方向に移動していたことを把握してもよい。その第２の持続的姿勢は、最も近くの持続的姿勢と見なされ得、それとともに記憶されたキーフレームは、最も近くのキーフレームと見なされ得る。代替として、または加えて、ＧＰＳデータまたはＷｉＦｉフィンガプリント等の他のメタデータも、最も近くのキーフレームまたは最も近くのキーフレームのセットを選択するために使用されてもよい。

最も近くのキーフレームが選択される方法にかかわらず、フレーム記述子が、新しい画像が近隣の持続的姿勢と関連付けられるものとして選択されたフレームのいずれかにマッチングするかどうかを決定するために使用されてもよい。決定は、新しい画像のフレーム記述子と任意の他の好適な方法において選択されたデータベース内の最も近いキーフレームまたはキーフレームのサブセットのフレーム記述子を比較し、新しい画像のフレーム記述子の所定の距離内のフレーム記述子を伴うキーフレームを選択することによって行われてもよい。いくつかの実施形態では、２つのフレーム記述子間の距離は、２つのフレーム記述子を表し得る、２つの数字の列間の差異を取得することによって算出されてもよい。列が複数の量の列として処理される、実施形態では、差異は、ベクトル差異として算出されてもよい。

いったんマッチング画像フレームが、識別されると、その画像フレームに対するＸＲデバイスの配向が、決定され得る。方法２３００は、識別された最も近くのキーフレームに対応する、マップ内の３Ｄ特徴に対して特徴マッチングを実施するステップ（行為２３０６）と、特徴マッチング結果に基づいて、ユーザによって装着されるデバイスの姿勢を算出するステップ（行為２３０８）とを含んでもよい。このように、２つの画像内の特徴点の算出上集約的であるマッチングは、新しい画像のための可能性が高いマッチングであるとすでに決定されているわずか１つの画像に関して実施されてもよい。

図２４は、いくつかの実施形態による、ニューラルネットワークを訓練する方法２４００を図示する、フローチャートである。方法２４００は、複数の画像セットを備える、データセットを生成するステップ（行為２４０２）から開始してもよい。複数の画像セットはそれぞれ、クエリ画像と、正のサンプル画像と、負のサンプル画像とを含んでもよい。いくつかの実施形態では、複数の画像セットは、例えば、ニューラルネットワークに形状等の基本情報を教示するように構成される、合成記録対を含んでもよい。いくつかの実施形態では、複数の画像セットは、物理的世界から記録され得る、実記録対を含んでもよい。

いくつかの実施形態では、インライアは、２つの画像間の基本行列を適合させることによって算出されてもよい。いくつかの実施形態では、疎重複が、画像の両方内で見られる着目点の和集合上の交点（ＩｏＵ）として算出されてもよい。いくつかの実施形態では、正のサンプルは、クエリ画像内で同一である、インライアとしての役割を果たす、少なくとも２０個の着目点を含んでもよい。負のサンプルは、１０未満のインライア点を含んでもよい。負のサンプルは、クエリ画像の解析点と重複する、半分未満の疎点を有してもよい。

方法２４００は、画像セット毎に、クエリ画像と正のサンプル画像および負のサンプル画像を比較することによって、損失を算出するステップ（行為２４０４）を含んでもよい。方法２４００は、クエリ画像のために人工ニューラルネットワークによって生成されたフレーム記述子と正のサンプル画像のためのフレーム記述子との間の距離が、クエリ画像のためのフレーム記述子と負のサンプル画像のためのフレーム記述子との間の距離未満であるように、算出された損失に基づいて、人工ニューラルネットワークを修正するステップ（行為２４０６）を含んでもよい。

個々の画像のためのグローバル記述子を生成するように構成される、方法および装置が、上記に説明されるが、方法および装置は、個々のマップのための記述子を生成するように構成されてもよいことを理解されたい。例えば、マップは、複数のキーフレームを含んでもよく、それぞれ、上記に説明されるように、フレーム記述子を有してもよい。最大プールユニットは、マップのキーフレームのフレーム記述子を分析し、フレーム記述子をマップのための一意のマップ記述子の中に組み合わせてもよい。

さらに、他のアーキテクチャも、上記に説明されるように、処理のために使用されてもよいことを理解されたい。例えば、別個のニューラルネットワークは、ＤＳＦ記述子およびフレーム記述子を生成するために説明される。そのようなアプローチは、算出上効率的である。しかしながら、いくつかの実施形態では、フレーム記述子は、最初にＤＳＦ記述子を生成せずに、選択された特徴点から生成されてもよい。
マップのランク付けおよびマージ

本明細書に説明されるものは、複数の環境マップをＸリアリティ（ＸＲ）システム内でランク付けおよびマージするための方法および装置である。マップマージは、物理的世界の重複部分を表すマップが、より大きいエリアを表すように組み合わせられることを可能にし得る。マップをランク付けすることは、類似性に基づいてマップをマップのセットから選択するステップを伴う、マップマージを含む、本明細書に説明されるような技法を効率的に実施することを可能にし得る。いくつかの実施形態では、例えば、いくつかのＸＲデバイスのいずれかによってアクセスされ得る方法でフォーマットされる、規準マップのセットが、システムによって維持されてもよい。これらの規準マップは、それらのデバイスからの選択された追跡マップと他の追跡マップまたは以前に記憶された規準マップをマージすることによって形成されてもよい。規準マップは、例えば、１つ以上の規準マップを選択し、新しい追跡マップとマージする、および／またはセットから１つ以上の規準マップを選択し、デバイス内で使用する際に使用するために、ランク付けされてもよい。

現実的ＸＲ体験をユーザに提供するために、ＸＲシステムは、実オブジェクトに関連して仮想オブジェクトの場所を正しく相関させるために、ユーザの物理的周囲を把握しなければならない。ユーザの物理的周囲についての情報は、ユーザの場所に関する環境マップから取得されてもよい。

本発明者らは、ＸＲシステムが、複数のユーザによって収集された実／物理的世界の環境マップの効率的共有を有効にすることによって、それらのユーザが同一または異なる時間に世界内に存在するかどうかにかかわらず、実および／または仮想コンテンツを備える、同一世界を共有する複数のユーザに、向上されたＸＲ体験を提供し得ることを認識し、その真価を認めた。しかしながら、そのようなシステムを提供する際、有意な課題が存在する。そのようなシステムは、複数のユーザによって生成された複数のマップを記憶し得、および／またはシステムは、異なる時間に生成された複数のマップを記憶し得る。例えば、上記に説明されるように、位置特定等の以前に生成されたマップを用いて実施され得る動作に関して、実質的処理が、同一世界（例えば、同一実世界場所）の関連環境マップをＸＲシステム内で収集された全ての環境マップから識別するために要求され得る。いくつかの実施形態では、デバイスが、例えば、位置特定のためにアクセスし得る、少数の環境マップのみが存在し得る。いくつかの実施形態では、デバイスがアクセスし得る、多数の環境マップが存在し得る。本発明者らは、環境マップの関連性を、例えば、図２８における全ての規準マップ１２０の母集団等のあらゆる可能性として考えられる環境マップから迅速かつ正確にランク付けする技法を認識し、その真価を認めた。高ランク付けマップは、次いで、仮想オブジェクトをユーザディスプレイ上にユーザの周囲の物理的世界と現実的に相互作用するようにレンダリングする、またはそのユーザによって収集されたマップデータと記憶されたマップをマージし、より大きいまたはより正確なマップを作成するため等、さらなる処理のために、選択されてもよい。

いくつかの実施形態では、物理的世界内のある場所におけるユーザのためのタスクに関連する、記憶されたマップが、複数の基準に基づいて、記憶されたマップをフィルタリングすることによって識別されてもよい。それらの基準は、その場所におけるユーザのウェアラブルデバイスによって生成された追跡マップと、データベース内に記憶される候補環境マップの比較を示してもよい。比較は、マップを生成するデバイスによって検出されたＷｉ－Ｆｉフィンガプリント等のマップと関連付けられる、メタデータ、および／またはマップを形成する間、それに対してデバイスが接続されるＢＳＳＩＤのセットに基づいて実施されてもよい。比較はまた、マップの圧縮または解凍されたコンテンツに基づいて実施されてもよい。圧縮された表現に基づく比較は、例えば、マップコンテンツから算出されたベクトルの比較によって実施されてもよい。解凍されたマップに基づく比較は、例えば、追跡マップを記憶されたマップ内で位置特定する、またはその逆によって実施されてもよい。複数の比較が、考慮のために、候補マップの数を低減させるために必要とされる算出時間に基づく順序に実施されてもよく、より少ない算出を伴う比較は、より多くの算出を要求する他の比較より先の順序で実施される。

図２６は、いくつかの実施形態による、１つ以上の環境マップをランク付けおよびマージするように構成される、ＡＲシステム８００を描写する。ＡＲシステムは、ＡＲデバイスのパス可能世界モデル８０２を含んでもよい。パス可能世界モデル８０２を取り込むための情報は、ＡＲデバイス上のセンサから生じてもよく、これは、プロセッサ８０４（例えば、図４におけるローカルデータ処理モジュール５７０）内に記憶される、センサデータをマップに変換するための処理のいくつかまたは全てを実施し得る、コンピュータ実行可能命令を含んでもよい。そのようなマップは、ＡＲデバイスが領域内で動作する際にセンサデータが収集されるにつれて構築され得るような追跡マップであってもよい。その追跡マップとともに、エリア属性が、追跡マップが表すエリアを示すように供給されてもよい。これらのエリア属性は、緯度および経度として提示される座標または場所を表すためにＡＲシステムによって使用されるＩＤ等の地理的場所識別子であってもよい。代替として、または加えて、エリア属性は、そのエリアに関して一意である高尤度を有する、測定された特性であってもよい。エリア属性は、例えば、エリア内で検出された無線ネットワークのパラメータから導出されてもよい。いくつかの実施形態では、エリア属性は、ＡＲシステムが近隣にある、および／または接続される、アクセスポイントの一意のアドレスと関連付けられてもよい。例えば、エリア属性は、５Ｇ基地局／ルータ、Ｗｉ－Ｆｉルータ、および同等物のＭＡＣアドレスまたは基本サービスセット識別子（ＢＳＳＩＤ）と関連付けられてもよい。

図２６の実施例では、追跡マップは、環境の他のマップとマージされてもよい。マップランク付け部分８０６は、追跡マップをデバイスＰＷ８０２から受信し、マップデータベース８０８と通信し、マップデータベース８０８からの環境マップを選択およびランク付けする。より高いランク付けされる選択されたマップは、マップマージ部分８１０に送信される。

マップマージ部分８１０は、マージ処理をマップランク付け部分８０６から送信されるマップ上で実施してもよい。マージ処理は、追跡マップとランク付けされたマップのいくつかまたは全てをマージし、新しいマージされたマップをパス可能世界モデル８１２に伝送するステップを伴ってもよい。マップマージ部分は、物理的世界の重複部分を描写するマップを識別することによって、マップをマージしてもよい。それらの重複部分は、両方のマップ内の情報が最終マップの中に集約され得るように整合されてもよい。規準マップは、他の規準マップおよび／または追跡マップとマージされてもよい。

集約は、１つのマップを別のマップからの情報で拡張するステップを伴ってもよい。代替として、または加えて、集約は、別のマップ内の情報に基づいて、１つのマップ内の物理的世界の表現を調節するステップを伴ってもよい。後者のマップは、例えば、マップが後者の情報に基づいて更新され得るように、特徴点を生じさせるオブジェクトが移動したことを表し得る。代替として、２つのマップは、異なる特徴点を伴う、同一領域を特徴付けし得、集約は、特徴点のセットを２つのマップから選択し、その領域をより良好に表すステップを伴ってもよい。マージするプロセスにおいて生じる、具体的処理にかかわらず、いくつかの実施形態では、マージされる全てのマップからのＰＣＦが、コンテンツをそれらに対して位置付けるアプリケーションがそのように行い続け得るように、留保されてもよい。いくつかの実施形態では、マップのマージは、冗長持続的姿勢をもたらし得、持続的姿勢のうちのいくつかは、削除されてもよい。ＰＣＦが、削除されるべき持続的姿勢と関連付けられるとき、マップをマージするステップは、ＰＣＦがマージ後にマップ内に残る持続的姿勢と関連付けられるように修正するステップを伴ってもよい。

いくつかの実施形態では、マップが、拡張および／または更新されるにつれて、それらは、精緻化されてもよい。精緻化は、物理的世界内の同一オブジェクトを表す可能性が高い、特徴点間の内部不一致を低減させるための算出を伴ってもよい。不一致は、物理的世界内の同一オブジェクトを表す特徴点を供給する、キーフレームと関連付けられる姿勢内の不正確性から生じ得る。そのような不一致は、例えば、追跡マップに対する姿勢を算出するＸＲデバイスから生じ得、これは、ひいては、姿勢推定内の誤差が、蓄積し、「ドリフト」を姿勢正確度内に経時的に作成するように、姿勢を推定するステップに基づいて構築される。バンドル調整または他の動作を実施し、複数のキーフレームからの特徴点の不一致を低減させることによって、マップは、精緻化されてもよい。

精緻化に応じて、マップの原点に対する持続的点の場所は、変化し得る。故に、持続的姿勢またはＰＣＦ等のその持続的点と関連付けられる変換も、変化し得る。いくつかの実施形態では、ＸＲシステムは、マップ精緻化（マージ動作の一部として、または他の理由から実施されるかどうかにかかわらず）に関連して、変化した任意の持続的点と関連付けられる変換を再算出してもよい。これらの変換は、変換の任意の使用が持続的点の更新された場所に基づき得るように、変換を算出するコンポーネントから変換を使用するコンポーネントにプッシュ配信され得る。

パス可能世界モデル８１２は、クラウドモデルであってもよく、これは、複数のＡＲデバイスによって共有されてもよい。パス可能世界モデル８１２は、環境マップをマップデータベース８０８内に記憶する、または別様にそれへのアクセスを有してもよい。いくつかの実施形態では、以前に算出された環境マップが、更新されると、そのマップの以前のバージョンは、古くなったマップをデータベースから除去するように、削除されてもよい。いくつかの実施形態では、以前に算出された環境マップが、更新されると、そのマップの以前のバージョンは、アーカイブされ、環境の以前のバージョンの読出／閲覧を有効にしてもよい。いくつかの実施形態では、許可が、ある読取／書込アクセスを有するＡＲシステムのみが、マップの以前のバージョンの削除／アーカイブをトリガし得るように設定されてもよい。

１つ以上のＡＲデバイス／システムによって供給される追跡マップから作成されたこれらの環境マップは、ＡＲシステム内のＡＲデバイスによってアクセスされてもよい。マップランク付け部分８０６はまた、環境マップをＡＲデバイスに供給する際に使用されてもよい。ＡＲデバイスは、その現在の場所に関する環境マップを要求するメッセージを送信してもよく、マップランク付け部分８０６は、要求側デバイスに関連する環境マップを選択およびランク付けするために使用されてもよい。

いくつかの実施形態では、ＡＲシステム８００は、マージされたマップをクラウドＰＷ８１２から受信するように構成される、ダウンサンプリング部分８１４を含んでもよい。クラウドＰＷ８１２から受信され、マージされたマップは、クラウドのための記憶フォーマットであってもよく、これは、平方メートルあたり多数のＰＣＦまたはＰＣＦと関連付けられる複数の画像フレームまたは大セットの特徴点等の高分解能情報を含んでもよい。ダウンサンプリング部分８１４は、クラウドフォーマットマップをＡＲデバイス上への記憶のために好適なフォーマットにダウンサンプリングするように構成されてもよい。デバイスフォーマットマップは、より少ないＰＣＦまたはＰＣＦ毎に記憶されたより少ないデータ等のより少ないデータを有し、ＡＲデバイスの限定されたローカル演算能力および記憶空間に対応し得る。

図２７は、遠隔記憶媒体、例えば、クラウド内に記憶され得る、複数の規準マップ１２０を図示する、簡略化されたブロック図である。各規準マップ１２０は、惑星である地球上のいずれかの場所等、物理的空間内の規準マップの場所を示す、複数の規準マップ識別子を含んでもよい。これらの規準マップ識別子は、以下の識別子、すなわち、経度および緯度の範囲によって表される、エリア識別子と、フレーム記述子（例えば、図２１におけるグローバル特徴列３１６）と、Ｗｉ－Ｆｉフィンガプリントと、特徴記述子（例えば、図２１における特徴記述子３１０）と、マップに寄与した１つ以上のデバイスを示す、デバイス識別とのうちの１つ以上のものを含んでもよい。

図示される実施例では、規準マップ１２０は、地球の表面上に存在し得るため、２次元パターンで地理的に配置される。規準マップ１２０は、重複経度および緯度を有する、任意の規準マップが、新しい規準マップの中にマージされ得るため、対応する経度および緯度によって、一意に識別可能であり得る。

図２８は、いくつかの実施形態による、新しい追跡マップを１つ以上の規準マップに対して位置特定するために使用され得る、規準マップを選択する方法を図示する、概略図である。本方法は、実施例として、パス可能世界（例えば、パス可能世界モジュール５３８）内のデータベース内に記憶され得る、規準マップ１２０の母集合にアクセスするステップ（行為１２０）から開始してもよい。規準マップの母集合は、全ての以前に訪問した場所からの規準マップを含んでもよい。ＸＲシステムは、全ての規準マップの母集合を小サブセットまたは単一マップのみにフィルタリングしてもよい。いくつかの実施形態では、帯域幅制限に起因して、全ての規準マップを視認デバイスに送信することは不可能であり得ることを理解されたい。デバイスに送信するために、追跡マップにマッチングするための可能性が高い候補として選択されたサブセットを選択することは、マップの遠隔データベースにアクセスすることと関連付けられる帯域幅および待ち時間を低減させ得る。

本方法は、所定のサイズおよび形状を伴うエリアに基づいて、規準マップの母集合をフィルタリングするステップ（行為３００）を含んでもよい。図２７に図示される実施例では、各正方形は、エリアを表し得る。各正方形は、５０ｍ×５０ｍを網羅し得る。各正方形は、６つの近傍のエリアを有し得る。いくつかの実施形態では、行為３００は、少なくとも１つのマップがその経度および緯度に存在する限り、ＸＲデバイスから受信された位置識別子のその経度および緯度を含む、経度および緯度を網羅する、少なくとも１つのマッチング規準マップ１２０を選択してもよい。いくつかの実施形態では、行為３００は、マッチング規準マップに隣接する、経度および緯度を網羅する、少なくとも１つの近傍の規準マップを選択してもよい。いくつかの実施形態では、行為３００は、複数のマッチング規準マップと、複数の近傍の規準マップとを選択してもよい。行為３００は、例えば、規準マップの数を約１０分の１、例えば、数千から数百に低減させ、第１のフィルタリングされた選択を形成してもよい。代替として、または加えて、緯度および経度以外の基準が、近傍のマップを識別するために使用されてもよい。ＸＲデバイスは、例えば、同一セッションの一部として、セット内の規準マップを用いて以前に位置特定されていてもよい。クラウドサービスは、以前に位置特定されたマップを含む、ＸＲデバイスについての情報を留保してもよい。本実施例では、行為３００において選択されたマップは、それに対してＸＲデバイスが位置特定されたマップに隣接する、エリアを網羅するものを含んでもよい。

本方法は、Ｗｉ－Ｆｉフィンガプリントに基づいて、規準マップの第１のフィルタリングされた選択をフィルタリングするステップ（行為３０２）を含んでもよい。行為３０２は、ＸＲデバイスからの位置識別子の一部として受信されたＷｉ－Ｆｉフィンガプリントに基づいて、緯度および経度を決定してもよい。行為３０２は、Ｗｉ－Ｆｉフィンガプリントからの緯度および経度と規準マップ１２０の緯度および経度を比較し、第２のフィルタリングされた選択を形成する、１つ以上の規準マップを決定してもよい。行為３０２は、規準マップの数を約１０分の１、例えば、第２の選択を形成する、数百から数十個の規準マップ（例えば、５０）に低減させてもよい。例えば、第１のフィルタリングされた選択は、１３０個の規準マップを含み得、第２のフィルタリングされた選択は、１３０個の規準マップのうちの５０個を含み得、１３０個の規準マップのうちの残りの８０個を含み得ない。

本方法は、キーフレームに基づいて、規準マップの第２のフィルタリングされた選択をフィルタリングするステップ（行為３０４）を含んでもよい。行為３０４は、ＸＲデバイスによって捕捉された画像を表すデータと規準マップ１２０を表すデータを比較してもよい。いくつかの実施形態では、画像および／またはマップを表すデータは、特徴記述子（例えば、図２５におけるＤＳＦ記述子）および／またはグローバル特徴列（例えば、図２１における３１６）を含んでもよい。行為３０４は、規準マップの第３のフィルタリングされた選択を提供してもよい。いくつかの実施形態では、行為３０４の出力は、例えば、第２のフィルタリングされた選択に続いて識別された５０個の規準マップのうちの５つのみであってもよい。マップ伝送機１２２が、次いで、第３のフィルタリングされた選択に基づいて、１つ以上の規準マップを視認デバイスに伝送する。行為３０４は、規準マップの数を約１０分の１、第３の選択を形成する、例えば、数十から単一桁数の規準マップ（例えば、５）に低減させ得る。いくつかの実施形態では、ＸＲデバイスは、第３のフィルタリングされた選択内の規準マップを受信し、受信された規準マップの中に位置特定するように試みてもよい。

例えば、行為３０４は、規準マップ１２０のグローバル特徴列３１６および視認デバイスによって捕捉された画像（例えば、ユーザのためのローカル追跡マップの一部であり得る、画像）に基づくグローバル特徴列３１６に基づいて、規準マップ１２０をフィルタリングしてもよい。図２７における規準マップ１２０のそれぞれのものは、したがって、それと関連付けられる１つ以上のグローバル特徴列３１６を有する。いくつかの実施形態では、グローバル特徴列３１６は、ＸＲデバイスが画像または特徴詳細をクラウドに提出するときに入手されてもよく、クラウドは、画像または特徴詳細を処理し、規準マップ１２０のためのグローバル特徴列３１６を生成する。

いくつかの実施形態では、クラウドは、視認デバイスによって捕捉されたライブ／新しい／現在の画像の特徴詳細を受信してもよく、クラウドは、ライブ画像のためのグローバル特徴列３１６を生成してもよい。クラウドは、次いで、ライブグローバル特徴列３１６に基づいて、規準マップ１２０をフィルタリングしてもよい。いくつかの実施形態では、グローバル特徴列は、ローカル視認デバイス上に生成されてもよい。いくつかの実施形態では、グローバル特徴列は、遠隔で、例えば、クラウド上で生成されてもよい。いくつかの実施形態では、クラウドは、フィルタリングされた規準マップを、フィルタリングされた規準マップと関連付けられるグローバル特徴列３１６とともに、ＸＲデバイスに伝送してもよい。いくつかの実施形態では、視認デバイスが、その追跡マップを規準マップに対して位置特定すると、ローカル追跡マップのグローバル特徴列３１６と規準マップのグローバル特徴列をマッチングさせることによって、そのように行ってもよい。

ＸＲデバイスの動作は、行為（３００、３０２、３０４）の全てを実施しなくてもよいことを理解されたい。例えば、規準マップの母集合が、比較的に小さい（例えば、５００個のマップ）場合、位置特定するように試みるＸＲデバイスは、Ｗｉ－Ｆｉフィンガプリント（例えば、行為３０２）およびキーフレーム（例えば、行為３０４）に基づいて、規準マップの母集合をフィルタリングするが、エリア（例えば、行為３００）に基づくフィルタリングを省略してもよい。さらに、マップは、その全体として比較される必要であるわけではない。いくつかの実施形態では、例えば、２つのマップの比較は、新しいマップおよびマップの母集合から選択されたマップの両方に現れる、持続的姿勢またはＰＣＦ等の共通の持続的点の識別をもたらし得る。その場合、記述子は、持続的点と関連付けられてもよく、それらの記述子は、比較されてもよい。

図２９は、いくつかの実施形態による、１つ以上のランク付けされた環境マップを選択する方法９００を図示する、フローチャートである。図示される実施形態では、ランク付けするステップは、追跡マップを作成する、ユーザのＡＲデバイスのために実施される。故に、追跡マップは、環境マップをランク付けする際に使用するために利用可能である。追跡マップが利用不可能である、実施形態では、追跡マップに明示的に依拠しない、環境マップの選択およびランク付けするステップの部分のいくつかまたは全てが、使用されてもよい。

方法９００は、行為９０２から開始し得、追跡マップが形成された場所の近傍の環境マップのデータベースからのマップのセット（規準マップとしてフォーマット化され得る）が、アクセスされ、次いで、ランク付けのためにフィルタリングされ得る。加えて、行為９０２では、その中でユーザのＡＲデバイスが動作しているエリアに関する、少なくとも１つのエリア属性が、決定される。ユーザのＡＲデバイスが追跡マップを構築している、シナリオでは、エリア属性は、それにわたって追跡マップが作成される、エリアに対応し得る。具体的実施例として、エリア属性は、ＡＲデバイスが追跡マップを算出していた間にアクセスポイントからコンピュータネットワークに受信された信号に基づいて、算出されてもよい。

図３０は、いくつかの実施形態による、ＡＲシステム８００の例示的マップランク付け部分８０６を描写する。マップランク付け部分８０６は、ＡＲデバイス上で実行される部分およびクラウド等の遠隔コンピューティングシステム上で実行される部分を含み得るため、クラウドコンピューティング環境内で実行されてもよい。マップランク付け部分８０６は、方法９００の少なくとも一部を実施するように構成されてもよい。

図３１Ａは、いくつかの実施形態による、追跡マップ（ＴＭ）１１０２およびデータベース内の環境マップＣＭ１－ＣＭ４のエリア属性ＡＡ１－ＡＡ８の実施例を描写する。図示されるように、環境マップは、複数のエリア属性に関連付けられてもよい。エリア属性ＡＡ１－ＡＡ８は、追跡マップ１１０２を算出するＡＲデバイスによって検出された無線ネットワークのパラメータ、例えば、それに対してＡＲデバイスが接続される、ネットワークの基本サービスセット識別子（ＢＳＳＩＤ）、および／または、例えば、ネットワークタワー１１０４を通して無線ネットワークに受信されるアクセスポイントの信号の強度を含んでもよい。無線ネットワークのパラメータは、Ｗｉ－Ｆｉおよび５ＧＮＲを含む、プロトコルに準拠してもよい。図３２に図示される実施例では、エリア属性は、その中でユーザＡＲデバイスが、センサデータを収集し、追跡マップを形成した、エリアのフィンガプリントである。

図３１Ｂは、いくつかの実施形態による、追跡マップ１１０２の決定された地理的場所１１０６の実施例を描写する。図示される実施例では、決定された地理的場所１１０６は、重心点１１１０と、重心点の周囲を囲むエリア１１０８とを含む。本願の地理的場所の決定は、図示されるフォーマットに限定されないことを理解されたい。決定された地理的場所は、例えば、異なるエリア形状を含む、任意の好適なフォーマットを有してもよい。本実施例では、地理的場所は、エリア属性を地理的場所に関連させるデータベースを使用して、エリア属性から決定される。データベースは、市販されており、例えば、緯度および経度として表され、本動作のために使用され得る、Ｗｉ－Ｆｉフィンガプリントを場所に関連させる、データベースである。

図２９の実施形態では、環境マップを含有する、マップデータベースはまた、マップによって網羅される緯度および経度を含む、それらのマップに関する場所データを含んでもよい。行為９０２における処理は、そのデータベースから、追跡マップのエリア属性に関して決定された同一緯度および経度を網羅する、環境マップのセットを選択するステップを伴ってもよい。

行為９０４は、行為９０２においてアクセスされる環境マップのセットの第１のフィルタリングである。行為９０２では、環境マップは、追跡マップの地理的場所との近接度に基づいて、セット内に留保される。本フィルタリングステップは、追跡マップとセット内の環境マップと関連付けられる緯度および経度を比較することによって実施されてもよい。

図３２は、いくつかの実施形態による、行為９０４の実施例を描写する。各エリア属性は、対応する地理的場所１２０２を有してもよい。環境マップのセットは、追跡マップの決定された地理的場所と重複する地理的場所を有する、少なくとも１つのエリア属性を伴う、環境マップを含んでもよい。図示される実施例では、識別された環境マップのセットは、それぞれ、追跡マップ１１０２の決定された地理的場所と重複する地理的場所を有する、少なくとも１つのエリア属性を有する、環境マップＣＭ１、ＣＭ２、およびＣＭ４を含む。エリア属性ＡＡ６と関連付けられる、環境マップＣＭ３は、追跡マップの決定された地理的場所外にあるため、セット内に含まれない。

他のフィルタリングステップもまた、最終的に処理される（マップマージのため、またはパス可能世界情報をユーザデバイスに提供するため等）セット内の環境マップの数を低減させる／ランク付けするために、環境マップのセット上で実施されてもよい。方法９００は、追跡マップおよび環境マップのセットの環境マップと関連付けられるネットワークアクセスポイントの１つ以上の識別子の類似性に基づいて、環境マップのセットをフィルタリングするステップ（行為９０６）を含んでもよい。マップの形成の間、センサデータを収集し、マップを生成する、デバイスは、Ｗｉ－Ｆｉまたは類似無線通信プロトコル等を通して、ネットワークアクセスポイントを通して、ネットワークに接続され得る。アクセスポイントは、ＢＳＳＩＤによって識別され得る。ユーザデバイスは、エリアを通して移動し、データを収集し、マップを形成するにつれて、複数の異なるアクセスポイントに接続し得る。同様に、複数のデバイスが、マップを形成するための情報を供給するとき、デバイスは、異なるアクセスポイントを通して接続されている場合があり、したがって、同様にその理由から、マップを形成する際に使用される複数のアクセスポイントが存在し得る。故に、マップと関連付けられる複数のアクセスポイントが存在し得、アクセスポイントのセットは、マップの場所のインジケーションであり得る。ＲＳＳＩ値として反映され得る、アクセスポイントからの信号の強度は、さらなる地理的情報を提供し得る。いくつかの実施形態では、ＢＳＳＩＤおよびＲＳＳＩ値のリストは、マップのためのエリア属性を形成し得る。

いくつかの実施形態では、ネットワークアクセスポイントの１つ以上の識別子の類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセット内に、ネットワークアクセスポイントの１つ以上の識別子に基づいて、追跡マップの少なくとも１つのエリア属性との最高Ｊａｃｃａｒｄ類似性を伴う環境マップを留保するステップを含んでもよい。図３３は、いくつかの実施形態による、行為９０６の実施例を描写する。図示される実施例では、エリア属性ＡＡ７と関連付けられるネットワーク識別子は、追跡マップ１１０２に関する識別子として決定され得る。行為９０６後の環境マップのセットは、ＡＡ７とのより高いＪａｃｃａｒｄ類似性内のエリア属性を有し得る、環境マップＣＭ２と、同様にエリア属性ＡＡ７を含む、環境マップＣＭ４とを含む。環境マップＣＭ１は、ＡＡ７との最低Ｊａｃｃａｒｄ類似性を有するため、セット内に含まれない。

行為９０２－９０６における処理は、マップと関連付けられるメタデータに基づいて、マップデータベース内に記憶されるマップのコンテンツに実際にアクセスすることなく、実施されてもよい。他の処理は、マップのコンテンツにアクセスするステップを伴ってもよい。行為９０８は、メタデータに基づいてフィルタリング後にサブセット内に残っている環境マップにアクセスするステップを示す。本行為は、後続動作がアクセスされるコンテンツを用いて実施され得る場合、プロセスにおけるより早い段階または後の段階のいずれかで実施されてもよいことを理解されたい。

方法９００は、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づいて、環境マップのセットをフィルタリングするステップ（行為９１０）を含んでもよい。追跡マップおよび環境マップのコンテンツを表すメトリックは、マップのコンテンツから算出された値のベクトルを含んでもよい。例えば、マップを形成する際に使用される１つ以上のキーフレームのために算出される、上記に説明されるような深層キーフレーム記述子は、マップまたはマップの一部の比較のためのメトリックを提供し得る。メトリックは、行為９０８において読み出されたマップから算出されてもよい、または事前に算出され、それらのマップと関連付けられるメタデータとして記憶されてもよい。いくつかの実施形態では、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセット内に、追跡マップの特性のベクトルと環境マップのセット内の環境マップを表すベクトルとの間に最小ベクトル距離を伴う環境マップを留保するステップを含んでもよい。

方法９００は、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づいて、環境マップのセットをさらにフィルタリングするステップ（行為９１２）を含んでもよい。マッチング度は、位置特定プロセスの一部として決定されてもよい。非限定的実施例として、位置特定は、それらが物理的世界の同一部分を表し得るほど十分に類似する、追跡マップおよび環境マップ内の重要点を識別することによって実施されてもよい。いくつかの実施形態では、重要点は、特徴、特徴記述子、キーフレーム、キーリグ、持続的姿勢、および／またはＰＣＦであってもよい。追跡マップ内の重要点のセットは、次いで、環境マップ内の重要点のセットとの最良適合を生産するように整合され得る。対応する重要点間の平均二乗距離が、算出され得、追跡マップの特定の領域に関する閾値を下回る場合、追跡マップおよび環境マップが物理的世界の同一領域を表すことのインジケーションとして使用される。

いくつかの実施形態では、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセットの環境マップ内にもまた表される、追跡マップによって表される物理的世界の体積を算出するステップと、環境マップのセット内に、セットのフィルタリング除去された環境マップより大きい算出された体積を伴う環境マップを留保するステップとを含んでもよい。図３４は、いくつかの実施形態による、行為９１２の実施例を描写する。図示される実施例では、行為９１２後の環境マップのセットは、追跡マップ１１０２のエリアとマッチングされるエリア１４０２を有する、環境マップＣＭ４を含む。環境マップＣＭ１は、追跡マップ１１０２のエリアとマッチングされるエリアを有していないため、セット内に含まれない。

いくつかの実施形態では、環境マップのセットは、行為９０６、行為９１０、および行為９１２の順序でフィルタリングされてもよい。いくつかの実施形態では、環境マップのセットは、行為９０６、行為９１０、および行為９１２に基づいて、フィルタリングされてもよく、これは、最低から最高へとフィルタリングを実施するために要求される処理に基づく順序で実施され得る。方法９００は、環境マップおよびデータのセットをロードするステップ（行為９１４）を含んでもよい。

図示される実施例では、ユーザデータベースは、ＡＲデバイスが使用されたエリアを示す、エリア識別を記憶する。エリア識別は、エリア属性であってもよく、これは、使用時にＡＲデバイスによって検出された無線ネットワークのパラメータを含み得る。マップデータベースは、ＡＲデバイスによって供給されるデータおよび関連付けられるメタデータから構築された複数の環境マップを記憶してもよい。関連付けられるメタデータは、そこから環境マップが構築されたデータを供給した、ＡＲデバイスのエリア識別から導出されるエリア識別を含んでもよい。ＡＲデバイスは、メッセージをＰＷモジュールに送信し、新しい追跡マップが作成される、または作成中であることを示してもよい。ＰＷモジュールは、ＡＲデバイスに関するエリア識別子を算出し、受信されたパラメータおよび／または算出されたエリア識別子に基づいて、ユーザデータベースを更新してもよい。ＰＷモジュールはまた、環境マップを要求するＡＲデバイスと関連付けられるエリア識別子を決定し、エリア識別子に基づいて、マップデータベースから環境マップのセットを識別し、環境マップのセットをフィルタリングし、フィルタリングされた環境マップのセットをＡＲデバイスに伝送してもよい。いくつかの実施形態では、ＰＷモジュールは、例えば、追跡マップの地理的場所、追跡マップおよび環境マップのセットの環境マップと関連付けられるネットワークアクセスポイントの１つ以上の識別子の類似性、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性、および追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度を含む、１つ以上の基準に基づいて、環境マップのセットをフィルタリングしてもよい。

いくつかの実施形態のいくつかの側面がこれまで説明されたが、種々の改変、修正、および改良が、当業者に容易に想起されるであろうことを理解されたい。一実施例として、実施形態は、拡張（ＡＲ）環境に関連して説明される。本明細書に説明される技法の一部または全部は、ＭＲ環境、より一般的には、他のＸＲ環境およびＶＲ環境内に適用されてもよいことを理解されたい。

別の実施例として、実施形態は、ウェアラブルデバイス等のデバイスに関連して説明される。本明細書に説明される技法の一部または全部は、ネットワーク（クラウド等）、離散アプリケーション、および／またはデバイス、ネットワーク、および離散アプリケーションの任意の好適な組み合わせを介して実装されてもよいことを理解されたい。

さらに、図２９は、候補マップをフィルタリングし、高ランク付けマップのセットをもたらすために使用され得る、基準の実施例を提供する。他の基準が、説明される基準の代わりに、またはそれに加え、使用されてもよい。例えば、複数の候補マップが、あまり望ましくないマップをフィルタリング除去するために使用されるメトリックの類似値を有する場合、候補マップの特性が、候補マップとして留保される、またはフィルタリング除去されるマップを決定するために使用されてもよい。例えば、より大きいまたはより稠密候補マップは、より小さい候補マップより優先されてもよい。いくつかの実施形態では、図２７－２８は、図２９－３４に説明されるシステムおよび方法の全部または一部を説明し得る。

図３５および３６は、いくつかの実施形態による、複数の環境マップをランク付けおよびマージするように構成される、ＸＲシステムを図示する、概略図である。いくつかの実施形態では、パス可能世界（ＰＷ）は、マップをランク付けおよび／またはマージするステップをトリガすべきときを決定し得る。いくつかの実施形態では、使用されるべきマップを決定するステップは、いくつかの実施形態によると、少なくとも部分的に、図２１－２５に関連して上記に説明される深層キーフレームに基づいてもよい。

図３７は、いくつかの実施形態による、物理的世界の環境マップを作成する方法３７００を図示する、ブロック図である。方法３７００は、ユーザによって装着されるＸＲデバイスによって捕捉された追跡マップを規準マップの群（例えば、図２８の方法および／または図２９の方法９００によって選択された規準マップ）に対して位置特定するステップ（行為３７０２）から開始してもよい。行為３７０２は、追跡マップのキーリグを規準マップの群の中に位置特定するステップを含んでもよい。各キーリグの位置特定結果は、キーリグの位置特定された姿勢と、２Ｄ／３Ｄ特徴対応のセットとを含んでもよい。

いくつかの実施形態では、方法３７００は、追跡マップを接続された成分に分裂させるステップ（行為３７０４）を含んでもよく、これは、接続された断片をマージすることによって、マップをロバストにマージすることを可能にし得る。各接続された成分は、所定の距離内にある、キーリグを含んでもよい。方法３７００は、所定の閾値より大きい接続された成分を１つ以上の規準マップの中にマージするステップ（行為３７０６）と、マージされた接続された成分を追跡マップから除去するステップとを含んでもよい。

いくつかの実施形態では、方法３７００は、追跡マップの同一の接続された成分とマージされる、群の規準マップをマージするステップ（行為３７０８）を含んでもよい。いくつかの実施形態では、方法３７００は、任意の規準マップとマージされない、追跡マップの残りの接続された成分を、規準マップにプロモートするステップ（行為３７１０）を含んでもよい。いくつかの実施形態では、方法３７００は、追跡マップの持続的姿勢および／またはＰＣＦと追跡マップの少なくとも１つの接続された成分とマージされる、規準マップをマージするステップ（行為３７１２）を含んでもよい。いくつかの実施形態では、方法３７００は、例えば、マップ点を融合させ、冗長キーリグをプルーニングすることによって、規準マップを完成させるステップ（行為３７１４）を含んでもよい。

図３８Ａおよび３８Ｂは、いくつかの実施形態による、新しい追跡マップで追跡マップ７００（図７）からプロモートされ得る、規準マップ７００を更新することによって作成された環境マップ３８００を図示する。図７に関して図示および説明されるように、規準マップ７００は、点７０２によって表される、対応する物理的世界内の再構成された物理的オブジェクトの間取図７０６を提供し得る。いくつかの実施形態では、マップ点７０２は、複数の特徴を含み得る、物理的オブジェクトの特徴を表し得る。新しい追跡マップは、物理的世界に関して捕捉され、クラウドにアップロードされ、マップ７００とマージされてもよい。新しい追跡マップは、マップ点３８０２と、キーリグ３８０４、３８０６とを含んでもよい。図示される実施例では、キーリグ３８０４は、例えば、マップ７００のキーリグ７０４との対応を確立することによって、規準マップに対して正常に位置特定されたキーリグを表す（図３８Ｂに図示されるように）。他方では、キーリグ３８０６は、マップ７００に対して位置特定されていない、キーリグを表す。キーリグ３８０６は、いくつかの実施形態では、別個の規準マップにプロモートされてもよい。

図３９Ａ－３９Ｆは、同一物理的空間内のユーザのための共有体験を提供する、クラウドベースの持続的座標系の実施例を図示する、概略図である。図３９Ａは、例えば、クラウドからの規準マップ４８１４が、図２０Ａ－２０Ｃのユーザ４８０２Ａおよび４８０２Ｂによって装着されるＸＲデバイスによって受信されることを示す。規準マップ４８１４は、規準座標フレーム４８０６Ｃを有してもよい。規準マップ４８１４は、複数の関連付けられるＰＰ（例えば、図３９Ｃにおける４８１８Ａ、４８１８Ｂ）を伴う、ＰＣＦ４８１０Ｃを有してもよい。

図３９Ｂは、ＸＲデバイスが、その個別の世界座標系４８０６Ａ、４８０６Ｂと規準座標フレーム４８０６Ｃとの間に関係を確立したことを示す。これは、例えば、規準マップ４８１４を個別のデバイス上で位置特定することによって行われてもよい。追跡マップを規準マップに対して位置特定することは、デバイス毎に、そのローカル世界座標系と規準マップの座標系との間の変換をもたらし得る。

図３９Ｃは、位置特定の結果として、変換が個別のデバイス上のローカルＰＣＦ（例えば、ＰＣＦ４８１０Ａ、４８１０Ｂ）と規準マップ上の個別の持続的姿勢（例えば、ＰＰ４８１８Ａ、４８１８Ｂ）との間で算出され得ることを示す（例えば、変換４８１６Ａ、４８１６Ｂ）。これらの変換を用いることで、各デバイスは、そのローカルＰＣＦを使用し得、これは、デバイス上のセンサを用いて検出された画像を処理し、ローカルデバイスに対する場所を決定し、ＰＰ４８１８Ａ、４８１８Ｂまたは規準マップの他の持続的点に結び付けられる仮想コンテンツを表示することによって、デバイス上でローカルで検出されることができる。そのようなアプローチは、仮想コンテンツを各ユーザに対して正確に位置特定し得、各ユーザが物理的空間内で仮想コンテンツの同一体験を有することを可能にし得る。

図３９Ｄは、規準マップからローカル追跡マップへの持続的姿勢スナップショットを示す。図から分かるように、ローカル追跡マップは、持続的姿勢を介して、相互に接続される。図３９Ｅは、ユーザ４８０２Ａによって装着されるデバイス上のＰＣＦ４８１０Ａが、ＰＰ４８１８Ａを通して、ユーザ４８０２Ｂによって装着されるデバイス内にアクセス可能であることを示す。図３９Ｆは、追跡マップ４８０４Ａ、４８０４Ｂおよび規準４８１４がマージされ得ることを示す。いくつかの実施形態では、いくつかのＰＣＦは、マージの結果として、除去されてもよい。図示される実施例では、マージされたマップは、規準マップ４８１４のＰＣＦ４８１０Ｃを含むが、追跡マップ４８０４Ａ、４８０４ＢのＰＣＦ４８１０Ａ、４８１０Ｂを含まない。ＰＣＦ４８１０Ａ、４８１０Ｂと以前に関連付けられるＰＰは、マップマージ後、ＰＣＦ４８１０Ｃと関連付けられてもよい。

図４０および４１は、図９の第１のＸＲデバイス１２．１によって追跡マップを生成する実施例を図示する。図４０は、いくつかの実施形態による、３次元の第１のローカル追跡マップ（マップ１）の２次元表現であって、これは、図９の第１のＸＲデバイスによって生成され得る。図４１は、いくつかの実施形態による、マップ１を第１のＸＲデバイスから図９のサーバにアップロードするステップを図示する、ブロック図である。

図４０は、第１のＸＲデバイス１２．１上のマップ１および仮想コンテンツ（コンテンツ１２３およびコンテンツ４５６）を図示する。マップ１は、原点（原点１）を有する。マップ１は、いくつかのＰＣＦ（ＰＣＦａ－ＰＣＦｄ）を含む。第１のＸＲデバイス１２．１の視点から、ＰＣＦａは、一例として、マップ１の原点に位置し、（０，０，０）のＸ、Ｙ、およびＺ座標を有し、ＰＣＦｂは、Ｘ、Ｙ、およびＺ座標（－１，０，０）を有する。コンテンツ１２３は、ＰＣＦａと関連付けられる。本実施例では、コンテンツ１２３は、（１，０，０）のＰＣＦａに対するＸ、Ｙ、およびＺ関係を有する。コンテンツ４５６は、ＰＣＦｂに対する関係を有する。本実施例では、コンテンツ４５６は、ＰＣＦｂに対する（１，０，０）のＸ、Ｙ、およびＺ関係を有する。

図４１では、第１のＸＲデバイス１２．１は、マップ１をサーバ２０にアップロードする。サーバ２０は、ここでは、マップ１に基づく、規準マップを有する。第１のＸＲデバイス１２．１は、本段階では空である、規準マップを有する。サーバ２０は、議論の目的のために、いくつかの実施形態では、マップ１以外の他のマップを含まない。マップは、第２のＸＲデバイス１２．２上に記憶されていない。

第１のＸＲデバイス１２．１はまた、そのＷｉ－Ｆｉシグネチャデータをサーバ２０に伝送する。サーバ２０は、Ｗｉ－Ｆｉシグネチャデータを使用して、過去に、サーバ２０または他のサーバに接続されていた他のデバイスから集められた知能とともに、記録されていたそのような他のデバイスのＧＰＳ場所に基づいて、第１のＸＲデバイス１２．１の大まかな場所を決定してもよい。第１のＸＲデバイス１２．１は、ここで、第１のセッション（図８参照）を終了し得、サーバ２０から接続解除し得る。

図４２は、いくつかの実施形態による、図１６のＸＲシステムを図示する、概略図であって、第１のユーザ１４．１が第１のセッションを終了した後、第２のユーザ１４．２がＸＲシステムの第２のＸＲデバイスを使用して第２のセッションを開始したことを示す。図４３Ａは、第２のユーザ１４．２による第２のセッションの開始を示す、ブロック図である。第１のユーザ１４．１は、第１のユーザ１４．１による第１のセッションが終了したため、想像線で示される。第２のＸＲデバイス１２．２は、オブジェクトを記録し始める。可変粒度を伴う種々のシステムが、第２のＸＲデバイス１２．２による第２のセッションが第１のＸＲデバイス１２．１による第１のセッションの同一近傍内にあることを決定するために、サーバ２０によって使用されてもよい。例えば、Ｗｉ－Ｆｉシグネチャデータ、全地球測位システム（ＧＰＳ）測位データ、Ｗｉ－Ｆｉシグネチャデータに基づくＧＰＳデータ、または場所を示す任意の他のデータが、その場所を記録するために、第１および第２のＸＲデバイス１２．１および１２．２内に含まれてもよい。代替として、第２のＸＲデバイス１２．２によって識別されるＰＣＦは、マップ１のＰＣＦと類似性を示し得る。

図４３Ｂに示されるように、第２のＸＲデバイスは、ブートアップし、画像１１１０等のデータを１つ以上のカメラ４４、４６から収集し始める。図１４に示されるように、いくつかの実施形態では、ＸＲデバイス（例えば、第２のＸＲデバイス１２．２）は、１つ以上の画像１１１０を収集し、画像処理を実施し、１つ以上の特徴／着目点１１２０を抽出してもよい。各特徴は、記述子１１３０に変換されてもよい。いくつかの実施形態では、記述子１１３０は、結び付けられた関連付けられる画像の位置および方向を有し得る、キーフレーム１１４０を説明するために使用されてもよい。１つ以上のキーフレーム１１４０は、前の持続的姿勢１１５０からの閾値距離、例えば、３メートル後に自動的に生成され得る、単一持続的姿勢１１５０に対応してもよい。１つ以上の持続的姿勢１１５０は、所定の距離後、例えば、５メートル毎に自動的に生成され得る、単一ＰＣＦ１１６０に対応してもよい。経時的に、ユーザが、ユーザの環境を動き回り続け、ＸＲデバイスが、画像１１１０等のより多くのデータを収集し続けるにつれて、付加的ＰＣＦ（例えば、ＰＣＦ３およびＰＣＦ４、５）が、作成され得る。アプリケーション、すなわち、２つの１１８０は、ＸＲデバイス上で起動され、ユーザへの提示のために、仮想コンテンツ１１７０をＸＲデバイスに提供してもよい。仮想コンテンツは、関連付けられるコンテンツ座標フレームを有してもよく、これは、１つ以上のＰＣＦに対して設置されてもよい。図４３Ｂに示されるように、第２のＸＲデバイス１２．２は、３つのＰＣＦを作成する。いくつかの実施形態では、第２のＸＲデバイス１２．２は、サーバ上２０に記憶される１つ以上の規準マップに対して位置特定するように試みてもよい。

いくつかの実施形態では、図４３Ｃに示されるように、第２のＸＲデバイス１２．２は、規準マップ１２０をサーバ２０からダウンロードしてもよい。第２のＸＲデバイス１２．２上のマップ１は、ＰＣＦａ－ｄと、原点１とを含む。いくつかの実施形態では、サーバ２０は、種々の場所のための複数の規準マップを有してもよく、第２のＸＲデバイス１２．２が第１のセッションの間の第１のＸＲデバイス１２．１の近傍と同じ近傍内にあることを決定し、第２のＸＲデバイス１２．２に、その近傍に関する規準マップを送信してもよい。

図４４は、第２のＸＲデバイス１２．２が、マップ２を生成する目的のためのＰＣＦの識別を開始することを示す。第２のＸＲデバイス１２．２は、単一ＰＣＦ、すなわち、ＰＣＦ１、２のみを識別している。第２のＸＲデバイス１２．２のためのＰＣＦ１、２のＸ、Ｙ、およびＺ座標は、（１，１，１）であり得る。マップ２は、その独自の原点（原点２）を有し、これは、現在の頭部姿勢セッションのためのデバイス始動時のデバイス２の頭部姿勢に基づいてもよい。いくつかの実施形態では、第２のＸＲデバイス１２．２は、マップ２を規準マップに対して位置特定するように直ちに試みてもよい。いくつかの実施形態では、マップ２は、システムが２つのマップ間の任意または十分な重複を認識しないため、規準マップ（マップ１）に対して位置特定することが不可能である場合がある（すなわち、位置特定が失敗し得る）。いくつかの実施形態では、システムは、ローカルマップと規準マップとの間のＰＣＦ比較に基づいて、位置特定してもよい。いくつかの実施形態では、システムは、ローカルマップと規準マップとの間の持続的姿勢比較に基づいて、位置特定してもよい。いくつかの実施形態では、システムは、ローカルマップと規準マップとの間のキーフレーム比較に基づいて、位置特定してもよい。

図４５は、第２のＸＲデバイス１２．２がマップ２のさらなるＰＣＦ（ＰＣＦ１、２、ＰＣＦ３、ＰＣＦ４、５）を識別した後のマップ２を示す。第２のＸＲデバイス１２．２は、再び、マップ２を規準マップに対して位置特定するように試みる。マップ２は、規準マップの少なくとも一部と重複するように拡張されたため、位置特定試行は、成功するであろう。いくつかの実施形態では、ローカル追跡マップ、マップ２、および規準マップ間の重複は、ＰＣＦ、持続的姿勢、キーフレーム、または任意の他の好適な中間または派生構築物によって表されてもよい。

さらに、第２のＸＲデバイス１２．２は、コンテンツ１２３およびコンテンツ４５６をマップ２のＰＣＦ１、２およびＰＣＦ３に関連付けている。コンテンツ１２３は、（１，０，０）のＰＣＦ１、２に対するＸ、Ｙ、およびＺ座標を有する。同様に、マップ２内のＰＣＦ３に対するＸ、Ｙ、およびＺ座標も、（１，０，０）である。

図４６Ａおよび４６Ｂは、規準マップに対するマップ２の位置特定成功を図示する。マップ１４１０の重複エリア／体積／セクションは、マップ１および規準マップとの共通部分を表す。マップ２は、位置特定する前に、ＰＣＦ３および４、５を作成し、規準マップは、マップ２が作成される前に、ＰＣＦａおよびｃを作成したため、異なるＰＣＦが、実空間（例えば、異なるマップ）内の同一体積を表すために作成された。

図４７に示されるように、第２のＸＲデバイス１２．２は、規準マップからのＰＣＦａ－ｄを含むように、マップ２を拡張させる。ＰＣＦａ－ｄの含有は、規準マップに対するマップ２の位置特定を表す。いくつかの実施形態では、ＸＲシステムは、最適化ステップを実施し、１４１０内のＰＣＦ、すなわち、ＰＣＦ３およびＰＣＦ４、５等の複製ＰＣＦを重複エリアから除去してもよい。マップ２が位置特定した後、コンテンツ４５６およびコンテンツ１２３等の仮想コンテンツの設置は、更新されたマップ２内の最も近い更新されたＰＣＦに対することになるだろう。仮想コンテンツは、コンテンツのための変化されたＰＣＦ結び付けにもかかわらず、かつマップ２のための更新されたＰＣＦにもかかわらず、ユーザに対して同一実世界場所内に現れる。

図４８に示されるように、第２のＸＲデバイス１２．２は、さらなるＰＣＦ（ＰＣＦｅ、ｆ、ｇ、およびｈ）が第２のＸＲデバイス１２．２によって識別されるにつれて、例えば、ユーザが実世界を歩き回るにつれて、マップ２を拡張させ続ける。また、マップ１は、図４７および４８において拡張されていないことに留意されたい。

図４９を参照すると、第２のＸＲデバイス１２．２は、マップ２をサーバ２０にアップロードする。サーバ２０は、規準マップとともに、マップ２を記憶する。いくつかの実施形態では、マップ２は、第２のＸＲデバイス１２．２のためのセッションが終了すると、サーバ２０にアップロードされてもよい。

サーバ２０内の規準マップは、ここでは、ＰＣＦｉを含み、これは、第１のＸＲデバイス１２．１上のマップ１内に含まれない。サーバ２０上の規準マップは、第３のＸＲデバイス（図示せず）が、マップをサーバ２０にアップロードし、そのようなマップが、ＰＣＦｉを含むと、ＰＣＦｉを含むように拡張され得る。

図５０では、サーバ２０は、マップ２を規準マップとマージし、新しい規準マップを形成する。サーバ２０は、ＰＣＦａ－ｄが規準マップおよびマップ２と共通であることを決定する。サーバは、ＰＣＦｅ－ｈおよびＰＣＦ１、２をマップ２から含むように、規準マップを拡張させ、新しい規準マップを形成する。第１および第２のＸＲデバイス１２．１および１２．２上の規準マップは、マップ１に基づき、古くなる。

図５１では、サーバ２０は、新しい規準マップを第１および第２のＸＲデバイス１２．１および１２．２に伝送する。いくつかの実施形態では、これは、第１のＸＲデバイス１２．１および第２のデバイス１２．２が、異なるまたは新しいまたは後続セッションの間、位置特定しようと試みるときに生じ得る。第１および第２のＸＲデバイス１２．１および１２．２は、上記に説明されるように、その個別のローカルマップ（それぞれ、マップ１およびマップ２）を新しい規準マップに対して位置特定するステップに進む。

図５２に示されるように、頭部座標フレーム９６または「頭部姿勢」は、マップ２内のＰＣＦに関連する。いくつかの実施形態では、マップの原点、すなわち、原点２は、セッションの開始時における第２のＸＲデバイス１２．２の頭部姿勢に基づく。ＰＣＦが、セッションの間に作成されるにつれて、ＰＣＦは、世界座標フレーム、すなわち、原点２に対して設置される。マップ２のＰＣＦは、規準座標フレームに対する持続座標フレームとしての役割を果たし、世界座標フレームは、前のセッションの世界座標フレーム（例えば、図４０におけるマップ１の原点１）であってもよい。世界座標フレームから頭部座標フレーム９６への変換は、図９を参照して前述されている。図５２に示される頭部座標フレーム９６は、マップ２のＰＣＦに対する特定の座標位置にあって、マップ２に対して特定の角度にある、２つの直交軸のみを有する。しかしながら、頭部座標フレーム９６は、マップ２のＰＣＦに対するある３次元場所内にあって、３次元空間内の３つの直交軸を有することを理解されたい。

図５３では、頭部座標フレーム９６は、マップ２のＰＣＦに対して移動している。頭部座標フレーム９６は、第２のユーザ１４．２がその頭部を移動させたため、移動している。ユーザは、その頭部を６自由度（６ｄｏｆ）において移動させることができる。頭部座標フレーム９６は、したがって、６ｄｏｆ、すなわち、図５２におけるその前の場所から、３次元において、かつマップ２のＰＣＦに対する約３つの直交軸において移動することができる。頭部座標フレーム９６は、それぞれ、図９における実オブジェクト検出カメラ４４および慣性測定ユニット４８が、実オブジェクトおよび頭部ユニット２２の運動を検出すると、調節される。頭部姿勢追跡に関するさらなる情報は、「ＥｎｈａｎｃｅｄＰｏｓｅＤｅｔｅｒｍｉｎａｔｉｏｎｆｏｒＤｉｓｐｌａｙＤｅｖｉｃｅ」と題された米国特許第出願第１６／２２１，０６５号に開示され、参照することによってその全体として本明細書に組み込まれる。

図５４は、音が１つ以上のＰＣＦと関連付けられてもよいことを示す。ユーザは、例えば、立体音を伴うヘッドホンまたはイヤホンを装着し得る。ヘッドホンを通した音の場所が、従来の技法を使用してシミュレートされることができる。音の場所は、ユーザがその頭部を左に回転させると、音の場所が右に回転し、したがって、ユーザが実世界内の同一場所から生じる音を知覚するように、定常位置に位置してもよい。本実施例では、音の場所は、音１２３および音４５６によって表される。議論の目的のために、図５４は、その分析において、図４８に類似する。第１および第２のユーザ１４．１および１４．２が、同一または異なる時間において、同一部屋内に位置するとき、彼らは、実世界内の同一場所から生じる音１２３および音４５６を知覚する。

図５５および５６は、上記に説明される技術のさらなる実装を図示する。第１のユーザ１４．１は、図８を参照して説明されるように、第１のセッションを開始した。図５５に示されるように、第１のユーザ１４．１は、想像線によって示されるように、第１のセッションを終了した。第１のセッションの終了時、第１のＸＲデバイス１２．１は、マップ１をサーバ２０にアップロードした。第１のユーザ１４．１は、今度は、第１のセッションの後の時間において、第２のセッションを開始した。第１のＸＲデバイス１２．１は、マップ１が第１のＸＲデバイス１２．１上にすでに記憶されているため、マップ１をサーバ２０からダウンロードしない。マップ１が、喪失される場合、第１のＸＲデバイス１２．１は、マップ１をサーバ２０からダウンロードする。第１のＸＲデバイス１２．１は、次いで、上記に説明されるように、マップ２のためのＰＣＦを構築し、マップ１に対して位置特定し、規準マップをさらに展開するステップに進む。第１のＸＲデバイス１２．１のマップ２は、次いで、上記に説明されるように、ローカルコンテンツ、頭部座標フレーム、ローカル音等を関連させるために使用される。

図５７および５８を参照すると、また、１人を上回るユーザが同一セッションにおいてサーバと相互作用することが可能性として考えられ得る。本実施例では、第１のユーザ１４．１および第２のユーザ１４．２に、第３のＸＲデバイス１２．３を伴う第３のユーザ１４．３が加わっている。各ＸＲデバイス１２．１、１２．２、および１２．３は、それぞれ、その独自のマップ、すなわち、マップ１、マップ２、およびマップ３を生成し始める。ＸＲデバイス１２．１、１２．２、および１２．３が、マップ１、２、および３を展開し続けるにつれて、マップは、サーバ２０に漸次的にアップロードされる。サーバ２０は、マップ１、２、および３をマージし、規準マップを形成する。規準マップは、次いで、サーバ２０からＸＲデバイス１２．１、１２．２、および１２．３のそれぞれのものに伝送される。

図５９は、いくつかの実施形態による、頭部姿勢を復元および／またはリセットするための視認方法の側面を図示する。図示される実施例では、行為１４００において、視認デバイスが、電源投入される。行為１４１０では、電源投入されることに応答して、新しいセッションが、開始される。いくつかの実施形態では、新しいセッションは、頭部姿勢を確立するステップを含んでもよい。ユーザの頭部に固着される、頭部搭載型フレーム上の１つ以上の捕捉デバイスが、最初に、環境の画像を捕捉し、次いで、表面を画像から決定することによって、環境の表面を捕捉する。いくつかの実施形態では、表面データはまた、重力センサからのデータと組み合わせられ、頭部姿勢を確立してもよい。頭部姿勢を確立する他の好適な方法が、使用されてもよい。

行為１４２０では、視認デバイスのプロセッサが、頭部姿勢の追跡のためのルーチンに入る。捕捉デバイスは、ユーザがその頭部を移動させるにつれて、環境の表面を捕捉し、表面に対する頭部搭載型フレームの配向を決定し続ける。

行為１４３０では、プロセッサが、頭部姿勢が喪失されたかどうかを決定する。頭部姿勢は、低特徴入手をもたらし得る、あまりに多くの反射性表面、低光量、何もない壁、屋外等、「エッジ」ケースに起因して、または移動し、マップの一部を形成する、群集等、動的ケースのため、喪失された状態になり得る。１４３０におけるルーチンは、頭部姿勢が喪失されたかどうかを決定するための十分な時間を可能にするために、ある時間量、例えば、１０秒が経過することを可能にする。頭部姿勢が喪失されていない場合、プロセッサは、１４２０に戻り、再び、頭部姿勢の追跡に入る。

頭部姿勢が、行為１４３０において喪失された場合、プロセッサは、１４４０において、頭部姿勢を復元するためのルーチンに入る。頭部姿勢が、低光量に起因して喪失された場合、以下のメッセージ等のメッセージが、視認デバイスのディスプレイを通してユーザに表示される：

システムが、低光量条件を検出中です。より光の多いエリアに移動してください。

システムは、十分な光が利用可能であるかどうかと、頭部姿勢が復元され得るかどうかとを監視し続けるであろう。システムは、代替として、表面の低テクスチャが頭部姿勢を喪失させていることを決定し得、その場合、ユーザは、表面の捕捉を改良するための提案として、以下のプロンプトがディスプレイ内に与えられる：

システムは、微細なテクスチャを伴う十分な表面を検出することができません。表面のテクスチャが粗くなく、テクスチャがより精緻化されたエリアに移動してください。

行為１４５０では、プロセッサは、頭部姿勢復元が失敗したかどうかを決定するためのルーチンに入る。頭部姿勢復元が失敗していない（すなわち、頭部姿勢復元が成功した）場合、プロセッサは、再び、頭部姿勢の追跡に入ることによって、行為１４２０に戻る。頭部姿勢復元が失敗した場合、プロセッサは、行為１４１０に戻り、新しいセッションを確立する。新しいセッションの一部として、全てのキャッシュされたデータは、無効化され、以降、頭部姿勢は、新しく確立される。頭部追跡の任意の好適な方法が、図５９に説明されるプロセスと組み合わせて使用されてもよい。米国特許第出願第１６／２２１，０６５号は、頭部追跡を説明しており、参照することによってその全体として本明細書に組み込まれる。

図６０は、コンピュータシステム１９００の例示的形態における機械の略図表現を示し、機械に本明細書で議論される方法論のうちの任意の１つ以上のものを実施させるための命令のセットが、いくつかの実施形態に従って実行されてもよい。代替実施形態では、機械は、独立型デバイスとして動作する、または他の機械に接続（例えば、ネットワーク化）されてもよい。さらに、単一機械のみが、図示されるが、用語「機械」はまた、個々にまたはともに、命令のセット（または複数のセット）を実行し、本明細書で議論される方法論のうちの任意の１つ以上のものを実施する、機械の任意の集合を含むものと捉えられるものとする。

例示的コンピュータシステム１９００は、プロセッサ１９０２（例えば、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、または両方）と、メインメモリ１９０４（例えば、読取専用メモリ（ＲＯＭ）、フラッシュメモリ、動的ランダムアクセスメモリ（ＤＲＡＭ）例えば、同期ＤＲＡＭ（ＳＤＲＡＭ）またはＲａｍｂｕｓＤＲＡＭ（ＲＤＲＡＭ）等）と、静的メモリ１９０６（例えば、フラッシュメモリ、静的ランダムアクセスメモリ（ＳＲＡＭ）等）とを含み、これらは、バス１９０８を介して相互に通信する。

コンピュータシステム１９００はさらに、ディスクドライブユニット１９１６と、ネットワークインターフェースデバイス１９２０とを含んでもよい。

ディスクドライブユニット１９１６は、その上に本明細書に説明される方法論または機能のうちの任意の１つ以上のものを具現化する、１つ以上の命令のセット１９２４（例えば、ソフトウェア）が記憶される、機械可読媒体１９２２を含む。ソフトウェアはまた、コンピュータシステム１９００、メインメモリ１９０４、およびプロセッサ１９０２によるその実行の間、完全にまたは少なくとも部分的に、メインメモリ１９０４内および／またはプロセッサ１９０２内に常駐し、同様に機械可読媒体を構成してもよい。

ソフトウェアはさらに、ネットワーク１８を経由して、ネットワークインターフェースデバイス１９２０を介して、伝送または受信されてもよい。

コンピュータシステム１９００は、プロジェクタを駆動し、光を生成するために使用される、ドライバチップ１９５０を含む。ドライバチップ１９５０は、その独自のデータ記憶装置１９６０と、その独自のプロセッサ１９６２とを含む。

機械可読媒体１９２２が、例示的実施形態では、単一媒体であるように示されるが、用語「機械可読媒体」は、１つ以上の命令のセットを記憶する、単一媒体または複数の媒体（例えば、集中型または分散型データベースおよび／または関連付けられるキャッシュおよびサーバ）を含むものと捉えられるべきである。用語「機械可読媒体」はまた、機械による実行のための命令のセットを記憶、エンコーディング、または搬送することが可能であって、機械に、本発明の方法論のうちの任意の１つ以上のものを実施させる、任意の媒体を含むものと捉えられるものとする。用語「機械可読媒体」は、故に、限定ではないが、ソリッドステートメモリ、光学および磁気媒体、および搬送波信号を含むものと捉えられるものとする。

いくつかの実施形態のいくつかの側面がこれまで説明されたが、種々の改変、修正、および改良が、当業者に容易に想起されるであろうことを理解されたい。

一実施例として、実施形態は、拡張（ＡＲ）環境に関連して説明される。本明細書に説明される技法の一部または全部は、ＭＲ環境、またはより一般的には、他のＸＲ環境およびＶＲ環境内に適用されてもよいことを理解されたい。

さらに、図２９は、候補マップをフィルタリングし、高ランク付けマップのセットをもたらすために使用され得る、基準の実施例を提供する。他の基準が、説明される基準の代わりに、またはそれに加え、使用されてもよい。例えば、複数の候補マップが、あまり望ましくないマップをフィルタリング除去するために使用されるメトリックの類似値を有する場合、候補マップの特性が、候補マップとして留保される、またはフィルタリング除去されるマップを決定するために使用されてもよい。例えば、より大きいまたはより稠密な候補マップは、より小さい候補マップより優先されてもよい。

そのような改変、修正、および改良は、本開示の一部であることが意図され、本開示の精神および範囲内であると意図される。さらに、本開示の利点が示されるが、本開示の全ての実施形態が、全ての説明される利点を含むわけではないことを理解されたい。いくつかの実施形態は、本明細書およびいくつかの事例において有利として説明される任意の特徴を実装しなくてもよい。故に、前述の説明および図面は、一例にすぎない。

いくつかの実施形態は、３次元（３Ｄ）環境についての情報を捕捉し、画像を出力するように構成される、センサであって、各画像は、複数のピクセルを備える、センサと、コンピュータ実行可能命令を実行し、センサによって出力された画像を処理するように構成される、少なくとも１つのプロセッサとを含む、ポータブル電子システムに関する。コンピュータ実行可能命令は、センサによって捕捉された複数の画像を受信するステップと、複数の画像の少なくともサブセットに関して、画像のサブセットの画像毎に、複数のピクセル内の１つ以上の特徴を識別するステップであって、各特徴は、１つ以上のピクセルに対応する、ステップと、１つ以上の特徴の特徴毎に、特徴記述子を算出するステップと、サブセットの画像毎に、少なくとも部分的に、画像内の算出された特徴記述子に基づいて、画像を表すためのフレーム記述子を算出するステップとのための命令を備える。

いくつかの実施形態では、センサは、少なくとも百万ピクセル回路を備える。複数の画像毎のフレーム記述子は、５１２またはより少ない数を備える。

いくつかの実施形態では、コンピュータ実行可能命令はさらに、３Ｄ環境の少なくとも一部のマップを構築するステップと、個別のフレームのための特徴記述子と、少なくとも部分的に個別のフレームから生成されたマップの部分を関連付けるステップとのための命令を備える。

いくつかの実施形態では、コンピュータ実行可能命令は、複数の画像のサブセットとして、少なくとも部分的に、３Ｄ環境に対する画像の場所および複数の画像の複数のピクセルに基づいて、複数の画像から１つ以上のキーフレームを選択するステップのための命令を備える。

いくつかの実施形態では、コンピュータ実行可能命令は、１つ以上のキーフレームのキーフレームのために３Ｄ環境のマップと関連付けられる、１つ以上のフレームを識別するステップのための命令を備え、１つ以上のフレームは、キーフレームのためのフレーム記述子からの閾値距離未満のフレーム記述子を有する。

いくつかの実施形態では、フレーム記述子を算出するためのコンピュータ実行可能命令は、人工ニューラルネットワークを備える。

いくつかの実施形態では、人工ニューラルネットワークは、類似および異なる画像に基づいて訓練され、画像内の特徴を表す複数の値を入力として受信し、特徴を表す複数の値の加重された組み合わせを出力として提供するように構成される、多層パーセプトロンユニットと、多層パーセプトロンユニットの出力のサブセットをフレーム記述子として選択するように構成される、最大プーリングユニットとを備える。

いくつかの実施形態は、コンピューティングシステムを動作させ、ユーザによって装着されるデバイスによって収集されたセンサデータに基づいて、３次元（３Ｄ）環境の少なくとも一部のマップを生成する方法に関する。本方法は、ユーザによって装着されるデバイスによって捕捉された複数の画像を受信するステップと、１つ以上のキーフレームを複数の画像から決定するステップと、第１の人工ニューラルネットワークを用いて、１つ以上のキーフレーム内の１つ以上の着目点を識別するステップと、第１の人工ニューラルネットワークを用いて、個々の着目点のための特徴記述子を算出するステップと、１つ以上のキーフレーム毎に、第２の人工ニューラルネットワークを用いて、少なくとも部分的に、キーフレーム内の識別された着目点のための算出された特徴記述子に基づいて、キーフレームを表すためのフレーム記述子を算出するステップとを含む。

いくつかの実施形態では、第１および第２の人工ニューラルネットワークは、人工ニューラルネットワークのサブネットワークである。

いくつかの実施形態では、フレーム記述子は、個々のキーフレームに一意である。

いくつかの実施形態では、１つ以上のキーフレームはそれぞれ、１メガバイトより高い分解能を有する。１つ以上のキーフレーム毎のフレーム記述子は、５１２の数未満の列である。

いくつかの実施形態では、各特徴記述子は、３２バイトの列である。

いくつかの実施形態では、フレーム記述子は、特徴記述子を最大プーリングすることによって生成される。

いくつかの実施形態では、本方法は、ユーザによって装着されるデバイスによって捕捉された新しい画像を受信するステップと、マップを生成するために使用されるキーフレームを備える、データベース内の１つ以上の最も近くのキーフレームを識別するステップであって、１つ以上の最も近くのキーフレームは、新しい画像のためのフレーム記述子の所定の距離内のフレーム記述子を有する、ステップとを含む。

いくつかの実施形態では、本方法は、識別された１つ以上の最も近くのキーフレームに対応する、マップの３Ｄマップ点に対して特徴マッチングを実施するステップと、特徴マッチング結果に基づいて、ユーザによって装着されるデバイスの姿勢を算出するステップとを含む。

いくつかの実施形態では、複数の画像から１つ以上のキーフレームを決定するステップは、第１の画像のピクセルと第１の画像直後に撮影された第２の画像のピクセルを比較するステップと、第１の画像のピクセルと第２の画像のピクセルとの間の差異が閾値を上回るまたは下回るとき、第２の画像をキーフレームとして識別するステップとを含む。

いくつかの実施形態では、本方法は、複数の画像セットを備えるデータセットを生成することによって、第２の人工ニューラルネットワークを訓練するステップであって、複数の画像セットはそれぞれ、クエリ画像、正のサンプル画像、および負のサンプル画像を含む、ステップと、データセット内の複数の画像セットの画像セット毎に、クエリ画像と正のサンプル画像および負のサンプル画像を比較することによって、損失を算出するステップと、クエリ画像のために第２の人工ニューラルネットワークによって生成されたフレーム記述子と正のサンプル画像のためのフレーム記述子との間の距離が、クエリ画像のためのフレーム記述子と負のサンプル画像のためのフレーム記述子との間の距離を上回るように、算出された損失に基づいて、第２の人工ニューラルネットワークを修正するステップとを含む。

いくつかの実施形態は、クロスリアリティシステムのためのコンピューティング環境に関する。コンピューティング環境は、複数のマップを記憶するデータベースを含む。各マップは、３Ｄ環境の領域を表す情報を備える。各領域を表す情報は、領域の画像を表すフレーム記述子を備え、非一過性コンピュータ記憶媒体は、少なくとも１つのプロセッサによって実行されると、コンピューティング環境内において、画像内の複数の特徴を識別することによって、ポータブルデバイスによって捕捉された画像を処理し、複数の特徴毎に、特徴記述子を算出し、少なくとも部分的に、画像内の１つ以上の識別された着目点のための算出された特徴記述子に基づいて、画像を表すためのフレーム記述子を算出し、算出されたフレーム記述子とマップのデータベース内に記憶されたフレーム記述子との間の比較に基づいて、データベース内のマップを選択する、コンピュータ実行可能命令を記憶する。

いくつかの実施形態では、フレーム記述子は、データベース内に記憶されたフレームに一意である。

いくつかの実施形態では、画像は、１メガバイトより高い分解能を有する。画像を表すために算出されたフレーム記述子は、５１２の数未満である、列である。

いくつかの実施形態では、コンピュータ実行可能命令は、複数の画像セットを備える、データセットを処理するステップであって、複数の画像セットはそれぞれ、クエリ画像、正のサンプル画像、および負のサンプル画像を含む、ステップと、データセット内の複数の画像セットの画像のセットのための損失を算出するステップと、クエリ画像と正のサンプル画像および負のサンプル画像を比較するステップと、クエリ画像のための人工ニューラルネットワークによって生成されたフレーム記述子と正のサンプル画像のためのフレーム記述子との間の距離がクエリ画像のためのフレーム記述子と負のサンプル画像のためのフレーム記述子との間の距離未満であるように、算出された損失に基づいて、人工ニューラルネットワークを修正するステップとによって訓練された、人工ニューラルネットワークを備える。

いくつかの実施形態では、人工ニューラルネットワークを修正するステップは、コンピューティング環境内のポータブルデバイス上の人工ニューラルネットワークのコピーを修正するステップを含む。

いくつかの実施形態では、コンピューティング環境は、クラウドプラットフォームと、クラウドプラットフォームと通信する、複数のポータブルデバイスとを備える。クラウドプラットフォームは、データベースと、マップを選択するためのコンピュータ実行可能命令とを備える。ポータブルデバイスによって捕捉された画像を処理するためのコンピュータ実行可能命令は、ポータブルデバイス上に記憶される。

いくつかの実施形態は、第１のプロセッサと、第１のプロセッサに接続される、第１のコンピュータ可読媒体と、第１のコンピュータ可読媒体上に記憶される、第１の原点座標フレームと、コンピュータ可読媒体上に記憶される、第１の目的地座標フレームと、ローカルコンテンツを表すデータを受信する、第１のデータチャネルと、第１のプロセッサによって実行可能であって、ローカルコンテンツの位置付けを第１の原点座標フレームから第１の目的地座標フレームに変換する、第１の座標フレーム変換器と、ローカルコンテンツの位置付けを第１の原点座標フレームから第１の目的地座標フレームに変換後、ローカルコンテンツを第１のユーザに表示するように適合される、第１のディスプレイシステムとを含む、第１のＸＲデバイスを含む、ＸＲシステムに関する。

いくつかの実施形態は、第１の原点座標フレームを記憶するステップと、第１の目的地座標フレームを記憶するステップと、ローカルコンテンツを表すデータを受信するステップと、ローカルコンテンツの位置付けを第１の原点座標フレームから第１の目的地座標フレームに変換するステップと、ローカルコンテンツの位置付けを第１の原点座標フレームから第１の目的地座標フレームに変換後、ローカルコンテンツを第１のユーザに表示するステップとを含む、視認方法に関する。

いくつかの実施形態は、複数の持続的座標フレーム（ＰＣＦ）を有する規準マップである、第１のマップを記憶する、マップ記憶ルーチンであって、第１のマップの各ＰＣＦは、座標のセットを有する、マップ記憶ルーチンと、実オブジェクトの場所を検出するように位置付けられる、実オブジェクト検出デバイスと、実オブジェクト検出デバイスに接続され、実オブジェクトの場所に基づいて、第２のマップのＰＣＦを検出する、ＰＣＦ識別システムであって、第２のマップの各ＰＣＦは、座標のセットを有する、ＰＣＦ識別システムと、規準マップおよび第２のマップに接続され、第２のマップの第１のＰＣＦを規準マップの第１のＰＣＦにマッチングさせ、第２のマップの第２のＰＣＦを規準マップの第２のＰＣＦにマッチングさせることによって、第２のマップを規準マップに対して位置特定するように実行可能である、位置特定モジュールとを含む、ＸＲシステムに関する。

いくつかの実施形態では、実オブジェクト検出デバイスは、実オブジェクト検出カメラである。

いくつかの実施形態では、ＸＲシステムはさらに、規準マップおよび第２のマップに接続され、規準マップの第３のＰＣＦを第２のマップに組み込むように実行可能である、規準マップ組込器を備える。

いくつかの実施形態では、ＸＲシステムはさらに、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの１つのＰＣＦに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムとを備える。

いくつかの実施形態では、ＸＲシステムはさらに、ローカルコンテンツのローカル座標フレームを第２のマップの世界座標フレームに変換する、ローカル／世界座標変換器を備える。

いくつかの実施形態では、ＸＲシステムはさらに、第２のマップのＰＣＦに基づいて、第１の世界座標フレームを計算する、第１の世界フレーム決定ルーチンと、世界座標フレームを記憶する、第１の世界フレーム記憶命令と、頭部搭載可能フレームの移動に応じて変化する、頭部座標フレームを計算する、頭部フレーム決定ルーチンと、第１の頭部座標フレームを記憶する、頭部フレーム記憶命令と、世界座標フレームを頭部座標フレームに変換する、世界／頭部座標変換器とを備える。

いくつかの実施形態では、頭部座標フレームは、頭部搭載可能フレームが移動すると、世界座標フレームに対して変化する。

いくつかの実施形態では、ＸＲシステムはさらに、第２のマップの少なくとも１つのＰＣＦに関連する、少なくとも１つの音要素を備える。

いくつかの実施形態では、第１および第２のマップは、ＸＲデバイスによって作成される。

いくつかの実施形態では、ＸＲシステムはさらに、第１および第２のＸＲデバイスを備える。各ＸＲデバイスは、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの１つのＰＣＦに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムとを含む。

いくつかの実施形態では、第１のＸＲデバイスは、第１のマップのためのＰＣＦを作成し、第２のＸＲデバイスは、第２のマップのためのＰＣＦを作成し、位置特定モジュールは、第２のＸＲデバイスの一部を形成する。

いくつかの実施形態では、第１および第２のマップは、それぞれ、第１および第２のセッションにおいて作成される。

いくつかの実施形態では、ＸＲシステムはさらに、サーバと、ＸＲデバイスの一部を形成し、第１のマップをネットワークを経由してサーバからダウンロードする、マップダウンロードシステムとを備える。

いくつかの実施形態では、位置特定モジュールは、第２のマップを規準マップに対して位置特定するように繰り返し試みる。

いくつかの実施形態では、ＸＲシステムはさらに、第２のマップをネットワークを経由してサーバにアップロードする、マップ発行器を備える。

いくつかの実施形態は、複数のＰＣＦを有する規準マップである、第１のマップを記憶するステップであって、規準マップの各ＰＣＦは、座標のセットを有する、ステップと、実オブジェクトの場所を検出するステップと、実オブジェクトの場所に基づいて、第２のマップのＰＣＦを検出するステップであって、第２のマップの各ＰＣＦは、座標のセットを有する、ステップと、第２のマップの第１のＰＣＦを第１のマップの第１のＰＣＦにマッチングさせ、第２のマップの第２のＰＣＦを規準マップの第２のＰＣＦにマッチングさせることによって、第２のマップを規準マップに対して位置特定するステップとを含む、視認方法に関する。

いくつかの実施形態は、プロセッサと、プロセッサに接続される、コンピュータ可読媒体と、コンピュータ可読媒体上の複数の規準マップと、各個別の規準マップと関連付けられるコンピュータ可読媒体上の個別の規準マップ識別子であって、相互に異なり、規準マップを一意に識別する、規準マップ識別子と、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、位置識別子をＸＲデバイスから受信し、記憶する、位置検出器と、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、位置識別子と規準マップ識別子を比較し、第１のフィルタリングされた選択を形成する、１つ以上の規準マップを決定する、第１のフィルタと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、第１のフィルタリングされた選択に基づいて、規準マップのうちの１つ以上のものをＸＲデバイスに伝送する、マップ伝送機とを有し得る、サーバを備える、ＸＲシステムに関する。

いくつかの実施形態では、規準マップ識別子はそれぞれ、経度および緯度を含み、位置識別子は、経度および緯度を含む。

いくつかの実施形態では、第１のフィルタは、位置識別子の経度および緯度を含む、経度および緯度を網羅する、少なくとも１つのマッチングする規準マップと、第１のマッチングする規準マップに隣接する経度および緯度を網羅する、少なくとも１つの近傍マップとを選択する、近傍エリアフィルタである。

いくつかの実施形態では、位置識別子は、ＷｉＦｉフィンガプリントを含む。ＸＲシステムはさらに、ＷｉＦｉフィンガプリントフィルタであって、コンピュータ可読媒体上にあって、プロセッサによって、ＷｉＦｉフィンガプリントに基づいて、緯度および経度を決定し、ＷｉＦｉフィンガプリントフィルタからの緯度および経度と規準マップの緯度および経度を比較し、第１のフィルタリングされた選択内の第２のフィルタリングされた選択を形成する、１つ以上の規準マップを決定し、マップ伝送機は、第２の選択に基づいて、１つ以上の規準マップを伝送し、第２の選択外の第１の選択に基づく規準マップを伝送しないように実行可能である、第２のフィルタを備える。

いくつかの実施形態では、第１のフィルタは、コンピュータ可読媒体上にあって、プロセッサによって、ＷｉＦｉフィンガプリントに基づいて、緯度および経度を決定し、ＷｉＦｉフィンガプリントフィルタからの緯度および経度と規準マップの緯度および経度を比較し、第１のフィルタリングされた選択を形成する、１つ以上の規準マップを決定するように実行可能である、ＷｉＦｉフィンガプリントフィルタである。

いくつかの実施形態では、ＸＲシステムはさらに、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、画像の複数の特徴を受信し、各特徴を個別の数の列に変換する、多層知覚ユニットと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、各数の列の最大値を画像を表すグローバル特徴列に組み合わせる、最大プールユニットであって、各規準マップは、グローバル特徴列のうちの少なくとも１つを有し、ＸＲデバイスから受信された位置識別子は、多層知覚ユニットおよび最大プールユニットによって、画像のグローバル特徴列を決定するために進展される、ＸＲデバイスによって捕捉された画像の特徴を含む、最大プールユニットと、画像のグローバル特徴列と規準マップのグローバル特徴列を比較し、第２のフィルタリングされた選択内の第３のフィルタリングされた選択を形成する、１つ以上の規準マップを決定する、キーフレームフィルタであって、マップ伝送機は、第３の選択に基づいて、１つ以上の規準マップを伝送し、第３の選択外の第２の選択に基づく規準マップを伝送しない、キーフレームフィルタとを備える。

いくつかの実施形態では、ＸＲシステムは、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、画像の複数の特徴を受信し、各特徴を個別の数の列に変換する、多層知覚ユニットと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、各数の列の最大値を画像を表すグローバル特徴列に組み合わせる、最大プールユニットであって、各規準マップは、グローバル特徴列のうちの少なくとも１つを有し、ＸＲデバイスから受信された位置識別子は、多層知覚ユニットおよび最大プールユニットによって、画像のグローバル特徴列を決定するために進展される、ＸＲデバイスによって捕捉された画像の特徴を含む、最大プールユニットとをさらに備え、第１のフィルタは、画像のグローバル特徴列と規準マップのグローバル特徴列を比較し、１つ以上の規準マップを決定する、キーフレームフィルタである。

いくつかの実施形態では、ＸＲシステムは、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの１つのＰＣＦに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムとを含む、ＸＲデバイスを備える。

いくつかの実施形態では、ＸＲデバイスは、複数のＰＣＦを有する規準マップである、第１のマップを記憶する、マップ記憶ルーチンであって、第１のマップの各ＰＣＦは、座標のセットを有する、マップ記憶ルーチンと、実オブジェクトの場所を検出するように位置付けられる、実オブジェクト検出デバイスと、実オブジェクト検出デバイスに接続され、実オブジェクトの場所に基づいて、第２のマップのＰＣＦを検出する、ＰＣＦ識別システムであって、第２のマップの各ＰＣＦは、座標のセットを有する、ＰＣＦ識別システムと、規準および第２のマップに接続され、第２のマップの第１のＰＣＦを規準マップの第１のＰＣＦにマッチングさせ、第２のマップの第２のＰＣＦを規準マップの第２のＰＣＦにマッチングさせることによって、第２のマップを規準マップに対して位置特定するように実行可能である、位置特定モジュールとを含む。

いくつかの実施形態では、ＸＲシステムは、規準マップおよび第２のマップに接続され、規準マップの第３のＰＣＦを第２のマップに組み込むように実行可能である、規準マップ組込器を備える。

いくつかの実施形態は、複数の規準マップをコンピュータ可読媒体上に記憶するステップであって、各規準マップは、個別の規準マップと関連付けられる個別の規準マップ識別子を有し、規準マップ識別子は、相互に異なり、規準マップを一意に識別する、ステップと、コンピュータ可読媒体に接続されるプロセッサを用いて、位置識別子をＸＲデバイスから受信し、記憶するステップと、プロセッサを用いて、位置識別子と規準マップ識別子を比較し、第１のフィルタリングされた選択を形成する、１つ以上の規準マップを決定するステップと、プロセッサを用いて、第１のフィルタリングされた選択に基づいて、複数の規準マップをＸＲデバイスに伝送するステップとを含む、視認方法に関する。

いくつかの実施形態は、プロセッサと、プロセッサに接続される、コンピュータ可読媒体と、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、画像の複数の特徴を受信し、各特徴を個別の数の列に変換する、多層知覚ユニットと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、各数の列の最大値を画像を表すグローバル特徴列に組み合わせる、最大プールユニットとを含む、ＸＲシステムに関する。

いくつかの実施形態では、ＸＲシステムは、コンピュータ可読媒体上の複数の規準マップであって、各規準マップは、それと関連付けられる該グローバル特徴列のうちの少なくとも１つを有する、複数の規準マップと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、画像のグローバル特徴列を決定するために、多層知覚ユニットおよび最大プールユニットによって処理される、ＸＲデバイスによって捕捉された画像の特徴をＸＲデバイスから受信する、位置検出器と、画像のグローバル特徴列と規準マップのグローバル特徴列を比較し、フィルタリングされた選択の一部を形成する、１つ以上の規準マップを決定する、キーフレームフィルタと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、フィルタリングされた選択に基づいて、規準マップのうちの１つ以上のものをＸＲデバイスに伝送する、マップ伝送機とを備える。

いくつかの実施形態では、ＸＲシステムは、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの１つのＰＣＦに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムとを備える。

いくつかの実施形態では、ＸＲシステムは、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの１つのＰＣＦに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムであって、マッチングさせるステップは、第２のマップの該グローバル特徴列を規準マップの該グローバル特徴列にマッチングさせることによって実行される、ディスプレイシステムとを含む、ＸＲデバイスを備える。

いくつかの実施形態は、プロセッサを用いて、画像の複数の特徴を受信するステップと、プロセッサを用いて、各特徴を個別の数の列に変換するステップと、プロセッサを用いて、各数の列の最大値を画像を表すグローバル特徴列に組み合わせるステップとを含む、視認方法に関する。

いくつかの実施形態は、コンピューティングシステムを動作させ、データベース内に記憶される１つ以上の環境マップを識別し、ユーザによって装着されるデバイスによって収集されたセンサデータに基づいて算出された追跡マップとマージする方法であって、デバイスは、追跡マップを算出する間、コンピュータネットワークへのアクセスポイントの信号を受信し、アクセスポイントとの通信の特性に基づいて、追跡マップの少なくとも１つのエリア属性を決定するステップと、少なくとも１つのエリア属性に基づいて、追跡マップの地理的場所を決定するステップと、決定された地理的場所に対応するデータベース内に記憶される環境マップのセットを識別するステップと、追跡マップおよび環境マップのセットの環境マップと関連付けられるネットワークアクセスポイントの１つ以上の識別子の類似性に基づいて、環境マップのセットをフィルタリングするステップと、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づいて、環境マップのセットをフィルタリングするステップと、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づいて、環境マップのセットをフィルタリングするステップとを含む、方法に関する。

いくつかの実施形態では、ネットワークアクセスポイントの１つ以上の識別子の類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセット内に、ネットワークアクセスポイントの１つ以上の識別子に基づいて、追跡マップの少なくとも１つのエリア属性との最高Ｊａｃｃａｒｄ類似性を伴う環境マップを留保するステップを含む。

いくつかの実施形態では、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセット内に、追跡マップの特性のベクトルと環境マップのセット内の環境マップを表すベクトルとの間に最小ベクトル距離を伴う環境マップを留保するステップを含む。

いくつかの実施形態では、追跡マップおよび環境マップのコンテンツを表すメトリックは、マップのコンテンツから算出された値のベクトルを含む。

いくつかの実施形態では、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセットの環境マップ内にもまた表される、追跡マップによって表される物理的世界の体積を算出するステップと、環境マップのセット内に、セットからフィルタリング除去された環境マップより大きい算出された体積を伴う環境マップを留保するステップとを含む。

いくつかの実施形態では、環境マップのセットは、最初に、１つ以上の識別子の類似性に基づいて、続いて、コンテンツを表すメトリックの類似性に基づいて、続いて、追跡マップの一部と環境マップの一部との間のマッチング度に基づいて、フィルタリングされる。

いくつかの実施形態では、１つ以上の識別子の類似性と、コンテンツを表すメトリックの類似性と、追跡マップの一部と環境マップの一部との間のマッチング度とに基づく、環境マップのセットのフィルタリングは、フィルタリングを実施するために要求される処理に基づく順序で実施される。

いくつかの実施形態では、環境マップは、１つ以上の識別子の類似性と、コンテンツを表すメトリックの類似性と、追跡マップの一部と環境マップの一部との間のマッチング度とに基づく、環境マップのセットのフィルタリングに基づいて選択され、情報は、選択された環境マップからユーザデバイス上にロードされる。

いくつかの実施形態では、環境マップは、１つ以上の識別子の類似性と、コンテンツを表すメトリックの類似性と、追跡マップの一部と環境マップの一部との間のマッチング度と、に基づく、環境マップのセットのフィルタリングに基づいて選択され、追跡マップは、選択された環境マップとマージされる。

いくつかの実施形態は、センサを備える複数のユーザデバイスとの通信のために構成される、拡張現実システムのためのクラウドコンピューティング環境であって、複数のユーザデバイスが使用されたエリアを示す、エリア識別を記憶する、ユーザデータベースであって、エリア識別は、使用時にユーザデバイスによって検出された無線ネットワークのパラメータを備える、ユーザデータベースと、複数のユーザデバイスによって供給されるデータおよび関連付けられるメタデータから構築された複数の環境マップを記憶する、マップデータベースであって、関連付けられるメタデータは、そこからマップが構築されたデータを供給した、複数のユーザデバイスのエリア識別から導出されたエリア識別を備え、エリア識別は、そこからマップが構築されたデータを供給した、ユーザデバイスによって検出された無線ネットワークのパラメータを備える、マップデータベースと、クラウドコンピューティング環境内の少なくとも１つのプロセッサによって実行されると、メッセージを、ユーザデバイスによって検出された無線ネットワークのパラメータを備える、複数のユーザデバイスから受信し、ユーザデバイスのためのエリア識別子を算出し、受信されたパラメータおよび／または算出されたエリア識別子に基づいて、ユーザデータベースを更新し、環境マップのための要求を複数のユーザデバイスから受信し、環境マップを要求するユーザデバイスと関連付けられるエリア識別子を決定し、少なくとも部分的に、エリア識別子に基づいて、環境マップのセットをマップデータベースから識別し、環境マップのセットをフィルタリングし、フィルタリングされた環境マップのセットをユーザデバイスに伝送し、環境マップのセットをフィルタリングするステップは、そこから環境マップのための要求が生じた、ユーザデバイスによって検出された無線ネットワークのパラメータと、環境マップのセット内の環境マップのためのマップデータベース内の無線ネットワークのパラメータとの類似性に基づく、コンピュータ実行可能命令を記憶する、非一過性コンピュータ記憶媒体とを備える、クラウドコンピューティング環境に関する。

いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも１つのプロセッサによって実行されると、追跡マップを環境マップを要求するユーザデバイスから受信するように構成され、環境マップのセットをフィルタリングするステップはさらに、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づく。

いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも１つのプロセッサによって実行されると、追跡マップを環境マップを要求するユーザデバイスから受信するように構成され、環境マップのセットをフィルタリングするステップはさらに、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づく。

いくつかの実施形態では、無線ネットワークのパラメータは、それにユーザデバイスが接続される、ネットワークの基本サービスセット識別子（ＢＳＳＩＤ）を備える。

いくつかの実施形態では、無線ネットワークのパラメータの類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップを要求するユーザデバイスと関連付けられるユーザデータベース内に記憶される複数のＢＳＳＩＤと、環境マップのセットの環境マップと関連付けられるマップデータベース内に記憶されるＢＳＳＩＤとの類似性を算出するステップを含む。

いくつかの実施形態では、エリア識別子は、経度および緯度によって、地理的場所を示す。

いくつかの実施形態では、エリア識別子を決定するステップは、ユーザデータベースからのエリア識別子にアクセスするステップを含む。

いくつかの実施形態では、エリア識別子を決定するステップは、複数のユーザデバイスから受信されたメッセージ内のエリア識別子を受信するステップを含む。

いくつかの実施形態では、無線ネットワークのパラメータは、Ｗｉ－Ｆｉおよび５ＧＮＲを含む、プロトコルに準拠する。

いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも１つのプロセッサによって実行されると、追跡マップをユーザデバイスから受信するように構成され、環境マップのセットをフィルタリングするステップはさらに、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づく。

いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも１つのプロセッサによって実行されると、追跡マップをユーザデバイスから受信し、追跡マップを供給するユーザデバイスに基づいて、追跡マップと関連付けられる、エリア識別子を決定し、少なくとも部分的に、追跡マップと関連付けられるエリア識別子に基づいて、第２の環境マップのセットをマップデータベースから選択し、受信された追跡マップに基づいて、マップデータベースを更新し、更新するステップは、受信された追跡マップと第２の環境マップのセット内の１つ以上の環境マップをマージするステップを含む、ように構成される。

いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも１つのプロセッサによって実行されると、受信された追跡マップの一部と第２の環境マップのセットの環境マップの一部との間のマッチング度に基づいて、第２の環境マップのセットをフィルタリングするように構成され、追跡マップと第２の環境マップのセット内の１つ以上の環境マップをマージするステップは、追跡マップとフィルタリングされた第２の環境マップのセット内の１つ以上の環境マップをマージするステップを含む。

いくつかの実施形態は、実世界オブジェクトの複数の表面を検出する、実オブジェクト検出デバイスと、実オブジェクト検出デバイスに接続され、実世界オブジェクトに基づいて、マップを生成する、ＰＣＦ識別システムと、マップに基づいて、第１のＰＣＦを生成し、第１のＰＣＦとマップを関連付ける、持続的座標フレーム（ＰＣＦ）生成システムと、それぞれ、第１および第２のＸＲデバイス上にある、第１および第２の記憶媒体と、第１のＰＣＦを、それぞれ、第１および第２のＸＲデバイスの第１および第２の記憶媒体内に記憶する、第１および第２のＸＲデバイスの少なくとも第１および第２のプロセッサとを備える、ＸＲシステムに関する。

いくつかの実施形態では、ＸＲシステムは、少なくとも１つのプロセッサによって実行可能であって、複数のカメラ画像を複数の個別のキーフレームに変換する、キーフレーム生成器と、少なくとも１つのプロセッサによって実行可能であって、複数のキーフレームを平均することによって、持続的姿勢を生成する、持続的姿勢計算機と、少なくとも１つのプロセッサによって実行可能であって、追跡マップを持続的姿勢に変換し、追跡マップに対する原点における持続的姿勢を決定する、追跡マップおよび持続的姿勢変換器と、少なくとも１つのプロセッサによって実行可能であって、持続的姿勢を第１のＰＣＦに変換し、持続的姿勢に対する第１のＰＣＦを決定する、持続的姿勢およびＰＣＦ変換器と、少なくとも１つのプロセッサによって実行可能であって、第１のＰＣＦを画像データに変換する、ＰＣＦおよび画像データ変換器と、第１のＰＣＦに対する画像データをユーザに表示する、ディスプレイデバイスとを備える。

いくつかの実施形態では、検出デバイスは、第１のＸＲデバイスプロセッサに接続される、第１のＸＲデバイスの検出デバイスである。

いくつかの実施形態では、マップは、第１のＸＲデバイス上の第１のマップであって、第１のマップを生成するプロセッサは、第１のＸＲデバイスの第１のＸＲデバイスプロセッサである。

いくつかの実施形態では、第１のＰＣＦを生成するプロセッサは、第１のＸＲデバイスの第１のＸＲデバイスプロセッサである。

いくつかの実施形態では、第１のＰＣＦと第１のマップを関連付けるプロセッサは、第１のＸＲデバイスの第１のＸＲデバイスプロセッサである。

いくつかの実施形態では、ＸＲシステムは、第１のＸＲデバイスプロセッサによって実行可能である、アプリケーションと、第１のＸＲデバイスプロセッサによって実行可能であって、第１のＰＣＦ追跡器をアプリケーションからオンに切り替えるためのオンプロンプトを含む、第１のＰＣＦ追跡器であって、第１のＰＣＦ追跡器がオンに切り替えられる場合のみ、第１のＰＣＦを生成する、第１のＰＣＦ追跡器とを備える。

いくつかの実施形態では、第１のＰＣＦ追跡器は、第１のＰＣＦ追跡器をアプリケーションからオフに切り替えるためのオフプロンプトを有し、第１のＰＣＦ追跡器は、第１のＰＣＦ追跡器がオフに切り替えられると、第１のＰＣＦ生成を終了する。

いくつかの実施形態では、ＸＲシステムは、第１のＸＲデバイスプロセッサによって実行可能であって、第１のＰＣＦをサーバに伝送する、マップ発行器と、サーバのサーバプロセッサによって実行可能であって、第１のＰＣＦをサーバの記憶デバイス上に記憶する、マップ記憶ルーチンと、サーバのサーバプロセッサを用いて、第１のＰＣＦを第２のＸＲデバイスに伝送するステップと、第２のＸＲデバイスの第２のＸＲデバイスプロセッサによって実行可能であって、第１のＰＣＦをサーバからダウンロードする、マップダウンロードシステムとを備える。

いくつかの実施形態では、ＸＲシステムは、第２のＸＲデバイスプロセッサによって実行可能である、アプリケーションと、第２のＸＲデバイスプロセッサによって実行可能であって、第２のＰＣＦ追跡器をアプリケーションからオンに切り替えるためのオンプロンプトを含む、第２のＰＣＦ追跡器であって、第２のＰＣＦ追跡器がオンに切り替えられる場合のみ、第２のＰＣＦを生成する、第２のＰＣＦ追跡器とを備える。

いくつかの実施形態では、第２のＰＣＦ追跡器は、第２のＰＣＦ追跡器をアプリケーションからオフに切り替えるためのオフプロンプトを有し、第２のＰＣＦ追跡器は、第２のＰＣＦ追跡器がオフに切り替えられると、第２のＰＣＦ生成を終了する。

いくつかの実施形態では、ＸＲシステムは、第２のＸＲデバイスプロセッサによって実行可能であって、第２のＰＣＦをサーバに伝送する、マップ発行器を備える。

いくつかの実施形態では、ＸＲシステムは、第１のＸＲデバイスプロセッサによって実行可能であって、持続的姿勢をサーバからダウンロードする、持続的姿勢入手器と、第１のＸＲデバイスプロセッサによって実行可能であって、持続的姿勢に基づいて、ＰＣＦを第１のＸＲデバイスの第１の記憶デバイスから読み出す、ＰＣＦ確認器と、第１のＸＲデバイスプロセッサによって実行可能であって、第１の記憶デバイスから読み出されたＰＣＦに基づいて、座標フレームを計算する、座標フレーム計算機とを備える。

いくつかの実施形態は、少なくとも１つの検出デバイスを用いて、実世界オブジェクトの複数の表面を検出するステップと、少なくとも１つのプロセッサを用いて、実世界オブジェクトに基づいて、マップを生成するステップと、少なくとも１つのプロセッサを用いて、マップに基づいて、第１のＰＣＦを生成するステップと、少なくとも１つのプロセッサを用いて、第１のＰＣＦとマップを関連付けるステップと、第１および第２のＸＲデバイスの少なくとも第１および第２のプロセッサを用いて、第１のＰＣＦを、それぞれ、第１および第２のＸＲデバイスの第１および第２の記憶媒体内に記憶するステップとを含む、視認方法に関する。

いくつかの実施形態では、視認方法は、少なくとも１つのプロセッサを用いて、複数のカメラ画像を複数の個別のキーフレームに変換するステップと、少なくとも１つのプロセッサを用いて、複数のキーフレームを平均することによって、持続的姿勢を生成するステップと、少なくとも１つのプロセッサを用いて、追跡マップを持続的姿勢に変換し、追跡マップに対する原点における持続的姿勢を決定するステップと、少なくとも１つのプロセッサによって、持続的姿勢を第１のＰＣＦに変換し、持続的姿勢に対する第１のＰＣＦを決定するステップと、少なくとも１つのプロセッサを用いて、第１のＰＣＦを画像データに変換するステップと、ディスプレイデバイスを用いて、第１のＰＣＦに対する画像データをユーザに表示するステップとを含む。

いくつかの実施形態では、視認方法は、第１のＸＲデバイスプロセッサを用いて、アプリケーションを実行するステップと、第１のＸＲデバイスプロセッサを用いて、アプリケーションからのオンプロンプトで、第１のＰＣＦ追跡器をオンに切り替えるステップであって、第１のＰＣＦ追跡器は、第１のＰＣＦ追跡器がオンに切り替えられる場合のみ、第１のＰＣＦを生成する、ステップとを含む。

いくつかの実施形態では、視認方法は、第１のＸＲデバイスプロセッサを用いて、アプリケーションからのオフプロンプトで、第１のＰＣＦ追跡器をオフに切り替え得るステップであって、第１のＰＣＦ追跡器は、第１のＰＣＦ追跡器がオフに切り替えられると、第１のＰＣＦ生成を終了するステップを含む。

いくつかの実施形態では、視認方法は、第１のＸＲデバイスプロセッサを用いて、第１のＰＣＦをサーバに伝送するステップと、サーバのサーバプロセッサを用いて、第１のＰＣＦをサーバの記憶デバイス上に記憶するステップと、サーバのサーバプロセッサを用いて、第１のＰＣＦを第２のＸＲデバイスに伝送するステップと、第２のＸＲデバイスの第２のＸＲデバイスプロセッサを用いて、第１のＰＣＦをサーバから受信するステップとを含む。

いくつかの実施形態では、視認方法は、第２のＸＲデバイスプロセッサを用いて、アプリケーションを実行するステップと、第２のＸＲデバイスプロセッサを用いて、アプリケーションからのオンプロンプトで、第２のＰＣＦ追跡器をオンに切り替えるステップであって、第２のＰＣＦ追跡器は、第２のＰＣＦ追跡器がオンに切り替えられる場合のみ、第２のＰＣＦを生成する、ステップとを含む。

いくつかの実施形態では、視認方法は、第１のＸＲデバイスプロセッサを用いて、アプリケーションからのオフプロンプトで、第２のＰＣＦ追跡器をオフに切り替えるステップであって、第２のＰＣＦ追跡器は、第２のＰＣＦ追跡器がオフに切り替えられると、第２のＰＣＦ生成を終了するステップを含む。

いくつかの実施形態では、視認方法は、第２のＸＲデバイスプロセッサを用いて、第２のＰＣＦをサーバにアップロードするステップを含む。

いくつかの実施形態では、視認方法は、第１のＸＲデバイスプロセッサを用いて、持続的姿勢をサーバから決定するステップと、第１のＸＲデバイスプロセッサを用いて、持続的姿勢に基づいて、ＰＣＦを第１のＸＲデバイスの第１の記憶デバイスから読み出すステップと、第１のＸＲデバイスプロセッサを用いて、第１の記憶デバイスから読み出されたＰＣＦに基づいて、座標フレームを計算するステップとを含む。

いくつかの実施形態は、第１のＸＲデバイスプロセッサと、第１のＸＲデバイスプロセッサに接続される、第１のＸＲデバイス記憶デバイスと、第１のＸＲデバイスプロセッサによって実行可能であって、持続的姿勢をサーバからダウンロードする、ダウンロードシステムと、第１のＸＲデバイスプロセッサによって実行可能であって、持続的姿勢に基づいて、ＰＣＦを第１のＸＲデバイスの第１の記憶デバイスから読み出す、ＰＣＦ読出器と、第１のＸＲデバイスプロセッサによって実行可能であって、第１の記憶デバイスから読み出されたＰＣＦに基づいて、座標フレームを計算する、座標フレーム計算機とを含む、第１のＸＲデバイスプロセッサ上の命令のセットとを含み得る、第１のＸＲデバイスを備えるＸＲシステムに関する。

いくつかの実施形態は、第１のＸＲデバイスの第１のＸＲデバイスプロセッサを用いて、持続的姿勢をサーバからダウンロードするステップと、第１のＸＲデバイスプロセッサを用いて、持続的姿勢に基づいて、ＰＣＦを第１のＸＲデバイスの第１の記憶デバイスから読み出すステップと、第１のＸＲデバイスプロセッサを用いて、第１の記憶デバイスから読み出されたＰＣＦに基づいて、座標フレームを計算するステップとを含む、視認方法に関する。

いくつかの実施形態は、サーバプロセッサと、サーバプロセッサに接続される、サーバ記憶デバイスと、サーバのサーバプロセッサを用いて実行可能であって、マップと関連付けられた第１のＰＣＦをサーバのサーバ記憶デバイス上に記憶する、マップ記憶ルーチンと、サーバプロセッサを用いて、サーバプロセッサを用いて実行可能であって、マップおよび第１のＰＣＦを第１のＸＲデバイスに伝送する、マップ伝送機とを含み得る、サーバを含む、ＸＲデバイスに関する。

いくつかの実施形態は、サーバのサーバプロセッサを用いて、マップと関連付けられた第１のＰＣＦをサーバのサーバ記憶デバイス上に記憶するステップと、サーバのサーバプロセッサを用いて、マップおよび第１のＰＣＦを第１のＸＲデバイスに伝送するステップとを含む、視認方法に関する。

いくつかの実施形態は、ＸＲデバイスのプロセッサによって、ユーザの頭部に固着される頭部搭載型フレーム上の捕捉デバイスを用いて、環境を捕捉し、頭部搭載型フレームの配向を決定することによって、頭部姿勢の追跡に入るステップと、プロセッサによって、頭部搭載型フレームの配向決定不能に起因して、頭部姿勢が喪失されたかどうかを決定するステップと、頭部姿勢が、喪失された場合、プロセッサによって、姿勢復元モードに入り、頭部搭載型フレームの配向を決定することによって、頭部姿勢を確立するステップとを含む、視認方法に関する。

いくつかの実施形態では、頭部姿勢が、喪失されていない場合、プロセッサによって、頭部姿勢の追跡に入る。

いくつかの実施形態では、姿勢復元は、プロセッサによって、環境の捕捉を改良するための提案とともに、メッセージをユーザに表示するステップを含む。

いくつかの実施形態では、提案は、光を増加させるステップおよびテクスチャを精緻化するステップのうちの少なくとも１つである。

いくつかの実施形態では、視認方法は、プロセッサによって、復元が失敗したかどうかを決定するステップと、復元が、失敗した場合、プロセッサによって、頭部姿勢を確立するステップを含む、新しいセッションを開始するステップとを含む。

いくつかの実施形態では、視認方法は、プロセッサによって、新しいセッションが開始されるであろうことのメッセージをユーザに表示するステップを含む。

いくつかの実施形態では、視認方法は、頭部姿勢が、喪失されていない場合、プロセッサによって、頭部姿勢の追跡に入るステップを含む。

いくつかの実施形態は、コンピューティングシステムを動作させ、仮想オブジェクトを、１つ以上の物理的オブジェクトを備える、場面内にレンダリングする方法に関する。本方法は、場面に関する複数の画像をユーザによって装着される第１のデバイスの１つ以上のセンサから捕捉するステップと、少なくとも部分的に、複数の画像に基づいて、１つ以上の持続的姿勢を算出するステップと、複数の画像の情報が、持続的座標フレームを介して、第１のデバイスおよび／または第２のデバイス上で起動する１つ以上のアプリケーションによって、異なる時間にアクセスされ得るように、少なくとも部分的に、算出された１つ以上の持続的姿勢に基づいて、持続的座標フレームを生成するステップとを含む。

いくつかの実施形態では、少なくとも部分的に、複数の画像に基づいて、１つ以上の持続的姿勢を算出するステップは、１つ以上の特徴を複数の画像のそれぞれから抽出するステップと、１つ以上の特徴毎に、記述子を生成するステップと、少なくとも部分的に、記述子に基づいて、複数の画像毎に、キーフレームを生成するステップと、少なくとも部分的に、１つ以上のキーフレームに基づいて、１つ以上の持続的姿勢を生成するステップとを含む。

いくつかの実施形態では、少なくとも部分的に、算出された１つ以上の持続的姿勢に基づいて、持続的座標フレームを生成するステップは、第１のデバイスが以前の持続的座標フレームの場所から所定の距離を進行すると、持続的座標フレームを生成するステップを含む。

いくつかの実施形態では、所定の距離は、２～２０メートルであって、デバイスの算出リソースの消費および仮想オブジェクトの設置誤差の両方に基づく。

いくつかの実施形態では、本方法は、第１のデバイスが電源投入されると、初期持続的姿勢を生成するステップと、第１のデバイスが、円形の中心としての初期持続的姿勢および閾値距離に等しい半径を伴う、円形の周に到達すると、第１のデバイスの現在の場所において第１の持続的姿勢を生成するステップとを含む。

いくつかの実施形態では、円形は、第１の円形である。本方法はさらに、デバイスが、円形の中心としての第１の持続的姿勢および閾値距離の２倍に等しい半径を伴う、第２の円形の周に到達すると、第１のデバイスの現在の場所で第２の持続的姿勢を生成するステップを含む。

いくつかの実施形態では、第１のデバイスが、既存の持続的姿勢を初期持続的姿勢からの閾値距離内に見出すとき、第１の持続的姿勢は、生成されない。

いくつかの実施形態では、第１のデバイスは、第１の持続的姿勢に、第１の持続的姿勢までの所定の距離内にある、複数のキーフレームのうちの１つ以上のものを結び付ける。

いくつかの実施形態では、第１のデバイス上で起動するアプリケーションが持続的姿勢を要求しない限り、第１の持続的姿勢は、生成されない。

いくつかの実施形態は、ユーザによって携行可能な電子システムに関する。電子システムは、場面内の１つ以上の物理的オブジェクトに関する画像を捕捉するように構成される、１つ以上のセンサと、コンピュータ実行可能命令を実行し、仮想コンテンツを場面内にレンダリングするように構成される、アプリケーションと、コンピュータ実行可能命令を実行し、仮想コンテンツについての画像データをアプリケーションに提供するように構成される、少なくとも１つのプロセッサであって、コンピュータ実行可能命令は、少なくとも部分的に、捕捉された画像に基づいて、持続座標フレームを生成するための命令を備える、少なくとも１つのプロセッサとを含む。

本開示の前述の実施形態は、多数の方法のいずれかにおいて実装されることができる。例えば、実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせを使用して実装されてもよい。ソフトウェア内に実装されるとき、ソフトウェアコードが、単一コンピュータ内に提供される、または複数のコンピュータ間に分散されるかどうかにかかわらず、任意の好適なプロセッサまたはプロセッサの集合上で実行されることができる。そのようなプロセッサは、いくつか挙げると、ＣＰＵチップ、ＧＰＵチップ、マイクロプロセッサ、マイクロコントローラ、またはコプロセッサ等、当技術分野において公知の市販の集積回路コンポーネントを含む、集積回路コンポーネント内の１つ以上のプロセッサとともに、集積回路として実装されてもよい。いくつかの実施形態では、プロセッサは、ＡＳＩＣ等のカスタム回路内に、またはプログラマブル論理デバイスを構成することから生じる半カスタム回路内に実装されてもよい。さらなる代替として、プロセッサは、市販、半カスタム、またはカスタムかどうかにかかわらず、より大きい回路または半導体デバイスの一部であってもよい。具体的実施例として、いくつかの市販のマイクロプロセッサは、１つまたはそれらのコアのサブセットがプロセッサを構成し得るように、複数のコアを有する。但し、プロセッサは、任意の好適なフォーマットにおける回路を使用して実装されてもよい。

さらに、コンピュータは、ラックマウント式コンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、またはタブレットコンピュータ等のいくつかの形態のうちのいずれかで具現化され得ることを理解されたい。加えて、コンピュータは、携帯情報端末（ＰＤＡ）、スマートフォン、または任意の好適な携帯用または固定電子デバイスを含む、概してコンピュータと見なされないが好適な処理能力を伴う、デバイスで具現化されてもよい。

また、コンピュータは、１つ以上の入力および出力デバイスを有してもよい。これらのデバイスは、とりわけ、ユーザインターフェースを提示するために使用されることができる。ユーザインターフェースを提供するために使用され得る、出力デバイスの実施例は、出力の視覚的提示のためのプリンタまたはディスプレイ画面、または出力の可聴提示のためのスピーカまたは他の音生成デバイスを含む。ユーザインターフェースのために使用され得る、入力デバイスの実施例は、キーボード、およびマウス、タッチパッド、およびデジタル化タブレット等のポインティングデバイスを含む。別の実施例として、コンピュータは、発話認識を通して、または他の可聴フォーマットにおいて、入力情報を受信してもよい。図示される実施形態では、入力／出力デバイスは、コンピューティングデバイスと物理的に別個として図示される。しかしながら、いくつかの実施形態では、入力および／または出力デバイスは、プロセッサと同一ユニットまたはコンピューティングデバイスの他の要素の中に物理的に統合されてもよい。例えば、キーボードは、タッチスクリーン上のソフトキーボードとして実装され得る。いくつかの実施形態では、入力／出力デバイスは、コンピューティングデバイスから完全に接続解除され、無線接続を通して機能的に統合されてもよい。

そのようなコンピュータは、企業ネットワークまたはインターネット等、ローカル面積ネットワークまたは広域ネットワークとしての形態を含む、任意の好適な形態の１つ以上のネットワークによって相互接続されてもよい。そのようなネットワークは、任意の好適な技術に基づいてもよく、任意の好適なプロトコルに従って動作してもよく、無線ネットワーク、有線ネットワーク、または光ファイバネットワークを含んでもよい。

また、本明細書で概説される種々の方法およびプロセスは、種々のオペレーティングシステムまたはプラットフォームのうちのいずれか１つを採用する、１つ以上のプロセッサ上で実行可能である、ソフトウェアとしてコード化されてもよい。加えて、そのようなソフトウェアは、いくつかの好適なプログラミング言語および／またはプログラミングまたはスクリプト作成ツールのうちのいずれかを使用して、書き込まれてもよく、また、フレームワークまたは仮想マシン上で実行される実行可能機械言語コードまたは中間コードとしてコンパイルされてもよい。

本側面では、本開示は、１つ以上のコンピュータまたは他のプロセッサ上で実行されるときに、上記で議論される本開示の種々の実施形態を実装する方法を行う、１つ以上のプログラムで符号化される、コンピュータ可読記憶媒体（または複数のコンピュータ可読媒体）（例えば、コンピュータメモリ、１つ以上のフロッピー（登録商標）ディスク、コンパクトディスク（ＣＤ）、光学ディスク、デジタルビデオディスク（ＤＶＤ）、磁気テープ、フラッシュメモリ、フィールドプログラマブルゲートアレイまたは他の半導体デバイス内の回路構成、または他の有形コンピュータ記憶媒体）として具現化されてもよい。前述の実施例から明白なように、コンピュータ可読記憶媒体は、非一過性形態においてコンピュータ実行可能命令を提供するために十分な時間の間、情報を留保し得る。そのようなコンピュータ可読記憶媒体または複数の媒体は、上記に記載されるように、その上に記憶される１つまたは複数のプログラムが、本開示の種々の側面を実装するように１つ以上の異なるコンピュータまたは他のプロセッサ上にロードされ得るように、トランスポータブルであることができる。本明細書で使用されるように、用語「コンピュータ可読記憶媒体」は、製造（すなわち、製造品）または機械と見なされ得るコンピュータ可読媒体のみを包含する。いくつかの実施形態では、本開示は、伝搬信号等のコンピュータ可読記憶媒体以外のコンピュータ可読媒体として具現化されてもよい。

用語「プログラム」または「ソフトウェア」は、上記に記載されるように、本開示の種々の側面を実装するようにコンピュータまたは他のプロセッサをプログラムするために採用され得る、任意のタイプのコンピュータコードまたはコンピュータ実行可能命令のセットを指すために、一般的意味において本明細書で使用される。加えて、本実施形態の一側面によると、実行されると、本開示の方法を行う、１つ以上のコンピュータプログラムは、単一のコンピュータまたはプロセッサ上に常駐する必要はないが、本開示の種々の側面を実装するように、いくつかの異なるコンピュータまたはプロセッサの間でモジュール様式において分散され得ることを理解されたい。

コンピュータ実行可能命令は、１つ以上のコンピュータまたは他のデバイスによって実行される、プログラムモジュール等の多くの形態であってもよい。概して、プログラムモジュールは、特定のタスクを行う、または特定の抽象データタイプを実装する、ルーチン、プログラム、オブジェクト、構成要素、データ構造等を含む。典型的には、プログラムモジュールの機能性は、種々の実施形態では、所望に応じて、組み合わせられる、または分散されてもよい。

また、データ構造は、任意の好適な形態でコンピュータ可読媒体に記憶されてもよい。例証を簡単にするために、データ構造は、データ構造内の場所を通して関係付けられるフィールドを有することが示されてもよい。そのような関係は、同様に、フィールド間の関係を伝えるコンピュータ可読媒体内の場所を伴うフィールドのために記憶装置を割り当てることによって、達成されてもよい。しかしながら、ポインタ、タグ、またはデータ要素間の関係を確立する他の機構の使用を通すことを含む、任意の好適な機構が、データ構造のフィールド内の情報の間の関係を確立するために使用されてもよい。

本開示の種々の側面は、単独で、組み合わせて、または前述の実施形態に具体的に議論されない種々の配列において使用されてもよく、したがって、その用途は、前述の説明に記載される、または図面に図示されるコンポーネントの詳細および配列に限定されない。例えば、一実施形態に説明される側面は、他の実施形態に説明される側面と任意の様式で組み合わせられてもよい。

また、本開示は、その実施例が提供されている、方法として具現化されてもよい。方法の一部として行われる作用は、任意の好適な方法で順序付けられてもよい。故に、例証的実施形態では、連続作用として示されるが、いくつかの作用を同時に行うことを含み得る、作用が図示されるものと異なる順序で行われる、実施形態が構築されてもよい。

請求項要素を修飾するための請求項における「第１の」、「第２の」、「第３の」等の順序の用語の使用は、単独では、別の要素と比べた１つの請求項要素のいかなる優先順位、先行、または順序、または方法の行為が行われる時間順序も含意しないが、順序の用語は、請求項要素を区別するために、（順序の用語の使用のためであるが）ある名前を有する１つの請求項要素と、同一の名前を有する別の要素を区別する標識としてのみ使用される。

また、本明細書で使用される語句および専門用語は、説明目的のためのものであって、限定と見なされるべきではない。本明細書の「～を含む」、「～を備える」、または「～を有する」、「～を含有する」、「～を伴う」、およびその変形の使用は、その後列挙されたアイテムおよびその均等物および付加的アイテムを包含することを意味する。

Claims

電子システムであって、前記電子システムは、
３Ｄ環境（３次元環境）についての情報を捕捉するように構成されている１つ以上のセンサであって、前記捕捉された情報は、複数の画像を備える、１つ以上のセンサと、
コンピュータ実行可能な命令を実行することにより、前記複数の画像に基づいて、前記３Ｄ環境の少なくとも一部のマップを生成するように構成されている少なくとも１つのプロセッサと
を備え、
前記コンピュータ実行可能な命令は、
前記複数の画像内の複数の特徴を識別することであって、前記複数の特徴は、前記３Ｄ環境内の複数のオブジェクトの複数の部分に対応する、ことと、
前記複数の画像内の前記複数の特徴に少なくとも部分的に基づいて、前記複数の画像の中から複数のキーフレームを選択することと、
前記選択されたキーフレームの前記識別された複数の特徴に少なくとも部分的に基づいて、１つ以上の座標フレームを生成することであって、前記１つ以上の座標フレームは、前記３Ｄ環境の前記マップ内の前記３Ｄ環境の１つ以上の場所を記述したものである、ことと、
前記１つ以上の座標フレームを１つ以上の持続的座標フレームとして記憶することであって、前記１つ以上の持続的座標フレームは、前記３Ｄ環境の前記マップ内のそれぞれのセットの特徴の場所に対して前記３Ｄ環境の前記１つ以上の場所を記述したものであり、前記１つ以上の持続的座標フレームは、前記１つ以上の座標フレームに関連付けられている前記３Ｄ環境の前記マップ内の前記それぞれのセットの特徴の前記場所に基づいて定義されている、ことと
を行うための命令をさらに備える、電子システム。
前記１つ以上のセンサは、前記複数の画像の各画像が複数のピクセルを備えるように２次元アレイで配列されている複数のピクセル回路を備え、
各特徴は、複数のピクセルに対応する、請求項１に記載の電子システム。
前記複数の画像内の複数の特徴を識別することは、前記識別された特徴として、持続的オブジェクトの部分を描写するピクセルの群との類似性の測定値に基づいて、前記ピクセルの群の所定の最大値未満の数を選択することを含む、請求項１に記載の電子システム。
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレームのそれぞれに対して、
そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセットを表す記述子
を記憶することを含む、請求項１に記載の電子システム。
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレームのそれぞれに対して、
そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセット
を記憶することを含む、請求項１に記載の電子システム。
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレームのそれぞれに対して、
前記３Ｄ環境のマップの座標フレームと前記持続的座標フレームとの間の変換と、
そこから前記座標フレームが生成された選択されたキーフレームの前記３Ｄ環境内の場所を示す地理的情報と
を記憶することを含む、請求項１に記載の電子システム。
前記地理的情報は、前記場所のＷｉＦｉフィンガプリントを備える、請求項６に記載の電子システム。
前記コンピュータ実行可能な命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える、請求項１に記載の電子システム。
前記人工ニューラルネットワークは、第１の人工ニューラルネットワークであり、
前記コンピュータ実行可能な命令は、前記キーフレーム内の前記識別された特徴のための前記算出された特徴記述子に少なくとも部分的に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成されている第２の人工ニューラルネットワークを実装するための命令を備える、請求項８に記載の電子システム。
前記コンピュータ実行可能な命令は、
アプリケーションプログラミングインターフェースであって、前記アプリケーションプログラミングインターフェースは、ポータブル電子システム上で実行されるアプリケーションに、前記１つ以上の持続的座標フレームの持続的座標フレームを特徴付ける情報を提供するように構成されている、アプリケーションプログラミングインターフェースと、
第２の複数の画像に基づいて、前記３Ｄ環境のマップを精緻化するための命令と、
前記第２の複数の画像に少なくとも部分的に基づいて、前記持続的座標フレームのうちの１つ以上のものを調節することと、
前記アプリケーションプログラミングインターフェースを通して前記調節された持続的座標フレームの通知を提供するための命令と
をさらに備える、請求項１に記載の電子システム。
前記１つ以上の持続的座標フレームを調節することは、前記３Ｄ環境のマップの原点に対する前記１つ以上の持続的座標フレームの平行移動および回転を調節することを含む、請求項１０に記載の電子システム。
前記電子システムは、ウェアラブルデバイスを備え、前記１つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記マップは、前記ウェアラブルデバイス上で算出された追跡マップであり、
前記マップの原点は、前記ウェアラブルデバイスが電源投入された場所に基づいて決定される、請求項１１に記載の電子システム。
前記電子システムは、ウェアラブルデバイスを備え、前記１つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記コンピュータ実行可能な命令は、
前記ウェアラブルデバイスの運動を追跡することと、
閾値距離を超える前記ウェアラブルデバイスの運動を示す前記追跡された運動に基づいて、１つ以上の座標フレームを生成するための命令および／または１つ以上の持続的座標フレームを記憶するための命令の実行のタイミングを制御することであって、前記閾値距離は、２～２０メートルである、ことと
を行うための命令をさらに備える、請求項１に記載の電子システム。
前記１つ以上のセンサは、前記複数の画像の各画像が複数のピクセルを備えるように２次元アレイで配列されている複数のピクセル回路を備え、
各特徴は、複数のピクセルに対応する、請求項３に記載の電子システム。
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレームのそれぞれに対して、
そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセットを表す記述子
を記憶することを含む、請求項３に記載の電子システム。
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレームのそれぞれに対して、
そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセット
を記憶することを含む、請求項３に記載の電子システム。
前記１つ以上の座標フレームを記憶することは、前記１つ以上の座標フレームのそれぞれに対して、
前記３Ｄ環境のマップの座標フレームと前記持続的座標フレームとの間の変換と、
そこから前記座標フレームが生成された選択されたキーフレームの前記３Ｄ環境内の場所を示す地理的情報と
を記憶することを含む、請求項３に記載の電子システム。
前記コンピュータ実行可能な命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える、請求項３に記載の電子システム。
前記人工ニューラルネットワークは、第１の人工ニューラルネットワークであり、
前記コンピュータ実行可能な命令は、前記キーフレーム内の前記識別された特徴のための前記算出された特徴記述子に少なくとも部分的に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成されている第２の人工ニューラルネットワークを実装するための命令を備える、請求項１８に記載の電子システム。
前記コンピュータ実行可能な命令は、
アプリケーションプログラミングインターフェースであって、前記アプリケーションプログラミングインターフェースは、ポータブル電子システム上で実行されるアプリケーションに、前記１つ以上の持続的座標フレームの持続的座標フレームを特徴付ける情報を提供するように構成されている、アプリケーションプログラミングインターフェースと、
第２の複数の画像に基づいて、前記３Ｄ環境のマップを精緻化するための命令と、
前記第２の複数の画像に少なくとも部分的に基づいて、前記持続的座標フレームのうちの１つ以上のものを調節することと、
前記アプリケーションプログラミングインターフェースを通して前記調節された持続的座標フレームの通知を提供するための命令と
をさらに備える、請求項３に記載の電子システム。
前記１つ以上の持続的座標フレームを調節することは、前記３Ｄ環境のマップの原点に対する前記１つ以上の持続的座標フレームの平行移動および回転を調節することを含む、請求項２０に記載の電子システム。
前記電子システムは、ウェアラブルデバイスを備え、前記１つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記マップは、前記ウェアラブルデバイス上で算出された追跡マップであり、
前記マップの原点は、前記ウェアラブルデバイスが電源投入された場所に基づいて決定される、請求項２１に記載の電子システム。
前記電子システムは、ウェアラブルデバイスを備え、前記１つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記コンピュータ実行可能な命令は、
前記ウェアラブルデバイスの運動を追跡することと、
閾値距離を超える前記ウェアラブルデバイスの運動を示す前記追跡された運動に基づいて、１つ以上の座標フレームを生成するための命令および／または１つ以上の持続的座標フレームを記憶するための命令の実行のタイミングを制御することであって、前記閾値距離は、２～２０メートルである、ことと
を行うための命令をさらに備える、請求項３に記載の電子システム。
前記コンピュータ実行可能な命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える、請求項１３に記載の電子システム。
前記人工ニューラルネットワークは、第１の人工ニューラルネットワークであり、
前記コンピュータ実行可能な命令は、前記キーフレーム内の前記識別された特徴のための前記算出された特徴記述子に少なくとも部分的に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成されている第２の人工ニューラルネットワークを実装するための命令を備える、請求項２４に記載の電子システム。
前記コンピュータ実行可能な命令は、
アプリケーションプログラミングインターフェースであって、前記アプリケーションプログラミングインターフェースは、ポータブル電子システム上で実行されるアプリケーションに、前記１つ以上の持続的座標フレームの持続的座標フレームを特徴付ける情報を提供するように構成されている、アプリケーションプログラミングインターフェースと、
第２の複数の画像に基づいて、前記３Ｄ環境のマップを精緻化するための命令と、
前記第２の複数の画像に少なくとも部分的に基づいて、前記持続的座標フレームのうちの１つ以上のものを調節することと、
前記アプリケーションプログラミングインターフェースを通して前記調節された持続的座標フレームの通知を提供するための命令と
をさらに備える、請求項１３に記載の電子システム。
前記１つ以上の持続的座標フレームを調節することは、前記３Ｄ環境のマップの原点に対する前記１つ以上の持続的座標フレームの平行移動および回転を調節することを含む、請求項２６に記載の電子システム。
前記電子システムは、ウェアラブルデバイスを備え、前記１つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記マップは、前記ウェアラブルデバイス上で算出された追跡マップであり、
前記マップの原点は、前記ウェアラブルデバイスが電源投入された場所に基づいて決定される、請求項２７に記載の電子システム。