JP7526169B2 - クロスリアリティシステム - Google Patents

クロスリアリティシステム Download PDF

Info

Publication number
JP7526169B2
JP7526169B2 JP2021518528A JP2021518528A JP7526169B2 JP 7526169 B2 JP7526169 B2 JP 7526169B2 JP 2021518528 A JP2021518528 A JP 2021518528A JP 2021518528 A JP2021518528 A JP 2021518528A JP 7526169 B2 JP7526169 B2 JP 7526169B2
Authority
JP
Japan
Prior art keywords
map
persistent
coordinate
user
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021518528A
Other languages
English (en)
Other versions
JP2022509731A (ja
JPWO2020072972A5 (ja
Inventor
アヌシュ モハン,
ロバート ブレイク テイラー,
ジェレミー ドウェイン ミランダ,
ラファエル ドミンゴス トーレス,
ダニエル オルシャンスキー,
アリ シャーロクニー,
エラン ゲンデルマン,
ニック クラマー,
ケン トッセル,
サミュエル エー. ミラー,
ジェハンギール タジク,
アシュウィン スワミナサン,
ロメシュ アガルワル,
プラティーク シンガル,
ジョエル デイビッド ホルダー,
シュアン ジャオ,
シッダルタ チョーダリー,
ヘルダー トシロウ スズキ,
ヒラル ホナル バロット,
クリスチャン イヴァン ロバート ムーア,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Magic Leap Inc
Original Assignee
Magic Leap Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Magic Leap Inc filed Critical Magic Leap Inc
Publication of JP2022509731A publication Critical patent/JP2022509731A/ja
Publication of JPWO2020072972A5 publication Critical patent/JPWO2020072972A5/ja
Priority to JP2024087120A priority Critical patent/JP2024103610A/ja
Application granted granted Critical
Publication of JP7526169B2 publication Critical patent/JP7526169B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04815Interaction with a metaphor-based environment or interaction object displayed as three-dimensional, e.g. changing the user viewpoint with respect to the environment or object
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Graphics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)

Description

(関連出願の相互参照)
本特許出願は、参照することによってその全体として本明細書に組み込まれる、2018年10月5日に出願され、「COORDINATE FRAME PROCESSING AUGMENTED REALITY」と題された、米国仮特許出願第62/742,237号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、2019年3月1日に出願され、「MERGING A PLURALITY OF INDIVIDUALLY MAPPED ENVIRONMENTS」と題された、米国仮特許出願第62/812,935号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、2019年3月8日に出願され、「VIEWING DEVICE OR VIEWING DEVICES HAVING ONE OR MORE COORDINATE FRAME TRANSFORMERS」と題された、米国仮特許出願第62/815,955号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、2019年6月28日に出願され、「RANKING AND MERGING A PLURALITY OF ENVIRONMENT MAPS」と題された、米国仮特許出願第62/868,786号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、2019年7月5日に出願され、「RANKING AND MERGING A PLURALITY OF ENVIRONMENT MAPS」と題された、米国仮特許出願第62/870,954号の優先権および利益を主張する。本特許出願はまた、参照することによってその全体として本明細書に組み込まれる、2019年8月7日に出願され、「A VIEWING SYSTEM」と題された、米国仮特許出願第62/884,109号の優先権および利益を主張する。
本願は、概して、クロスリアリティシステムに関する。
コンピュータは、ヒューマンユーザインターフェースを制御し、ユーザによって知覚されるにつれて、XR環境の一部または全部がコンピュータによって生成される、Xリアリティ(XRまたはクロスリアリティ)環境を作成し得る。これらのXR環境は、XR環境の一部または全部が、部分的に、環境を説明するデータを使用して、コンピュータによって生成され得る、仮想現実(VR)、拡張現実(AR)、および複合現実(MR)環境であり得る。本データは、例えば、ユーザが、物理的世界の一部として、感知または知覚し、仮想オブジェクトと相互作用し得るようにレンダリングされ得る、仮想オブジェクトを説明し得る。ユーザは、例えば、頭部搭載型ディスプレイデバイス等のユーザインターフェースデバイスを通してレンダリングおよび提示されているデータの結果として、これらの仮想オブジェクトを体験し得る。データは、ユーザに見えるように表示され得る、またはユーザに聞こえるように再生される、オーディオを制御し得る、または触知的(または触覚的)インターフェースを制御し、ユーザが、仮想オブジェクトを感じるにつれて、ユーザが感知または知覚する、タッチ感覚を体験することを可能にし得る。
XRシステムは、科学的可視化、医療訓練、工学設計、およびプロトタイプ化、遠隔操作およびテレプレゼンス、および個人的娯楽の分野に及ぶ、多くの用途のために有用であり得る。ARおよびMRは、VRと対照的に、物理的世界の実オブジェクトと関連して、1つ以上のオブジェクトを含む。実オブジェクトと相互作用する、仮想オブジェクトの体験は、概して、XRシステムを使用する際、ユーザの享受を向上させ、また、物理的世界が改変され得る様子についての現実的かつ容易に理解可能な情報を提示する、種々の用途のための可能性を広げる。
仮想コンテンツを現実的にレンダリングするために、XRシステムは、システムのユーザの周囲の物理的世界の表現を構築し得る。本表現は、例えば、XRシステムの一部を形成する、ウェアラブルデバイス上のセンサを用いて入手された処理画像によって構築されてもよい。そのようなシステムでは、ユーザは、システムがその環境の表現を構築するために十分な情報を入手するまで、ユーザがXRシステムを使用することを意図する部屋または他の物理的環境を見て回ることによって、初期化ルーチンを実施し得る。システムが動作し、ユーザが環境の周囲を、または他の環境へと動き回るにつれて、ウェアラブルデバイス上のセンサは、付加的情報を入手し、物理的世界の表現を拡張または更新し得る。
本願の側面は、Xリアリティ(クロスリアリティまたはXR)場面を提供するための方法および装置に関する。本明細書に説明される技法は、ともに、別個に、または任意の好適な組み合わせにおいて、使用されてもよい。
いくつかの実施形態は、3次元(3D)環境についての情報を捕捉するように構成される、1つ以上のセンサを含む、電子システムに関する。捕捉された情報は、複数の画像を含む。電子システムは、コンピュータ実行可能命令を実行し、複数の画像に基づいて、3D環境の少なくとも一部のマップを生成するように構成される、少なくとも1つのプロセッサを含む。コンピュータ実行可能命令はさらに、複数の画像内の複数の特徴を識別するステップと、少なくとも部分的に、選択されたキーフレームの複数の特徴に基づいて、複数のキーフレームを複数の画像の中から選択するステップと、少なくとも部分的に、選択されたキーフレームの識別された特徴に基づいて、1つ以上の座標フレームを生成するステップと、3D環境のマップと関連付けて、1つ以上の座標フレームを1つ以上の持続的座標フレームとして記憶するステップとのための命令を含む。
いくつかの実施形態では、1つ以上のセンサは、複数の画像の各画像が複数のピクセルを備えるように2次元アレイで配列される、複数のピクセル回路を備える。各特徴は、複数のピクセルに対応する。
いくつかの実施形態では、複数の画像内の複数の特徴を識別するステップは、識別された特徴として、持続的オブジェクトの部分を描写するピクセルの群との類似性の測定値に基づいて、ピクセルの群の所定の最大値未満の数を選択するステップを含む。
いくつかの実施形態では、1つ以上の座標フレームを記憶するステップは、1つ以上の座標フレーム毎に、そこから座標フレームが生成された、選択されたキーフレーム内の特徴の少なくともサブセットを表す、記述子を記憶するステップを含む。
いくつかの実施形態では、1つ以上の座標フレームを記憶するステップは、1つ以上の座標フレーム毎に、そこから座標フレームが生成された、選択されたキーフレーム内の特徴の少なくともサブセットを記憶するステップを含む。
いくつかの実施形態では、1つ以上の座標フレームを記憶するステップは、1つ以上の座標フレーム毎に、3D環境のマップの座標フレームと持続的座標フレームとの間の変換と、そこから座標フレームが生成された、選択されたキーフレームの3D環境内の場所を示す、地理的情報とを記憶するステップを含む。
いくつかの実施形態では、地理的情報は、その場所のWiFiフィンガプリントを備える。
いくつかの実施形態では、コンピュータ実行可能命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える。
いくつかの実施形態では、第1の人工ニューラルネットワークは、第1の人工ニューラルネットワークである。コンピュータ実行可能命令は、少なくとも部分的に、キーフレーム内の識別された特徴のための算出された特徴記述子に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成される、第2の人工ニューラルネットワークを実装するための命令を備える。
いくつかの実施形態では、コンピュータ実行可能命令はさらに、ポータブル電子システム上で実行されるアプリケーションに、1つ以上の持続的座標フレームの持続的座標フレームを特徴付ける、情報を提供するように構成される、アプリケーションプログラミングインターフェースと、第2の複数の画像に基づいて、3D環境のマップを精緻化するための命令と、少なくとも部分的に、第2の複数の画像に基づいて、持続的座標フレームのうちの1つ以上のものを調節するための命令と、アプリケーションプログラミングインターフェースを通して調節された持続的座標フレームの通知を提供するための命令とを備える。
いくつかの実施形態では、1つ以上の持続的座標フレームを調節するステップは、3D環境のマップの原点に対する1つ以上の持続的座標フレームの平行移動および回転を調節するステップを含む。
いくつかの実施形態では、電子システムは、ウェアラブルデバイスを備え、1つ以上のセンサは、ウェアラブルデバイス上に搭載される。マップは、ウェアラブルデバイス上で算出された追跡マップである。マップの原点は、デバイスが電源投入された場所に基づいて決定される。
いくつかの実施形態では、電子システムは、ウェアラブルデバイスを備え、1つ以上のセンサは、ウェアラブルデバイス上に搭載される。コンピュータ実行可能命令はさらに、ポータブルデバイスの運動を追跡するステップと、閾値距離を超えるウェアラブルデバイスの運動を示す、追跡された運動に基づいて、1つ以上の座標フレームを生成するための命令および/または1つ以上の持続的座標フレームを記憶するための命令の実行のタイミングを制御するステップであって、閾値距離は、2~20メートルである、ステップとのための命令を備える。
いくつかの実施形態は、電子システムを動作させ、ポータブルデバイスを備える、3D環境内に仮想コンテンツをレンダリングする方法に関する。本方法は、1つ以上のプロセッサを用いて、ポータブルデバイス上に、ポータブルデバイス上の1つ以上のセンサの出力に基づいて、ポータブルデバイスにローカルの座標フレームを維持するステップと、記憶された座標フレームを3D環境についての記憶された空間情報から取得するステップと、ポータブルデバイスにローカルの座標フレームと取得された記憶された座標フレームとの間の変換を算出するステップと、仮想オブジェクトにローカルの座標フレームを有する、仮想オブジェクトの仕様と、選択された記憶された座標フレームに対する仮想オブジェクトの場所とを受信するステップと、少なくとも部分的に、算出された変換および仮想オブジェクトの受信された場所に基づいて、決定された場所において、仮想オブジェクトをポータブルデバイスのディスプレイ上にレンダリングするステップとを含む。
いくつかの実施形態では、記憶された座標フレームを取得するステップは、アプリケーションプログラミングインターフェース(API)を通して、座標フレームを取得するステップを含む。
いくつかの実施形態では、ポータブルデバイスは、1つ以上のプロセッサの第1のプロセッサを備える、第1のポータブルデバイスを備える。本システムはさらに、1つ以上のプロセッサの第2のプロセッサを備える、第2のポータブルデバイスを備える。第1および第2のデバイスのそれぞれ上のプロセッサは、同一の記憶された座標フレームを取得し、個別のデバイスにローカルの座標フレームと取得された同一記憶された座標フレームとの間の変換を算出し、仮想オブジェクトの仕様を受信し、仮想オブジェクトを個別のディスプレイ上にレンダリングする。
いくつかの実施形態では、第1および第2のデバイスはそれぞれ、複数のカメラ画像を出力するように構成される、カメラと、複数のカメラ画像を複数のキーフレームに変換するように構成される、キーフレーム生成器と、複数のキーフレームを平均することによって、持続的姿勢を生成するように構成される、持続的姿勢計算機と、追跡マップを持続的姿勢に変換し、追跡マップの原点に対する持続的姿勢を決定するように構成される、追跡マップおよび持続的姿勢変換器と、持続的姿勢をPCFに変換するように構成される、持続的姿勢および持続的座標フレーム(PCF)変換器と、PCFを含む空間情報をサーバに伝送するように構成される、マップ発行器とを備える。
いくつかの実施形態では、本方法はさらに、アプリケーションを実行し、仮想オブジェクトの仕様および選択された記憶された座標フレームに対する仮想オブジェクトの場所を生成するステップを含む。
いくつかの実施形態では、ポータブルデバイス上に、ポータブルデバイスにローカルの座標フレームを維持するステップは、第1および第2のポータブルデバイス毎に、ポータブルデバイスの1つ以上のセンサから、3D環境についての複数の画像を捕捉するステップと、少なくとも部分的に、複数の画像に基づいて、1つ以上の持続的姿勢を算出するステップと、少なくとも部分的に、算出された1つ以上の持続的姿勢に基づいて、3D環境についての空間情報を生成するステップとを含む。本方法はさらに、第1および第2のポータブルデバイス毎に、遠隔サーバに、生成された空間情報を伝送するステップを含み、記憶された座標フレームを取得するステップは、記憶された座標フレームを遠隔サーバから受信するステップを含む。
いくつかの実施形態では、少なくとも部分的に、複数の画像に基づいて、1つ以上の持続的姿勢を算出するステップは、1つ以上の特徴を複数の画像のそれぞれから抽出するステップと、1つ以上の特徴毎に、記述子を生成するステップと、複数の画像毎に、少なくとも部分的に、記述子に基づいて、キーフレームを生成するステップと、少なくとも部分的に、1つ以上のキーフレームに基づいて、1つ以上の持続的姿勢を生成するステップとを含む。
いくつかの実施形態では、1つ以上の持続的姿勢を生成するステップは、他の持続的姿勢の場所から所定の距離だけ進行するポータブルデバイスに基づいて、持続的姿勢を選択的に生成するステップを含む。
いくつかの実施形態では、第1および第2のデバイスはそれぞれ、記憶された座標フレームをサーバからダウンロードするように構成される、ダウンロードシステムを備える。
いくつかの実施形態は、仮想コンテンツを複数のポータブルデバイスのそれぞれ上にレンダリングするために、3D環境についての持続的空間情報を維持するための電子システムに関する。電子システムは、ネットワーク化されたコンピューティングデバイスを含む。ネットワーク化されたコンピューティングデバイスは、少なくとも1つのプロセッサと、プロセッサに接続される、少なくとも1つの記憶デバイスと、少なくとも1つのプロセッサを用いて実行可能であって、複数のポータブルデバイスのポータブルデバイスから、複数のマップを受信し、少なくとも1つの記憶デバイス上にマップ情報を記憶する、マップ記憶ルーチンであって、複数の受信されたマップはそれぞれ、少なくとも1つの座標フレームを備える、マップ記憶ルーチンと、少なくとも1つのプロセッサを用いて実行可能であって、複数のポータブルデバイスのポータブルデバイスから、場所情報を受信し、記憶されたマップの中から、1つ以上のマップを選択し、複数のポータブルデバイスのポータブルデバイスに、選択された1つ以上のマップからの情報を伝送し、伝送される情報は、選択された1つ以上のマップのマップの座標フレームを備える、ためのマップ伝送機とを含む。
いくつかの実施形態では、座標フレームは、コンピュータデータ構造を備える。コンピュータデータ構造は、3D環境内のオブジェクトの複数の特徴を特徴付ける、情報を備える、座標フレームを備える。
いくつかの実施形態では、複数の特徴を特徴付ける、情報は、3D環境の領域を特徴付ける、記述子を備える。
いくつかの実施形態では、少なくとも1つの座標フレームの各座標フレームは、3D環境を表すセンサデータ内で検出された特徴によって特徴付けられる、持続的点を備える。
いくつかの実施形態では、少なくとも1つの座標フレームの各座標フレームは、持続的姿勢を備える。
いくつかの実施形態では、少なくとも1つの座標フレームの各座標フレームは、持続的座標フレームを備える。
前述の説明は、例証として提供され、限定することを意図するものではない。
本発明は、例えば、以下を提供する。
(項目1)
電子システムであって、
3次元(3D)環境についての情報を捕捉するように構成される1つ以上のセンサであって、前記捕捉された情報は、複数の画像を備える、センサと、
コンピュータ実行可能命令を実行し、前記複数の画像に基づいて、前記3D環境の少なくとも一部のマップを生成するように構成される少なくとも1つのプロセッサであって、前記コンピュータ実行可能命令はさらに、
前記複数の画像内の複数の特徴を識別することと、
少なくとも部分的に、選択されたキーフレームの複数の特徴に基づいて、複数のキーフレームを前記複数の画像の中から選択することと、
少なくとも部分的に、前記選択されたキーフレームの識別された特徴に基づいて、1つ以上の座標フレームを生成することと、
前記3D環境のマップと関連付けて、前記1つ以上の座標フレームを1つ以上の持続的座標フレームとして記憶することと
を行うための命令を備える、少なくとも1つのプロセッサと
を備える、電子システム。
(項目2)
前記1つ以上のセンサは、前記複数の画像の各画像が複数のピクセルを備えるように2次元アレイで配列される複数のピクセル回路を備え、
各特徴は、複数のピクセルに対応する、
項目1に記載の電子システム。
(項目3)
前記複数の画像内の複数の特徴を識別することは、前記識別された特徴として、持続的オブジェクトの部分を描写するピクセルの群との類似性の測定値に基づいて、前記ピクセルの群の所定の最大値未満の数を選択することを含む、項目1に記載の電子システム。
(項目4)
前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレーム毎に、
そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセットを表す記述子
を記憶することを含む、項目1に記載の電子システム。
(項目5)
前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレーム毎に、
そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセット
を記憶することを含む、項目1に記載の電子システム。
(項目6)
前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレーム毎に、
前記3D環境のマップの座標フレームと前記持続的座標フレームとの間の変換と、
そこから前記座標フレームが生成された選択されたキーフレームの前記3D環境内の場所を示す地理的情報と
を記憶することを含む、項目1に記載の電子システム。
(項目7)
前記地理的情報は、前記場所のWiFiフィンガプリントを備える、項目6に記載の電子システム。
(項目8)
前記コンピュータ実行可能命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える、項目1に記載の電子システム。
(項目9)
前記第1の人工ニューラルネットワークは、第1の人工ニューラルネットワークであり、
前記コンピュータ実行可能命令は、少なくとも部分的に、前記キーフレーム内の前記識別された特徴のための前記算出された特徴記述子に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成される第2の人工ニューラルネットワークを実装するための命令を備える、
項目8に記載の電子システム。
(項目10)
前記コンピュータ実行可能命令はさらに、
アプリケーションプログラミングインターフェースであって、前記アプリケーションプログラミングインターフェースは、ポータブル電子システム上で実行されるアプリケーションに、前記1つ以上の持続的座標フレームの持続的座標フレームを特徴付ける情報を提供するように構成される、アプリケーションプログラミングインターフェースと、
第2の複数の画像に基づいて、前記3D環境のマップを精緻化するための命令と、
少なくとも部分的に、前記第2の複数の画像に基づいて、前記持続的座標フレームのうちの1つ以上のものを調節することと、
前記アプリケーションプログラミングインターフェースを通して前記調節された持続的座標フレームの通知を提供するための命令と
を備える、項目1に記載の電子システム。
(項目11)
前記1つ以上の持続的座標フレームを調節することは、前記3D環境のマップの原点に対する前記1つ以上の持続的座標フレームの平行移動および回転を調節することを含む、項目10に記載の電子システム。
(項目12)
前記電子システムは、ウェアラブルデバイスを備え、前記1つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記マップは、前記ウェアラブルデバイス上で算出された追跡マップであり、
前記マップの原点は、前記デバイスが電源投入された場所に基づいて決定される、
項目11に記載の電子システム。
(項目13)
前記電子システムは、ウェアラブルデバイスを備え、前記1つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
前記コンピュータ実行可能命令はさらに、
前記ポータブルデバイスの運動を追跡することと、
閾値距離を超える前記ウェアラブルデバイスの運動を示す前記追跡された運動に基づいて、1つ以上の座標フレームを生成するための命令および/または1つ以上の持続的座標フレームを記憶するための命令の実行のタイミングを制御することであって、前記閾値距離は、2~20メートルである、ことと
を行うための命令を備える、項目1に記載の電子システム。
(項目14)
電子システムを動作させ、ポータブルデバイスを備える3D環境内に仮想コンテンツをレンダリングする方法であって、前記方法は、1つ以上のプロセッサを用いて、
前記ポータブルデバイス上に、前記ポータブルデバイス上の1つ以上のセンサの出力に基づいて、前記ポータブルデバイスにローカルの座標フレームを維持することと、
記憶された座標フレームを前記3D環境についての記憶された空間情報から取得することと、
前記ポータブルデバイスにローカルの座標フレームと前記取得された記憶された座標フレームとの間の変換を算出することと、
仮想オブジェクトにローカルの座標フレームを有する仮想オブジェクトの仕様と、前記選択された記憶された座標フレームに対する前記仮想オブジェクトの場所とを受信することと、
少なくとも部分的に、前記算出された変換および前記仮想オブジェクトの前記受信された場所に基づいて、決定された場所において、前記仮想オブジェクトを前記ポータブルデバイスのディスプレイ上にレンダリングすることと
を含む、方法。
(項目15)
前記記憶された座標フレームを取得することは、アプリケーションプログラミングインターフェース(API)を通して、前記座標フレームを取得することを含む、項目14に記載の方法。
(項目16)
前記ポータブルデバイスは、前記1つ以上のプロセッサの第1のプロセッサを備える第1のポータブルデバイスを備え、
前記システムはさらに、前記1つ以上のプロセッサの第2のプロセッサを備える第2のポータブルデバイスを備え、
前記第1および第2のデバイスのそれぞれ上のプロセッサは、
同一の記憶された座標フレームを取得することと、
個別のデバイスにローカルの座標フレームと前記取得された同一の記憶された座標フレームとの間の変換を算出することと、
前記仮想オブジェクトの仕様を受信することと、
前記仮想オブジェクトを個別のディスプレイ上にレンダリングすることと
を行う、項目14に記載の方法。
(項目17)
前記第1および第2のデバイスはそれぞれ、
複数のカメラ画像を出力するように構成されるカメラと、
複数のカメラ画像を複数のキーフレームに変換するように構成されるキーフレーム生成器と、
前記複数のキーフレームを平均することによって、持続的姿勢を生成するように構成される持続的姿勢計算機と、
追跡マップを前記持続的姿勢に変換し、前記追跡マップの原点に対する前記持続的姿勢を決定するように構成される追跡マップおよび持続的姿勢変換器と、
前記持続的姿勢をPCFに変換するように構成される持続的姿勢および持続的座標フレーム(PCF)変換器と、
前記PCFを含む空間情報をサーバに伝送するように構成されるマップ発行器と
を備える、項目16に記載の方法。
(項目18)
アプリケーションを実行し、前記仮想オブジェクトの仕様および前記選択された記憶された座標フレームに対する前記仮想オブジェクトの場所を生成することをさらに含む、項目16に記載の方法。
(項目19)
前記ポータブルデバイス上に、前記ポータブルデバイスにローカルの座標フレームを維持することは、前記第1および第2のポータブルデバイス毎に、
前記ポータブルデバイスの1つ以上のセンサから、前記3D環境についての複数の画像を捕捉することと、
少なくとも部分的に、前記複数の画像に基づいて、1つ以上の持続的姿勢を算出することと、
少なくとも部分的に、前記算出された1つ以上の持続的姿勢に基づいて、前記3D環境についての空間情報を生成することと
を含み、
前記方法はさらに、前記第1および第2のポータブルデバイス毎に、遠隔サーバに、前記生成された空間情報を伝送することを含み、
前記記憶された座標フレームを取得することは、前記記憶された座標フレームを前記遠隔サーバから受信することを含む、
項目16に記載の方法。
(項目20)
少なくとも部分的に、前記複数の画像に基づいて、前記1つ以上の持続的姿勢を算出することは、
1つ以上の特徴を前記複数の画像のそれぞれから抽出することと、
前記1つ以上の特徴毎に、記述子を生成することと、
前記複数の画像毎に、少なくとも部分的に、前記記述子に基づいて、キーフレームを生成することと、
少なくとも部分的に、前記1つ以上のキーフレームに基づいて、前記1つ以上の持続的姿勢を生成することと
を含む、項目19に記載の方法。
(項目21)
前記1つ以上の持続的姿勢を生成することは、
他の持続的姿勢の場所から所定の距離だけ進行する前記ポータブルデバイスに基づいて、持続的姿勢を選択的に生成すること
を含む、項目20に記載の方法。
(項目22)
前記第1および第2のデバイスはそれぞれ、
前記記憶された座標フレームをサーバからダウンロードするように構成されるダウンロードシステム
を備える、項目16に記載の方法。
(項目23)
仮想コンテンツを複数のポータブルデバイスのそれぞれ上にレンダリングするために、3D環境についての持続的空間情報を維持するための電子システムであって、前記電子システムは、
ネットワーク化されたコンピューティングデバイスであって、
少なくとも1つのプロセッサと、
前記プロセッサに接続される少なくとも1つの記憶デバイスと、
マップ記憶ルーチンであって、前記マップ記憶ルーチンは、前記複数のポータブルデバイスのポータブルデバイスから、複数のマップを受信し、前記少なくとも1つの記憶デバイス上にマップ情報を記憶するように、前記少なくとも1つのプロセッサを用いて実行可能であり、前記複数の受信されたマップはそれぞれ、少なくとも1つの座標フレームを備える、マップ記憶ルーチンと、
マップ伝送機であって、前記マップ伝送機は、
前記複数のポータブルデバイスのポータブルデバイスから、場所情報を受信することと、
前記記憶されたマップの中から、1つ以上のマップを選択することと、
前記複数のポータブルデバイスのポータブルデバイスに、前記選択された1つ以上のマップからの情報を伝送することであって、前記伝送される情報は、前記選択された1つ以上のマップの、マップの座標フレームを備える、ことと
を行うように、前記少なくとも1つのプロセッサを用いて実行可能である、マップ伝送機と
を備える、ネットワーク化されたコンピューティングデバイス
を備える、電子システム。
(項目24)
前記座標フレームは、
前記3D環境内のオブジェクトの複数の特徴を特徴付ける情報を備える座標フレーム
を備えるコンピュータデータ構造を備える、項目23に記載の電子システム。
(項目25)
前記複数の特徴を特徴付ける情報は、前記3D環境の領域を特徴付ける記述子を備える、項目23に記載の電子システム。
(項目26)
前記少なくとも1つの座標フレームの各座標フレームは、前記3D環境を表すセンサデータ内で検出された特徴によって特徴付けられる持続的点を備える、項目23に記載の電子システム。
(項目27)
前記少なくとも1つの座標フレームの各座標フレームは、持続的姿勢を備える、項目26に記載の電子システム。
(項目28)
前記少なくとも1つの座標フレームの各座標フレームは、持続的座標フレームを備える、項目26に記載の電子システム。
添付の図面は、縮尺通りに描かれることを意図していない。図面では、種々の図に図示される、各同じまたはほぼ同じコンポーネントは、同様の数字で表される。明確性の目的のために、全てのコンポーネントが、全ての図面において標識されているわけではない。
図1は、いくつかの実施形態による、簡略化された拡張現実(AR)場面の実施例を図示する、スケッチである。
図2は、いくつかの実施形態による、XRシステムの例示的ユースケースを示す、例示的簡略化されたAR場面のスケッチである。
図3は、いくつかの実施形態による、物理的世界と相互作用するARコンテンツの体験をユーザに提供するように構成される、ARシステム内の単一ユーザのためのデータフローを図示する、概略図である。
図4は、いくつかの実施形態による、単一ユーザのための仮想コンテンツを表示する、例示的ARディスプレイシステムを図示する、概略図である。
図5Aは、いくつかの実施形態による、ユーザが物理的世界環境を通して移動するにつれてARコンテンツをレンダリングする、ARディスプレイシステムを装着しているユーザを図示する、概略図である。
図5Bは、いくつかの実施形態による、視認光学系アセンブリおよび付帯コンポーネントを図示する、概略図である。
図6Aは、いくつかの実施形態による、世界再構築システムを使用するARシステムを図示する、概略図である。
図6Bは、いくつかの実施形態による、パス可能世界のモデルを維持する、ARシステムのコンポーネントを図示する、概略図である。
図7は、物理的世界を通した経路をトラバースするデバイスによって形成される、追跡マップの概略図である。
図8は、いくつかの実施形態による、仮想コンテンツを知覚する、クロスリアリティ(XR)システムのユーザを図示する、概略図である。
図9は、いくつかの実施形態による、座標系間で変換する、図8のXRシステムの第1のXRデバイスのコンポーネントのブロック図である。
図10は、いくつかの実施形態による、ローカルXRコンテンツを正しくレンダリングするための目的地座標フレームへの原点座標フレームの例示的変換を図示する、概略図である。
図11は、いくつかの実施形態による、瞳孔ベースの座標フレームを図示する、上部平面図である。
図12は、いくつかの実施形態による、全ての瞳孔位置を含む、カメラ座標フレームを図示する、上部平面図である。
図13は、いくつかの実施形態による、図9のディスプレイシステムの概略図である。
図14は、いくつかの実施形態による、持続的座標フレーム(PCF)の作成およびXRコンテンツのPCFへの結付を図示する、ブロック図である。
図15は、いくつかの実施形態による、PCFを確立および使用する方法を図示する、フローチャートである。
図16は、いくつかの実施形態による、第2のXRデバイスを含む、図8のXRシステムのブロック図である。
図17は、いくつかの実施形態による、部屋と、部屋内の種々のエリアのために確立される、キーフレームとを図示する、概略図である。
図18は、いくつかの実施形態による、キーフレームに基づく、持続的姿勢の確立を図示する、概略図である。
図19は、いくつかの実施形態による、持続的姿勢に基づく、持続座標フレーム(PCF)の確立を図示する、概略図である。
図20A-20Cは、いくつかの実施形態による、PCFを作成する実施例を図示する、概略図である。
図21は、いくつかの実施形態による、個々の画像および/またはマップのためのグローバル記述子を生成するためのシステムを図示する、ブロック図である。
図22は、いくつかの実施形態による、画像記述子を算出する方法を図示する、フローチャートである。
図23は、いくつかの実施形態による、画像記述子を使用した位置特定の方法を図示する、フローチャートである。
図24は、いくつかの実施形態による、ニューラルネットワークを訓練する方法を図示する、フローチャートである。
図25は、いくつかの実施形態による、ニューラルネットワークを訓練する方法を図示する、ブロック図である。
図26は、いくつかの実施形態による、複数の環境マップをランク付けおよびマージするように構成される、ARシステムを図示する、概略図である。
図27は、いくつかの実施形態による、遠隔記憶媒体上に記憶された複数の規準マップを図示する、簡略化されたブロック図である。
図28は、いくつかの実施形態による、規準マップを選択し、例えば、1つ以上の規準マップ内で新しい追跡マップを位置特定する、および/またはPCFを規準マップから取得する方法を図示する、概略図である。
図29は、いくつかの実施形態による、複数のランク付けされた環境マップを選択する方法を図示する、フローチャートである。
図30は、いくつかの実施形態による、図26のARシステムの例示的マップランク付け部分を図示する、概略図である。
図31Aは、いくつかの実施形態による、データベース内の追跡マップ(TM)および環境マップのエリア属性の実施例を図示する、概略図である。
図31Bは、いくつかの実施形態による、図29の地理的場所フィルタリングのための追跡マップ(TM)の地理的場所を決定する実施例を図示する、概略図である。
図32は、いくつかの実施形態による、図29の地理的場所フィルタリングの実施例を図示する、概略図である。
図33は、いくつかの実施形態による、図29のWi-Fi BSSIDフィルタリングの実施例を図示する、概略図である。
図34は、いくつかの実施形態による、図29の位置特定の実施例を図示する、概略図である。
図35および36は、いくつかの実施形態による、複数の環境マップをランク付けおよびマージするように構成される、XRシステムのブロック図である。 図35および36は、いくつかの実施形態による、複数の環境マップをランク付けおよびマージするように構成される、XRシステムのブロック図である。
図37は、いくつかの実施形態による、規準形態において、物理的世界の環境マップを作成する方法を図示する、ブロック図である。
図38Aおよび38Bは、いくつかの実施形態による、図7の追跡マップを新しい追跡マップで更新することによって規準形態において作成された環境マップを図示する、概略図である。 図38Aおよび38Bは、いくつかの実施形態による、図7の追跡マップを新しい追跡マップで更新することによって規準形態において作成された環境マップを図示する、概略図である。
図39A-39Fは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。 図39A-39Fは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。 図39A-39Fは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。 図39A-39Fは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。 図39A-39Fは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。 図39A-39Fは、いくつかの実施形態による、マップをマージする実施例を図示する、概略図である。
図40は、いくつかの実施形態による、3次元の第1のローカル追跡マップ(マップ1)の2次元表現であって、これは、図9の第1のXRデバイスによって生成され得る。
図41は、いくつかの実施形態による、マップ1を第1のXRデバイスから図9のサーバにアップロードするステップを図示する、ブロック図である。
図42は、いくつかの実施形態による、図16のXRシステムを図示する、概略図であって、第2のユーザが、第1のユーザが第1のセッションを終了した後、XRシステムの第2のXRデバイスを使用して、第2のセッションを開始したことを示す。
図43Aは、いくつかの実施形態による、図42の第2のXRデバイスのための新しいセッションを図示する、ブロック図である。
図43Bは、いくつかの実施形態による、図42の第2のXRデバイスのための追跡マップの作成を図示する、ブロック図である。
図43Cは、いくつかの実施形態による、規準マップをサーバから図42の第2のXRデバイスにダウンロードするステップを図示する、ブロック図である。
図44は、いくつかの実施形態による、規準マップに対して、図42の第2のXRデバイスによって生成され得る、第2の追跡マップ(マップ2)を位置特定するように試みる、位置特定を図示する、概略図である。
図45は、いくつかの実施形態による、規準マップに対して、さらに展開され得、マップ2のPCFと関連付けられるXRコンテンツを伴う、図44の第2の追跡マップ(マップ2)を位置特定するように試みる、位置特定を図示する、概略図である。
図46A-46Bは、いくつかの実施形態による、規準マップに対する図45のマップ2の位置特定成功を図示する、概略図である。 図46A-46Bは、いくつかの実施形態による、規準マップに対する図45のマップ2の位置特定成功を図示する、概略図である。
図47は、いくつかの実施形態による、図46Aの規準マップからの1つ以上のPCFを図45のマップ2の中に含めることによって生成された、規準マップを図示する、概略図である。
図48は、いくつかの実施形態による、第2のXRデバイス上のマップ2のさらなる拡張を伴う、図47の規準マップを図示する、概略図である。
図49は、いくつかの実施形態による、マップ2を第2のXRデバイスからサーバにアップロードするステップを図示する、ブロック図である。
図50は、いくつかの実施形態による、マップ2と規準マップをマージするステップを図示する、ブロック図である。
図51は、いくつかの実施形態による、サーバから第1および第2のXRデバイスへの新しい規準マップの伝送を図示する、ブロック図である。
図52は、いくつかの実施形態による、マップ2の2次元表現と、マップ2に参照される、第2のXRデバイスの頭部座標フレームとを図示する、ブロック図である。
図53は、いくつかの実施形態による、2次元において、6自由度で生じ得る、頭部座標フレームの調節を図示する、ブロック図である。
図54は、いくつかの実施形態による、音がマップ2のPCFに対して位置特定される、第2のXRデバイス上の規準マップを図示する、ブロック図である。
図55および56は、いくつかの実施形態による、第1のユーザが第1のセッションを終了し、第1のユーザがXRシステムを使用して第2のセッションを開始したときの、XRシステムの使用を図示する、斜視図およびブロック図である。 図55および56は、いくつかの実施形態による、第1のユーザが第1のセッションを終了し、第1のユーザがXRシステムを使用して第2のセッションを開始したときの、XRシステムの使用を図示する、斜視図およびブロック図である。
図57および58は、いくつかの実施形態による、3人のユーザが同一セッション内でXRシステムを同時に使用するときの、XRシステムの使用を図示する、斜視図およびブロック図である。 図57および58は、いくつかの実施形態による、3人のユーザが同一セッション内でXRシステムを同時に使用するときの、XRシステムの使用を図示する、斜視図およびブロック図である。
図59は、いくつかの実施形態による、頭部姿勢を復元およびリセットする方法を図示する、フローチャートである。
図60は、いくつかの実施形態による、本発明のシステム内でアプリケーションを見出し得る、コンピュータの形態における機械のブロック図である。
本明細書に説明されるものは、Xリアリティ(XRまたはクロスリアリティ)場面を提供するための方法および装置である。現実的XR体験を複数のユーザに提供するために、XRシステムは、実オブジェクトに関連して仮想オブジェクトの場所を正しく相関させるために、ユーザの物理的周囲を把握しなければならない。XRシステムは、場面の環境マップを構築し得、これは、XRシステムのユーザによって装着されるXRデバイスの一部であるセンサを用いて収集された、画像および/または深度情報から作成され得る。
本発明者らは、ある時点での走査の間に収集された1つ以上の画像からの情報を統合することによって、各XRデバイスがその物理的環境のローカルマップを展開する、XRシステムを有することが有益であり得ることを実現し、その真価を認めた。いくつかの実施形態では、そのマップの座標系は、走査が開始されたときのデバイスの配向に結び付けられる。その配向は、異なる瞬間が、異なるユーザ、それぞれ環境を走査するセンサを伴うその独自のウェアラブルデバイス、または異なる時間において同一デバイスを使用する同一ユーザと関連付けられるかどうかにかかわらず、ユーザがXRシステムと相互作用するにつれて、瞬間毎に変化し得る。本発明者らは、各ユーザデバイスが、異なるユーザインスタンス(例えば、時間単位のスナップショット)またはシステムのセッション(例えば、オンとオフとの間の時間)に関して異なる、配向に対して収集される、空間情報のみに依拠する、XRシステムの限界を克服する、持続的空間情報に基づいてXRシステムを動作させるための技法を実現し、その真価を認めた。本技法は、例えば、持続的空間情報が、XRシステムの複数のユーザのいずれかによって、作成され、記憶され、読み出されることを可能にすることによって、単一または複数のユーザのためのより算出上効率的および没入型の体験のためのXR場面を提供し得る。
持続的空間情報は、XR体験を向上させる、1つ以上の機能を有効にし得る、持続的マップによって表されてもよい。持続的マップは、遠隔記憶媒体(例えば、クラウド)内に記憶されてもよい。例えば、ユーザによって装着されるウェアラブルデバイスは、オンにされた後、クラウド記憶装置等の持続記憶装置から、以前に作成および記憶された、適切な記憶されたマップを読み出してもよい。その以前に記憶されたマップは、以前のセッションの間に、ユーザのウェアラブルデバイス上のセンサを用いて収集された環境についてのデータに基づき得る。記憶されたマップを読み出すことは、ウェアラブルデバイス上のセンサを用いた物理的世界の走査を伴わずに、ウェアラブルデバイスの使用を有効にし得る。代替として、または加えて、システム/デバイスは、物理的世界の新しい領域に進入することに応じて、同様に、適切な記憶されたマップを読み出してもよい。
記憶されたマップは、各XRデバイスがそのローカル基準フレームに関連し得る、規準形態において表されてもよい。マルチデバイスXRシステムでは、1つのデバイスによってアクセスされる記憶されたマップは、別のデバイスによって作成および記憶されていてもよく、および/または記憶されたマップによって表される物理的世界の少なくとも一部内に以前に存在した、複数のウェアラブルデバイス上のセンサによって収集された物理的世界についてのデータを集約することによって、構築されていてもよい。
さらに、物理的世界についてのデータを複数のデバイス間で共有することは、仮想コンテンツの共有ユーザ体験を有効にし得る。同一の記憶されたマップへのアクセスを有する、2つのXRデバイスは両方とも、例えば、記憶されたマップに対して位置特定されてもよい。いったん位置特定されると、ユーザデバイスは、基準によって規定された場所を有する、仮想コンテンツを、その場所をユーザデバイスによって維持されるフレームまたは基準に平行移動させることによって、記憶されたマップにレンダリングしてもよい。ユーザデバイスは、本ローカル基準フレームを使用して、ユーザデバイスのディスプレイを制御し、仮想コンテンツを規定された場所内にレンダリングしてもよい。
これらおよび他の機能をサポートするために、XRシステムは、ユーザデバイス上のセンサを用いて収集された物理的世界についてのデータに基づいて、1つ以上の記憶されたマップを含む、持続的空間情報を展開、維持、および使用する、コンポーネントを含んでもよい。これらのコンポーネントは、XRシステムを横断して分散されてもよく、一部は、例えば、ユーザデバイスの頭部搭載型部分上で動作する。他のコンポーネントは、ローカルまたはパーソナルエリアネットワークを経由して頭部搭載型部分に結合される、ユーザと関連付けられるコンピュータ上で動作してもよい。さらにその他は、広域ネットワークを経由してアクセス可能な1つ以上のサーバ等、遠隔場所で動作してもよい。
これらのコンポーネントは、例えば、1つ以上のユーザデバイスによって収集された物理的世界についての情報から、持続的マップとして、または持続的マップ内に記憶されるために十分な品質である情報を識別し得る、コンポーネントを含んでもよい。下記により詳細に説明される、そのようなコンポーネントの実施例は、マップマージコンポーネントである。そのようなコンポーネントは、例えば、ユーザデバイスからの入力を受信し、持続的マップを更新するために使用される入力の部分の好適性を決定してもよい。マップマージコンポーネントは、例えば、ユーザデバイスによって作成されたローカルマップを部分に分裂させ、部分のうちの1つ以上のものと持続的マップのマージ可能性を決定し、認定されたマージ可能性基準を満たす部分を持続的マップにマージしてもよい。マップマージコンポーネントはまた、例えば、持続的マップとマージされない部分が別個の持続的マップとなるようにプロモートしてもよい。
別の実施例として、これらのコンポーネントは、ユーザデバイスによって読み出され、使用され得る、適切な持続的マップを決定することを補助し得る、コンポーネントを含んでもよい。下記により詳細に説明される、そのようなコンポーネントの実施例は、マップランク付けコンポーネントである。そのようなコンポーネントは、例えば、入力をユーザデバイスから受信し、その中でデバイスが動作中である、物理的世界の領域を表す可能性が高い、1つ以上の持続的マップを識別してもよい。マップランク付けコンポーネントは、例えば、仮想コンテンツをレンダリングする、環境についてのデータを集める、または他のアクションを実施する際、そのローカルデバイスによって使用されるべき持続的マップを選択することを補助し得る。マップランク付けコンポーネントは、代替として、または加えて、物理的世界についての付加的情報が1つ以上のユーザデバイスによって収集されるにつれて、更新されるべき持続的マップを識別することを補助し得る。
さらに他のコンポーネントは、1つの基準フレームに関連して捕捉または説明される情報を別の基準フレームに変換する、変換を決定してもよい。例えば、センサは、そのセンサから読み取られたデータが、装着者の頭部姿勢に対する物理的世界内のオブジェクトの場所を示すように、頭部搭載型ディスプレイに取り付けられてもよい。1つ以上の変換が、その場所情報を持続環境マップと関連付けられる座標フレームに関連させるように適用されてもよい。同様に、持続環境マップの座標フレーム内に表されるとき、仮想オブジェクトがレンダリングされるべき場所を示す、データは、ユーザの頭部上のディスプレイの基準フレーム内にあるように1つ以上の変換を受けてもよい。下記により詳細に説明されるように、複数のそのような変換が存在してもよい。これらの変換は、それらが分散型システム内で効率的に更新および/または適用され得るように、XRシステムのコンポーネントを横断してパーティション化されてもよい。
いくつかの実施形態では、持続的マップは、複数のユーザデバイスによって収集された情報から構築されてもよい。XRデバイスは、種々の場所および時間においてXRデバイスのそれぞれのセンサによって収集された情報を用いて、ローカル空間情報を捕捉し、別個の追跡マップを構築してもよい。各追跡マップは、それぞれ、複数の特徴を含み得る、実オブジェクトの特徴と関連付けられ得る、点を含んでもよい。潜在的に、入力を供給し、持続的マップを作成および維持するステップに加え、追跡マップは、場面内のユーザの運動を追跡するために使用され、XRシステムが、追跡マップに基づいて、個別のユーザの頭部姿勢を推定することを可能にしてもよい。
マップの作成と頭部姿勢の推定との間の本共依存性は、有意な課題を構成する。実質的処理が、同時に、マップを作成し、頭部姿勢を推定するために要求され得る。待ち時間は、XR体験をユーザにとってあまり現実的ではないものにするため、処理は、オブジェクトが場面内を移動する(例えば、カップをテーブル上で移動させる)につれて、かつユーザが場面内を移動するにつれて、迅速に遂行されなければならない。他方では、XRデバイスの重量は、ユーザが快適に装着するために軽量であるべきであるため、XRデバイスは、限定された算出リソースを提供し得る。算出リソースの欠如は、望ましくないことに、重量もまた追加するであろう、センサの追加のため、より多くのセンサを用いて補償されることができない。さらに、より多くのセンサまたはより多くの算出リソースのいずれかは、熱につながり、これは、XRデバイスの変形を生じさせ得る。
本発明者らは、1kHzの周波数における頭部姿勢の推定、例えば、30Hzで動作する4つのビデオグラフィックアレイ(VGA)カメラとともに構成され得る、XRデバイスと関連する算出リソースの低使用量、1kHzで動作する1つの慣性測定ユニット(IMU)、単一の高度RISC機械(ARM)コアの算出パワー、1GB未満のメモリ、および100Mbp未満のネットワーク帯域幅等、より没入型のユーザ体験のために、XRシステムを動作させ、XR場面を提供するための技法を実現し、その真価を認めた。これらの技法は、マップを生成および維持し、頭部姿勢を推定するために要求される処理を低減させ、かつ低算出オーバーヘッドを伴ってデータを提供および消費するステップに関する。
これらの技法は、XRシステムが、(1)環境の連続画像間の区別可能な点のパッチベースの追跡(例えば、フレーム/フレーム追跡)と、(2)現在の画像の着目点と対応する着目点の既知の実世界場所の記述子ベースのマップのマッチング(例えば、マップ/フレーム追跡)との両方を活用し得るように、ハイブリッド追跡を含んでもよい。フレーム/フレーム追跡では、XRシステムは、実世界環境の捕捉された画像間の角等の特定の着目点(例えば、顕著な点)を追跡してもよい。例えば、ディスプレイシステムは、前の画像内に含まれていた(例えば、その中に位置していた)、現在の画像内の視覚的着目点の場所を識別してもよい。本識別は、例えば、測光誤差最小限化プロセスを使用して遂行されてもよい。マップ/フレーム追跡では、XRシステムは、着目点の実世界場所を示す、マップ情報にアクセスし、現在の画像内に含まれる着目点をマップ情報に示される着目点にマッチングさせてもよい。着目点に関する情報は、記述子としてマップデータベース内に記憶されてもよい。XRシステムは、マッチングされた視覚的特徴に基づいて、その姿勢を計算してもよい。米国特許第出願第16/221,065号は、ハイブリッド追跡を説明し、参照することによってその全体として本明細書に組み込まれる。
これらの技法は、マッピングされた点の集合およびキーフレームを用いて疎マップを構築する、および/またはマップをブロックに分割し、ブロックによる更新を有効にすること等によって、マップを構築するときに処理される、データの量を低減させるステップを含み得る。マッピングされた点は、環境内の着目点と関連付けられてもよい。キーフレームは、カメラ捕捉データから選択された情報を含んでもよい。米国特許第出願第16/520,582号は、位置特定マップを決定および/または評価するステップを説明し、参照することによってその全体として本明細書に組み込まれる。
いくつかの実施形態では、持続的空間情報は、ユーザ間およびアプリケーションを含む分散型コンポーネント間で容易に共有され得る、方法で表されてもよい。物理的世界についての情報は、例えば、持続的座標フレーム(PCF)として表されてもよい。PCFは、物理的世界内で認識される特徴を表す、1つ以上の点に基づいて定義されてもよい。特徴は、それらがXRシステムのユーザセッション毎に同一である可能性が高いように選択されてもよい。PCFは、それらが効率的に処理および転送され得るように、疎らに存在し、物理的世界についての利用可能な情報の全て未満を提供してもよい。持続的空間情報を処理するための技法は、1つ以上のセッションを横断して、実空間内の1つ以上の座標系に基づいて動的マップを作成するステップと、例えば、アプリケーションプログラミングインターフェース(API)を介して、XRアプリケーションにエクスポーズされ得る、持続座標フレーム(PCF)を疎マップにわたって生成するステップとを含んでもよい。これらの能力は、1つ以上のXRデバイスによって作成された複数のマップをランク付けおよびマージするための技法によってサポートされてもよい。持続的空間情報はまた、算出上効率的方法において、1つ以上のXRデバイスのそれぞれ上に頭部姿勢を迅速に復元およびリセットすることを可能にし得る。
さらに、本技法は、空間情報の効率的比較を有効にし得る。いくつかの実施形態では、画像フレームは、数値記述子によって表されてもよい。その記述子は、画像内で識別された特徴のセットを記述子にマッピングする、変換を介して算出されてもよい。その変換は、訓練されたニューラルネットワーク内で実施されてもよい。いくつかの実施形態では、ニューラルネットワークへの入力として供給される、特徴のセットは、例えば、持続的である可能性が高い特徴を優先的に選択する、技法を使用して画像から抽出された、特徴のフィルタリングされたセットであってもよい。
記述子としての画像フレームの表現は、例えば、新しい画像情報と記憶された画像情報の効率的マッチングを有効にする。XRシステムは、持続的マップと併せて、1つ以上のフレームの記述子を持続的マップの下層に記憶してもよい。ユーザデバイスによって入手されたローカル画像フレームも同様に、そのような記述子に変換されてもよい。ローカル画像フレームのものに類似する記述子を伴う記憶されたマップを選択することによって、ユーザデバイスと同一物理的空間を表す可能性が高い1つ以上の持続的マップが、比較的に少量の処理を伴って選択され得る。いくつかの実施形態では、記述子は、ローカルマップおよび持続的マップ内のキーフレームに関して算出され、マップを比較するとき、処理をさらに低減させてもよい。そのような効率的比較は、例えば、ローカルデバイスを用いて入手された画像情報に基づいて、ローカルデバイス内にロードする、または更新するための持続的マップを見出すためための持続的マップを見出すことを簡略化するために使用されてもよい。
本明細書に説明される技法は、拡張または複合現実場面を提供する、限定された算出リソースを伴う、ウェアラブルまたはポータブルデバイスを含む、多くのタイプのデバイスとともに、かつ多くのタイプの場面のために、ともにまたは別個に使用されてもよい。いくつかの実施形態では、技法は、XRシステムの一部を形成する、1つ以上のサービスによって実装されてもよい。
ARシステム概要
図1および2は、物理的世界の一部と併せて表示される、仮想コンテンツを伴う場面を図示する。例証目的のために、ARシステムが、XRシステムの実施例として使用される。図3-6Bは、本明細書に説明される技法に従って動作し得る、1つ以上のプロセッサと、メモリと、センサと、ユーザインターフェースとを含む、例示的ARシステムを図示する。
図1を参照すると、屋外AR場面354が、描写されており、AR技術のユーザには、人々、木々、背景における建物、およびコンクリートプラットフォーム358を特徴とする、物理的世界公園状設定356が見える。これらのアイテムに加え、AR技術のユーザはまた、物理的世界コンクリートプラットフォーム358上に立っているロボット像357と、それによってマルハナバチの擬人化のように見える、飛んでいる漫画のようなアバタキャラクタ352とが「見える」と知覚するが、これらの要素(例えば、アバタキャラクタ352およびロボット像357)は、物理的世界内には存在しない。ヒト視知覚および神経系の極端な複雑性に起因して、他の仮想または物理的世界画像要素の中で仮想画像要素の快適で、自然な感覚で、かつ豊かな提示を促進する、AR技術を生産することは、困難である。
そのようなAR場面は、ユーがARコンテンツを物理的世界内に設置することを可能にし、ARコンテンツが設置された物理的世界のマップ内の場所を決定し、設置されたARコンテンツが、例えば、異なるAR体験セッションの間、物理的世界内に表示するために再ロードされ得るように、AR場面を保存し、複数のユーザがAR体験を共有することを可能にする、追跡情報に基づいて物理的世界のマップを構築するシステムを用いて、達成され得る。本システムは、ユーザの周囲の物理的世界表面のデジタル表現を構築および更新し得る。本表現は、仮想オブジェクトを設置するため、物理学ベースの相互作用において、および仮想キャラクタ経路計画およびナビゲーションのため、またはその中で物理的世界についての情報が使用される、他の動作のために、完全または部分的に、ユーザと仮想コンテンツのレンダリングされた場所との間で物理的オブジェクトによってオクルードされるように現れるように、仮想コンテンツをレンダリングするために使用されてもよい。
図2は、いくつかの実施形態による、屋内AR場面400の別の実施例を描写し、XRシステムの例示的ユースケースを示す。例示的場面400は、壁と、壁の片側上の本棚と、部屋の角における床置きランプと、床と、ソファと、床上のコーヒーテーブルとを有する、居間である。これらの物理的アイテムに加え、AR技術のユーザはまた、ソファの背後の壁上の画像、ドアを通して飛んで来た鳥、本棚から外を覗いているシカ、およびコーヒーテーブル上に設置された風車の形態における装飾品等の仮想オブジェクトを知覚する。
壁上の画像に関して、AR技術は、壁の表面だけではなく、また、仮想オブジェクトを正しくレンダリングするために画像をオクルードする、ランプ形状等の部屋内のオブジェクトおよび表面についての情報も要求する。飛んで来た鳥に関して、AR技術は、オブジェクトおよび表面を回避する、または鳥が衝突する場合、跳ね返るように、現実的物理学を用いて鳥をレンダリングするために、部屋の周囲の全てのオブジェクトおよび表面についての情報を要求する。シカに関して、AR技術は、シカを設置すべき場所を算出するために、床またはコーヒーテーブル等の表面についての情報を要求する。風車に関して、システムは、テーブルと別個のオブジェクトであることを識別し得、それが移動可能であることを決定し得る一方、棚の角または壁の角は、定常であると決定され得る。そのような特異性は、種々の動作のそれぞれにおいて使用または更新される場面の部分に関する決定において使用されてもよい。
仮想オブジェクトは、前のAR体験セッション内に設置されてもよい。新しいAR体験セッションが、居間で開始すると、AR技術は、仮想オブジェクトが、以前に設置された場所に正確に表示され、異なる視点から現実的に可視であることを要求する。例えば、風車は、書籍を伴わない異なる場所においても、テーブルの上方に漂流しているのではなく、書籍上に立っているように表示されるべきである。そのような漂流は、新しいAR体験セッションのユーザの場所が居間内で正確に位置特定されない場合に起こり得る。別の実施例として、ユーザが、風車が設置されたときの視点と異なる視点から風車を視認している場合、AR技術は、表示されている風車の対応する側を要求する。
場面は、視覚、聴覚、および/または触覚等、1つ以上のユーザ感知を刺激し得る、ユーザインターフェースを含む、複数のコンポーネントを含む、システムを介して、ユーザに提示されてもよい。加えて、システムは、場面の物理的部分内のユーザの位置および/または運動を含む、場面の物理的部分のパラメータを測定し得る、1つ以上のセンサを含んでもよい。さらに、システムは、メモリ等の関連付けられるコンピュータハードウェアを伴う、1つ以上のコンピューティングデバイスを含んでもよい。これらのコンポーネントは、単一デバイスの中に統合されてもよい、または複数の相互接続されるデバイスを横断して分散されてもよい。いくつかの実施形態では、これらのコンポーネントのいくつかまたは全ては、ウェアラブルデバイスの中に統合されてもよい。
図3は、いくつかの実施形態による、物理的世界506と相互作用するARコンテンツの体験を提供するように構成される、ARシステム502を描写する。ARシステム502は、ディスプレイ508を含んでもよい。図示される実施形態では、ディスプレイ508は、ユーザが、一対のゴーグルまたは眼鏡のように、ディスプレイをその眼にわたって装着し得るように、ヘッドセットの一部としてユーザによって装着されてもよい。ディスプレイの少なくとも一部は、ユーザがシースルー現実510を観察し得るように、透明であってもよい。シースルー現実510は、ARシステム502の現在の視点内の物理的世界506の部分に対応し得、これは、ユーザが、ARシステムのディスプレイおよびセンサの両方を組み込む、ヘッドセットを装着し、物理的世界についての情報を入手している場合のユーザの視点に対応し得る。
ARコンテンツはまた、シースルー現実510上にオーバーレイされる、ディスプレイ508上に提示されてもよい。ARコンテンツとシースルー現実510との間の正確な相互作用をディスプレイ508上で提供するために、ARシステム502は、物理的世界506についての情報を捕捉するように構成される、センサ522を含んでもよい。
センサ522は、深度マップ512を出力する、1つ以上の深度センサを含んでもよい。各深度マップ512は、それぞれ、深度センサに対する特定の方向における物理的世界506内の表面までの距離を表し得る、複数のピクセルを有してもよい。未加工深度データが、深度センサから生じ、深度マップを作成し得る。そのような深度マップは、深度センサが新しい画像を形成し得るほど高速に更新され得、これは、数百または数千回/秒であり得る。しかしながら、そのデータは、雑音が多くかつ不完全であって、図示される深度マップ上に黒色ピクセルとして示される、穴を有し得る。
システムは、画像センサ等の他のセンサを含んでもよい。画像センサは、他の方法において物理的世界を表すように処理され得る、単眼または立体視情報を入手してもよい。例えば、画像は、世界再構築コンポーネント516内で処理され、物理的世界内のオブジェクトの接続される部分を表す、メッシュを作成してもよい。例えば、色および表面テクスチャを含む、そのようなオブジェクトについてのメタデータも同様に、センサを用いて入手され、世界再構築物の一部として記憶されてもよい。
システムはまた、物理的世界に対するユーザの頭部姿勢(または「姿勢」)についての情報を入手してもよい。いくつかの実施形態では、システムの頭部姿勢追跡コンポーネントは、頭部姿勢をリアルタイムで算出するために使用されてもよい。頭部姿勢追跡コンポーネントは、例えば、3つの垂直軸における平行移動(例えば、前/後、上/下、左/右)および3つの垂直軸を中心とした回転(例えば、ピッチ、ヨー、およびロール)を含む、6自由度を伴って、座標フレーム内のユーザの頭部姿勢を表し得る。いくつかの実施形態では、センサ522は、頭部姿勢514を算出および/または決定するために使用され得る、慣性測定ユニットを含んでもよい。深度マップのための頭部姿勢514は、例えば、6自由度を伴う、深度マップを捕捉するセンサの現在の視点を示し得るが、頭部姿勢514は、画像情報を物理的世界の特定の部分に関連させる、またはユーザの頭部上に装着されるディスプレイの位置を物理的世界に関連させる等の他の目的のために使用されてもよい。
いくつかの実施形態では、頭部姿勢情報は、画像内のオブジェクトの分析から等、IMU以外の方法で導出されてもよい。例えば、頭部姿勢追跡コンポーネントは、カメラによって捕捉された視覚的情報およびIMUによって捕捉された慣性情報に基づいて、物理的オブジェクトに対するARデバイスの相対的位置および配向を算出してもよい。頭部姿勢追跡コンポーネントは、次いで、例えば、物理的オブジェクトに対するARデバイスの算出された相対的位置および配向と物理的オブジェクトの特徴を比較することによって、ARデバイスの頭部姿勢を算出してもよい。いくつかの実施形態では、その比較は、経時的に捕捉された画像内のこれらの特徴の位置の変化がユーザの頭部姿勢の変化と関連付けられ得るように、経時的に安定する、センサ522のうちの1つ以上のものを用いて捕捉された画像内の特徴を識別することによって、行われてもよい。
いくつかの実施形態では、ARデバイスは、ユーザがARデバイスとともに物理的世界全体を通して移動するにつれて捕捉された一連の画像フレーム内の連続画像内で認識される、特徴点から、マップを構築してもよい。各画像フレームは、ユーザが移動するにつれて、異なる姿勢から得られ得るが、システムは、連続画像フレームの特徴と以前に捕捉された画像フレームをマッチングさせることによって、各連続画像フレームの特徴の配向を調節し、初期画像フレームの配向をマッチングさせてもよい。同一特徴を表す点が、以前に収集された画像フレームからの対応する特徴点にマッチングするであろうように、連続画像フレームの平行移動は、各連続画像フレームを整合させ、以前に処理された画像フレームの配向をマッチングさせるために使用されることができる。結果として生じるマップ内のフレームは、第1の画像フレームがマップに追加されたときに確立される共通配向を有し得る。本マップは、共通基準フレーム内の特徴点のセットとともに、現在の画像フレームからの特徴をマップにマッチングさせることによって、物理的世界内のユーザの姿勢を決定するために使用されてもよい。いくつかの実施形態では、本マップは、追跡マップと呼ばれ得る。
環境内のユーザの姿勢の追跡を有効にすることに加え、本マップは、世界再構築コンポーネント516等のシステムの他のコンポーネントがユーザに対する物理的オブジェクトの場所を決定することを可能にし得る。世界再構築コンポーネント516は、深度マップ512および頭部姿勢514およびセンサからの任意の他のデータを受信し、そのデータを再構築物518の中に統合してもよい。再構築物518は、センサデータより完全かつより雑音が少なくあり得る。世界再構築コンポーネント516は、経時的な複数の視点からのセンサデータの空間および時間的平均を使用して、再構築物518を更新してもよい。
再構築物518は、例えば、ボクセル、メッシュ、平面等を含む、1つ以上のデータフォーマットにおいて、物理的世界の表現を含んでもよい。異なるフォーマットは、物理的世界の同一部分の代替表現を表し得る、または物理的世界の異なる部分を表し得る。図示される実施例では、再構築物518の左側には、物理的世界の一部が、グローバル表面として提示され、再構築物518の右側には、物理的世界の一部が、メッシュとして提示される。
いくつかの実施形態では、頭部姿勢コンポーネント514によって維持されるマップは、物理的世界の維持され得る、他のマップに対して疎隔されてもよい。場所および可能性として表面の他の特性についての情報を提供するのではなく、疎マップは、角または縁等の着目点および/または構造の場所を示してもよい。いくつかの実施形態では、マップは、センサ522によって捕捉されるような画像フレームを含んでもよい。これらのフレームは、着目点および/または構造を表し得る、特徴に低減され得る。各フレームと併せて、そこからフレームが入手されたユーザの姿勢についての情報もまた、マップの一部として記憶されてもよい。いくつかの実施形態では、センサによって入手された全ての画像が、記憶される場合とそうではない場合がある。いくつかの実施形態では、システムは、それらがセンサによって収集されるにつれて、画像を処理し、さらなる算出のために、画像フレームのサブセットを選択してもよい。選択は、情報の追加を限定するが、マップが有用な情報を含有することを確実にする、1つ以上の基準に基づいてもよい。本システムは、例えば、マップにすでに追加されている以前の画像フレームとの重複に基づいて、または定常オブジェクトを表す可能性が高いと決定された十分な数の特徴を含有する、画像フレームに基づいて、新しい画像フレームをマップに追加してもよい。いくつかの実施形態では、選択された画像フレームまたは選択された画像フレームからの特徴の群は、マップのためのキーフレームとしての役割を果たし得、これは、空間情報を提供するために使用される。
ARシステム502は、物理的世界の複数の視点からのセンサデータを経時的に統合してもよい。センサの姿勢(例えば、位置および配向)が、センサを含むデバイスが移動されるにつれて追跡されてもよい。センサのフレーム姿勢およびそれが他の姿勢とどのように関連するかが、把握されるにつれて、物理的世界のこれらの複数の視点はそれぞれ、物理的世界の単一の組み合わせられた再構築物の中にともに融合されてもよく、これは、マップのための抽象層としての役割を果たし、空間情報を提供し得る。再構築物は、空間および時間的平均(すなわち、経時的な複数の視点からのデータの平均)または任意の他の好適な方法を使用することによって、オリジナルセンサデータより完全かつ雑音が少なくなり得る。
図3に図示される実施形態では、マップは、その中に単一ウェアラブルデバイスのユーザが存在する、物理的世界の一部を表す。そのシナリオでは、マップ内のフレームと関連付けられる頭部姿勢は、セッションの開始時における単一デバイスに関する初期配向に対する配向を示す、ローカル頭部姿勢として表されてもよい。例えば、頭部姿勢は、デバイスが、オンにされた、または別様に、環境を走査し、その環境の表現を構築するように動作されたときの、初期頭部姿勢に対して追跡されてもよい。
物理的世界のその部分を特徴付けるコンテンツと組み合わせて、マップは、メタデータを含んでもよい。メタデータ、例えば、マップを形成するために使用されるセンサ情報の捕捉時間を示してもよい。メタデータは、代替として、または加えて、マップを形成するために使用される情報の捕捉時間におけるセンサの場所を示してもよい。場所は、直接、GPSチップからの情報等を用いて、または間接的に、センサデータが収集されていた間の1つ以上の無線アクセスポイントから受信された信号の強度を示す、Wi-Fiシグネチャ等を用いて、および/またはセンサデータが収集された間にそれに対してユーザデバイスが接続した無線アクセスポイントのBSSIDを用いて、表されてもよい。
再構築物518は、オクルージョン処理または物理学ベースの処理のための物理的世界の表面表現の生産等、AR機能のために使用されてもよい。本表面表現は、ユーザが移動する、または物理的世界内のオブジェクトが変化するにつれて、変化してもよい。再構築物518の側面は、例えば、他のコンポーネントによって使用され得る、世界座標内の変化するグローバル表面表現を生産する、コンポーネント520によって使用されてもよい。
ARコンテンツは、本情報に基づいて、ARアプリケーション504等によって生成されてもよい。ARアプリケーション504は、例えば、視覚的オクルージョン、物理学ベースの相互作用、および環境推測等の物理的世界についての情報に基づいて、1つ以上の機能を実施する、ゲームプログラムであってもよい。これは、世界再構築コンポーネント516によって生産された再構築物518から異なるフォーマットにおけるデータにクエリすることによって、これらの機能を実施してもよい。いくつかの実施形態では、コンポーネント520は、物理的世界の着目領域内の表現が変化すると、更新を出力するように構成されてもよい。その着目領域は、例えば、ユーザの視野内の一部等、システムのユーザの近傍内の物理的世界の一部に近似するように設定される、またはユーザの視野内に入るように投影(予測/決定)されてもよい。
ARアプリケーション504は、本情報を使用して、ARコンテンツを生成および更新してもよい。ARコンテンツの仮想部分は、シースルー現実510と組み合わせて、ディスプレイ508上に提示され、現実的ユーザ体験を作成してもよい。
いくつかの実施形態では、AR体験は、遠隔処理および/または遠隔データ記憶装置を含み得る、システムの一部であり得る、ウェアラブルディスプレイデバイス、および/または、いくつかの実施形態では、他のユーザによって装着される他のウェアラブルディスプレイデバイスであり得る、XRデバイスを通して、ユーザに提供されてもよい。図4は、例証の便宜上、単一ウェアラブルデバイスを含む、システム580(以降、「システム580」と称される)の実施例を図示する。システム580は、頭部搭載型ディスプレイデバイス562(以降、「ディスプレイデバイス562」と称される)と、ディスプレイデバイス562の機能をサポートする、種々の機械および電子モジュールおよびシステムとを含む。ディスプレイデバイス562は、フレーム564に結合されてもよく、これは、ディスプレイシステムのユーザまたは視認者560(以降、「ユーザ560」と称される)によって装着可能であって、ディスプレイデバイス562をユーザ560の眼の正面に位置付けるように構成される。種々の実施形態によると、ディスプレイデバイス562は、シーケンシャルディスプレイであってもよい。ディスプレイデバイス562は、単眼または両眼であってもよい。いくつかの実施形態では、ディスプレイデバイス562は、図3におけるディスプレイ508の実施例であってもよい。
いくつかの実施形態では、スピーカ566が、フレーム564に結合され、ユーザ560の外耳道に近接して位置付けられる。いくつかの実施形態では、示されない、別のスピーカが、ユーザ560の別の外耳道に隣接して位置付けられ、ステレオ/調節可能音制御を提供する。ディスプレイデバイス562は、有線導線または無線コネクティビティ568等によって、ローカルデータ処理モジュール570に動作可能に結合され、これは、フレーム564に固定して取り付けられる、ユーザ560によって装着されるヘルメットまたは帽子に固定して取り付けられる、ヘッドホンに内蔵される、または別様にユーザ560に除去可能に取り付けられる(例えば、リュック式構成において、ベルト結合式構成において)等、種々の構成において搭載されてもよい。
ローカルデータ処理モジュール570は、プロセッサおよび不揮発性メモリ(例えば、フラッシュメモリ)等のデジタルメモリを含んでもよく、その両方とも、データの処理、キャッシュ、および記憶を補助するために利用され得る。データは、a)画像捕捉デバイス(カメラ等)、マイクロホン、慣性測定ユニット、加速度計、コンパス、GPSユニット、無線デバイス、および/またはジャイロスコープ等の(例えば、フレーム564に動作可能に結合される、または別様にユーザ560に取り付けられ得る)センサから捕捉されるデータ、および/またはb)可能性として、処理または読出後にディスプレイデバイス562への通過のために、遠隔処理モジュール572および/または遠隔データリポジトリ574を使用して入手および/または処理されるデータを含む。
いくつかの実施形態では、ウェアラブルデバイスは、遠隔コンポーネントと通信してもよい。ローカルデータ処理モジュール570は、それぞれ、有線または無線通信リンク等を介して、通信リンク576、578によって、遠隔処理モジュール572および遠隔データリポジトリ574に、これらの遠隔モジュール572、574が、相互に動作可能に結合され、ローカルデータ処理モジュール570へのリソースとして利用可能であるように、動作可能に結合されてもよい。いくつかの実施形態では、上記に説明される頭部姿勢追跡コンポーテントは、少なくとも部分的に、ローカルデータ処理モジュール570内に実装されてもよい。いくつかの実施形態では、図3における世界再構築コンポーネント516は、少なくとも部分的に、ローカルデータ処理モジュール570内に実装されてもよい。例えば、ローカルデータ処理モジュール570は、少なくとも部分的に、データの少なくとも一部に基づいて、コンピュータ実行可能命令を実行し、マップおよび/または物理的世界表現を生成するように構成されてもよい。
いくつかの実施形態では、処理は、ローカルおよび遠隔プロセッサを横断して分散されてもよい。例えば、ローカル処理が、そのユーザのデバイス上のセンサを用いて収集されたセンサデータに基づいて、マップ(例えば、追跡マップ)をユーザデバイス上に構築するために使用されてもよい。そのようなマップは、そのユーザのデバイス上のアプリケーションによって使用されてもよい。加えて、以前に作成されたマップ(例えば、規準マップ)は、遠隔データリポジトリ574内に記憶されてもよい。好適な記憶されたまたは持続的マップが、利用可能である場合、デバイス上にローカルで作成された追跡マップの代わりに、またはそれに加え、使用されてもよい。いくつかの実施形態では、追跡マップは、対応が、ユーザがシステムをオンにした時間におけるウェアラブルデバイスの位置に対して配向され得る、追跡マップと、1つ以上の持続的特徴に対して配向され得る、規準マップとの間に確立されるように、記憶されたマップに対して位置特定されてもよい。いくつかの実施形態では、持続的マップは、ユーザデバイス上にロードされ、ユーザデバイスが、走査の間に入手されたセンサデータからのユーザの完全な環境の追跡マップを構築するための場所の走査と関連付けられる遅延を伴わずに、仮想コンテンツをレンダリングすることを可能にし得る。いくつかの実施形態では、ユーザデバイスは、持続的マップをユーザデバイス上にダウンロードする必要なく、(例えば、クラウド上に記憶された)遠隔持続的マップにアクセスしてもよい。
代替として、または加えて、追跡マップは、以前に記憶されたマップとマージされ、それらのマップを拡張させる、またはその品質を改良してもよい。好適な以前に作成された環境マップが利用可能であるか、および/または追跡マップと1つ以上の記憶された環境マップをマージするかどうかを決定するための処理は、ローカルデータ処理モジュール570または遠隔処理モジュール572内で行われてもよい。
いくつかの実施形態では、ローカルデータ処理モジュール570は、データおよび/または画像情報を分析および処理するように構成される、1つ以上のプロセッサ(例えば、グラフィック処理ユニット(GPU))を含んでもよい。いくつかの実施形態では、ローカルデータ処理モジュール570は、単一プロセッサ(例えば、シングルコアまたはマルチコアARMプロセッサ)を含んでもよく、これは、ローカルデータ処理モジュール570の算出予算を限定するが、より小型のデバイスを有効にするであろう。いくつかの実施形態では、世界再構築コンポーネント516は、単一ARMコアの残りの算出予算が、例えば、メッシュの抽出等の他の使用のためにアクセスされ得るように、単一高度RISC機械(ARM)コアより少ない算出予算を使用して、物理的世界表現をリアルタイムで非所定の空間上に生成してもよい。
いくつかの実施形態では、遠隔データリポジトリ574は、デジタルデータ記憶設備を含んでもよく、これは、インターネットまたは「クラウド」リソース構成における他のネットワーキング構成を通して利用可能であってもよい。いくつかの実施形態では、全てのデータが、記憶され、全ての算出が、ローカルデータ処理モジュール570において実施され、遠隔モジュールからの完全に自律的な使用を可能にする。いくつかの実施形態では、全てのデータが、記憶され、全てまたは大部分の算出は、遠隔データリポジトリ574内で実施され、より小さいデバイスを可能にする。世界再構築物は、例えば、全体または部分的に、本リポジトリ574内に記憶されてもよい。
その中にデータが、遠隔で記憶され、ネットワークを経由してアクセス可能である、実施形態では、データは、拡張現実システムの複数のユーザによって共有されてもよい。例えば、ユーザデバイスは、その追跡マップをアップロードし、環境マップのデータベース内に拡張されてもよい。いくつかの実施形態では、追跡マップのアップロードは、ウェアラブルデバイスとのユーザセッションの終了時に生じる。いくつかの実施形態では、追跡マップのアップロードは、持続的に、半持続的に、断続的に、事前に定義された時間において、前のアップロードから事前に定義された周期後、またはあるイベントによってトリガされると、生じ得る。任意のユーザデバイスによってアップロードされた追跡マップは、そのユーザデバイスまたは任意の他のユーザデバイスからのデータに基づくかどうかにかかわらず、以前に記憶されたマップを拡張または改良するために使用されてもよい。同様に、ユーザデバイスにダウンロードされた持続的マップは、そのユーザデバイスまたは任意の他のユーザデバイスからのデータに基づいてもよい。このように、高品質環境マップが、ARシステムを用いたその体験を改良するために、ユーザに容易に利用可能であり得る。
いくつかの実施形態では、ローカルデータ処理モジュール570は、バッテリ582に動作可能に結合される。いくつかの実施形態では、バッテリ582は、市販のバッテリ等のリムーバブル電源である。他の実施形態では、バッテリ582は、リチウムイオンバッテリである。いくつかの実施形態では、バッテリ582は、ユーザ560が、電源に繋がれ、リチウムイオンバッテリを充電する必要なく、またはシステム580をシャットオフし、バッテリを交換する必要なく、より長い時間周期にわたってシステム580を動作させ得るように、システム580の非動作時間の間、ユーザ560によって充電可能な内部リチウムイオンバッテリと、リムーバブルバッテリとの両方を含む。
図5Aは、ユーザ530が物理的世界環境532(以降、「環境532」と称される)を通して移動するにつれてARコンテンツをレンダリングする、ARディスプレイシステムを装着している、ユーザ530を図示する。ユーザの移動経路に沿ってARシステムによって捕捉された情報は、1つ以上の追跡マップの中に処理されてもよい。ユーザ530は、ARディスプレイシステムを位置534に位置付け、ARディスプレイシステムは、位置534に対するパス可能世界(例えば、物理的世界内の実オブジェクトの変化に伴って記憶および更新され得る、物理的世界内の実オブジェクトのデジタル表現)の周囲情報を記録する。その情報は、画像、特徴、指向性オーディオ入力、または他の所望のデータと組み合わせて、姿勢として記憶されてもよい。位置534は、例えば、追跡マップの一部として、データ入力536に対して集約され、少なくともパス可能世界モジュール538によって処理され、これは、例えば、図4の遠隔処理モジュール572上の処理によって実装されてもよい。いくつかの実施形態では、パス可能世界モジュール538は、処理された情報が、レンダリング仮想コンテンツ内で使用される物理的オブジェクトについての他の情報と組み合わせて、物理的世界内のオブジェクトの場所を示し得るように、頭部姿勢コンポーネント514と、世界再構築コンポーネント516とを含んでもよい。
パス可能世界モジュール538は、データ入力536から決定されるように、少なくとも部分的に、ARコンテンツ540が物理的世界内に設置され得る場所および方法を決定する。ARコンテンツは、ユーザインターフェースを介して、物理的世界の表現およびARコンテンツの両方を提示することによって、物理的世界内に「設置」され、ARコンテンツは、物理的世界内のオブジェクトと相互作用しているかのようにレンダリングされ、物理的世界内のオブジェクトは、ARコンテンツが、適切なとき、それらのオブジェクトのユーザのビューを不明瞭にしているかのように提示される。いくつかの実施形態では、ARコンテンツは、固定要素542(例えば、テーブル)の一部を再構築物(例えば、再構築物518)から適切に選択し、ARコンテンツ540の形状および位置を決定することによって、設置されてもよい。実施例として、固定要素は、テーブルであってもよく、仮想コンテンツは、そのテーブル上に現れるように位置付けられてもよい。いくつかの実施形態では、ARコンテンツは、現在の視野または推定される将来的視野であり得る、視野544内の構造の中に設置されてもよい。いくつかの実施形態では、ARコンテンツは、物理的世界のモデル546(例えば、メッシュ)に対して持続されてもよい。
描写されるように、固定要素542は、ユーザ530にそれが見える度に、システムが固定要素542にマッピングする必要なく、ユーザ530が固定要素542上にコンテンツを知覚し得るように、パス可能世界モジュール538内に記憶され得る、物理的世界内の任意の固定要素のためのプロキシ(例えば、デジタルコピー)としての役割を果たす。固定要素542は、したがって、前のモデル化セッションからの、または別個のユーザから決定されるものであるものの、複数のユーザによる将来的参照のためにパス可能世界モジュール538によって記憶される、メッシュモデルであってもよい。したがって、パス可能世界モジュール538は、環境532を以前にマッピングされた環境から認識し、ユーザ530のデバイスが環境532の全部または一部を最初にマッピングすることなく、ARコンテンツを表示し、算出プロセスおよびサイクルを節約し、任意のレンダリングされたARコンテンツの待ち時間を回避し得る。
物理的世界のメッシュモデル546は、ARディスプレイシステムによって作成されてもよく、ARコンテンツ540と相互作用し、表示するための適切な表面およびメトリックは、完全または部分的に、モデルを再作成する必要なく、ユーザ530または他のユーザによる将来的読出のために、パス可能世界モジュール538によって記憶されることができる。いくつかの実施形態では、データ入力536は、パス可能世界モジュール538に、1つ以上の固定要素のうちのどの固定要素542が利用可能であるかどうか、固定要素542上に最後に設置されたARコンテンツ540、およびその同一コンテンツを表示すべきかどうか(そのようなARコンテンツは、ユーザが特定のパス可能世界モデルを視認しているかどうかにかかわらず、「持続」コンテンツである)を示すための、地理的場所、ユーザ識別、および現在のアクティビティ等の入力である。
オブジェクトが固定されていると見なされる(例えば、台所のテーブル)、実施形態においてさえ、パス可能世界モジュール538は、物理的世界の変化の可能性を考慮するために、物理的世界のモデル内のそれらのオブジェクトを随時更新してもよい。固定されたオブジェクトのモデルは、非常に低頻度で更新されてもよい。物理的世界内の他のオブジェクトは、移動している、または別様に固定されていると見なされないものであり得る(例えば、台所の椅子)。AR場面を現実的感覚でレンダリングするために、ARシステムは、これらの非固定オブジェクトの位置を、固定オブジェクトを更新するために使用されるものよりはるかに高い頻度で更新してもよい。物理的世界内のオブジェクトの全ての正確な追跡を有効にするために、ARシステムは、1つ以上の画像センサを含む、複数のセンサから情報を引き出してもよい。
図5Bは、視認光学系アセンブリ548および付帯コンポーネントの概略例証である。いくつかの実施形態では、2つの眼追跡カメラ550が、ユーザの眼549に向かって指向され、眼形状、眼瞼オクルージョン、瞳孔方向、およびユーザの眼549上の閃光等、ユーザの眼549のメトリックを検出する。
いくつかの実施形態では、センサのうちの1つは、飛行時間センサ等の深度センサ551であって、信号を世界に放出し、近隣のオブジェクトからのそれらの信号の反射を検出し、所与のオブジェクトまでの距離を決定してもよい。深度センサは、例えば、オブジェクトが、それらのオブジェクトの運動またはユーザの姿勢の変化のいずれかの結果として、ユーザの視野に進入したかどうかを迅速に決定し得る。しかしながら、ユーザの視野内のオブジェクトの位置についての情報は、代替として、または加えて、他のセンサを用いて収集されてもよい。深度情報は、例えば、立体視的画像センサまたはプレノプティックセンサから取得されてもよい。
いくつかの実施形態では、世界カメラ552は、周辺より広いビューを記録し、マッピングし、および/または別様に、環境532のモデルを作成し、ARコンテンツに影響を及ぼし得る、入力を検出する。いくつかの実施形態では、世界カメラ552および/またはカメラ553は、グレースケールおよび/またはカラー画像センサであってもよく、これは、グレースケールおよび/またはカラー画像フレームを固定される時間インターバルにおいて出力してもよい。カメラ553はさらに、ユーザの視野内の物理的世界画像を具体的時間において捕捉してもよい。フレームベースの画像センサのピクセルは、その値が不変である場合でも、反復的にサンプリングされてもよい。世界カメラ552、カメラ553、および深度センサ551はそれぞれ、554、555、および556の個別の視野を有し、図34Aに描写される物理的世界環境532等の物理的世界場面からのデータを収集および記録する。
慣性測定ユニット557は、視認光学系アセンブリ548の移動および配向を決定してもよい。いくつかの実施形態では、各コンポーネントは、少なくとも1つの他のコンポーネントに動作可能に結合される。例えば、深度センサ551は、ユーザの眼549が見ている実際の距離に対する測定された遠近調節の確認として、眼追跡カメラ550に動作可能に結合される。
視認光学系アセンブリ548は、図34Bに図示されるコンポーネントのうちのいくつかを含んでもよく、図示されるコンポーネントの代わりに、またはそれに加え、コンポーネントを含んでもよいことを理解されたい。いくつかの実施形態では、例えば、視認光学系アセンブリ548は、4つの代わりに、2つの世界カメラ552を含んでもよい。代替として、または加えて、カメラ552および553は、その完全視野の可視光画像を捕捉する必要はない。視認光学系アセンブリ548は、他のタイプのコンポーネントを含んでもよい。いくつかの実施形態では、視認光学系アセンブリ548は、1つ以上の動的視覚センサ(DVS)を含んでもよく、そのピクセルは、光強度の相対的変化が閾値を超えることに非同期して応答してもよい。
いくつかの実施形態では、視認光学系アセンブリ548は、飛行時間情報に基づく深度センサ551を含まなくてもよい。いくつかの実施形態では、例えば、視認光学系アセンブリ548は、1つ以上のプレノプティックカメラを含んでもよく、そのピクセルは、入射光の光強度および角度を捕捉してもよく、そこから深度情報が、決定されることができる。例えば、プレノプティックカメラは、透過性回折マスク(TDM)でオーバーレイされた画像センサを含んでもよい。代替として、または加えて、プレノプティックカメラは、角度感知ピクセルおよび/または位相検出自動焦点ピクセル(PDAF)および/またはマイクロレンズアレイ(MLA)を含有する、画像センサを含んでもよい。そのようなセンサは、深度センサ551の代わりに、またはそれに加え、深度情報源としての役割を果たし得る。
また、図5Bにおけるコンポーネントの構成は、実施例として提供されることを理解されたい。視認光学系アセンブリ548は、任意の好適な構成を伴うコンポーネントを含んでもよく、これは、ユーザに、特定のセットのコンポーネントのために実践的な最大視野を提供するように設定されてもよい。例えば、視認光学系アセンブリ548が、1つの世界カメラ552を有する場合、世界カメラは、側面の代わりに、視認光学系アセンブリの中心領域内に設置されてもよい。
視認光学系アセンブリ548内のセンサからの情報は、システム内のプロセッサのうちの1つ以上のものに結合されてもよい。プロセッサは、ユーザに仮想コンテンツが物理的世界内のオブジェクトと相互作用するように知覚させるようにレンダリングされ得る、データを生成してもよい。そのレンダリングは、物理的および仮想オブジェクトの両方を描写する、画像データを生成するステップを含め、任意の好適な方法において実装されてもよい。他の実施形態では、物理的および仮想コンテンツは、ユーザが物理的世界を透かし見る、ディスプレイデバイスの不透明度を変調させることによって、1つの場面に描写されてもよい。不透明度は、仮想オブジェクトの外観を作成し、ユーザに仮想オブジェクトによってオクルードされる物理的世界内のオブジェクトが見えないように遮断するように、制御されてもよい。いくつかの実施形態では、画像データは、仮想コンテンツがユーザインターフェースを通して視認されるとき、物理的世界と現実的に相互作用するように、ユーザによって知覚されるように修正され得る(例えば、コンテンツをクリッピングし、オクルージョンを考慮する)、仮想コンテンツのみを含んでもよい。
コンテンツが特定の場所におけるオブジェクトの印象を作成するために表示され得る、視認光学系アセンブリ548上の場所は、視認光学系アセンブリの物理学に依存し得る。加えて、物理的世界に対するユーザの頭部の姿勢およびユーザの眼が見ている方向は、コンテンツが現れるであろう視認光学系アセンブリ上の特定の場所に表示される、物理的世界コンテンツ内の場所に影響を及ぼすであろう。上記に説明されるようなセンサは、センサ入力を受信するプロセッサが、オブジェクトが、視認光学系アセンブリ548上にレンダリングされ、ユーザのために所望の外観を作成すべき場所を算出し得るように、本情報を収集し、および/またはそこから本情報が計算され得る、情報を供給してもよい。
コンテンツがユーザに提示される方法にかかわらず、物理的世界のモデルが、仮想オブジェクトの形状、位置、運動、および可視性を含む、物理的オブジェクトによって影響され得る、仮想オブジェクトの特徴が、正しく算出され得るように、使用され得る。いくつかの実施形態では、モデルは、物理的世界の再構築物、例えば、再構築物518を含んでもよい。
そのモデルは、ユーザのウェアラブルデバイス上のセンサから収集されたデータから作成されてもよい。但し、いくつかの実施形態では、モデルは、複数のユーザによって収集されたデータから作成されてもよく、これは、全てのユーザから遠隔のコンピューティングデバイス内に集約されてもよい(かつ「クラウド内」にあってもよい)。
モデルは、少なくとも部分的に、例えば、図6Aにさらに詳細に描写される図3の世界再構築コンポーネント516等の世界再構築システムによって作成されてもよい。世界再構築コンポーネント516は、物理的世界の一部のための表現を生成、更新、および記憶し得る、知覚モジュール660を含んでもよい。いくつかの実施形態では、知覚モジュール660は、センサの再構築範囲内の物理的世界の一部を複数のボクセルとして表し得る。各ボクセルは、物理的世界内の所定の体積の3D立方体に対応し、表面情報を含み、ボクセルによって表される体積内に表面が存在するかどうかを示し得る。ボクセルは、その対応する体積が、物理的オブジェクトの表面を含むと決定されている、空であると決定されている、またはセンサを用いてまだ測定されていない、したがって、その値が未知であるかどうかを示す、値を割り当てられてもよい。空または未知であると決定されたボクセルを示す値は、明示的に記憶される必要はなく、ボクセルの値は、空または未知であると決定されたボクセルに関する情報を記憶しないことを含め、任意の好適な方法において、コンピュータメモリ内に記憶されてもよいことを理解されたい。
持続される世界表現のための情報を生成することに加え、知覚モジュール660は、ARシステムのユーザの周囲の領域の変化のインジケーションを識別し、出力してもよい。そのような変化のインジケーションは、持続される世界の一部として記憶される立体データへの更新をトリガする、またはARコンテンツを生成し、ARコンテンツを更新する、コンポーネント604をトリガする等、他の機能をトリガしてもよい。
いくつかの実施形態では、知覚モジュール660は、符号付き距離関数(SDF)モデルに基づいて、変化を識別してもよい。知覚モジュール660は、例えば、深度マップ660aおよび頭部姿勢660b等のセンサデータを受信し、次いで、センサデータをSDFモデル660cに融合させるように構成されてもよい。深度マップ660aは、直接、SDF情報を提供してもよく、画像は、SDF情報に到着するように処理されてもよい。SDF情報は、その情報を捕捉するために使用されるセンサからの距離を表す。それらのセンサは、ウェアラブルユニットの一部であり得るため、SDF情報は、ウェアラブルユニットの視点、したがって、ユーザの視点から物理的世界を表し得る。頭部姿勢660bは、SDF情報が物理的世界内のボクセルに関連されることを可能にし得る。
いくつかの実施形態では、知覚モジュール660は、知覚範囲内にある、物理的世界の一部のための表現を生成、更新、および記憶してもよい。知覚範囲は、少なくとも部分的に、センサの再構築範囲に基づいて決定されてもよく、これは、少なくとも部分的に、センサの観察範囲の限界に基づいて決定されてもよい。具体的実施例として、アクティブIRパルスを使用して動作する、アクティブ深度センサは、ある距離の範囲にわたって確実に動作し、数センチメートルまたは数十センチメートル~数メートルであり得る、センサの観察範囲を作成し得る。
世界再構築コンポーネント516は、知覚モジュール660と相互作用し得る、付加的モジュールを含んでもよい。いくつかの実施形態では、持続される世界モジュール662は、知覚モジュール660によって入手されたデータに基づいて、物理的世界のための表現を受信してもよい。持続される世界モジュール662はまた、物理的世界の種々のフォーマットの表現を含んでもよい。例えば、ボクセル等の立体メタデータ662bが、メッシュ662cおよび平面662dとともに記憶されてもよい。いくつかの実施形態では、深度マップ等の他の情報も、保存され得る。
いくつかの実施形態では、図6Aに図示されるもの等の物理的世界の表現は、上記に説明されるように、特徴点に基づく追跡マップ等の疎マップと比較して、物理的世界についての比較的に稠密情報を提供し得る。
いくつかの実施形態では、知覚モジュール660は、例えば、メッシュ660d、平面、および意味論660eを含む、種々のフォーマットにおける、物理的世界のための表現を生成する、モジュールを含んでもよい。物理的世界のための表現は、ローカルおよび遠隔記憶媒体を横断して記憶されてもよい。物理的世界のための表現は、例えば、記憶媒体の場所に応じて、異なる座標フレーム内に説明されてもよい。例えば、デバイス内に記憶された物理的世界のための表現は、デバイスにローカルの座標フレーム内に説明されてもよい。物理的世界のための表現は、クラウド内に記憶された対応物を有してもよい。クラウド内の対応物は、XRシステム内の全てのデバイスによって共有される座標フレーム内に説明されてもよい。
いくつかの実施形態では、これらのモジュールは、表現が生成された時点の1つ以上のセンサの知覚範囲内のデータおよび以前の時間に捕捉されたデータおよび持続される世界モジュール662内の情報に基づいて、表現を生成してもよい。いくつかの実施形態では、これらのコンポーネントは、深度センサを用いて捕捉された深度情報に作用してもよい。しかしながら、ARシステムは、視覚センサを含んでもよく、単眼または両眼視覚情報を分析することによって、そのような表現を生成してもよい。
いくつかの実施形態では、これらのモジュールは、物理的世界の領域に作用してもよい。それらのモジュールは、物理的世界のサブ領域を、知覚モジュール660がそのサブ領域内の物理的世界の変化を検出すると、更新するようにトリガされてもよい。そのような変化は、例えば、SDFモデル660c内の新しい表面を検出することによって、またはサブ領域を表す十分な数のボクセルの値の変化等の他の基準によって、検出されてもよい。
世界再構築コンポーネント516は、物理的世界の表現を知覚モジュール660から受信し得る、コンポーネント664を含んでもよい。物理的世界についての情報は、例えば、アプリケーションからの使用要求に従って、これらのコンポーネントによってプル配信されてもよい。いくつかの実施形態では、情報は、事前に識別された領域の変化または知覚範囲内の物理的世界表現の変化のインジケーション等を介して、使用コンポーネントにプッシュ配信されてもよい。コンポーネント664は、例えば、視覚的オクルージョン、物理学ベースの相互作用、および環境推測のための処理を実施する、ゲームプログラムおよび他のコンポーネントを含んでもよい。
コンポーネント664からのクエリに応答して、知覚モジュール660は、物理的世界のための表現を1つ以上のフォーマットにおいて送信してもよい。例えば、コンポーネント664が、使用が視覚的オクルージョンまたは物理学ベースの相互作用のためのものであることを示すとき、知覚モジュール660は、表面の表現を送信してもよい。コンポーネント664が、使用が環境推測のためのものであることを示すとき、知覚モジュール660は、物理的世界のメッシュ、平面、および意味論を送信してもよい。
いくつかの実施形態では、知覚モジュール660は、フォーマット情報をコンポーネント664に提供する、コンポーネントを含んでもよい。そのようなコンポーネントの実施例は、レイキャスティングコンポーネント660fであってもよい。使用コンポーネント(例えば、コンポーネント664)は、例えば、特定の視点からの物理的世界についての情報をクエリしてもよい。レイキャスティングコンポーネント660fは、その視点からの視野内の物理的世界データの1つ以上の表現から選択してもよい。
前述の説明から理解されるはずであるように、知覚モジュール660またはARシステムの別のコンポーネントは、データを処理し、物理的世界の一部の3D表現を作成してもよい。処理されるべきデータは、少なくとも部分的に、カメラ錐台および/または深度画像に基づいて、3D再構築体積の一部を間引く、平面データを抽出および持続させる、近傍系の一貫性を維持しながらローカル更新を可能にするブロックにおいて、3D再構築データを捕捉し、持続させ、更新する、オクルージョンデータが1つ以上の深度データソースの組み合わせから導出される、オクルージョンデータをそのような場面を生成するアプリケーションに提供する、および/または多段階メッシュ簡略化を実施することによって、低減され得る。再構築物は、例えば、ライブ深度データ等の未加工データ、ボクセル等の融合された立体データ、およびメッシュ等の算出されたデータを含む、異なるレベルの精巧さのデータを含有してもよい。
いくつかの実施形態では、パス可能世界モデルのコンポーネントは、分散されてもよく、いくつかの部分は、XRデバイス上でローカルで実行され、いくつかの部分は、サーバに接続されるネットワーク上または別様にクラウド内等の遠隔で実行される。ローカルXRデバイスとクラウドとの間の情報の処理および記憶の配分は、XRシステムの機能性およびユーザ体験に影響を及ぼし得る。例えば、処理をクラウドに配分することによって、ローカルデバイス上の処理を低減させることは、より長いバッテリ寿命を有効にし、ローカルデバイス上に生成される熱を低減させ得る。しかし、はるかに多い処理をクラウドに配分することは、容認不可能なユーザ体験を引き起こす、望ましくない待ち時間を作成し得る。
図6Bは、いくつかの実施形態による、空間コンピューティングのために構成される、分散型コンポーネントアーキテクチャ600を描写する。分散型コンポーネントアーキテクチャ600は、パス可能世界コンポーネント602(例えば、図5AにおけるPW538)と、Lumin OS604と、API606と、SDK608と、アプリケーション610とを含んでもよい。Lumin OS604は、XRデバイスと互換性があるカスタムドライバを伴う、Linux(登録商標)ベースのカーネルを含んでもよい。APIの606は、XRアプリケーション(例えば、アプリケーション610)にXRデバイスの空間コンピューティング特徴へのアクセスを与える、アプリケーションプログラミングインターフェースを含んでもよい。SDK608は、XRアプリケーションの作成を可能にする、ソフトウェア開発キットを含んでもよい。
アーキテクチャ600内の1つ以上のコンポーネントは、パス可能世界のモデルを作成および維持してもよい。本実施例では、センサデータは、ローカルデバイス上で収集される。そのセンサデータの処理は、部分的に、XRデバイス上でローカルで、部分的に、クラウド内で実施されてもよい。PW538は、少なくとも部分的に、複数のユーザによって装着されるARデバイスによって捕捉されたデータに基づいて作成される、環境マップを含んでもよい。AR体験のセッションの間、個々のARデバイス(図4に関連して上記に説明されるウェアラブルデバイス等)は、マップの1つのタイプである、追跡マップを作成してもよい。
いくつかの実施形態では、デバイスは、疎マップおよび稠密マップの両方を構築する、コンポーネントを含んでもよい。追跡マップは、疎マップとしての役割を果たしてもよく、環境を走査するARデバイスの頭部姿勢ならび各頭部姿勢においてその環境内で検出されたオブジェクトについての情報を含んでもよい。それらの頭部姿勢は、デバイス毎にローカルで維持されてもよい。例えば、各デバイス上の頭部姿勢は、デバイスがそのセッションのためにオンにされたときの初期頭部姿勢に対するものであり得る。結果として、各追跡マップは、それを作成するデバイスにローカルであり得る。稠密マップは、表面情報を含んでもよく、これは、メッシュまたは深度情報によって表されてもよい。代替として、または加えて、稠密マップは、平面および/または他のオブジェクトの場所および/または特性等の表面または深度情報から導出されるより高いレベルの情報を含んでもよい。
稠密マップの作成は、いくつかの実施形態では、疎マップの作成から独立してもよい。稠密マップおよび疎マップの作成は、例えば、ARシステム内の別個の処理パイプライン内で実施されてもよい。処理を分離することは、例えば、異なるタイプのマップの生成または処理が異なるレートで実施されることを可能にし得る。疎マップは、例えば、稠密マップより高速のレートでリフレッシュされてもよい。しかしながら、いくつかの実施形態では、稠密および疎マップの処理は、異なるパイプライン内で実施される場合でも、関連し得る。疎マップ内で露見される物理的世界の変化は、例えば、稠密マップの更新をトリガし得る、またはその逆である。さらに、独立して作成される場合でも、マップは、ともに使用され得る。例えば、疎マップから導出される座標系は、稠密マップ内のオブジェクトの位置および/または配向を定義するために使用されてもよい。
疎マップおよび/または稠密マップは、同一デバイスによる再使用のために、および/または他のデバイスと共有するために、存続してもよい。そのような存続は、情報をクラウド内に記憶することによって達成されてもよい。ARデバイスは、追跡マップをクラウドに送信し、例えば、クラウド内に以前に記憶された存続されるマップから選択された環境マップとマージしてもよい。いくつかの実施形態では、選択された存続されるマップは、マージするために、クラウドからARデバイスに送信されてもよい。いくつかの実施形態では、存続されるマップは、1つ以上の持続的座標フレームに対して配向されてもよい。そのようなマップは、それらが複数のデバイスのいずれかによって使用され得るため、規準マップとしての役割を果たし得る。いくつかの実施形態では、パス可能世界のモデルは、1つ以上の規準マップを含む、または作成されてもよい。デバイスは、デバイスにローカルの座標フレームに基づいて、いくつかの動作を実施するものの、デバイスにローカルのその座標フレームと規準マップとの間の変換を決定することによって、規準マップを使用してもよい。
規準マップは、追跡マップ(TM)(例えば、図31AにおけるTM1102)として生じてもよく、これは、規準マップにプロモートされ得る。規準マップは、規準マップにアクセスするデバイスが、いったんそのローカル座標系と規準マップの座標系との間の変換を決定すると、規準マップ内の情報を使用して、デバイスの周囲の物理的世界内の規準マップ内に表されるオブジェクトの場所を決定し得るように、存続されてもよい。いくつかの実施形態では、TMは、XRデバイスによって作成された頭部姿勢疎マップであってもよい。いくつかの実施形態では、規準マップは、異なる時間においてXRデバイスによって、または他のXRデバイスによって、捕捉された付加的TMとマージするために、XRデバイスが1つ以上のTMをクラウドサーバに送信すると、作成されてもよい。
規準マップまたは他のマップは、個別のマップを作成するために処理されたデータによって表される物理的世界の一部についての情報を提供してもよい。図7は、いくつかの実施形態による、例示的追跡マップ700を描写する。追跡マップ700は、点702によって表される対応する物理的世界内の物理的オブジェクトの平面図706を提供してもよい。いくつかの実施形態では、マップ点702は、複数の特徴を含み得る、物理的オブジェクトの特徴を表し得る。例えば、テーブルの各角は、マップ上の点によって表される、特徴であり得る。特徴は、拡張現実システム内のウェアラブルデバイスのセンサを用いて入手され得るような処理画像から導出されてもよい。特徴は、例えば、センサによって出力された画像フレームを処理し、画像内の大勾配または他の好適な基準に基づいて、特徴を識別することによって導出されてもよい。さらなる処理は、各フレーム内の特徴の数を限定してもよい。例えば、処理は、持続的オブジェクトを表す可能性が高い、特徴を選択してもよい。1つ以上のヒューリスティックが、本選択のために適用されてもよい。
追跡マップ700は、デバイスによって収集された点702に関するデータを含んでもよい。追跡マップ内に含まれるデータ点を伴う、画像フレーム毎に、姿勢が、記憶されてもよい。姿勢は、各画像フレーム内の特徴点が空間的に相関され得るように、そこから画像フレームが捕捉された配向を表し得る。姿勢は、ウェアラブルデバイス上のIMUセンサ等のセンサから導出され得るような位置付け情報によって決定されてもよい。代替として、または加えて、姿勢は、画像フレームと、物理的世界の重複部分を描写する、他の画像フレームをマッチングさせることから決定されてもよい。2つのフレーム内の特徴点のサブセットをマッチングさせることによって遂行され得る、そのような位置相関を見出すことによって、2つのフレーム間の相対的姿勢が、算出され得る。相対的姿勢は、マップが、追跡マップの構築が開始されたときのデバイスの初期姿勢に基づいて確立されるデバイスにローカルの座標系に対するものであり得るため、追跡マップのために適正であり得る。
センサを用いて収集された情報の多くが冗長である可能性が高いため、デバイスによって収集された特徴点および画像フレームの全てが、追跡マップの一部として留保され得るわけではない。むしろ、あるフレームのみが、マップに追加されてもよい。それらのフレームは、すでにマップ内にある画像フレームとの重複度、それらが含有する新しい特徴の数、またはフレーム内の特徴に関する品質メトリック等の1つ以上の基準に基づいて選択されてもよい。追跡マップに追加されない画像フレームは、破棄されてもよい、または特徴の場所を改訂するために使用されてもよい。さらなる代替として、特徴のセットとして表される、画像フレームの全部または大部分が、留保されてもよいが、それらのフレームのサブセットは、キーフレームとして指定されてもよく、これは、さらなる処理のために使用される。
キーフレームは、処理され、キーリグ704を生産してもよい。キーフレームは、処理され、特徴点の3次元セットを生産し、キーリグ704として保存されてもよい。そのような処理は、例えば、2つのカメラから同時に導出される画像フレームを比較し、特徴点の3D位置を立体視的に決定するステップを伴ってもよい。姿勢等のメタデータが、これらのキーフレームおよび/またはキーリグと関連付けられてもよい。
環境マップは、例えば、ARデバイスのローカル記憶装置および遠隔記憶装置を含む、例えば、環境マップの記憶場所に応じて、複数のフォーマットのいずれかを有してもよい。例えば、遠隔記憶装置内のマップは、メモリが限定されると、ウェアラブルデバイス上のローカル記憶装置内のマップより高い分解能を有してもよい。より高い分解能マップを遠隔記憶装置からローカル記憶装置に送信するために、マップは、マップ内に記憶される物理的世界のエリアあたりの姿勢の数および/または姿勢毎に記憶される特徴点の数を低減させること等によって、ダウンサンプリングまたは別様に適切なフォーマットに変換されてもよい。いくつかの実施形態では、遠隔記憶装置からの高分解能マップのスライスまたは一部が、ローカル記憶装置に送信されてもよく、スライスまたは一部は、ダウンサンプリングされない。
環境マップのデータベースは、新しい追跡マップが作成されるにつれて、更新されてもよい。データベース内の潜在的に非常に多数の環境マップのうちのどれが更新されるべきかを決定するために、更新するステップは、新しい追跡マップに関連するデータベース内に記憶される1つ以上の環境マップを効率的に選択するステップを含んでもよい。選択された1つ以上の環境マップは、関連性によってランク付けされてもよく、最高ランク付けマップのうちの1つ以上のものが、より高いランク付けされた選択された環境マップと新しい追跡マップをマージし、1つ以上の更新された環境マップを作成するために処理するために選択されてもよい。新しい追跡マップが、それにわたって更新するための既存の環境マップが存在しない、物理的世界の部分を表すとき、その追跡マップは、新しい環境マップとしてデータベース内に記憶されてもよい。
ビュー独立ディスプレイ
本明細書に説明されるものは、仮想コンテンツを視認する眼の場所から独立して、XRシステムを使用して仮想コンテンツを提供するための方法および装置である。従来、仮想コンテンツは、表示システムの任意の運動に応じて、再レンダリングされる。例えば、ディスプレイシステムを装着しているユーザが、ディスプレイ上の3次元(3D)オブジェクトの仮想表現を視認し、3Dオブジェクトが現れるエリアの周囲を歩き回る場合、3Dオブジェクトは、ユーザが実空間を占有する、オブジェクトの周囲を歩き回っているという知覚を有するように、視点毎に再レンダリングされるべきである。しかしながら、再レンダリングは、システムの有意な算出リソースを消費し、待ち時間に起因して、アーチファクトを生じさせる。
本発明者らは、頭部姿勢(例えば、XRシステムを装着しているユーザの場所および配向)が、ユーザの頭部における眼回転から独立して、仮想コンテンツをレンダリングするために使用され得ることを認識し、その真価を認めた。いくつかの実施形態では、場面の動的マップが、ユーザの頭部における眼回転から独立して、および/または、例えば、高速算出集約的動作の間に生成された熱によって生じるセンサ変形から独立して、動的マップと相互作用する仮想コンテンツが、ロバストにレンダリングされ得るように、1つ以上のセッションを横断して、実空間内の複数の座標フレームに基づいて生成されてもよい。いくつかの実施形態では、複数の座標フレームの構成は、第1のユーザによって装着される第1のXRデバイスおよび第2のユーザによって装着される第2のXRデバイスが、場面内の共通場所を認識することを可能にし得る。いくつかの実施形態では、複数の座標フレームの構成は、XRデバイスを装着しているユーザが、仮想コンテンツを場面の同一場所内で視認することを可能にし得る。
いくつかの実施形態では、追跡マップが、世界座標フレーム内に構築されてもよく、これは、世界原点を有してもよい。世界原点は、XRデバイスが電源投入されるときの、XRデバイスの第1の姿勢であってもよい。世界原点は、XRアプリケーションの開発者が余剰作業を伴わずに重力整合を得ることができるように、重力に整合されてもよい。異なる追跡マップが、追跡マップが、異なるセッションにおける同一XRデバイスおよび/または異なるユーザによって装着される異なるXRデバイスによって捕捉され得るため、異なる世界座標フレーム内に構築されてもよい。いくつかの実施形態では、XRデバイスのセッションは、デバイスを電源オンにしてから開始し、電源オフにするまで続いてもよい。いくつかの実施形態では、XRデバイスは、頭部座標フレームを有してもよく、これは、頭部原点を有してもよい。頭部原点は、画像が撮影されるときの、XRデバイスの現在の姿勢であってもよい。世界座標フレームおよび頭部座標フレームの頭部姿勢の間の差異は、追跡ルートを推定するために使用されてもよい。
いくつかの実施形態では、XRデバイスは、カメラ座標フレームを有してもよく、これは、カメラ原点を有してもよい。カメラ原点は、XRデバイスの1つ以上のセンサの現在の姿勢であってもよい。本発明者らは、カメラ座標フレームの構成が、ユーザの頭部における眼回転から独立して、仮想コンテンツのロバストな表示を有効にすることを認識し、その真価を認めた。本構成はまた、例えば、動作の間に生成された熱に起因するセンサ変形から独立して、仮想コンテンツのロバストな表示を有効にする。
いくつかの実施形態では、XRデバイスは、ユーザが、その頭部に固着させ得、ユーザの各眼の正面に1つずつ、2つの導波管を含み得る、頭部搭載可能フレームを伴う、頭部ユニットを有してもよい。導波管は、実世界オブジェクトからの周囲光が、導波管を通して透過し得、ユーザに実世界オブジェクトが見え得るように、透明であり得る。各導波管は、プロジェクタから投影された光をユーザの個別の眼に透過させ得る。投影された光は、画像を眼の網膜上に形成し得る。眼の網膜は、したがって、周囲光および投影された光を受光する。ユーザには、同時に、実世界オブジェクトと、投影された光によって作成される、1つ以上の仮想オブジェクトとが見え得る。いくつかの実施形態では、XRデバイスは、ユーザの周囲の実世界オブジェクトを検出する、センサを有してもよい。これらのセンサは、例えば、実世界オブジェクトの場所を識別するために処理され得る、画像を捕捉する、カメラであってもよい。
いくつかの実施形態では、XRシステムは、仮想コンテンツを世界座標フレーム内に結び付けることとは対照的に、座標フレームを仮想コンテンツに割り当ててもよい。そのような構成は、ユーザのためにレンダリングされた場所にかかわらず、仮想コンテンツが説明されることを可能にするが、例えば、図14-20Cに関連して説明される持続的座標フレーム(PCF)等のより持続的フレーム位置に結び付けられ、規定された場所にレンダリングされ得る。オブジェクトの場所が変化すると、XRデバイスは、環境マップの変化を検出し、ユーザによって装着される頭部ユニットの移動を実世界オブジェクトに対して決定してもよい。
図8は、いくつかの実施形態による、XRシステム10によって物理的環境内にレンダリングされるような仮想コンテンツを体験するユーザを図示する。XRシステムは、第1のユーザ14.1によって装着される、第1のXRデバイス12.1と、ネットワーク18と、サーバ20とを含んでもよい。ユーザ14.1は、テーブル16の形態における実オブジェクトを伴う、物理的環境内に存在する。
図示される実施例では、第1のXRデバイス12.1は、頭部ユニット22と、ベルトパック24と、ケーブル接続26とを含む。第1のユーザ14.1は、頭部ユニット22をその頭部に、頭部ユニット22から遠隔のベルトパック24をその腰部上に固着させる。ケーブル接続26は、頭部ユニット22をベルトパック24に接続する。頭部ユニット22は、第1のユーザ14.1にテーブル16等の実オブジェクトが見えることを可能にしたまま、仮想オブジェクトまたは複数のオブジェクトを第1のユーザ14.1に表示するために使用される、技術を含む。ベルトパック24は、主に、第1のXRデバイス12.1の処理および通信能力を含む。いくつかの実施形態では、処理および通信能力は、ベルトパック24が、除去され得る、またはリュック等の別のデバイス内に位置し得るように、全体的または部分的に、頭部ユニット22内に常駐してもよい。
図示される実施例では、ベルトパック24は、無線接続を介して、ネットワーク18に接続される。サーバ20は、ネットワーク18に接続され、ローカルコンテンツを表すデータを保持する。ベルトパック24は、ローカルコンテンツを表すデータをサーバ20からネットワーク18を介してダウンロードする。ベルトパック24は、ケーブル接続26を介して、データを頭部ユニット22に提供する。頭部ユニット22は、光源、例えば、レーザ光源または発光ダイオード(LED)光源と、光を誘導する、導波管とを有する、ディスプレイを含んでもよい。
いくつかの実施形態では、第1のユーザ14.1は、頭部ユニット22をその頭部に、ベルトパック24をその腰部に搭載してもよい。ベルトパック24は、仮想コンテンツを表す画像データをネットワーク18を経由してサーバ20からダウンロードしてもよい。第1のユーザ14.1には、頭部ユニット22のディスプレイを通して、テーブル16が見え得る。頭部ユニット22の一部を形成する、プロジェクタは、画像データをベルトパック24から受信し、画像データに基づいて、光を生成してもよい。光は、頭部ユニット22のディスプレイの一部を形成する導波管のうちの1つ以上のものを通して進行してもよい。光は、次いで、導波管から出射し、第1のユーザ14.1の眼の網膜上に伝搬してもよい。プロジェクタは、第1のユーザ14.1の眼の網膜上に複製される、パターンにおいて光を生成してもよい。第1のユーザ14.1の眼の網膜上に当たる光は、第1のユーザ14.1が画像を導波管の背後の事前に選択された深度において知覚するように、選択された被写界深度を有してもよい。加えて、第1のユーザ14.1の両眼は、第1のユーザ14.1の脳が3次元画像または複数の画像を頭部ユニット22からの選択された距離において知覚するように、若干異なる画像を受信してもよい。図示される実施例では、第1のユーザ14.1は、仮想コンテンツ28をテーブル16の上方において知覚する。仮想コンテンツ28および第1のユーザ14.1からのその場所および距離の割合は、仮想コンテンツ28を表すデータと、仮想コンテンツ28を第1のユーザ14.1に表示するために使用される、種々の座標フレームとによって決定される。
図示される実施例では、仮想コンテンツ28は、図面の視点から不可視であって、第1のXRデバイス12.1の使用を通して第1のユーザ14.1に可視である。仮想コンテンツ28は、最初に、視覚データ内のデータ構造およびベルトパック24内のアルゴリズムとして常駐し得る。データ構造は、次いで、頭部ユニット22のプロジェクタがデータ構造に基づいて光を生成するとき、光として露見し得る。仮想コンテンツ28は、第1のユーザ14.1の正面の3次元空間内に存在しないが、仮想コンテンツ28は、依然として、頭部ユニット22の装着者が知覚する内容の例証目的のために、3次元空間内の図1において表されることを理解されたい。3次元空間内のコンピュータデータの可視化は、1人以上のユーザによって知覚されるレンダリングを促進するデータ構造が、ベルトパック24内のデータ構造の中で相互に関連する方法を図示するために、本説明において使用され得る。
図9は、いくつかの実施形態による、第1のXRデバイス12.1のコンポーネントを図示する。第1のXRデバイス12.1は、頭部ユニット22と、例えば、レンダリングエンジン30と、種々の座標系32と、種々の原点および目的地座標フレーム34と、種々の原点/目的地座標フレーム変換器36とを含む、視覚データおよびアルゴリズムの一部を形成する、種々のコンポーネントとを含んでもよい。種々の座標系は、XRデバイスの固有性質に基づいてもよい、または本明細書に説明されるような持続的姿勢または持続的座標系等の他の情報を参照することによって決定されてもよい。
頭部ユニット22は、頭部搭載可能フレーム40と、ディスプレイシステム42と、実オブジェクト検出カメラ44と、移動追跡カメラ46と、慣性測定ユニット48とを含んでもよい。
頭部搭載可能フレーム40は、図8における第1のユーザ14.1の頭部に固着可能である、形状を有してもよい。ディスプレイシステム42、実オブジェクト検出カメラ44、移動追跡カメラ46、および慣性測定ユニット48は、頭部搭載可能フレーム40に搭載され、したがって、頭部搭載可能フレーム40とともに移動し得る。
座標系32は、ローカルデータシステム52と、世界フレームシステム54と、頭部フレームシステム56と、カメラフレームシステム58とを含んでもよい。
ローカルデータシステム52は、データチャネル62と、ローカルフレーム決定ルーチン64と、ローカルフレーム記憶命令66とを含んでもよい。データチャネル62は、内部ソフトウェアルーチン、外部ケーブルまたは無線周波数受信機等のハードウェアコンポーネント、または開放されるポート等のハイブリッドコンポーネントであってもよい。データチャネル62は、仮想コンテンツを表す画像データ68を受信するように構成されてもよい。
ローカルフレーム決定ルーチン64は、データチャネル62に接続されてもよい。ローカルフレーム決定ルーチン64は、ローカル座標フレーム70を決定するように構成されてもよい。いくつかの実施形態では、ローカルフレーム決定ルーチンは、実世界オブジェクトまたは実世界場所に基づいて、ローカル座標フレームを決定してもよい。いくつかの実施形態では、ローカル座標フレームは、ブラウザウィンドウの底部縁に対する上部縁、キャラクタの頭または足、仮想コンテンツを包囲する、プリズムまたは境界ボックスの外面上のノード、または仮想コンテンツの対面方向およびそれを用いて仮想コンテンツを設置すべき場所(例えば、設置ノードまたはアンカノード等のノード)を定義する、座標フレームを設置するための任意の他の好適な場所等に基づいてもよい。
ローカルフレーム記憶命令66は、ローカルフレーム決定ルーチン64に接続されてもよい。当業者は、ソフトウェアモジュールおよびルーチンが、サブルーチン、コール等を通して、相互に「接続」されることを理解するであろう。ローカルフレーム記憶命令66は、ローカル座標フレーム70をローカル座標フレーム72として原点および目的地座標フレーム34内に記憶してもよい。いくつかの実施形態では、原点および目的地座標フレーム34は、仮想コンテンツがセッション間で持続するために、操作または変換され得る、1つ以上の座標フレームであってもよい。いくつかの実施形態では、セッションは、XRデバイスのブートアップとシャットダウンとの間の時間周期であってもよい。2つのセッションは、単一XRデバイスに関する2回の始動およびシャットダウン周期であってもよい、または2つの異なるXRデバイスに関する始動およびシャットダウンであってもよい。
いくつかの実施形態では、原点および目的地座標フレーム34は、第1のユーザのXRデバイスおよび第2のユーザのXRデバイスが共通場所を認識するために要求される1つ以上の変換の際に関わる座標フレームであってもよい。いくつかの実施形態では、目的地座標フレームは、第1および第2のユーザが同一場所における仮想コンテンツを視認するために、標的座標フレームに適用される一連の算出および変換の出力であってもよい。
レンダリングエンジン30は、データチャネル62に接続されてもよい。レンダリングエンジン30は、レンダリングエンジン30が、少なくとも部分的に、画像データ68に基づいて、仮想コンテンツをレンダリングし得るように、画像データ68をデータチャネル62から受信してもよい。
ディスプレイシステム42は、レンダリングエンジン30に接続されてもよい。ディスプレイシステム42は、画像データ68を可視光に変換する、コンポーネントを含んでもよい。可視光は、眼毎に1つの2つのパターンを形成してもよい。可視光は、図8における第1のユーザ14.1の眼に入射し得、第1のユーザ14.1の眼の網膜上で検出され得る。
実オブジェクト検出カメラ44は、画像を頭部搭載可能フレーム40の異なる側から捕捉し得る、1つ以上のカメラを含んでもよい。移動追跡カメラ46は、画像を頭部搭載可能フレーム40の側面上で捕捉する、1つ以上のカメラを含んでもよい。1つ以上のカメラの1つのセットが、実オブジェクト検出カメラ44および移動追跡カメラ46を表す、1つ以上のカメラの2つのセットの代わりに使用されてもよい。いくつかの実施形態では、カメラ44、46は、画像を捕捉してもよい。上記に説明されるように、これらのカメラは、追跡マップを構築するために使用される、データを収集してもよい。
慣性測定ユニット48は、頭部ユニット22の移動を検出するために使用される、いくつかのデバイスを含んでもよい。慣性測定ユニット48は、重力センサと、1つ以上の加速度計と、1つ以上のジャイロスコープとを含んでもよい。慣性測定ユニット48のセンサは、組み合わせて、少なくとも3つの直交方向および約少なくとも3つの直交軸において、頭部ユニット22の移動を追跡する。
図示される実施例では、世界フレームシステム54は、世界表面決定ルーチン78と、世界フレーム決定ルーチン80と、世界フレーム記憶命令82とを含む。世界表面決定ルーチン78は、実オブジェクト検出カメラ44に接続される。世界表面決定ルーチン78は、実オブジェクト検出カメラ44によって捕捉された画像に基づいて、画像および/またはキーフレームを受信し、画像を処理し、画像内の表面を識別する。深度センサ(図示せず)は、表面までの距離を決定してもよい。表面は、したがって、そのサイズ、形状、および実オブジェクト検出カメラからの距離を含む、3次元におけるデータによって表される。
いくつかの実施形態では、世界座標フレーム84は、頭部姿勢セッションの初期化時の原点に基づいてもよい。いくつかの実施形態では、世界座標フレームは、デバイスがブートアップされた場所に位置してもよい、またはブートセッションの間に頭部姿勢が喪失された場合、新しいある場所であり得る。いくつかの実施形態では、世界座標フレームは、頭部姿勢セッションの開始時の原点であってもよい。
図示される実施例では、世界フレーム決定ルーチン80は、世界表面決定ルーチン78に接続され、世界表面決定ルーチン78によって決定されるような表面の場所に基づいて、世界座標フレーム84を決定する。世界フレーム記憶命令82は、世界フレーム決定ルーチン80に接続され、世界座標フレーム84を世界フレーム決定ルーチン80から受信する。世界フレーム記憶命令82は、世界座標フレーム84を世界座標フレーム86として原点および目的地座標フレーム34内に記憶する。
頭部フレームシステム56は、頭部フレーム決定ルーチン90と、頭部フレーム記憶命令92とを含んでもよい。頭部フレーム決定ルーチン90は、移動追跡カメラ46および慣性測定ユニット48に接続されてもよい。頭部フレーム決定ルーチン90は、移動追跡カメラ46および慣性測定ユニット48からのデータを使用して、頭部座標フレーム94を計算してもよい。例えば、慣性測定ユニット48は、頭部ユニット22に対する重力の方向を決定する、重力センサを有してもよい。移動追跡カメラ46は、頭部フレーム決定ルーチン90によって使用され、頭部座標フレーム94を精緻化する、画像を継続的に捕捉してもよい。頭部ユニット22は、図8における第1のユーザ14.1がその頭部を移動させると移動する。移動追跡カメラ46および慣性測定ユニット48は、頭部フレーム決定ルーチン90が頭部座標フレーム94を更新し得るように、データを頭部フレーム決定ルーチン90に持続的に提供してもよい。
頭部フレーム記憶命令92は、頭部フレーム決定ルーチン90に接続され、頭部座標フレーム94を頭部フレーム決定ルーチン90から受信してもよい。頭部フレーム記憶命令92は、頭部座標フレーム94を頭部座標フレーム96として原点および目的地座標フレーム34の中に記憶してもよい。頭部フレーム記憶命令92は、頭部フレーム決定ルーチン90が頭部座標フレーム94を再計算すると、更新された頭部座標フレーム94を頭部座標フレーム96として繰り返し記憶してもよい。いくつかの実施形態では、頭部座標フレームは、ローカル座標フレーム72に対するウェアラブルXRデバイス12.1の場所であってもよい。
カメラフレームシステム58は、カメラ固有性質98を含んでもよい。カメラ固有性質98は、その設計および製造の特徴である、頭部ユニット22の寸法を含んでもよい。カメラ固有性質98は、原点および目的地座標フレーム34内に記憶される、カメラ座標フレーム100を計算するために使用されてもよい。
いくつかの実施形態では、カメラ座標フレーム100は、図8における第1のユーザ14.1の左眼の全ての瞳孔位置を含んでもよい。左眼が、左から右または上下に移動すると、左眼の瞳孔位置は、カメラ座標フレーム100内に位置する。加えて、右眼の瞳孔位置は、右眼のためのカメラ座標フレーム100内に位置する。いくつかの実施形態では、カメラ座標フレーム100は、画像が撮影されると、ローカル座標フレームに対するカメラの場所を含んでもよい。
原点/目的地座標フレーム変換器36は、ローカル/世界座標変換器104と、世界/頭部座標変換器106と、頭部/カメラ座標変換器108とを含んでもよい。ローカル/世界座標変換器104は、ローカル座標フレーム72を受信し、ローカル座標フレーム72を世界座標フレーム86に変換してもよい。世界座標フレーム86へのローカル座標フレーム72の変換は、世界座標フレーム86内で世界座標フレーム110に変換されるローカル座標フレームとして表され得る。
世界/頭部座標変換器106は、世界座標フレーム86から頭部座標フレーム96に変換してもよい。世界/頭部座標変換器106は、世界座標フレーム110に変換されるローカル座標フレームを頭部座標フレーム96に変換してもよい。変換は、頭部座標フレーム96内の頭部座標フレーム112に変換されるローカル座標フレームとして表され得る。
頭部/カメラ座標変換器108は、頭部座標フレーム96からカメラ座標フレーム100に変換してもよい。頭部/カメラ座標変換器108は、頭部座標フレーム112に変換されるローカル座標フレームをカメラ座標フレーム100内のカメラ座標フレーム114に変換されるローカル座標フレームに変換してもよい。カメラ座標フレーム114に変換されるローカル座標フレームは、レンダリングエンジン30の中に取り込まれてもよい。レンダリングエンジン30は、カメラ座標フレーム114に変換されるローカル座標フレームに基づいて、ローカルコンテンツ28を表す画像データ68をレンダリングしてもよい。
図10は、種々の原点および目的地座標フレーム34の空間表現である。ローカル座標フレーム72、世界座標フレーム86、頭部座標フレーム96、およびカメラ座標フレーム100が、図内に表される。いくつかの実施形態では、XRコンテンツ28と関連付けられるローカル座標フレームは、仮想コンテンツが実世界内に設置され、したがって、仮想コンテンツがユーザによって視認され得るとき、ローカルおよび/または世界座標フレームおよび/またはPCFに対する位置および回転を有し得る(例えば、ノードおよび対面方向を提供し得る)。各カメラは、片眼の全ての瞳孔位置を包含する、その独自のカメラ座標フレーム100を有してもよい。参照番号104Aおよび106Aは、それぞれ、図9におけるローカル/世界座標変換器104、世界/頭部座標変換器106、および頭部/カメラ座標変換器108によって行われる、変換を表す。
図11は、いくつかの実施形態による、頭部座標フレームからカメラ座標フレームに変換するためのカメラレンダリングプロトコルを描写する。図示される実施例では、片眼に関する瞳孔は、位置AからBに移動する。定常として現れることが意図される仮想オブジェクトは、瞳孔の位置に応じて、2つの位置AまたはBのうちの1つにおける深度平面上に投影されるであろう(カメラが瞳孔ベースの座標フレームとして使用するように構成されると仮定して)。その結果、頭部座標フレームに変換される瞳孔座標フレームを使用することは、眼が位置Aから位置Bに移動するにつれて、ジッタを定常仮想オブジェクト内に生じさせるであろう。本状況は、ビュー依存ディスプレイまたは投影と称される。
図12に描写されるように、カメラ座標フレーム(例えば、CR)が、位置付けられ、全ての瞳孔位置を包含するが、オブジェクト投影は、ここでは、瞳孔位置AおよびBにかかわらず、一貫するであろう。頭部座標フレームは、CRフレームに変換し、これは、ビュー独立ディスプレイまたは投影と称される。画像再投影が、仮想コンテンツに適用され、眼位置の変化を考慮してもよいが、しかしながら、レンダリングは、依然として、同一位置にあるため、ジッタは、最小限にされる。
図13は、ディスプレイシステム42をさらに詳細に図示する。ディスプレイシステム42は、レンダリングエンジン30に接続され、視覚データおよびアルゴリズムの一部を形成する、立体視分析器144を含む。
ディスプレイシステム42はさらに、左および右プロジェクタ166Aおよび166Bと、左および右導波管170Aおよび170Bとを含む。左および右プロジェクタ166Aおよび166Bは、電力供給源に接続される。各プロジェクタ166Aおよび166Bは、画像データが個別のプロジェクタ166Aまたは166Bに提供されるための個別の入力を有する。個別のプロジェクタ166Aまたは166Bは、給電されると、2次元パターンにおける光を生成し、光をそこから発出する。左および右導波管170Aおよび170Bは、それぞれ、光を左および右プロジェクタ166Aおよび166Bから受光するように位置付けられる。左および右導波管170Aおよび170Bは、透明導波管である。
使用時、ユーザは、頭部搭載可能フレーム40をその頭部に搭載する。頭部搭載可能フレーム40のコンポーネントは、例えば、ユーザの頭部の背面の周囲に巻着する、ストラップ(図示せず)を含んでもよい。左および右導波管170Aおよび170Bは、次いで、ユーザの左および右眼220Aおよび220Bの正面に位置する。
レンダリングエンジン30は、それが受信する画像データを立体視分析器144の中に取り込む。画像データは、図8におけるローカルコンテンツ28の3次元画像データである。画像データは、複数の仮想平面上に投影される。立体視分析器144は、画像データを分析し、各深度平面上への投影のために、画像データに基づいて、左および右画像データセットを決定する。左および右画像データセットは、3次元において投影され、ユーザに深度の知覚を与える、2次元画像を表す、データセットである。
立体視分析器144は、左および右画像データセットを左および右プロジェクタ166Aおよび166Bに取り込む。左および右プロジェクタ166Aおよび166Bは、次いで、左および右光パターンを作成する。ディスプレイシステム42のコンポーネントは、平面図に示されるが、左および右パターンは、正面立面図に示されるとき、2次元パターンであることを理解されたい。各光パターンは、複数のピクセルを含む。例証目的のために、ピクセルのうちの2つからの光線224Aおよび226Aが、左プロジェクタ166Aから出射し、左導波管170Aに入射するように示される。光線224Aおよび226Aは、左導波管170Aの側から反射する。光線224Aおよび226Aは、左導波管170A内で左から右に内部反射を通して伝搬することが示されるが、光線224Aおよび226Aはまた、屈折性および反射性システムを使用して、紙面に向かう方向にも伝搬することを理解されたい。
光線224Aおよび226Aは、左光導波管170Aから瞳孔228Aを通して出射し、次いで、左眼220Aの瞳孔230Aを通して左眼220Aに入射する。光線224Aおよび226Aは、次いで、左眼220Aの網膜232A上に当たる。このように、左光パターンは、左眼220Aの網膜232A上に当たる。ユーザは、網膜232A上に形成されるピクセルが、ユーザが左眼220Aに対向する左導波管170Aの側上のある距離にあるように知覚する、ピクセル234Aおよび236Aであるという知覚を与えられる。深度知覚は、光の焦点距離を操作することによって作成される。
同様に、立体視分析器144は、右画像データセットを右プロジェクタ166Bに取り込む。右プロジェクタ166Bは、右光パターンを伝送し、これは、光線224Bおよび226Bの形態におけるピクセルによって表される。光線224Bおよび226Bは、右導波管170B内で反射し、瞳孔228Bを通して出射する。光線224Bおよび226Bは、次いで、右眼220Bの瞳孔230Bを通して入射し、右眼220Bの網膜232B上に当たる。光線224Bおよび226Bのピクセルは、右導波管170Bの背後のピクセル134Bおよび236Bとして知覚される。
網膜232Aおよび232B上に作成されたパターンは、左および右画像として個々に知覚される。左および右画像は、立体視分析器144の機能に起因して、相互に若干異なる。左および右画像は、ユーザの脳内で3次元レンダリングとして知覚される。
述べられたように、左および右導波管170Aおよび170Bは、透明である。眼220Aおよび220Bに対向する左および右導波管170Aおよび170B側上のテーブル16等の実在のオブジェクトからの光は、左および右導波管170Aおよび170Bを通して投影され、網膜232Aおよび232B上に当たることができる。
持続的座標フレーム(PCF)
本明細書に説明されるものは、共有空間内のユーザインスタンスを横断して空間存続を提供するための方法および装置である。空間存続がなければ、セッション内にユーザによって物理的世界内に設置された仮想コンテンツは、異なるセッション内のユーザのビュー内に存在し得ない、または誤設置され得る。空間存続がなければ、1人のユーザによって物理的世界内に設置された仮想コンテンツは、第2のユーザが第1のユーザと同一物理的空間の体験を共有するように意図する場合でも、第2のユーザのビュー内に、存在し得ない、または場所がずれ得る。
本発明者らは、空間存続が持続的座標フレーム(PCF)を通して提供され得ることを認識および理解している。PCFは、物理的世界内で認識される特徴(例えば、角、縁)を表す、1つ以上の点に基づいて定義されてもよい。特徴は、それらがユーザインスタンスからXRシステムの別のユーザインスタンスと同一である可能性が高いように選択されてもよい。
さらに、算出された追跡経路(例えば、カメラ軌道)を実際の追跡経路から逸脱させ得る、追跡の間のドリフトは、仮想コンテンツの場所を、追跡マップのみに基づく、ローカルマップに対してレンダリングされるとき、場所からずれて現れさせ得る。空間のための追跡マップは、XRデバイスが経時的に場面のさらなる情報を収集するにつれて、精緻化され、ドリフトを補正してもよい。しかしながら、仮想コンテンツが、マップ精緻化の前に、実オブジェクト上に設置され、追跡マップから導出されるデバイスの世界座標フレームに対して保存される場合、仮想コンテンツは、実オブジェクトがマップ精緻化の間に移動したかのように変位されて現れ得る。PCFは、PCFが、特徴に基づいて定義され、特徴がマップ精緻化の間に移動するにつれて、更新されるため、マップ精緻化に従って更新されてもよい。
PCFは、マップ座標系に対する平行移動および回転を伴う、6自由度を備えてもよい。PCFは、ローカルおよび/または遠隔記憶媒体内に記憶されてもよい。PCFの平行移動および回転は、例えば、記憶場所に応じて、マップ座標系に対して算出されてもよい。例えば、デバイスによってローカルで使用されるPCFは、デバイスの世界座標フレームに対する平行移動および回転を有してもよい。クラウド内のPCFは、規準マップの規準座標フレームに対する平行移動および回転を有してもよい。
PCFは、それらが効率的に処理および転送され得るように、物理的世界の疎表現を提供し、物理的世界についての利用可能な情報の全て未満を提供してもよい。持続的空間情報を処理するための技法は、1つ以上のセッションを横断して、実空間内の1つ以上の座標系に基づいて、動的マップを作成し、例えば、アプリケーションプログラミングインターフェース(API)を介して、XRアプリケーションにエクスポーズされ得る、疎マップにわたる持続的座標フレーム(PCF)を生成するステップを含んでもよい。
図14は、いくつかの実施形態による、持続的座標フレーム(PCF)の作成およびXRコンテンツとPCFの結付を図示する、ブロック図である。各ブロックは、コンピュータメモリ内に記憶されたデジタル情報を表し得る。アプリケーション1180の場合、データは、コンピュータ実行可能命令を表し得る。仮想コンテンツ1170の場合、デジタル情報は、例えば、アプリケーション1180によって規定されるような仮想オブジェクトを定義し得る。他のボックスの場合、デジタル情報は、物理的世界のいくつかの側面を特徴付けし得る。
図示される実施形態では、1つ以上のPCFは、ウェアラブルデバイス上のセンサを用いて捕捉された画像から作成される。図14の実施形態では、センサは、視覚的画像カメラである。これらのカメラは、追跡マップを形成するために使用される、同一カメラであってもよい。故に、図14によって提案される処理のうちのいくつかは、追跡マップを更新するステップの一部として実施されてもよい。しかしながら、図14は、存続を提供する情報が追跡マップに加えて生成されることを図示する。
3D PCFを導出するために、立体視画像分析を有効にする構成においてウェアラブルデバイスに搭載される、2つのカメラからの2つの画像1110は、ともに処理される。図14は、画像1および画像2を図示し、それぞれ、カメラのうちの1つから導出される。各カメラからの単一画像が、便宜上、図示される。しかしながら、各カメラは、画像フレームのストリームを出力してもよく、図14に図示される処理は、ストリーム内の複数の画像フレームのために実施されてもよい。
故に、画像1および画像2はそれぞれ、画像フレームのシーケンス内の1つのフレームであってもよい。図14に描写されるような処理は、そこから持続的空間情報を形成する、好適な画像を提供する特徴点を含有する画像フレームが処理されるまで、シーケンスにおいて連続画像フレーム上で繰り返されてもよい。代替として、または加えて、図14の処理は、ユーザがもはや以前に識別されたPCFに十分に近接しておらず、物理的世界に対する位置を決定するためにそのPCFを確実に使用することができないほど、ユーザが移動するにつれて、繰り返され得る。例えば、XRシステムは、ユーザのために、現在のPCFを維持してもよい。その距離が、閾値を超えると、システムは、ユーザの現在の場所において入手された画像フレームを使用して図14のプロセスに従って生成され得る、ユーザにより近い新しい現在のPCFに切り替えてもよい。
単一PCFを生成するときでも、画像フレームのストリームが、安定する可能性が高く、画像フレームに描写される物理的世界の領域の近傍におけるデバイスによって容易に識別され得る、物理的世界内のコンテンツを描写する画像フレームを識別するように処理されてもよい。図14の実施形態では、本処理は、画像内の特徴1120の識別から開始する。特徴は、例えば、オブジェクトの角に対応し得る、例えば、閾値を上回る画像内の勾配の場所または他の特性を見出すことによって、識別されてもよい。図示される実施形態では、特徴は、点であるが、縁等の他の認識可能特徴も、代替として、または加えて、使用されてもよい。
図示される実施形態では、固定数Nの特徴1120が、さらなる処理のために選択される。それらの特徴点は、勾配の大きさまたは他の特徴点との近接度等の1つ以上の基準に基づいて選択されてもよい。代替として、または加えて、特徴点は、特徴点が持続的であることを示唆する、特性に基づいて等、ヒューリスティックに選択されてもよい。例えば、ヒューリスティックは、窓またはドアまたは大型家具の角に対応する可能性が高い、特徴点の特性に基づいて定義されてもよい。そのようなヒューリスティックは、特徴点自体およびそれを囲繞するものを考慮してもよい。具体的実施例として、画像あたり特徴点の数は、200等の100~500または150~250であってもよい。
選択された特徴点の数にかかわらず、記述子1130が、特徴点に関して算出されてもよい。本実施例では、記述子は、選択された特徴点毎に算出されるが、記述子は、特徴点の群に関して、または特徴点のサブセットに関して、または画像内の全ての特徴に関して算出されてもよい。記述子は、物理的世界内の同一オブジェクトを表す特徴点が類似記述子を割り当てられるように、特徴点を特徴付ける。記述子は、1つのマップが別のマップに対して位置特定されるときに生じ得るような2つのフレームの整合を促進し得る。2つの画像の特徴点間の距離を最小限にする、フレームの相対的配向を検索するのではなく、2つのフレームの初期整合は、類似記述子を伴う特徴点を識別することによって行われてもよい。画像フレームの整合は、類似記述子を伴う点を整合させるステップに基づいてもよく、これは、画像内の全ての特徴点の整合を算出する、より少ない処理を伴い得る。
記述子は、記述子への特徴点のマッピング、またはいくつかの実施形態では、特徴点の周囲の画像のパッチのマッピングとして算出されてもよい。記述子は、数値量であってもよい。米国特許出願第16/190,948号は、特徴点に関する記述子を算出するステップを説明しており、参照することによってその全体として本明細書に組み込まれる。
図14の実施例では、記述子1130は、各画像フレーム内の特徴点毎に算出される。記述子および/または特徴点および/または画像自体に基づいて、画像フレームは、キーフレーム1140として識別されてもよい。図示される実施形態では、キーフレームは、次いで、さらなる処理のために選択される、ある基準を満たす、画像フレームである。追跡マップを作成する際、例えば、有意義な情報をマップに追加する、画像フレームが、マップの中に統合される、キーフレームとして選択されてもよい。他方では、それにわたって画像フレームがすでにマップの中に統合されている、領域に実質的に重複する、画像フレームは、それらがキーフレームとならないように破棄されてもよい。代替として、または加えて、キーフレームは、画像フレーム内の特徴点の数および/またはタイプに基づいて選択されてもよい。図14の実施形態では、追跡マップ内への含有のために選択されたキーフレーム1150はまた、PCFを決定するためのキーフレームとして処理されてもよいが、PCFの生成のためのキーフレームを選択するための異なるまたは付加的基準が、使用されてもよい。
図14は、キーフレームがさらなる処理のために使用されることを示すが、画像から入手された情報は、他の形態で処理されてもよい。例えば、キーリグ内等の特徴点が、代替として、または加えて、処理されてもよい。さらに、キーフレームは、単一画像フレームから導出されるように説明されるが、キーフレームと入手された画像フレームとの間の1対1の関係が存在することが必要であるわけではない。キーフレームは、例えば、複数の画像内に現れる特徴のみがキーフレーム内に留保されるように、画像フレームをともにスティッチングまたは集約すること等によって、複数の画像フレームから入手されてもよい。
キーフレームは、画像情報および/または画像情報と関連付けられるメタデータを含んでもよい。いくつかの実施形態では、カメラ44、46(図9)によって捕捉された画像が、1つ以上のキーフレーム(例えば、キーフレーム1、2)の中に算出されてもよい。いくつかの実施形態では、キーフレームは、カメラ姿勢を含んでもよい。いくつかの実施形態では、キーフレームは、カメラ姿勢において捕捉された1つ以上のカメラ画像を含んでもよい。いくつかの実施形態では、XRシステムは、カメラ姿勢において捕捉されたカメラ画像の一部を有用ではないと決定し、したがって、その部分をキーフレーム内に含まなくてもよい。したがって、キーフレームを使用して、新しい画像と場面のより早期の知識を整合させることは、XRシステムの算出リソースの使用を低減させる。いくつかの実施形態では、キーフレームは、ある方向/角度を伴う場所における画像および/または画像データを含んでもよい。いくつかの実施形態では、キーフレームは、そこから1つ以上のマップ点が観察され得る、場所および方向を含んでもよい。いくつかの実施形態では、キーフレームは、あるIDを伴う、座標フレームを含んでもよい。米国特許第出願第15/877,359号は、キーフレームを説明しており、参照することによってその全体として本明細書に組み込まれる。
キーフレーム1140のいくつかまたは全てが、キーフレームのための持続的姿勢1150の生成等のさらなる処理のために選択されてもよい。選択は、画像フレーム内の特徴点の全てまたはサブセットの特性に基づいてもよい。それらの特性は、記述子、特徴、および/または画像フレーム自体を処理することから決定されてもよい。具体的実施例として、選択は、持続的オブジェクトに関連する可能性が高いと識別された特徴点のクラスタに基づいてもよい。
各キーフレームは、キーフレームが入手された、カメラの姿勢と関連付けられる。持続的姿勢に処理するために選択されたキーフレームに関して、その姿勢情報は、入手時および/または入手の場所におけるWiFiフィンガプリントおよび/またはGPS座標等のキーフレームについての他のメタデータとともに保存されてもよい。
持続的姿勢は、デバイスがそれ自体を物理的世界についての以前に入手された情報に対して配向するために使用し得る、情報源である。例えば、そこから持続的姿勢が作成された、キーフレームが、物理的世界のマップの中に組み込まれる場合、デバイスは、持続的姿勢と関連付けられる、キーフレーム内の十分な数の特徴点を使用して、それ自体をその持続的姿勢に対して配向し得る。デバイスは、その周囲の得られた現在の画像と持続的姿勢を整合させ得る。本整合は、現在の画像と、持続的姿勢を生じさせた画像1110、特徴1120、および/または記述子1130、またはその画像またはそれらの特徴または記述子の任意のサブセットのマッチングに基づいてもよい。いくつかの実施形態では、持続的姿勢にマッチされた現在の画像フレームは、デバイスの追跡マップの中に組み込まれている、別のキーフレームであってもよい。
持続的姿勢についての情報は、同一または異なるデバイス上で実行され得る、複数のアプリケーション間の共有を促進する、フォーマットで記憶されてもよい。図14の実施例では、持続的姿勢のいくつかまたは全てが、持続的座標フレーム(PCF)1160として反映され得る。持続的姿勢のように、PCFも、マップと関連付けられてもよく、デバイスがそのPCFに対するその配向を決定するために使用し得る、特徴のセットまたは他の情報を備えてもよい。PCFは、その位置をPCFに相関させることによって、デバイスがマップ内に反映される物理的世界内の任意のオブジェクトに対するその位置を決定し得るように、そのマップの原点に対するその変換を定義する、変換を含んでもよい。
PCFが、物理的オブジェクトに対する場所を決定するための機構を提供するため、アプリケーション1180等のアプリケーションが、仮想コンテンツ1170のためのアンカとしての役割を果たす、1つ以上のPCFに対する仮想オブジェクトの位置を定義し得る。図14は、例えば、アプリ1が、その仮想コンテンツ2とPCF1、2を関連付けていることを図示する。同様に、アプリ2は、その仮想コンテンツ3とPCF1、2を関連付けている。アプリ1はまた、その仮想コンテンツ1とPCF4、5を関連付けていることが示され、アプリ2は、その仮想コンテンツ4とPCF3を関連付けていることが示される。いくつかの実施形態では、PCF1、2が画像1および画像2に基づく方法と同様に、PCF3は、画像3(図示せず)に基づいてもよく、PCF4、5は、画像4および画像5(図示せず)に基づいてもよい。本仮想コンテンツをレンダリングするとき、デバイスは、1つ以上の変換を適用し、デバイスのディスプレイに対する仮想コンテンツの場所および/または仮想コンテンツの所望の場所に対する物理的オブジェクトの場所等の情報を算出してもよい。PCFを基準として使用することは、そのような算出を簡略化し得る。
いくつかの実施形態では、持続的姿勢は、1つ以上の関連付けられるキーフレームを有する、座標場所および/または方向であってもよい。いくつかの実施形態では、持続的姿勢は、ユーザが、ある距離、例えば、3メートル進行した後、自動的に作成されてもよい。いくつかの実施形態では、持続的姿勢は、位置特定の間、基準点として作用してもよい。いくつかの実施形態では、持続的姿勢は、パス可能世界(例えば、パス可能世界モジュール538)内に記憶されてもよい。
いくつかの実施形態では、新しいPCFは、隣接するPCF間で許容される、事前に定義された距離に基づいて決定されてもよい。いくつかの実施形態では、1つ以上の持続的姿勢は、ユーザが、所定の距離、例えば、5メートル進行すると、PCFの中に算出されてもよい。いくつかの実施形態では、PCFは、例えば、パス可能世界内において、1つ以上の世界座標フレームおよび/または規準座標フレームと関連付けられてもよい。いくつかの実施形態では、PCFは、例えば、セキュリティ設定に応じて、ローカルおよび/または遠隔データベース内に記憶されてもよい。
図15は、いくつかの実施形態による、持続座標フレームを確立および使用する方法4700を図示する。方法4700は、XRデバイスの1つ以上のセンサを使用して、場面に関する画像(例えば、図14における画像1および画像2)を捕捉するステップ(行為4702)から開始してもよい。複数のカメラが、使用されてもよく、1つのカメラが、例えば、ストリームにおいて、複数の画像を生成してもよい。
方法4700は、着目点(例えば、図7におけるマップ点702、図14における特徴1120)を捕捉された画像から抽出するステップ(4704)と、抽出された着目点に関する記述子(例えば、図14における記述子1130)を生成するステップ(行為4706)と、記述子に基づいて、キーフレーム(例えば、キーフレーム1140)を生成するステップ(行為4708)とを含んでもよい。いくつかの実施形態では、本方法は、キーフレーム内の着目点を比較し、所定の量の着目点を共有する、対のキーフレームを形成してもよい。本方法は、個々の対のキーフレームを使用して、物理的世界の一部を再構築してもよい。物理的世界のマッピングされた部分は、3D特徴(例えば、図7におけるキーリグ704)として保存されてもよい。いくつかの実施形態では、対のキーフレームの選択された部分は、3D特徴を構築するために使用されてもよい。いくつかの実施形態では、マッピングの結果は、選択的に保存されてもよい。3D特徴を構築するために使用されない、キーフレームは、例えば、キーフレームの姿勢間に共分散行列を伴う、キーフレーム間の距離を表す、姿勢を通して、3D特徴と関連付けられてもよい。いくつかの実施形態では、対のキーフレームは、構築される3D特徴のそれぞれ間の距離が、必要とされる算出の量および結果として生じるモデルの正確度のレベルを平衡させるように決定され得る、所定の距離内にあるように、3D特徴を構築するように選択されてもよい。そのようなアプローチは、XRシステムを用いた効率的および正確な算出のために好適なデータの量を伴う、物理的世界のモデルを提供することを可能にする。いくつかの実施形態では、2つの画像の共分散行列は、2つの画像の姿勢(例えば、6自由度)間の共分散を含んでもよい。
方法4700は、キーフレームに基づいて持続的姿勢を生成するステップ(行為4710)を含んでもよい。いくつかの実施形態では、本方法は、対のキーフレームから再構成された3D特徴に基づいて、持続的姿勢を生成するステップを含んでもよい。いくつかの実施形態では、持続的姿勢は、3D特徴に結び付けられてもよい。いくつかの実施形態では、持続的姿勢は、3D特徴を構築するために使用される、キーフレームの姿勢を含んでもよい。いくつかの実施形態では、持続的姿勢は、3D特徴を構築するために使用される、キーフレームの平均姿勢を含んでもよい。いくつかの実施形態では、持続的姿勢は、近傍の持続的姿勢の間の距離が、所定の値、例えば、1つのメートル~5メートルの範囲内、その間の任意の値、または任意の他の好適な値内であるように生成されてもよい。いくつかの実施形態では、近傍の持続的姿勢間の距離は、近傍の持続的姿勢の共分散行列によって表されてもよい。
方法4700は、持続的姿勢に基づいてPCFを生成するステップ(行為4712)を含んでもよい。いくつかの実施形態では、PCFは、3D特徴に結び付けられてもよい。いくつかの実施形態では、PCFは、1つ以上の持続的姿勢と関連付けられてもよい。いくつかの実施形態では、PCFは、関連付けられる持続的姿勢のうちの1つの姿勢を含んでもよい。いくつかの実施形態では、PCFは、関連付けられる持続的姿勢の姿勢の平均姿勢を含んでもよい。いくつかの実施形態では、PCFは、近傍のPCF間の距離が、所定の値、例えば、3メートル~10メートルの範囲、その間の任意の値、または任意の他の好適な値内にあるように生成されてもよい。いくつかの実施形態では、近傍のPCF間の距離は、近傍のPCFの共分散行列によって表されてもよい。いくつかの実施形態では、PCFは、XRアプリケーションが、モデル自体にアクセスせずに、PCFを通して、物理的世界のモデルにアクセスし得るように、例えば、アプリケーションプログラミングインターフェース(API)を介して、XRアプリケーションにエクスポーズされてもよい。
方法4700は、XRデバイスによって表示されるための仮想オブジェクトの画像データとPCFのうちの少なくとも1つを関連付けるステップ(行為4714)を含んでもよい。いくつかの実施形態では、本方法は、関連付けられるPCFに対する仮想オブジェクトの平行移動および配向を算出するステップを含んでもよい。仮想オブジェクトと仮想オブジェクトを設置するデバイスによって生成されたPCFを関連付けることは、必要とされないことを理解されたい。例えば、デバイスは、クラウド内の規準マップ内の保存されたPCFを読み出し、仮想オブジェクトと読み出されたPCFを関連付けてもよい。仮想オブジェクトは、PCFが経時的に調節されるにつれて、関連付けられるPCFとともに移動し得ることを理解されたい。
図16は、いくつかの実施形態による、第1のXRデバイス12.1と、第2のXRデバイス12.2の視覚データおよびアルゴリズムと、サーバ20とを図示する。図16に図示されるコンポーネントは、本明細書に説明されるような持続的姿勢、持続的座標フレーム、追跡マップ、または規準マップ等の空間情報を生成、更新、および/または使用するステップと関連付けられる、動作のいくつかまたは全てを実施するように動作し得る。図示されないが、第1のXRデバイス12.1は、第2のXRデバイス12.2と同一に構成されてもよい。サーバ20は、マップ記憶ルーチン118と、規準マップ120と、マップ伝送機122と、マップマージアルゴリズム124とを有してもよい。
第1のXRデバイス12.1と同一場面にあり得る、第2のXRデバイス12.2は、持続的座標フレーム(PCF)統合ユニット1300と、仮想オブジェクトをレンダリングするために使用され得る画像データ68を生成する、アプリケーション1302と、フレーム埋込生成器308(図21参照)とを含んでもよい。いくつかの実施形態では、マップダウンロードシステム126、PCF識別システム128、マップ2、位置特定モジュール130、規準マップ組込器132、規準マップ133、およびマップ発行器136は、パス可能世界ユニット1304の中に群化されてもよい。PCF統合ユニット1300は、パス可能世界ユニット1304および第2のXRデバイス12.2の他のコンポーネントに接続され、PCFの読出、生成、使用、アップロード、およびダウンロードを可能にしてもよい。
PCFを備える、マップは、変化する世界内のより多くの存続を有効にし得る。いくつかの実施形態では、例えば、画像のためのマッチング特徴を含む、追跡マップを位置特定するステップは、PCFによって構成されるマップから、持続的コンテンツを表す特徴を選択するステップを含んでもよく、これは、高速マッチングおよび/または位置特定を有効にする。例えば、人々が場面の内外に移動し、ドア等のオブジェクトが場面に対して移動する、世界は、より少ない記憶空間および伝送レートを要求し、場面をマッピングするために個々のPCFおよび相互に対するその関係(例えば、PCFの統合されたコンステレーション)の使用を有効にする。
いくつかの実施形態では、PCF統合ユニット1300は、第2のXRデバイス12.2の記憶ユニット上のデータ記憶内に以前に記憶されたPCF1306と、PCF追跡器1308と、持続的姿勢入手器1310と、PCF確認器1312と、PCF生成システム1314と、座標フレーム計算機1316と、持続的姿勢計算機1318と、追跡マップおよび持続的姿勢変換器1320と、持続的姿勢およびPCF変換器1322と、PCFおよび画像データ変換器1324とを含む、3つの変換器とを含んでもよい。
いくつかの実施形態では、PCF追跡器1308は、アプリケーション1302によって選択可能である、オンプロンプトおよびオフプロンプトを有してもよい。アプリケーション1302は、第2のXRデバイス12.2のプロセッサによって実行可能であって、例えば、仮想コンテンツを表示してもよい。アプリケーション1302は、オンプロンプトを介して、PCF追跡器1308をオンに切り替える、コールを有してもよい。PCF追跡器1308は、PCF追跡器1308がオンに切り替えられると、PCFを生成してもよい。アプリケーション1302は、オフプロンプトを介して、PCF追跡器1308をオフに切り替え得る、後続コールを有してもよい。PCF追跡器1308は、PCF追跡器1308がオフに切り替えられると、PCF生成を終了する。
いくつかの実施形態では、サーバ20は、規準マップ120と関連付けられて以前に保存されている、複数の持続的姿勢1332と、複数のPCF1330とを含んでもよい。マップ伝送機122は、規準マップ120を持続的姿勢1332および/またはPCF1330とともに、第2のXRデバイス12.2に伝送してもよい。持続的姿勢1332およびPCF1330は、規準マップ133と関連付けて第2のXRデバイス12.2上に記憶されてもよい。マップ2が、規準マップ133に対して位置特定すると、持続的姿勢1332およびPCF1330は、マップ2と関連付けて記憶されてもよい。
いくつかの実施形態では、持続的姿勢入手器1310は、マップ2のための持続的姿勢を入手してもよい。PCF確認器1312は、持続的姿勢入手器1310に接続されてもよい。PCF確認器1312は、持続的姿勢入手器1310によって読み出された持続的姿勢に基づいて、PCFをPCF1306から読み出してもよい。PCF確認器1312によって読み出されたPCFは、PCFに基づいて、画像ディスプレイのために使用される、PCFの初期群を形成してもよい。
いくつかの実施形態では、アプリケーション1302は、付加的PCFが生成されることを要求し得る。例えば、ユーザが、以前にマッピングされていないエリアに移動する場合、アプリケーション1302は、PCF追跡器1308をオンに切り替えてもよい。PCF生成システム1314は、PCF追跡器1308に接続され、マップ2が拡張し始めるにつれて、マップ2に基づいて、PCFの生成を開始してもよい。PCF生成システム1314によって生成されたPCFは、PCFベースの画像表示のために使用され得る、PCFの第2のグループを形成してもよい。
座標フレーム計算機1316は、PCF確認器1312に接続されてもよい。PCF確認器1312がPCFを読み出した後、座標フレーム計算機1316は、頭部座標フレーム96を呼び出し、第2のXRデバイス12.2の頭部姿勢を決定してもよい。座標フレーム計算機1316はまた、持続的姿勢計算機1318を呼び出してもよい。持続的姿勢計算機1318は、フレーム埋込生成器308に直接または間接的に接続されてもよい。いくつかの実施形態では、画像/フレームは、前のキーフレームからの閾値距離、例えば、3メートルが、進行された後、キーフレームと指定されてもよい。持続的姿勢計算機1318は、複数の、例えば、3つのキーフレームに基づいて、持続的姿勢を生成してもよい。いくつかの実施形態では、持続的姿勢は、本質的に、複数のキーフレームの座標フレームの平均であってもよい。
追跡マップおよび持続的姿勢変換器1320は、マップ2および持続的姿勢計算機1318に接続されてもよい。追跡マップおよび持続的姿勢変換器1320は、マップ2を持続的姿勢に変換し、マップ2に対する原点における持続的姿勢を決定してもよい。
持続的姿勢およびPCF変換器1322は、追跡マップおよび持続的姿勢変換器1320およびさらにPCF確認器1312およびPCF生成システム1314に接続されてもよい。持続的姿勢およびPCF変換器1322は、持続的姿勢(それに対して追跡マップが変換された)をPCF確認器1312およびPCF生成システム1314からのPCFに変換し、持続的姿勢に対するPCFを決定してもよい。
PCFおよび画像データ変換器1324は、持続的姿勢およびPCF変換器1322およびデータチャネル62に接続されてもよい。PCFおよび画像データ変換器1324は、PCFを画像データ68に変換する。レンダリングエンジン30は、PCFおよび画像データ変換器1324に接続され、PCFに対する画像データ68をユーザに表示してもよい。
PCF統合ユニット1300は、PCF1306内でPCF生成システム1314を用いて生成される、付加的PCFを記憶してもよい。PCF1306は、持続的姿勢に対して記憶されてもよい。マップ発行器136は、マップ発行器136が、マップ2をサーバ20に伝送し、マップ発行器136がまた、マップ2と関連付けられるPCFおよび持続的姿勢をサーバ20に伝送するとき、PCF1306およびPCF1306と関連付けられる持続的姿勢を読み出し得る。サーバ20のマップ記憶ルーチン118が、マップ2を記憶するとき、マップ記憶ルーチン118はまた、第2の視認デバイス12.2によって生成された持続的姿勢およびPCFを記憶してもよい。マップマージアルゴリズム124は、それぞれ、規準マップ120と関連付けられ、持続的姿勢1332およびPCF1330内に記憶される、マップ2の持続的姿勢およびPCFとともに、規準マップ120を作成してもよい。
第1のXRデバイス12.1は、第2のXRデバイス12.2のPCF統合ユニット1300に類似する、PCF統合ユニットを含んでもよい。マップ伝送機122が、規準マップ120を第1のXRデバイス12.1に伝送するとき、マップ伝送機122は、規準マップ120と関連付けられ、第2のXRデバイス12.2から生じる、持続的姿勢1332およびPCF1330を伝送してもよい。第1のXRデバイス12.1は、PCFおよび持続的姿勢を第1のXRデバイス12.1の記憶デバイス上のデータ記憶装置内に記憶してもよい。第1のXRデバイス12.1は、次いで、PCFに対する画像表示のために、第2のXRデバイス12.2から生じる持続的姿勢およびPCFを利用してもよい。加えて、または代替として、第1のXRデバイス12.1は、上記に説明されるように、第2のXRデバイス12.2に類似する様式において、PCFおよび持続的姿勢を読み出し、生成し、利用し、アップロードし、ダウンロードしてもよい。
図示される実施例では、第1のXRデバイス12.1は、ローカル追跡マップ(以降、「マップ1」と称される)を生成し、マップ記憶ルーチン118は、マップ1を第1のXRデバイス12.1から受信する。マップ記憶ルーチン118は、次いで、マップ1をサーバ20の記憶デバイス上に規準マップ120として記憶する。
第2のXRデバイス12.2は、マップダウンロードシステム126と、アンカ識別システム128と、位置特定モジュール130と、規準マップ組込器132と、ローカルコンテンツ位置付けシステム134と、マップ発行器136とを含む。
使用時、マップ伝送機122は、規準マップ120を第2のXRデバイス12.2に送信し、マップダウンロードシステム126は、規準マップ120を規準マップ133としてサーバ20からダウンロードし、記憶する。
アンカ識別システム128は、世界表面決定ルーチン78に接続される。アンカ識別システム128は、世界表面決定ルーチン78によって検出されたオブジェクトに基づいて、アンカを識別する。アンカ識別システム128は、アンカを使用して、第2のマップ(マップ2)を生成する。サイクル138によって示されるように、アンカ識別システム128は、アンカを識別し続け、マップ2を更新し続ける。アンカの場所は、世界表面決定ルーチン78によって提供されるデータに基づいて、3次元データとして記録される。世界表面決定ルーチン78は、画像を実オブジェクト検出カメラ44から、深度データを深度センサ135から受信し、表面の場所および深度センサ135からのその相対的距離を決定する。
位置特定モジュール130は、規準マップ133およびマップ2に接続される。位置特定モジュール130は、マップ2を規準マップ133に対して位置特定するように繰り返し試みる。規準マップ組込器132は、規準マップ133およびマップ2に接続される。位置特定モジュール130が、マップ2を規準マップ133に対して位置特定すると、規準マップ組込器132は、規準マップ133をマップ2のアンカの中に組み込む。マップ2は、次いで、規準マップ内に含まれる欠測データで更新される。
ローカルコンテンツ位置付けシステム134は、マップ2に接続される。ローカルコンテンツ位置付けシステム134は、例えば、ユーザが世界座標フレーム内の特定の場所においてローカルコンテンツを位置特定し得る、システムであってもよい。ローカルコンテンツ自体が、次いで、マップ2の1つのアンカに結び付けられる。ローカル/世界座標変換器104は、ローカルコンテンツ位置付けシステム134の設定に基づいて、ローカル座標フレームを世界座標フレームに変換する。レンダリングエンジン30、ディスプレイシステム42、およびデータチャネル62の機能は、図2を参照して説明されている。
マップ発行器136は、マップ2をサーバ20にアップロードする。サーバ20のマップ記憶ルーチン118は、次いで、マップ2をサーバ20の記憶媒体内に記憶する。
マップマージアルゴリズム124は、マップ2と規準マップ120をマージする。物理的世界の同一または隣接する領域に関連する、2つを上回るマップ、例えば、3つまたは4つのマップが、記憶されているとき、マップマージアルゴリズム124は、全てのマップを規準マップ120にマージし、新しい規準マップ120をレンダリングする。マップ伝送機122は、次いで、新しい規準マップ120を、新しい規準マップ120によって表されるエリア内のあらゆるデバイス12.1および12.2に伝送する。デバイス12.1および12.2が、その個別のマップを規準マップ120に対して位置特定すると、規準マップ120は、プロモートされたマップとなる。
図17は、いくつかの実施形態による、場面のマップのためのキーフレームを生成する実施例を図示する。図示される実施例では、第1のキーフレームKF1は、部屋の左壁上のドアのために生成される。第2のキーフレームKF2は、部屋の床、左壁、および右壁が出会う角内のエリアのために生成される。第3のキーフレームKF3は、部屋の右壁上の窓のエリアのために生成される。第4のキーフレームKF4は、壁の床上のラグの縁端におけるエリアのために生成される。第5のキーフレームKF5は、ユーザに最も近いラグのエリアのために生成される。
図18は、いくつかの実施形態による、図17のマップのための持続的姿勢を生成する実施例を図示する。いくつかの実施形態では、新しい持続的姿勢が、デバイスが進行された閾値距離を測定すると、および/またはアプリケーションが新しい持続的姿勢(PP)を要求すると、作成される。いくつかの実施形態では、閾値距離は、3メートル、5メートル、20メートル、または任意の他の好適な距離であってもよい。より小さい閾値距離(例えば、1m)を選択することは、より多数のPPが、より大きい閾値距離と比較して、作成および管理され得るため、算出負荷の増加をもたらし得る。より大きい閾値距離(例えば、40m)を選択することは、より少数のPPが作成され、より少ないPCFが作成される結果をもたらし、PCFに結び付けられた仮想コンテンツが、PCFから比較的に大距離(例えば、30m)離れ、PCFから仮想コンテンツまでの距離の増加に伴って誤差が増加し得ることを意味するため、仮想コンテンツ設置誤差の増加をもたらし得る。
いくつかの実施形態では、PPは、新しいセッションの開始時に作成されてもよい。本初期PPは、ゼロと見なされ得、閾値距離に等しい半径を有する、円形の中心として可視化され得る。デバイスが、円形の周に到達し、いくつかの実施形態では、アプリケーションが、新しいPPを要求すると、新しいPPは、デバイスの現在の場所(閾値距離)に設置されてもよい。いくつかの実施形態では、新しいPPは、デバイスが、既存のPPをデバイスの新しい位置からの閾値距離内に見出すことが可能である場合、閾値距離に作成されないであろう。いくつかの実施形態では、新しいPP(図14におけるPP1150)が、作成されると、デバイスは、最も近いキーフレームのうちの1つ以上のものをPPに結び付ける。いくつかの実施形態では、キーフレームに対するPPの場所は、PPが作成された時点でのデバイスの場所に基づいてもよい。いくつかの実施形態では、PPは、アプリケーションがPPを要求しない限り、デバイスが閾値距離を進行しても作成されないであろう。
いくつかの実施形態では、アプリケーションは、アプリケーションがユーザに表示するための仮想コンテンツを有するとき、PCFをデバイスから要求してもよい。アプリケーションからのPCF要求は、PP要求をトリガしてもよく、新しいPPは、デバイスが閾値距離を進行した後に作成されるであろう。図18は、例えば、キーフレームと持続的姿勢との間の相対的姿勢を算出することによっって、最も近いキーフレーム(例えば、KF1、KF2、およびKF3)を結び付けさせ得る、第1の持続的姿勢PP1を図示する。図18はまた、最も近いキーフレーム(例えば、KF4およびKF5)を結び付けさせ得る、第2の持続的姿勢PP2を図示する。
図19は、いくつかの実施形態による、図17のマップのためのPCFを生成する実施例を図示する。図示される実施例では、PCF1は、PP1と、PP2とを含んでもよい。上記に説明されるように、PCFは、PCFに対する画像データを表示するために使用されてもよい。いくつかの実施形態では、各PCFは、別の座標フレーム(例えば、世界座標フレーム)内の座標と、例えば、PCFを一意に識別する、PCF記述子とを有してもよい。いくつかの実施形態では、PCF記述子は、PCFと関連付けられるフレーム内の特徴の特徴記述子に基づいて算出されてもよい。いくつかの実施形態では、PCFの種々のコンステレーションは、より少ないデータおよびより少ないデータの伝送を要求する、持続的様式において、組み合わせられ、実世界を表してもよい。
図20A-20Cは、持続的座標フレームを確立および使用する実施例を図示する、概略図である。図20Aは、規準マップに対して位置特定されていない、個別のローカル追跡マップ4804A、4804Bを伴う、2人のユーザ4802A、4802Bを示す。個々のユーザに関する原点4806A、4806Bは、その個別のエリア内の座標系(例えば、世界座標系)によって描写される。各追跡マップのこれらの原点は、原点が、追跡が開始されたときのその個別のデバイスの配向に依存するため、各ユーザにローカルであり得る。
ユーザデバイスのセンサが、環境を走査するにつれて、デバイスは、図14に関連して上記に説明されるように、それらの画像が、そこから持続的姿勢が作成され得る、キーフレームとして分類され得るように、持続的オブジェクトを表す特徴を含有し得る、画像を捕捉してもよい。本実施例では、追跡マップ4802Aは、持続的姿勢(PP)4808Aを含み、追跡マップ4802Bは、PP4808Bを含む。
また、図14に関連して上記に説明されるように、PPのうちのいくつかは、ユーザにそれをレンダリングするために仮想コンテンツの配向を決定するために使用される、PCFとして分類されてもよい。図20Bは、個別のユーザ4802A、4802Bによって装着されるXRデバイスが、PP4808A、4808Bに基づいて、ローカルPCF4810A、4810Bを作成し得ることを示す。図20Cは、持続的コンテンツ4812A、4812B(例えば、仮想コンテンツ)が個別のXRデバイスによってPCF4810A、4810Bに結び付けられ得ることを示す。
本実施例では、仮想コンテンツは、仮想コンテンツが表示されるべき方法にかかわらず、仮想コンテンツを生成するアプリケーションによって使用され得る、仮想コンテンツ座標フレームを有し得る。仮想コンテンツは、例えば、仮想コンテンツ座標フレームに対して特定の場所および角度における、メッシュの三角形等の表面として規定されてもよい。その仮想コンテンツをユーザにレンダリングするために、それらの表面の場所が、仮想コンテンツを知覚することになるユーザに対して決定されてもよい。
仮想コンテンツをPCFに結び付けることは、ユーザに対する仮想コンテンツの場所を決定する際に関わる算出を簡略化し得る。ユーザに対する仮想コンテンツの場所は、一連の変換を適用することによって決定されてもよい。それらの変換のうちのいくつかは、変化し得、頻繁に更新されてもよい。それらの変換のその他は、安定し得、あまり頻繁にまたは全く更新されなくてもよい。それにもかかわらず、変換は、仮想コンテンツの場所が、ユーザに対して頻繁に更新され、現実的外観をレンダリングされた仮想コンテンツに提供し得るように、比較的に低算出負担を伴って適用され得る。
図20A-20Cの実施例では、ユーザ1のデバイスは、変換rig1_T_w1によってマップの原点を定義する、座標系に関連し得る、座標系を有する。ユーザ2のデバイスは、類似変換rig2_T_w2を有する。これらの変換は、6度の変換として表され、デバイス座標系とマップ座標系を整合させるための平行移動および回転を規定し得る。いくつかの実施形態では、変換は、2つの別個の変換として表され得、一方は、平行移動を規定し、他方は、回転を規定する。故に、変換は、算出を簡略化する、または別様に利点を提供する形態で表され得ることを理解されたい。
追跡マップの原点と個別のユーザデバイスによって識別されるPCFとの間の変換は、pcf1_T_w1およびpcf2_T_w2として表される。本実施例では、PCFおよびPPは、同一変換がまたPPを特徴付けるように、同じである。
PCFに対するユーザデバイスの場所は、したがって、rig1_T_pcf1=(rig1_T_w1)(pcf1_T_w1)等のこれらの変換の連続適用によって算出されることができる。
図20Cに示されるように、仮想コンテンツは、obj1_T_pcf1の変換を用いて、PCFに対して位置特定される。本変換は、PCFに対する物理的オブジェクトを説明する世界再構築システムからの情報を受信し得る、仮想コンテンツを生成するアプリケーションによって設定されてもよい。仮想コンテンツをユーザにレンダリングするために、ユーザのデバイスの座標系への変換が、算出され、これは、変換obj1_t_w1=(obj1_T_pcf1)(pcf1_T_w1)を通して、仮想コンテンツ座標フレームを追跡マップの原点に関連させることによって算出され得る。その変換は、次いで、さらなる変換rig1_T_w1を通して、ユーザのデバイスに関連され得る。
仮想コンテンツの場所は、仮想コンテンツを生成するアプリケーションからの出力に基づいて変化し得る。それが変化すると、ソース座標系から目的地座標系へのエンドツーエンド変換が、再算出され得る。加えて、ユーザの場所および/または頭部姿勢も、ユーザが移動するにつれて変化し得る。結果として、変換rig1_T_w1が、変化し得るのと同様に、ユーザの場所または頭部姿勢に依存する、任意のエンドツーエンド変換も変化するであろう。
変換rig1_T_w1は、ユーザの位置を物理的世界内の定常オブジェクトに対して追跡することに基づいて、ユーザの運動に伴って更新されてもよい。そのような追跡は、上記に説明されるように、画像のシーケンスを処理するヘッドホン追跡コンポーネント、またはシステムの他のコンポーネントによって実施されてもよい。そのような更新は、PP等の定常基準フレームに対するユーザの姿勢を決定することによって行われてもよい。
いくつかの実施形態では、ユーザデバイスの場所および配向は、最も近くの持続的姿勢に対して決定されてもよい、または、本実施例では、PPとしてのPCFが、PCFとして使用される。そのような決定は、デバイス上のセンサを用いて捕捉された現在の画像内において、PPを特徴付ける、特徴点を識別することによって、行われてもよい。立体視画像分析等の画像処理技法を使用して、それらの特徴点に対するデバイスの場所が、決定されてもよい。本データから、システムは、関係rig1_T_pcf1=(rig1_T_w1)(pcf1_T_w1)に基づいて、ユーザの運動と関連付けられる変換の変化を計算し得る。
システムは、算出上効率的である順序において、変換を決定および適用してもよい。例えば、rig1_T_pcf1をもたらす測定からrig1_T_w1を算出する必要性は、ユーザ姿勢を追跡することと、持続的姿勢上に構築されるPPまたはPCFに対する仮想コンテンツの場所を定義することとの両方によって、回避され得る。このように、仮想コンテンツのソース座標系からユーザのデバイスの目的地座標系への変換は、表現(rig1_T_pcf1)(obj1_t_pcf1)に従う測定された変換に基づいてもよく、第1の変換は、システムによって測定され、後者の変換は、レンダリングのための仮想コンテンツを規定するアプリケーションによって供給される。仮想コンテンツがマップの原点に対して位置付けられる、実施形態では、エンドツーエンド変換は、マップ座標とPCF座標との間のさらなる変換に基づいて、仮想オブジェクト座標系をPCF座標系に関連させ得る。仮想コンテンツが、それに対してユーザ位置が追跡されているものと異なるPPまたはPCFに対して位置付けられる、実施形態では、2つの間の変換が、適用されてもよい。そのような変換は、固定されてもよく、例えば、両方が現れる、マップから決定されてもよい。
変換ベースのアプローチは、例えば、センサデータを処理し、追跡マップを構築する、コンポーネントを伴う、デバイス内に実装されてもよい。そのプロセスの一部として、それらのコンポーネントは、持続的姿勢として使用され得る、特徴点を識別してもよく、これは、ひいては、PCFに変えられてもよい。それらのコンポーネントは、図17-19に関連して上記に説明されるように、マップのために生成される持続的姿勢の数を限定し、持続的姿勢間の好適な間隔を提供する一方、ユーザが、物理的環境内の場所にかかわらず、持続的姿勢場所に十分に近接し、ユーザの姿勢を正確に算出することを可能にし得る。ユーザに最も近い持続的姿勢が、ユーザ移動、追跡マップに対する精緻化、または他の原因の結果として、更新されるにつれて、PP(または使用されている場合、PCF)の場所に依存する、ユーザに対する仮想コンテンツの場所を算出するために使用される、変換のいずれかが、少なくとも、ユーザがその持続的姿勢から離れるように移動するまで、使用のために、更新および記憶されてもよい。なお、変換を算出および記憶することによって、仮想コンテンツの場所が更新される度の算出負担は、比較的に短待ち時間を伴って実施され得るほど比較的に低くなり得る。
図20A-20Cは、追跡マップに対する位置付けを図示し、各デバイスがその独自の追跡マップを有する。しかしながら、変換は、任意のマップ座標系に対して生成されてもよい。XRシステムのユーザセッションを横断したコンテンツの存続は、持続的マップを使用することによって達成され得る。ユーザの共有体験はまた、それに対して複数のユーザデバイスが配向され得る、マップを使用することによって促進され得る。
下記により詳細に説明される、いくつかの実施形態では、仮想コンテンツの場所は、複数のデバイスのいずれかがマップを使用し得るようにフォーマットされる、規準マップにおける座標に関連して規定されてもよい。各デバイスは、追跡マップを維持し得、追跡マップに対するユーザの姿勢の変化を決定してもよい。本実施例では、追跡マップと規準マップとの間の変換は、「位置特定」のプロセスを通して決定されてもよく、これは、追跡マップ内の構造(1つ以上の持続的姿勢等)と規準マップの1つ以上の構造(1つ以上のPCF等)をマッチングさせることによって実施されてもよい。
下記にさらに説明されるものは、このように規準マップを作成および使用するための技法である。
深層キーフレーム
本明細書に説明されるような技法は、画像フレームの比較に依拠する。例えば、追跡マップに対するデバイスの位置を確立するために、新しい画像が、ユーザによって装着されるセンサを用いて捕捉されてもよく、XRシステムは、追跡マップを作成するために使用された画像のセット内において、少なくとも所定の量の着目点を新しい画像と共有する、画像を検索してもよい。画像フレームの比較を伴う、別のシナリオの実施例として、追跡マップが、最初に、規準マップ内のPCFと関連付けられる画像フレームに類似する、追跡マップ内の持続的姿勢と関連付けられる画像フレームを見出すことによって、規準マップに対して位置特定され得る。代替として、2つの規準マップ間の変換が、最初に、2つのマップ内の類似画像フレームを見出すことによって、算出されてもよい。
深層キーフレームは、類似画像フレームを識別するために要求される処理の量を低減させるための方法を提供する。例えば、いくつかの実施形態では、比較は、新しい2D画像内の画像特徴(例えば、「2D特徴」)とマップ内の3D特徴との間で行われ得る。そのような比較は、3D画像を2D平面の中に投影すること等によって、任意の好適な方法において行われ得る。単語の袋(BoW)等の従来の方法は、マップ内の全ての2D特徴を含む、データベース内の新しい画像の2D特徴を検索し、これは、特に、マップが大エリアを表すとき、有意な算出リソースを要求し得る。従来の方法は、次いで、2D特徴のうちの少なくとも1つを新しい画像と共有する、画像を位置特定し、これは、マップ内の有意義な3D特徴を位置特定するために有用ではない、画像を含み得る。従来の方法は、次いで、新しい画像内の2D特徴に対して有意義ではない、3D特徴を位置特定する。
本発明者らは、より少ないメモリリソース(例えば、BoWによって使用されるメモリリソースの4分の1)、より高い効率(例えば、キーフレーム毎に2.5msの処理時間、500枚のキーフレームに対する比較のために100μs)、およびより高い正確度(例えば、1,024次元モデルのためにBoWより20%良好な読出再生、256次元モデルのためにBoWより5%良好な読出再生)を使用した、マップ内の画像を読み出すための技法を認識および理解している。
算出を低減させるために、画像フレームと他の画像フレームを比較するために使用され得る、記述子が、画像フレームのために算出されてもよい。記述子は、画像フレームおよび特徴点の代わりに、またはそれに加え、記憶されてもよい。持続的姿勢および/またはPCFが画像フレームから生成され得る、マップでは、そこから各持続的姿勢またはPCFが生成された画像フレームまたは複数のフレームの記述子が、持続的姿勢および/またはPCFの一部として記憶されてもよい。
いくつかの実施形態では、記述子は、画像フレーム内の特徴点の関数として算出されてもよい。いくつかの実施形態では、ニューラルネットワークが、画像を表すための一意のフレーム記述子を算出するように構成される。画像は、ユーザによって装着されるデバイスの視野内の3D環境の十分な詳細が画像内で捕捉されるように、1メガバイトより高い分解能を有し得る。フレーム記述子は、数字の列、例えば、128バイト~512バイトの範囲内またはその間の任意の数等、はるかに小さくあり得る。
いくつかの実施形態では、ニューラルネットワークは、算出されたフレーム記述子が画像間の類似性を示すように訓練される。マップ内の画像は、マップを生成するために使用される画像を備えるデータベース内において、新しい画像のためのフレーム記述子に対して所定の距離内のフレーム記述子を有し得る、最も近くの画像を識別することによって位置特定され得る。いくつかの実施形態では、画像間の距離は、2つの画像のフレーム記述子間の差異によって表されてもよい。
図21は、いくつかの実施形態による、個々の画像のための記述子を生成するためのシステムを図示する、ブロック図である。図示される実施例では、フレーム埋込生成器308が、示される。フレーム埋込生成器308は、いくつかの実施形態では、サーバ20と併用されてもよいが、代替として、または加えて、全体または部分的に、XRデバイス12.1および12.2、または他の画像との比較のための画像を処理する任意の他のデバイスのうちの1つ内で実行されてもよい。
いくつかの実施形態では、フレーム埋込生成器は、低減されたサイズにもかかわらず、それでもなお、画像内のコンテンツを示す、初期サイズ(例えば、76,800バイト)から最終サイズ(例えば、256バイト)に低減された画像のデータ表現を生成するように構成されてもよい。いくつかの実施形態では、フレーム埋込生成器は、他の方法において使用されるキーフレームまたはフレームであり得る、画像のためのデータ表現を生成するために使用されてもよい。いくつかの実施形態では、フレーム埋込生成器308は、特定の場所および配向における画像を一意の数字の列(例えば、256バイト)に変換するように構成されてもよい。図示される実施例では、XRデバイスによって撮影される画像320は、画像320内の着目点322を検出するために特徴抽出器324によって処理されてもよい。着目点は、特徴1120(図14)に関して上記に説明されるように、または本明細書に別様に説明されるように、識別された特徴点から導出される場合とそうではない場合がある。いくつかの実施形態では、着目点は、深層疎特徴方法を使用して生成され得る、記述子1130(図14)に関して上記に説明されるように、記述子によって表されてもよい。いくつかの実施形態では、各着目点322は、数字の列(例えば、32バイト)によって表されてもよい。例えば、n個の特徴(例えば、100)が存在してもよく、各特徴は、32バイトの列によって表される。
いくつかの実施形態では、フレーム埋込生成器308は、ニューラルネットワーク326を含んでもよい。ニューラルネットワーク326は、多層パーセプトロンユニット312と、最大(max)プールユニット314とを含んでもよい。いくつかの実施形態では、多層パーセプトロン(MLP)ユニット312は、多層パーセプトロンを備えてもよく、これは、訓練されてもよい。いくつかの実施形態では、着目点322(例えば、着目点のための記述子)は、多層パーセプトロン312によって低減され得、記述子の加重された組み合わせ310として出力され得る。例えば、MLPは、n個の特徴を、n個の特徴未満である、m個の特徴に低減させ得る。
いくつかの実施形態では、MLPユニット312は、行列乗算を実施するように構成されてもよい。多層パーセプトロンユニット312は、画像320の複数の着目点322を受信し、各着目点を個別の数字の列(例えば、256)に変換する。例えば、100個の特徴が存在してもよく、各特徴は、256の数字の列によって表され得る。行列は、本実施例では、100の水平行および256の垂直列を有するように作成されてもよい。各行は、一部は、より小さく、一部は、より大きい、大きさが変動する、一連の256の数を有してもよい。いくつかの実施形態では、MLPの出力は、n×256の行列であってもよく、nは、画像から抽出された特徴の数を表す。いくつかの実施形態では、MLPの出力は、m×256行列であってもよく、mは、nから低減された着目点の数である。
いくつかの実施形態では、MLP312は、その間にMLPのためのモデルパラメータが決定される、訓練相と、使用相とを有してもよい。いくつかの実施形態では、MLPは、図25に図示されるように、訓練されてもよい。入力訓練データは、3つのセット内にデータを備えてもよく、3つのセットは、1)クエリ画像と、2)正のサンプルと、3)負のサンプルとを備える。クエリ画像は、基準画像と見なされ得る。
いくつかの実施形態では、正のサンプルは、クエリ画像に類似する、画像を備えてもよい。例えば、いくつかの実施形態では、類似するとは、同一オブジェクトをクエリおよび正のサンプル画像の両方内に有することであるが、異なる角度から視認され得る。いくつかの実施形態では、類似するとは、同一オブジェクトをクエリおよび正のサンプル画像の両方内に有することであるが、他の画像に対して(例えば、左、右、上、下に)偏移されるオブジェクトを有し得る。
いくつかの実施形態では、負のサンプルは、クエリ画像と類似しない、画像を備えてもよい。例えば、いくつかの実施形態では、類似しない画像は、クエリ画像内で顕著な任意のオブジェクトを含有し得ない、またはクエリ画像内で顕著なオブジェクトの小部分のみ(例えば、<10%、1%)を含有し得る。類似画像は、対照的に、例えば、クエリ画像内でオブジェクトの大部分(例えば、>50%、または>75%)を有し得る。
いくつかの実施形態では、着目点は、入力訓練データ内の画像から抽出されてもよく、特徴記述子に変換されてもよい。これらの記述子は、図25に示されるように、訓練画像のためと、図21のフレーム埋込生成器308の動作時に抽出された特徴のためとの両方のために算出されてもよい。いくつかの実施形態では、深層疎特徴(DSF)プロセスが、米国特許出願第16/190,948号に説明されるように、記述子(例えば、DSF記述子)を生成するために使用されてもよい。いくつかの実施形態では、DSF記述子は、n×32寸法である。記述子は、次いで、モデル/MLPを通して通過され、256バイト出力を作成してもよい。いくつかの実施形態では、モデル/MLPは、いったんモデルパラメータが訓練を通して設定されると、結果として生じる訓練されたMLPがMLP312として使用され得るように、MLP312と同一構造を有してもよい。
いくつかの実施形態では、特徴記述子(例えば、MLPモデルから出力された256バイト)は、次いで、トリプレットマージン損失モジュール(MLPニューラルネットワークの訓練相の間にのみ使用され、使用相の間には使用され得ない)に送信されてもよい。いくつかの実施形態では、トリプレットマージン損失モジュールは、クエリ画像から出力された256バイトと正のサンプルから出力された256バイトとの間の差異を低減させ、クエリ画像から出力された256バイトと負のサンプルから出力された256バイトとの間の差異を増加させるように、モデルのためのパラメータを選択するように構成されてもよい。いくつかの実施形態では、訓練相は、複数のトリプレット入力画像を学習プロセスの中にフィードし、モデルパラメータを決定するステップを含んでもよい。本訓練プロセスは、例えば、正の画像に関する差異が最小限にされ、負の画像に関する差異が最大限にされるまで、または他の好適な終了基準に到達するまで、継続し得る。
図21に戻って参照すると、フレーム埋込生成器308は、ここでは、最大(max)プールユニット314として図示される、プーリング層を含んでもよい。最大プールユニット314は、各列を分析し、個別の列内の最大数を決定してもよい。最大プールユニット314は、MLP312の出力行列の数の各列の最大値を、例えば、256の数のグローバル特徴列316に組み合わせてもよい。XRシステム内で処理された画像は、望ましくは、潜在的に数百万ピクセルを伴う、高分解能フレームを有し得ることを理解されたい。グローバル特徴列316は、比較的に少ないメモリを占有し、画像(例えば、1メガバイトより高い分解能を伴う)と比較して、容易に検索可能である、比較的に小数である。したがって、カメラからの各オリジナルフレームを分析せずに、画像を検索することが可能であって、また、完全フレームの代わりに、256バイトを記憶するようにより安価である。
図22は、いくつかの実施形態による、画像記述子を算出する方法2200を図示する、フローチャートである。方法2200は、ユーザによって装着されるXRデバイスによって捕捉された複数の画像を受信するステップ(行為2202)から開始してもよい。いくつかの実施形態では、方法2200は、1つ以上のキーフレームを複数の画像から決定するステップ(行為2204)を含んでもよい。いくつかの実施形態では、行為2204は、スキップされてもよい、および/または代わりに、ステップ2210後に生じてもよい。
方法2200は、人工ニューラルネットワークを用いて、複数の画像内の1つ以上の着目点を識別するステップ(行為2206)と、人工ニューラルネットワークを用いて、個々の着目点のための特徴記述子を算出するステップ(行為2208)とを含んでもよい。本方法は、画像毎に、少なくとも部分的に、人工ニューラルネットワークを用いて、画像内の識別された着目点のための算出された特徴記述子に基づいて、画像を表すためのフレーム記述子を算出するステップ(行為2210)を含んでもよい。
図23は、いくつかの実施形態による、画像記述子を使用した位置特定の方法2300を図示する、フローチャートである。本実施例では、XRデバイスの現在の場所を描写する、新しい画像フレームが、マップ内の点(上記に説明されるように、持続的姿勢またはPCF等)に関連して記憶された画像フレームと比較されてもよい。方法2300は、ユーザによって装着されるXRデバイスによって捕捉された新しい画像を受信するステップ(行為2302)から開始してもよい。方法2300は、1つ以上のマップを生成するために使用されるキーフレームを備える、データベース内の1つ以上の最も近くのキーフレームを識別するステップ(行為2304)を含んでもよい。いくつかの実施形態では、最も近くのキーフレームは、大まかな空間情報および/または以前に決定された空間情報に基づいて識別されてもよい。例えば、大まかな空間情報は、XRデバイスがマップの50m×50mエリアによって表される地理的領域内に存在することを示し得る。画像マッチングは、そのエリア内の点のみに関して実施されてもよい。別の実施例として、追跡に基づいて、XRシステムは、XRデバイスが、マップ内の第1の持続的姿勢に以前に近接しており、マップ内の第2の持続的姿勢の方向に移動していたことを把握してもよい。その第2の持続的姿勢は、最も近くの持続的姿勢と見なされ得、それとともに記憶されたキーフレームは、最も近くのキーフレームと見なされ得る。代替として、または加えて、GPSデータまたはWiFiフィンガプリント等の他のメタデータも、最も近くのキーフレームまたは最も近くのキーフレームのセットを選択するために使用されてもよい。
最も近くのキーフレームが選択される方法にかかわらず、フレーム記述子が、新しい画像が近隣の持続的姿勢と関連付けられるものとして選択されたフレームのいずれかにマッチングするかどうかを決定するために使用されてもよい。決定は、新しい画像のフレーム記述子と任意の他の好適な方法において選択されたデータベース内の最も近いキーフレームまたはキーフレームのサブセットのフレーム記述子を比較し、新しい画像のフレーム記述子の所定の距離内のフレーム記述子を伴うキーフレームを選択することによって行われてもよい。いくつかの実施形態では、2つのフレーム記述子間の距離は、2つのフレーム記述子を表し得る、2つの数字の列間の差異を取得することによって算出されてもよい。列が複数の量の列として処理される、実施形態では、差異は、ベクトル差異として算出されてもよい。
いったんマッチング画像フレームが、識別されると、その画像フレームに対するXRデバイスの配向が、決定され得る。方法2300は、識別された最も近くのキーフレームに対応する、マップ内の3D特徴に対して特徴マッチングを実施するステップ(行為2306)と、特徴マッチング結果に基づいて、ユーザによって装着されるデバイスの姿勢を算出するステップ(行為2308)とを含んでもよい。このように、2つの画像内の特徴点の算出上集約的であるマッチングは、新しい画像のための可能性が高いマッチングであるとすでに決定されているわずか1つの画像に関して実施されてもよい。
図24は、いくつかの実施形態による、ニューラルネットワークを訓練する方法2400を図示する、フローチャートである。方法2400は、複数の画像セットを備える、データセットを生成するステップ(行為2402)から開始してもよい。複数の画像セットはそれぞれ、クエリ画像と、正のサンプル画像と、負のサンプル画像とを含んでもよい。いくつかの実施形態では、複数の画像セットは、例えば、ニューラルネットワークに形状等の基本情報を教示するように構成される、合成記録対を含んでもよい。いくつかの実施形態では、複数の画像セットは、物理的世界から記録され得る、実記録対を含んでもよい。
いくつかの実施形態では、インライアは、2つの画像間の基本行列を適合させることによって算出されてもよい。いくつかの実施形態では、疎重複が、画像の両方内で見られる着目点の和集合上の交点(IoU)として算出されてもよい。いくつかの実施形態では、正のサンプルは、クエリ画像内で同一である、インライアとしての役割を果たす、少なくとも20個の着目点を含んでもよい。負のサンプルは、10未満のインライア点を含んでもよい。負のサンプルは、クエリ画像の解析点と重複する、半分未満の疎点を有してもよい。
方法2400は、画像セット毎に、クエリ画像と正のサンプル画像および負のサンプル画像を比較することによって、損失を算出するステップ(行為2404)を含んでもよい。方法2400は、クエリ画像のために人工ニューラルネットワークによって生成されたフレーム記述子と正のサンプル画像のためのフレーム記述子との間の距離が、クエリ画像のためのフレーム記述子と負のサンプル画像のためのフレーム記述子との間の距離未満であるように、算出された損失に基づいて、人工ニューラルネットワークを修正するステップ(行為2406)を含んでもよい。
個々の画像のためのグローバル記述子を生成するように構成される、方法および装置が、上記に説明されるが、方法および装置は、個々のマップのための記述子を生成するように構成されてもよいことを理解されたい。例えば、マップは、複数のキーフレームを含んでもよく、それぞれ、上記に説明されるように、フレーム記述子を有してもよい。最大プールユニットは、マップのキーフレームのフレーム記述子を分析し、フレーム記述子をマップのための一意のマップ記述子の中に組み合わせてもよい。
さらに、他のアーキテクチャも、上記に説明されるように、処理のために使用されてもよいことを理解されたい。例えば、別個のニューラルネットワークは、DSF記述子およびフレーム記述子を生成するために説明される。そのようなアプローチは、算出上効率的である。しかしながら、いくつかの実施形態では、フレーム記述子は、最初にDSF記述子を生成せずに、選択された特徴点から生成されてもよい。
マップのランク付けおよびマージ
本明細書に説明されるものは、複数の環境マップをXリアリティ(XR)システム内でランク付けおよびマージするための方法および装置である。マップマージは、物理的世界の重複部分を表すマップが、より大きいエリアを表すように組み合わせられることを可能にし得る。マップをランク付けすることは、類似性に基づいてマップをマップのセットから選択するステップを伴う、マップマージを含む、本明細書に説明されるような技法を効率的に実施することを可能にし得る。いくつかの実施形態では、例えば、いくつかのXRデバイスのいずれかによってアクセスされ得る方法でフォーマットされる、規準マップのセットが、システムによって維持されてもよい。これらの規準マップは、それらのデバイスからの選択された追跡マップと他の追跡マップまたは以前に記憶された規準マップをマージすることによって形成されてもよい。規準マップは、例えば、1つ以上の規準マップを選択し、新しい追跡マップとマージする、および/またはセットから1つ以上の規準マップを選択し、デバイス内で使用する際に使用するために、ランク付けされてもよい。
現実的XR体験をユーザに提供するために、XRシステムは、実オブジェクトに関連して仮想オブジェクトの場所を正しく相関させるために、ユーザの物理的周囲を把握しなければならない。ユーザの物理的周囲についての情報は、ユーザの場所に関する環境マップから取得されてもよい。
本発明者らは、XRシステムが、複数のユーザによって収集された実/物理的世界の環境マップの効率的共有を有効にすることによって、それらのユーザが同一または異なる時間に世界内に存在するかどうかにかかわらず、実および/または仮想コンテンツを備える、同一世界を共有する複数のユーザに、向上されたXR体験を提供し得ることを認識し、その真価を認めた。しかしながら、そのようなシステムを提供する際、有意な課題が存在する。そのようなシステムは、複数のユーザによって生成された複数のマップを記憶し得、および/またはシステムは、異なる時間に生成された複数のマップを記憶し得る。例えば、上記に説明されるように、位置特定等の以前に生成されたマップを用いて実施され得る動作に関して、実質的処理が、同一世界(例えば、同一実世界場所)の関連環境マップをXRシステム内で収集された全ての環境マップから識別するために要求され得る。いくつかの実施形態では、デバイスが、例えば、位置特定のためにアクセスし得る、少数の環境マップのみが存在し得る。いくつかの実施形態では、デバイスがアクセスし得る、多数の環境マップが存在し得る。本発明者らは、環境マップの関連性を、例えば、図28における全ての規準マップ120の母集団等のあらゆる可能性として考えられる環境マップから迅速かつ正確にランク付けする技法を認識し、その真価を認めた。高ランク付けマップは、次いで、仮想オブジェクトをユーザディスプレイ上にユーザの周囲の物理的世界と現実的に相互作用するようにレンダリングする、またはそのユーザによって収集されたマップデータと記憶されたマップをマージし、より大きいまたはより正確なマップを作成するため等、さらなる処理のために、選択されてもよい。
いくつかの実施形態では、物理的世界内のある場所におけるユーザのためのタスクに関連する、記憶されたマップが、複数の基準に基づいて、記憶されたマップをフィルタリングすることによって識別されてもよい。それらの基準は、その場所におけるユーザのウェアラブルデバイスによって生成された追跡マップと、データベース内に記憶される候補環境マップの比較を示してもよい。比較は、マップを生成するデバイスによって検出されたWi-Fiフィンガプリント等のマップと関連付けられる、メタデータ、および/またはマップを形成する間、それに対してデバイスが接続されるBSSIDのセットに基づいて実施されてもよい。比較はまた、マップの圧縮または解凍されたコンテンツに基づいて実施されてもよい。圧縮された表現に基づく比較は、例えば、マップコンテンツから算出されたベクトルの比較によって実施されてもよい。解凍されたマップに基づく比較は、例えば、追跡マップを記憶されたマップ内で位置特定する、またはその逆によって実施されてもよい。複数の比較が、考慮のために、候補マップの数を低減させるために必要とされる算出時間に基づく順序に実施されてもよく、より少ない算出を伴う比較は、より多くの算出を要求する他の比較より先の順序で実施される。
図26は、いくつかの実施形態による、1つ以上の環境マップをランク付けおよびマージするように構成される、ARシステム800を描写する。ARシステムは、ARデバイスのパス可能世界モデル802を含んでもよい。パス可能世界モデル802を取り込むための情報は、ARデバイス上のセンサから生じてもよく、これは、プロセッサ804(例えば、図4におけるローカルデータ処理モジュール570)内に記憶される、センサデータをマップに変換するための処理のいくつかまたは全てを実施し得る、コンピュータ実行可能命令を含んでもよい。そのようなマップは、ARデバイスが領域内で動作する際にセンサデータが収集されるにつれて構築され得るような追跡マップであってもよい。その追跡マップとともに、エリア属性が、追跡マップが表すエリアを示すように供給されてもよい。これらのエリア属性は、緯度および経度として提示される座標または場所を表すためにARシステムによって使用されるID等の地理的場所識別子であってもよい。代替として、または加えて、エリア属性は、そのエリアに関して一意である高尤度を有する、測定された特性であってもよい。エリア属性は、例えば、エリア内で検出された無線ネットワークのパラメータから導出されてもよい。いくつかの実施形態では、エリア属性は、ARシステムが近隣にある、および/または接続される、アクセスポイントの一意のアドレスと関連付けられてもよい。例えば、エリア属性は、5G基地局/ルータ、Wi-Fiルータ、および同等物のMACアドレスまたは基本サービスセット識別子(BSSID)と関連付けられてもよい。
図26の実施例では、追跡マップは、環境の他のマップとマージされてもよい。マップランク付け部分806は、追跡マップをデバイスPW802から受信し、マップデータベース808と通信し、マップデータベース808からの環境マップを選択およびランク付けする。より高いランク付けされる選択されたマップは、マップマージ部分810に送信される。
マップマージ部分810は、マージ処理をマップランク付け部分806から送信されるマップ上で実施してもよい。マージ処理は、追跡マップとランク付けされたマップのいくつかまたは全てをマージし、新しいマージされたマップをパス可能世界モデル812に伝送するステップを伴ってもよい。マップマージ部分は、物理的世界の重複部分を描写するマップを識別することによって、マップをマージしてもよい。それらの重複部分は、両方のマップ内の情報が最終マップの中に集約され得るように整合されてもよい。規準マップは、他の規準マップおよび/または追跡マップとマージされてもよい。
集約は、1つのマップを別のマップからの情報で拡張するステップを伴ってもよい。代替として、または加えて、集約は、別のマップ内の情報に基づいて、1つのマップ内の物理的世界の表現を調節するステップを伴ってもよい。後者のマップは、例えば、マップが後者の情報に基づいて更新され得るように、特徴点を生じさせるオブジェクトが移動したことを表し得る。代替として、2つのマップは、異なる特徴点を伴う、同一領域を特徴付けし得、集約は、特徴点のセットを2つのマップから選択し、その領域をより良好に表すステップを伴ってもよい。マージするプロセスにおいて生じる、具体的処理にかかわらず、いくつかの実施形態では、マージされる全てのマップからのPCFが、コンテンツをそれらに対して位置付けるアプリケーションがそのように行い続け得るように、留保されてもよい。いくつかの実施形態では、マップのマージは、冗長持続的姿勢をもたらし得、持続的姿勢のうちのいくつかは、削除されてもよい。PCFが、削除されるべき持続的姿勢と関連付けられるとき、マップをマージするステップは、PCFがマージ後にマップ内に残る持続的姿勢と関連付けられるように修正するステップを伴ってもよい。
いくつかの実施形態では、マップが、拡張および/または更新されるにつれて、それらは、精緻化されてもよい。精緻化は、物理的世界内の同一オブジェクトを表す可能性が高い、特徴点間の内部不一致を低減させるための算出を伴ってもよい。不一致は、物理的世界内の同一オブジェクトを表す特徴点を供給する、キーフレームと関連付けられる姿勢内の不正確性から生じ得る。そのような不一致は、例えば、追跡マップに対する姿勢を算出するXRデバイスから生じ得、これは、ひいては、姿勢推定内の誤差が、蓄積し、「ドリフト」を姿勢正確度内に経時的に作成するように、姿勢を推定するステップに基づいて構築される。バンドル調整または他の動作を実施し、複数のキーフレームからの特徴点の不一致を低減させることによって、マップは、精緻化されてもよい。
精緻化に応じて、マップの原点に対する持続的点の場所は、変化し得る。故に、持続的姿勢またはPCF等のその持続的点と関連付けられる変換も、変化し得る。いくつかの実施形態では、XRシステムは、マップ精緻化(マージ動作の一部として、または他の理由から実施されるかどうかにかかわらず)に関連して、変化した任意の持続的点と関連付けられる変換を再算出してもよい。これらの変換は、変換の任意の使用が持続的点の更新された場所に基づき得るように、変換を算出するコンポーネントから変換を使用するコンポーネントにプッシュ配信され得る。
パス可能世界モデル812は、クラウドモデルであってもよく、これは、複数のARデバイスによって共有されてもよい。パス可能世界モデル812は、環境マップをマップデータベース808内に記憶する、または別様にそれへのアクセスを有してもよい。いくつかの実施形態では、以前に算出された環境マップが、更新されると、そのマップの以前のバージョンは、古くなったマップをデータベースから除去するように、削除されてもよい。いくつかの実施形態では、以前に算出された環境マップが、更新されると、そのマップの以前のバージョンは、アーカイブされ、環境の以前のバージョンの読出/閲覧を有効にしてもよい。いくつかの実施形態では、許可が、ある読取/書込アクセスを有するARシステムのみが、マップの以前のバージョンの削除/アーカイブをトリガし得るように設定されてもよい。
1つ以上のARデバイス/システムによって供給される追跡マップから作成されたこれらの環境マップは、ARシステム内のARデバイスによってアクセスされてもよい。マップランク付け部分806はまた、環境マップをARデバイスに供給する際に使用されてもよい。ARデバイスは、その現在の場所に関する環境マップを要求するメッセージを送信してもよく、マップランク付け部分806は、要求側デバイスに関連する環境マップを選択およびランク付けするために使用されてもよい。
いくつかの実施形態では、ARシステム800は、マージされたマップをクラウドPW812から受信するように構成される、ダウンサンプリング部分814を含んでもよい。クラウドPW812から受信され、マージされたマップは、クラウドのための記憶フォーマットであってもよく、これは、平方メートルあたり多数のPCFまたはPCFと関連付けられる複数の画像フレームまたは大セットの特徴点等の高分解能情報を含んでもよい。ダウンサンプリング部分814は、クラウドフォーマットマップをARデバイス上への記憶のために好適なフォーマットにダウンサンプリングするように構成されてもよい。デバイスフォーマットマップは、より少ないPCFまたはPCF毎に記憶されたより少ないデータ等のより少ないデータを有し、ARデバイスの限定されたローカル演算能力および記憶空間に対応し得る。
図27は、遠隔記憶媒体、例えば、クラウド内に記憶され得る、複数の規準マップ120を図示する、簡略化されたブロック図である。各規準マップ120は、惑星である地球上のいずれかの場所等、物理的空間内の規準マップの場所を示す、複数の規準マップ識別子を含んでもよい。これらの規準マップ識別子は、以下の識別子、すなわち、経度および緯度の範囲によって表される、エリア識別子と、フレーム記述子(例えば、図21におけるグローバル特徴列316)と、Wi-Fiフィンガプリントと、特徴記述子(例えば、図21における特徴記述子310)と、マップに寄与した1つ以上のデバイスを示す、デバイス識別とのうちの1つ以上のものを含んでもよい。
図示される実施例では、規準マップ120は、地球の表面上に存在し得るため、2次元パターンで地理的に配置される。規準マップ120は、重複経度および緯度を有する、任意の規準マップが、新しい規準マップの中にマージされ得るため、対応する経度および緯度によって、一意に識別可能であり得る。
図28は、いくつかの実施形態による、新しい追跡マップを1つ以上の規準マップに対して位置特定するために使用され得る、規準マップを選択する方法を図示する、概略図である。本方法は、実施例として、パス可能世界(例えば、パス可能世界モジュール538)内のデータベース内に記憶され得る、規準マップ120の母集合にアクセスするステップ(行為120)から開始してもよい。規準マップの母集合は、全ての以前に訪問した場所からの規準マップを含んでもよい。XRシステムは、全ての規準マップの母集合を小サブセットまたは単一マップのみにフィルタリングしてもよい。いくつかの実施形態では、帯域幅制限に起因して、全ての規準マップを視認デバイスに送信することは不可能であり得ることを理解されたい。デバイスに送信するために、追跡マップにマッチングするための可能性が高い候補として選択されたサブセットを選択することは、マップの遠隔データベースにアクセスすることと関連付けられる帯域幅および待ち時間を低減させ得る。
本方法は、所定のサイズおよび形状を伴うエリアに基づいて、規準マップの母集合をフィルタリングするステップ(行為300)を含んでもよい。図27に図示される実施例では、各正方形は、エリアを表し得る。各正方形は、50m×50mを網羅し得る。各正方形は、6つの近傍のエリアを有し得る。いくつかの実施形態では、行為300は、少なくとも1つのマップがその経度および緯度に存在する限り、XRデバイスから受信された位置識別子のその経度および緯度を含む、経度および緯度を網羅する、少なくとも1つのマッチング規準マップ120を選択してもよい。いくつかの実施形態では、行為300は、マッチング規準マップに隣接する、経度および緯度を網羅する、少なくとも1つの近傍の規準マップを選択してもよい。いくつかの実施形態では、行為300は、複数のマッチング規準マップと、複数の近傍の規準マップとを選択してもよい。行為300は、例えば、規準マップの数を約10分の1、例えば、数千から数百に低減させ、第1のフィルタリングされた選択を形成してもよい。代替として、または加えて、緯度および経度以外の基準が、近傍のマップを識別するために使用されてもよい。XRデバイスは、例えば、同一セッションの一部として、セット内の規準マップを用いて以前に位置特定されていてもよい。クラウドサービスは、以前に位置特定されたマップを含む、XRデバイスについての情報を留保してもよい。本実施例では、行為300において選択されたマップは、それに対してXRデバイスが位置特定されたマップに隣接する、エリアを網羅するものを含んでもよい。
本方法は、Wi-Fiフィンガプリントに基づいて、規準マップの第1のフィルタリングされた選択をフィルタリングするステップ(行為302)を含んでもよい。行為302は、XRデバイスからの位置識別子の一部として受信されたWi-Fiフィンガプリントに基づいて、緯度および経度を決定してもよい。行為302は、Wi-Fiフィンガプリントからの緯度および経度と規準マップ120の緯度および経度を比較し、第2のフィルタリングされた選択を形成する、1つ以上の規準マップを決定してもよい。行為302は、規準マップの数を約10分の1、例えば、第2の選択を形成する、数百から数十個の規準マップ(例えば、50)に低減させてもよい。例えば、第1のフィルタリングされた選択は、130個の規準マップを含み得、第2のフィルタリングされた選択は、130個の規準マップのうちの50個を含み得、130個の規準マップのうちの残りの80個を含み得ない。
本方法は、キーフレームに基づいて、規準マップの第2のフィルタリングされた選択をフィルタリングするステップ(行為304)を含んでもよい。行為304は、XRデバイスによって捕捉された画像を表すデータと規準マップ120を表すデータを比較してもよい。いくつかの実施形態では、画像および/またはマップを表すデータは、特徴記述子(例えば、図25におけるDSF記述子)および/またはグローバル特徴列(例えば、図21における316)を含んでもよい。行為304は、規準マップの第3のフィルタリングされた選択を提供してもよい。いくつかの実施形態では、行為304の出力は、例えば、第2のフィルタリングされた選択に続いて識別された50個の規準マップのうちの5つのみであってもよい。マップ伝送機122が、次いで、第3のフィルタリングされた選択に基づいて、1つ以上の規準マップを視認デバイスに伝送する。行為304は、規準マップの数を約10分の1、第3の選択を形成する、例えば、数十から単一桁数の規準マップ(例えば、5)に低減させ得る。いくつかの実施形態では、XRデバイスは、第3のフィルタリングされた選択内の規準マップを受信し、受信された規準マップの中に位置特定するように試みてもよい。
例えば、行為304は、規準マップ120のグローバル特徴列316および視認デバイスによって捕捉された画像(例えば、ユーザのためのローカル追跡マップの一部であり得る、画像)に基づくグローバル特徴列316に基づいて、規準マップ120をフィルタリングしてもよい。図27における規準マップ120のそれぞれのものは、したがって、それと関連付けられる1つ以上のグローバル特徴列316を有する。いくつかの実施形態では、グローバル特徴列316は、XRデバイスが画像または特徴詳細をクラウドに提出するときに入手されてもよく、クラウドは、画像または特徴詳細を処理し、規準マップ120のためのグローバル特徴列316を生成する。
いくつかの実施形態では、クラウドは、視認デバイスによって捕捉されたライブ/新しい/現在の画像の特徴詳細を受信してもよく、クラウドは、ライブ画像のためのグローバル特徴列316を生成してもよい。クラウドは、次いで、ライブグローバル特徴列316に基づいて、規準マップ120をフィルタリングしてもよい。いくつかの実施形態では、グローバル特徴列は、ローカル視認デバイス上に生成されてもよい。いくつかの実施形態では、グローバル特徴列は、遠隔で、例えば、クラウド上で生成されてもよい。いくつかの実施形態では、クラウドは、フィルタリングされた規準マップを、フィルタリングされた規準マップと関連付けられるグローバル特徴列316とともに、XRデバイスに伝送してもよい。いくつかの実施形態では、視認デバイスが、その追跡マップを規準マップに対して位置特定すると、ローカル追跡マップのグローバル特徴列316と規準マップのグローバル特徴列をマッチングさせることによって、そのように行ってもよい。
XRデバイスの動作は、行為(300、302、304)の全てを実施しなくてもよいことを理解されたい。例えば、規準マップの母集合が、比較的に小さい(例えば、500個のマップ)場合、位置特定するように試みるXRデバイスは、Wi-Fiフィンガプリント(例えば、行為302)およびキーフレーム(例えば、行為304)に基づいて、規準マップの母集合をフィルタリングするが、エリア(例えば、行為300)に基づくフィルタリングを省略してもよい。さらに、マップは、その全体として比較される必要であるわけではない。いくつかの実施形態では、例えば、2つのマップの比較は、新しいマップおよびマップの母集合から選択されたマップの両方に現れる、持続的姿勢またはPCF等の共通の持続的点の識別をもたらし得る。その場合、記述子は、持続的点と関連付けられてもよく、それらの記述子は、比較されてもよい。
図29は、いくつかの実施形態による、1つ以上のランク付けされた環境マップを選択する方法900を図示する、フローチャートである。図示される実施形態では、ランク付けするステップは、追跡マップを作成する、ユーザのARデバイスのために実施される。故に、追跡マップは、環境マップをランク付けする際に使用するために利用可能である。追跡マップが利用不可能である、実施形態では、追跡マップに明示的に依拠しない、環境マップの選択およびランク付けするステップの部分のいくつかまたは全てが、使用されてもよい。
方法900は、行為902から開始し得、追跡マップが形成された場所の近傍の環境マップのデータベースからのマップのセット(規準マップとしてフォーマット化され得る)が、アクセスされ、次いで、ランク付けのためにフィルタリングされ得る。加えて、行為902では、その中でユーザのARデバイスが動作しているエリアに関する、少なくとも1つのエリア属性が、決定される。ユーザのARデバイスが追跡マップを構築している、シナリオでは、エリア属性は、それにわたって追跡マップが作成される、エリアに対応し得る。具体的実施例として、エリア属性は、ARデバイスが追跡マップを算出していた間にアクセスポイントからコンピュータネットワークに受信された信号に基づいて、算出されてもよい。
図30は、いくつかの実施形態による、ARシステム800の例示的マップランク付け部分806を描写する。マップランク付け部分806は、ARデバイス上で実行される部分およびクラウド等の遠隔コンピューティングシステム上で実行される部分を含み得るため、クラウドコンピューティング環境内で実行されてもよい。マップランク付け部分806は、方法900の少なくとも一部を実施するように構成されてもよい。
図31Aは、いくつかの実施形態による、追跡マップ(TM)1102およびデータベース内の環境マップCM1-CM4のエリア属性AA1-AA8の実施例を描写する。図示されるように、環境マップは、複数のエリア属性に関連付けられてもよい。エリア属性AA1-AA8は、追跡マップ1102を算出するARデバイスによって検出された無線ネットワークのパラメータ、例えば、それに対してARデバイスが接続される、ネットワークの基本サービスセット識別子(BSSID)、および/または、例えば、ネットワークタワー1104を通して無線ネットワークに受信されるアクセスポイントの信号の強度を含んでもよい。無線ネットワークのパラメータは、Wi-Fiおよび5G NRを含む、プロトコルに準拠してもよい。図32に図示される実施例では、エリア属性は、その中でユーザARデバイスが、センサデータを収集し、追跡マップを形成した、エリアのフィンガプリントである。
図31Bは、いくつかの実施形態による、追跡マップ1102の決定された地理的場所1106の実施例を描写する。図示される実施例では、決定された地理的場所1106は、重心点1110と、重心点の周囲を囲むエリア1108とを含む。本願の地理的場所の決定は、図示されるフォーマットに限定されないことを理解されたい。決定された地理的場所は、例えば、異なるエリア形状を含む、任意の好適なフォーマットを有してもよい。本実施例では、地理的場所は、エリア属性を地理的場所に関連させるデータベースを使用して、エリア属性から決定される。データベースは、市販されており、例えば、緯度および経度として表され、本動作のために使用され得る、Wi-Fiフィンガプリントを場所に関連させる、データベースである。
図29の実施形態では、環境マップを含有する、マップデータベースはまた、マップによって網羅される緯度および経度を含む、それらのマップに関する場所データを含んでもよい。行為902における処理は、そのデータベースから、追跡マップのエリア属性に関して決定された同一緯度および経度を網羅する、環境マップのセットを選択するステップを伴ってもよい。
行為904は、行為902においてアクセスされる環境マップのセットの第1のフィルタリングである。行為902では、環境マップは、追跡マップの地理的場所との近接度に基づいて、セット内に留保される。本フィルタリングステップは、追跡マップとセット内の環境マップと関連付けられる緯度および経度を比較することによって実施されてもよい。
図32は、いくつかの実施形態による、行為904の実施例を描写する。各エリア属性は、対応する地理的場所1202を有してもよい。環境マップのセットは、追跡マップの決定された地理的場所と重複する地理的場所を有する、少なくとも1つのエリア属性を伴う、環境マップを含んでもよい。図示される実施例では、識別された環境マップのセットは、それぞれ、追跡マップ1102の決定された地理的場所と重複する地理的場所を有する、少なくとも1つのエリア属性を有する、環境マップCM1、CM2、およびCM4を含む。エリア属性AA6と関連付けられる、環境マップCM3は、追跡マップの決定された地理的場所外にあるため、セット内に含まれない。
他のフィルタリングステップもまた、最終的に処理される(マップマージのため、またはパス可能世界情報をユーザデバイスに提供するため等)セット内の環境マップの数を低減させる/ランク付けするために、環境マップのセット上で実施されてもよい。方法900は、追跡マップおよび環境マップのセットの環境マップと関連付けられるネットワークアクセスポイントの1つ以上の識別子の類似性に基づいて、環境マップのセットをフィルタリングするステップ(行為906)を含んでもよい。マップの形成の間、センサデータを収集し、マップを生成する、デバイスは、Wi-Fiまたは類似無線通信プロトコル等を通して、ネットワークアクセスポイントを通して、ネットワークに接続され得る。アクセスポイントは、BSSIDによって識別され得る。ユーザデバイスは、エリアを通して移動し、データを収集し、マップを形成するにつれて、複数の異なるアクセスポイントに接続し得る。同様に、複数のデバイスが、マップを形成するための情報を供給するとき、デバイスは、異なるアクセスポイントを通して接続されている場合があり、したがって、同様にその理由から、マップを形成する際に使用される複数のアクセスポイントが存在し得る。故に、マップと関連付けられる複数のアクセスポイントが存在し得、アクセスポイントのセットは、マップの場所のインジケーションであり得る。RSSI値として反映され得る、アクセスポイントからの信号の強度は、さらなる地理的情報を提供し得る。いくつかの実施形態では、BSSIDおよびRSSI値のリストは、マップのためのエリア属性を形成し得る。
いくつかの実施形態では、ネットワークアクセスポイントの1つ以上の識別子の類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセット内に、ネットワークアクセスポイントの1つ以上の識別子に基づいて、追跡マップの少なくとも1つのエリア属性との最高Jaccard類似性を伴う環境マップを留保するステップを含んでもよい。図33は、いくつかの実施形態による、行為906の実施例を描写する。図示される実施例では、エリア属性AA7と関連付けられるネットワーク識別子は、追跡マップ1102に関する識別子として決定され得る。行為906後の環境マップのセットは、AA7とのより高いJaccard類似性内のエリア属性を有し得る、環境マップCM2と、同様にエリア属性AA7を含む、環境マップCM4とを含む。環境マップCM1は、AA7との最低Jaccard類似性を有するため、セット内に含まれない。
行為902-906における処理は、マップと関連付けられるメタデータに基づいて、マップデータベース内に記憶されるマップのコンテンツに実際にアクセスすることなく、実施されてもよい。他の処理は、マップのコンテンツにアクセスするステップを伴ってもよい。行為908は、メタデータに基づいてフィルタリング後にサブセット内に残っている環境マップにアクセスするステップを示す。本行為は、後続動作がアクセスされるコンテンツを用いて実施され得る場合、プロセスにおけるより早い段階または後の段階のいずれかで実施されてもよいことを理解されたい。
方法900は、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づいて、環境マップのセットをフィルタリングするステップ(行為910)を含んでもよい。追跡マップおよび環境マップのコンテンツを表すメトリックは、マップのコンテンツから算出された値のベクトルを含んでもよい。例えば、マップを形成する際に使用される1つ以上のキーフレームのために算出される、上記に説明されるような深層キーフレーム記述子は、マップまたはマップの一部の比較のためのメトリックを提供し得る。メトリックは、行為908において読み出されたマップから算出されてもよい、または事前に算出され、それらのマップと関連付けられるメタデータとして記憶されてもよい。いくつかの実施形態では、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセット内に、追跡マップの特性のベクトルと環境マップのセット内の環境マップを表すベクトルとの間に最小ベクトル距離を伴う環境マップを留保するステップを含んでもよい。
方法900は、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づいて、環境マップのセットをさらにフィルタリングするステップ(行為912)を含んでもよい。マッチング度は、位置特定プロセスの一部として決定されてもよい。非限定的実施例として、位置特定は、それらが物理的世界の同一部分を表し得るほど十分に類似する、追跡マップおよび環境マップ内の重要点を識別することによって実施されてもよい。いくつかの実施形態では、重要点は、特徴、特徴記述子、キーフレーム、キーリグ、持続的姿勢、および/またはPCFであってもよい。追跡マップ内の重要点のセットは、次いで、環境マップ内の重要点のセットとの最良適合を生産するように整合され得る。対応する重要点間の平均二乗距離が、算出され得、追跡マップの特定の領域に関する閾値を下回る場合、追跡マップおよび環境マップが物理的世界の同一領域を表すことのインジケーションとして使用される。
いくつかの実施形態では、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセットの環境マップ内にもまた表される、追跡マップによって表される物理的世界の体積を算出するステップと、環境マップのセット内に、セットのフィルタリング除去された環境マップより大きい算出された体積を伴う環境マップを留保するステップとを含んでもよい。図34は、いくつかの実施形態による、行為912の実施例を描写する。図示される実施例では、行為912後の環境マップのセットは、追跡マップ1102のエリアとマッチングされるエリア1402を有する、環境マップCM4を含む。環境マップCM1は、追跡マップ1102のエリアとマッチングされるエリアを有していないため、セット内に含まれない。
いくつかの実施形態では、環境マップのセットは、行為906、行為910、および行為912の順序でフィルタリングされてもよい。いくつかの実施形態では、環境マップのセットは、行為906、行為910、および行為912に基づいて、フィルタリングされてもよく、これは、最低から最高へとフィルタリングを実施するために要求される処理に基づく順序で実施され得る。方法900は、環境マップおよびデータのセットをロードするステップ(行為914)を含んでもよい。
図示される実施例では、ユーザデータベースは、ARデバイスが使用されたエリアを示す、エリア識別を記憶する。エリア識別は、エリア属性であってもよく、これは、使用時にARデバイスによって検出された無線ネットワークのパラメータを含み得る。マップデータベースは、ARデバイスによって供給されるデータおよび関連付けられるメタデータから構築された複数の環境マップを記憶してもよい。関連付けられるメタデータは、そこから環境マップが構築されたデータを供給した、ARデバイスのエリア識別から導出されるエリア識別を含んでもよい。ARデバイスは、メッセージをPWモジュールに送信し、新しい追跡マップが作成される、または作成中であることを示してもよい。PWモジュールは、ARデバイスに関するエリア識別子を算出し、受信されたパラメータおよび/または算出されたエリア識別子に基づいて、ユーザデータベースを更新してもよい。PWモジュールはまた、環境マップを要求するARデバイスと関連付けられるエリア識別子を決定し、エリア識別子に基づいて、マップデータベースから環境マップのセットを識別し、環境マップのセットをフィルタリングし、フィルタリングされた環境マップのセットをARデバイスに伝送してもよい。いくつかの実施形態では、PWモジュールは、例えば、追跡マップの地理的場所、追跡マップおよび環境マップのセットの環境マップと関連付けられるネットワークアクセスポイントの1つ以上の識別子の類似性、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性、および追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度を含む、1つ以上の基準に基づいて、環境マップのセットをフィルタリングしてもよい。
いくつかの実施形態のいくつかの側面がこれまで説明されたが、種々の改変、修正、および改良が、当業者に容易に想起されるであろうことを理解されたい。一実施例として、実施形態は、拡張(AR)環境に関連して説明される。本明細書に説明される技法の一部または全部は、MR環境、より一般的には、他のXR環境およびVR環境内に適用されてもよいことを理解されたい。
別の実施例として、実施形態は、ウェアラブルデバイス等のデバイスに関連して説明される。本明細書に説明される技法の一部または全部は、ネットワーク(クラウド等)、離散アプリケーション、および/またはデバイス、ネットワーク、および離散アプリケーションの任意の好適な組み合わせを介して実装されてもよいことを理解されたい。
さらに、図29は、候補マップをフィルタリングし、高ランク付けマップのセットをもたらすために使用され得る、基準の実施例を提供する。他の基準が、説明される基準の代わりに、またはそれに加え、使用されてもよい。例えば、複数の候補マップが、あまり望ましくないマップをフィルタリング除去するために使用されるメトリックの類似値を有する場合、候補マップの特性が、候補マップとして留保される、またはフィルタリング除去されるマップを決定するために使用されてもよい。例えば、より大きいまたはより稠密候補マップは、より小さい候補マップより優先されてもよい。いくつかの実施形態では、図27-28は、図29-34に説明されるシステムおよび方法の全部または一部を説明し得る。
図35および36は、いくつかの実施形態による、複数の環境マップをランク付けおよびマージするように構成される、XRシステムを図示する、概略図である。いくつかの実施形態では、パス可能世界(PW)は、マップをランク付けおよび/またはマージするステップをトリガすべきときを決定し得る。いくつかの実施形態では、使用されるべきマップを決定するステップは、いくつかの実施形態によると、少なくとも部分的に、図21-25に関連して上記に説明される深層キーフレームに基づいてもよい。
図37は、いくつかの実施形態による、物理的世界の環境マップを作成する方法3700を図示する、ブロック図である。方法3700は、ユーザによって装着されるXRデバイスによって捕捉された追跡マップを規準マップの群(例えば、図28の方法および/または図29の方法900によって選択された規準マップ)に対して位置特定するステップ(行為3702)から開始してもよい。行為3702は、追跡マップのキーリグを規準マップの群の中に位置特定するステップを含んでもよい。各キーリグの位置特定結果は、キーリグの位置特定された姿勢と、2D/3D特徴対応のセットとを含んでもよい。
いくつかの実施形態では、方法3700は、追跡マップを接続された成分に分裂させるステップ(行為3704)を含んでもよく、これは、接続された断片をマージすることによって、マップをロバストにマージすることを可能にし得る。各接続された成分は、所定の距離内にある、キーリグを含んでもよい。方法3700は、所定の閾値より大きい接続された成分を1つ以上の規準マップの中にマージするステップ(行為3706)と、マージされた接続された成分を追跡マップから除去するステップとを含んでもよい。
いくつかの実施形態では、方法3700は、追跡マップの同一の接続された成分とマージされる、群の規準マップをマージするステップ(行為3708)を含んでもよい。いくつかの実施形態では、方法3700は、任意の規準マップとマージされない、追跡マップの残りの接続された成分を、規準マップにプロモートするステップ(行為3710)を含んでもよい。いくつかの実施形態では、方法3700は、追跡マップの持続的姿勢および/またはPCFと追跡マップの少なくとも1つの接続された成分とマージされる、規準マップをマージするステップ(行為3712)を含んでもよい。いくつかの実施形態では、方法3700は、例えば、マップ点を融合させ、冗長キーリグをプルーニングすることによって、規準マップを完成させるステップ(行為3714)を含んでもよい。
図38Aおよび38Bは、いくつかの実施形態による、新しい追跡マップで追跡マップ700(図7)からプロモートされ得る、規準マップ700を更新することによって作成された環境マップ3800を図示する。図7に関して図示および説明されるように、規準マップ700は、点702によって表される、対応する物理的世界内の再構成された物理的オブジェクトの間取図706を提供し得る。いくつかの実施形態では、マップ点702は、複数の特徴を含み得る、物理的オブジェクトの特徴を表し得る。新しい追跡マップは、物理的世界に関して捕捉され、クラウドにアップロードされ、マップ700とマージされてもよい。新しい追跡マップは、マップ点3802と、キーリグ3804、3806とを含んでもよい。図示される実施例では、キーリグ3804は、例えば、マップ700のキーリグ704との対応を確立することによって、規準マップに対して正常に位置特定されたキーリグを表す(図38Bに図示されるように)。他方では、キーリグ3806は、マップ700に対して位置特定されていない、キーリグを表す。キーリグ3806は、いくつかの実施形態では、別個の規準マップにプロモートされてもよい。
図39A-39Fは、同一物理的空間内のユーザのための共有体験を提供する、クラウドベースの持続的座標系の実施例を図示する、概略図である。図39Aは、例えば、クラウドからの規準マップ4814が、図20A-20Cのユーザ4802Aおよび4802Bによって装着されるXRデバイスによって受信されることを示す。規準マップ4814は、規準座標フレーム4806Cを有してもよい。規準マップ4814は、複数の関連付けられるPP(例えば、図39Cにおける4818A、4818B)を伴う、PCF4810Cを有してもよい。
図39Bは、XRデバイスが、その個別の世界座標系4806A、4806Bと規準座標フレーム4806Cとの間に関係を確立したことを示す。これは、例えば、規準マップ4814を個別のデバイス上で位置特定することによって行われてもよい。追跡マップを規準マップに対して位置特定することは、デバイス毎に、そのローカル世界座標系と規準マップの座標系との間の変換をもたらし得る。
図39Cは、位置特定の結果として、変換が個別のデバイス上のローカルPCF(例えば、PCF4810A、4810B)と規準マップ上の個別の持続的姿勢(例えば、PP4818A、4818B)との間で算出され得ることを示す(例えば、変換4816A、4816B)。これらの変換を用いることで、各デバイスは、そのローカルPCFを使用し得、これは、デバイス上のセンサを用いて検出された画像を処理し、ローカルデバイスに対する場所を決定し、PP4818A、4818Bまたは規準マップの他の持続的点に結び付けられる仮想コンテンツを表示することによって、デバイス上でローカルで検出されることができる。そのようなアプローチは、仮想コンテンツを各ユーザに対して正確に位置特定し得、各ユーザが物理的空間内で仮想コンテンツの同一体験を有することを可能にし得る。
図39Dは、規準マップからローカル追跡マップへの持続的姿勢スナップショットを示す。図から分かるように、ローカル追跡マップは、持続的姿勢を介して、相互に接続される。図39Eは、ユーザ4802Aによって装着されるデバイス上のPCF4810Aが、PP4818Aを通して、ユーザ4802Bによって装着されるデバイス内にアクセス可能であることを示す。図39Fは、追跡マップ4804A、4804Bおよび規準4814がマージされ得ることを示す。いくつかの実施形態では、いくつかのPCFは、マージの結果として、除去されてもよい。図示される実施例では、マージされたマップは、規準マップ4814のPCF4810Cを含むが、追跡マップ4804A、4804BのPCF4810A、4810Bを含まない。PCF4810A、4810Bと以前に関連付けられるPPは、マップマージ後、PCF4810Cと関連付けられてもよい。
図40および41は、図9の第1のXRデバイス12.1によって追跡マップを生成する実施例を図示する。図40は、いくつかの実施形態による、3次元の第1のローカル追跡マップ(マップ1)の2次元表現であって、これは、図9の第1のXRデバイスによって生成され得る。図41は、いくつかの実施形態による、マップ1を第1のXRデバイスから図9のサーバにアップロードするステップを図示する、ブロック図である。
図40は、第1のXRデバイス12.1上のマップ1および仮想コンテンツ(コンテンツ123およびコンテンツ456)を図示する。マップ1は、原点(原点1)を有する。マップ1は、いくつかのPCF(PCFa-PCFd)を含む。第1のXRデバイス12.1の視点から、PCFaは、一例として、マップ1の原点に位置し、(0,0,0)のX、Y、およびZ座標を有し、PCFbは、X、Y、およびZ座標(-1,0,0)を有する。コンテンツ123は、PCFaと関連付けられる。本実施例では、コンテンツ123は、(1,0,0)のPCFaに対するX、Y、およびZ関係を有する。コンテンツ456は、PCFbに対する関係を有する。本実施例では、コンテンツ456は、PCFbに対する(1,0,0)のX、Y、およびZ関係を有する。
図41では、第1のXRデバイス12.1は、マップ1をサーバ20にアップロードする。サーバ20は、ここでは、マップ1に基づく、規準マップを有する。第1のXRデバイス12.1は、本段階では空である、規準マップを有する。サーバ20は、議論の目的のために、いくつかの実施形態では、マップ1以外の他のマップを含まない。マップは、第2のXRデバイス12.2上に記憶されていない。
第1のXRデバイス12.1はまた、そのWi-Fiシグネチャデータをサーバ20に伝送する。サーバ20は、Wi-Fiシグネチャデータを使用して、過去に、サーバ20または他のサーバに接続されていた他のデバイスから集められた知能とともに、記録されていたそのような他のデバイスのGPS場所に基づいて、第1のXRデバイス12.1の大まかな場所を決定してもよい。第1のXRデバイス12.1は、ここで、第1のセッション(図8参照)を終了し得、サーバ20から接続解除し得る。
図42は、いくつかの実施形態による、図16のXRシステムを図示する、概略図であって、第1のユーザ14.1が第1のセッションを終了した後、第2のユーザ14.2がXRシステムの第2のXRデバイスを使用して第2のセッションを開始したことを示す。図43Aは、第2のユーザ14.2による第2のセッションの開始を示す、ブロック図である。第1のユーザ14.1は、第1のユーザ14.1による第1のセッションが終了したため、想像線で示される。第2のXRデバイス12.2は、オブジェクトを記録し始める。可変粒度を伴う種々のシステムが、第2のXRデバイス12.2による第2のセッションが第1のXRデバイス12.1による第1のセッションの同一近傍内にあることを決定するために、サーバ20によって使用されてもよい。例えば、Wi-Fiシグネチャデータ、全地球測位システム(GPS)測位データ、Wi-Fiシグネチャデータに基づくGPSデータ、または場所を示す任意の他のデータが、その場所を記録するために、第1および第2のXRデバイス12.1および12.2内に含まれてもよい。代替として、第2のXRデバイス12.2によって識別されるPCFは、マップ1のPCFと類似性を示し得る。
図43Bに示されるように、第2のXRデバイスは、ブートアップし、画像1110等のデータを1つ以上のカメラ44、46から収集し始める。図14に示されるように、いくつかの実施形態では、XRデバイス(例えば、第2のXRデバイス12.2)は、1つ以上の画像1110を収集し、画像処理を実施し、1つ以上の特徴/着目点1120を抽出してもよい。各特徴は、記述子1130に変換されてもよい。いくつかの実施形態では、記述子1130は、結び付けられた関連付けられる画像の位置および方向を有し得る、キーフレーム1140を説明するために使用されてもよい。1つ以上のキーフレーム1140は、前の持続的姿勢1150からの閾値距離、例えば、3メートル後に自動的に生成され得る、単一持続的姿勢1150に対応してもよい。1つ以上の持続的姿勢1150は、所定の距離後、例えば、5メートル毎に自動的に生成され得る、単一PCF1160に対応してもよい。経時的に、ユーザが、ユーザの環境を動き回り続け、XRデバイスが、画像1110等のより多くのデータを収集し続けるにつれて、付加的PCF(例えば、PCF3およびPCF4、5)が、作成され得る。アプリケーション、すなわち、2つの1180は、XRデバイス上で起動され、ユーザへの提示のために、仮想コンテンツ1170をXRデバイスに提供してもよい。仮想コンテンツは、関連付けられるコンテンツ座標フレームを有してもよく、これは、1つ以上のPCFに対して設置されてもよい。図43Bに示されるように、第2のXRデバイス12.2は、3つのPCFを作成する。いくつかの実施形態では、第2のXRデバイス12.2は、サーバ上20に記憶される1つ以上の規準マップに対して位置特定するように試みてもよい。
いくつかの実施形態では、図43Cに示されるように、第2のXRデバイス12.2は、規準マップ120をサーバ20からダウンロードしてもよい。第2のXRデバイス12.2上のマップ1は、PCFa-dと、原点1とを含む。いくつかの実施形態では、サーバ20は、種々の場所のための複数の規準マップを有してもよく、第2のXRデバイス12.2が第1のセッションの間の第1のXRデバイス12.1の近傍と同じ近傍内にあることを決定し、第2のXRデバイス12.2に、その近傍に関する規準マップを送信してもよい。
図44は、第2のXRデバイス12.2が、マップ2を生成する目的のためのPCFの識別を開始することを示す。第2のXRデバイス12.2は、単一PCF、すなわち、PCF1、2のみを識別している。第2のXRデバイス12.2のためのPCF1、2のX、Y、およびZ座標は、(1,1,1)であり得る。マップ2は、その独自の原点(原点2)を有し、これは、現在の頭部姿勢セッションのためのデバイス始動時のデバイス2の頭部姿勢に基づいてもよい。いくつかの実施形態では、第2のXRデバイス12.2は、マップ2を規準マップに対して位置特定するように直ちに試みてもよい。いくつかの実施形態では、マップ2は、システムが2つのマップ間の任意または十分な重複を認識しないため、規準マップ(マップ1)に対して位置特定することが不可能である場合がある(すなわち、位置特定が失敗し得る)。いくつかの実施形態では、システムは、ローカルマップと規準マップとの間のPCF比較に基づいて、位置特定してもよい。いくつかの実施形態では、システムは、ローカルマップと規準マップとの間の持続的姿勢比較に基づいて、位置特定してもよい。いくつかの実施形態では、システムは、ローカルマップと規準マップとの間のキーフレーム比較に基づいて、位置特定してもよい。
図45は、第2のXRデバイス12.2がマップ2のさらなるPCF(PCF1、2、PCF3、PCF4、5)を識別した後のマップ2を示す。第2のXRデバイス12.2は、再び、マップ2を規準マップに対して位置特定するように試みる。マップ2は、規準マップの少なくとも一部と重複するように拡張されたため、位置特定試行は、成功するであろう。いくつかの実施形態では、ローカル追跡マップ、マップ2、および規準マップ間の重複は、PCF、持続的姿勢、キーフレーム、または任意の他の好適な中間または派生構築物によって表されてもよい。
さらに、第2のXRデバイス12.2は、コンテンツ123およびコンテンツ456をマップ2のPCF1、2およびPCF3に関連付けている。コンテンツ123は、(1,0,0)のPCF1、2に対するX、Y、およびZ座標を有する。同様に、マップ2内のPCF3に対するX、Y、およびZ座標も、(1,0,0)である。
図46Aおよび46Bは、規準マップに対するマップ2の位置特定成功を図示する。マップ1410の重複エリア/体積/セクションは、マップ1および規準マップとの共通部分を表す。マップ2は、位置特定する前に、PCF3および4、5を作成し、規準マップは、マップ2が作成される前に、PCFaおよびcを作成したため、異なるPCFが、実空間(例えば、異なるマップ)内の同一体積を表すために作成された。
図47に示されるように、第2のXRデバイス12.2は、規準マップからのPCFa-dを含むように、マップ2を拡張させる。PCFa-dの含有は、規準マップに対するマップ2の位置特定を表す。いくつかの実施形態では、XRシステムは、最適化ステップを実施し、1410内のPCF、すなわち、PCF3およびPCF4、5等の複製PCFを重複エリアから除去してもよい。マップ2が位置特定した後、コンテンツ456およびコンテンツ123等の仮想コンテンツの設置は、更新されたマップ2内の最も近い更新されたPCFに対することになるだろう。仮想コンテンツは、コンテンツのための変化されたPCF結び付けにもかかわらず、かつマップ2のための更新されたPCFにもかかわらず、ユーザに対して同一実世界場所内に現れる。
図48に示されるように、第2のXRデバイス12.2は、さらなるPCF(PCFe、f、g、およびh)が第2のXRデバイス12.2によって識別されるにつれて、例えば、ユーザが実世界を歩き回るにつれて、マップ2を拡張させ続ける。また、マップ1は、図47および48において拡張されていないことに留意されたい。
図49を参照すると、第2のXRデバイス12.2は、マップ2をサーバ20にアップロードする。サーバ20は、規準マップとともに、マップ2を記憶する。いくつかの実施形態では、マップ2は、第2のXRデバイス12.2のためのセッションが終了すると、サーバ20にアップロードされてもよい。
サーバ20内の規準マップは、ここでは、PCFiを含み、これは、第1のXRデバイス12.1上のマップ1内に含まれない。サーバ20上の規準マップは、第3のXRデバイス(図示せず)が、マップをサーバ20にアップロードし、そのようなマップが、PCFiを含むと、PCFiを含むように拡張され得る。
図50では、サーバ20は、マップ2を規準マップとマージし、新しい規準マップを形成する。サーバ20は、PCFa-dが規準マップおよびマップ2と共通であることを決定する。サーバは、PCFe-hおよびPCF1、2をマップ2から含むように、規準マップを拡張させ、新しい規準マップを形成する。第1および第2のXRデバイス12.1および12.2上の規準マップは、マップ1に基づき、古くなる。
図51では、サーバ20は、新しい規準マップを第1および第2のXRデバイス12.1および12.2に伝送する。いくつかの実施形態では、これは、第1のXRデバイス12.1および第2のデバイス12.2が、異なるまたは新しいまたは後続セッションの間、位置特定しようと試みるときに生じ得る。第1および第2のXRデバイス12.1および12.2は、上記に説明されるように、その個別のローカルマップ(それぞれ、マップ1およびマップ2)を新しい規準マップに対して位置特定するステップに進む。
図52に示されるように、頭部座標フレーム96または「頭部姿勢」は、マップ2内のPCFに関連する。いくつかの実施形態では、マップの原点、すなわち、原点2は、セッションの開始時における第2のXRデバイス12.2の頭部姿勢に基づく。PCFが、セッションの間に作成されるにつれて、PCFは、世界座標フレーム、すなわち、原点2に対して設置される。マップ2のPCFは、規準座標フレームに対する持続座標フレームとしての役割を果たし、世界座標フレームは、前のセッションの世界座標フレーム(例えば、図40におけるマップ1の原点1)であってもよい。世界座標フレームから頭部座標フレーム96への変換は、図9を参照して前述されている。図52に示される頭部座標フレーム96は、マップ2のPCFに対する特定の座標位置にあって、マップ2に対して特定の角度にある、2つの直交軸のみを有する。しかしながら、頭部座標フレーム96は、マップ2のPCFに対するある3次元場所内にあって、3次元空間内の3つの直交軸を有することを理解されたい。
図53では、頭部座標フレーム96は、マップ2のPCFに対して移動している。頭部座標フレーム96は、第2のユーザ14.2がその頭部を移動させたため、移動している。ユーザは、その頭部を6自由度(6dof)において移動させることができる。頭部座標フレーム96は、したがって、6dof、すなわち、図52におけるその前の場所から、3次元において、かつマップ2のPCFに対する約3つの直交軸において移動することができる。頭部座標フレーム96は、それぞれ、図9における実オブジェクト検出カメラ44および慣性測定ユニット48が、実オブジェクトおよび頭部ユニット22の運動を検出すると、調節される。頭部姿勢追跡に関するさらなる情報は、「Enhanced Pose Determination for Display Device」と題された米国特許第出願第16/221,065号に開示され、参照することによってその全体として本明細書に組み込まれる。
図54は、音が1つ以上のPCFと関連付けられてもよいことを示す。ユーザは、例えば、立体音を伴うヘッドホンまたはイヤホンを装着し得る。ヘッドホンを通した音の場所が、従来の技法を使用してシミュレートされることができる。音の場所は、ユーザがその頭部を左に回転させると、音の場所が右に回転し、したがって、ユーザが実世界内の同一場所から生じる音を知覚するように、定常位置に位置してもよい。本実施例では、音の場所は、音123および音456によって表される。議論の目的のために、図54は、その分析において、図48に類似する。第1および第2のユーザ14.1および14.2が、同一または異なる時間において、同一部屋内に位置するとき、彼らは、実世界内の同一場所から生じる音123および音456を知覚する。
図55および56は、上記に説明される技術のさらなる実装を図示する。第1のユーザ14.1は、図8を参照して説明されるように、第1のセッションを開始した。図55に示されるように、第1のユーザ14.1は、想像線によって示されるように、第1のセッションを終了した。第1のセッションの終了時、第1のXRデバイス12.1は、マップ1をサーバ20にアップロードした。第1のユーザ14.1は、今度は、第1のセッションの後の時間において、第2のセッションを開始した。第1のXRデバイス12.1は、マップ1が第1のXRデバイス12.1上にすでに記憶されているため、マップ1をサーバ20からダウンロードしない。マップ1が、喪失される場合、第1のXRデバイス12.1は、マップ1をサーバ20からダウンロードする。第1のXRデバイス12.1は、次いで、上記に説明されるように、マップ2のためのPCFを構築し、マップ1に対して位置特定し、規準マップをさらに展開するステップに進む。第1のXRデバイス12.1のマップ2は、次いで、上記に説明されるように、ローカルコンテンツ、頭部座標フレーム、ローカル音等を関連させるために使用される。
図57および58を参照すると、また、1人を上回るユーザが同一セッションにおいてサーバと相互作用することが可能性として考えられ得る。本実施例では、第1のユーザ14.1および第2のユーザ14.2に、第3のXRデバイス12.3を伴う第3のユーザ14.3が加わっている。各XRデバイス12.1、12.2、および12.3は、それぞれ、その独自のマップ、すなわち、マップ1、マップ2、およびマップ3を生成し始める。XRデバイス12.1、12.2、および12.3が、マップ1、2、および3を展開し続けるにつれて、マップは、サーバ20に漸次的にアップロードされる。サーバ20は、マップ1、2、および3をマージし、規準マップを形成する。規準マップは、次いで、サーバ20からXRデバイス12.1、12.2、および12.3のそれぞれのものに伝送される。
図59は、いくつかの実施形態による、頭部姿勢を復元および/またはリセットするための視認方法の側面を図示する。図示される実施例では、行為1400において、視認デバイスが、電源投入される。行為1410では、電源投入されることに応答して、新しいセッションが、開始される。いくつかの実施形態では、新しいセッションは、頭部姿勢を確立するステップを含んでもよい。ユーザの頭部に固着される、頭部搭載型フレーム上の1つ以上の捕捉デバイスが、最初に、環境の画像を捕捉し、次いで、表面を画像から決定することによって、環境の表面を捕捉する。いくつかの実施形態では、表面データはまた、重力センサからのデータと組み合わせられ、頭部姿勢を確立してもよい。頭部姿勢を確立する他の好適な方法が、使用されてもよい。
行為1420では、視認デバイスのプロセッサが、頭部姿勢の追跡のためのルーチンに入る。捕捉デバイスは、ユーザがその頭部を移動させるにつれて、環境の表面を捕捉し、表面に対する頭部搭載型フレームの配向を決定し続ける。
行為1430では、プロセッサが、頭部姿勢が喪失されたかどうかを決定する。頭部姿勢は、低特徴入手をもたらし得る、あまりに多くの反射性表面、低光量、何もない壁、屋外等、「エッジ」ケースに起因して、または移動し、マップの一部を形成する、群集等、動的ケースのため、喪失された状態になり得る。1430におけるルーチンは、頭部姿勢が喪失されたかどうかを決定するための十分な時間を可能にするために、ある時間量、例えば、10秒が経過することを可能にする。頭部姿勢が喪失されていない場合、プロセッサは、1420に戻り、再び、頭部姿勢の追跡に入る。
頭部姿勢が、行為1430において喪失された場合、プロセッサは、1440において、頭部姿勢を復元するためのルーチンに入る。頭部姿勢が、低光量に起因して喪失された場合、以下のメッセージ等のメッセージが、視認デバイスのディスプレイを通してユーザに表示される:
システムが、低光量条件を検出中です。より光の多いエリアに移動してください。
システムは、十分な光が利用可能であるかどうかと、頭部姿勢が復元され得るかどうかとを監視し続けるであろう。システムは、代替として、表面の低テクスチャが頭部姿勢を喪失させていることを決定し得、その場合、ユーザは、表面の捕捉を改良するための提案として、以下のプロンプトがディスプレイ内に与えられる:
システムは、微細なテクスチャを伴う十分な表面を検出することができません。表面のテクスチャが粗くなく、テクスチャがより精緻化されたエリアに移動してください。
行為1450では、プロセッサは、頭部姿勢復元が失敗したかどうかを決定するためのルーチンに入る。頭部姿勢復元が失敗していない(すなわち、頭部姿勢復元が成功した)場合、プロセッサは、再び、頭部姿勢の追跡に入ることによって、行為1420に戻る。頭部姿勢復元が失敗した場合、プロセッサは、行為1410に戻り、新しいセッションを確立する。新しいセッションの一部として、全てのキャッシュされたデータは、無効化され、以降、頭部姿勢は、新しく確立される。頭部追跡の任意の好適な方法が、図59に説明されるプロセスと組み合わせて使用されてもよい。米国特許第出願第16/221,065号は、頭部追跡を説明しており、参照することによってその全体として本明細書に組み込まれる。
図60は、コンピュータシステム1900の例示的形態における機械の略図表現を示し、機械に本明細書で議論される方法論のうちの任意の1つ以上のものを実施させるための命令のセットが、いくつかの実施形態に従って実行されてもよい。代替実施形態では、機械は、独立型デバイスとして動作する、または他の機械に接続(例えば、ネットワーク化)されてもよい。さらに、単一機械のみが、図示されるが、用語「機械」はまた、個々にまたはともに、命令のセット(または複数のセット)を実行し、本明細書で議論される方法論のうちの任意の1つ以上のものを実施する、機械の任意の集合を含むものと捉えられるものとする。
例示的コンピュータシステム1900は、プロセッサ1902(例えば、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、または両方)と、メインメモリ1904(例えば、読取専用メモリ(ROM)、フラッシュメモリ、動的ランダムアクセスメモリ(DRAM)例えば、同期DRAM(SDRAM)またはRambus DRAM(RDRAM)等)と、静的メモリ1906(例えば、フラッシュメモリ、静的ランダムアクセスメモリ(SRAM)等)とを含み、これらは、バス1908を介して相互に通信する。
コンピュータシステム1900はさらに、ディスクドライブユニット1916と、ネットワークインターフェースデバイス1920とを含んでもよい。
ディスクドライブユニット1916は、その上に本明細書に説明される方法論または機能のうちの任意の1つ以上のものを具現化する、1つ以上の命令のセット1924(例えば、ソフトウェア)が記憶される、機械可読媒体1922を含む。ソフトウェアはまた、コンピュータシステム1900、メインメモリ1904、およびプロセッサ1902によるその実行の間、完全にまたは少なくとも部分的に、メインメモリ1904内および/またはプロセッサ1902内に常駐し、同様に機械可読媒体を構成してもよい。
ソフトウェアはさらに、ネットワーク18を経由して、ネットワークインターフェースデバイス1920を介して、伝送または受信されてもよい。
コンピュータシステム1900は、プロジェクタを駆動し、光を生成するために使用される、ドライバチップ1950を含む。ドライバチップ1950は、その独自のデータ記憶装置1960と、その独自のプロセッサ1962とを含む。
機械可読媒体1922が、例示的実施形態では、単一媒体であるように示されるが、用語「機械可読媒体」は、1つ以上の命令のセットを記憶する、単一媒体または複数の媒体(例えば、集中型または分散型データベースおよび/または関連付けられるキャッシュおよびサーバ)を含むものと捉えられるべきである。用語「機械可読媒体」はまた、機械による実行のための命令のセットを記憶、エンコーディング、または搬送することが可能であって、機械に、本発明の方法論のうちの任意の1つ以上のものを実施させる、任意の媒体を含むものと捉えられるものとする。用語「機械可読媒体」は、故に、限定ではないが、ソリッドステートメモリ、光学および磁気媒体、および搬送波信号を含むものと捉えられるものとする。
いくつかの実施形態のいくつかの側面がこれまで説明されたが、種々の改変、修正、および改良が、当業者に容易に想起されるであろうことを理解されたい。
一実施例として、実施形態は、拡張(AR)環境に関連して説明される。本明細書に説明される技法の一部または全部は、MR環境、またはより一般的には、他のXR環境およびVR環境内に適用されてもよいことを理解されたい。
別の実施例として、実施形態は、ウェアラブルデバイス等のデバイスに関連して説明される。本明細書に説明される技法の一部または全部は、ネットワーク(クラウド等)、離散アプリケーション、および/またはデバイス、ネットワーク、および離散アプリケーションの任意の好適な組み合わせを介して実装されてもよいことを理解されたい。
さらに、図29は、候補マップをフィルタリングし、高ランク付けマップのセットをもたらすために使用され得る、基準の実施例を提供する。他の基準が、説明される基準の代わりに、またはそれに加え、使用されてもよい。例えば、複数の候補マップが、あまり望ましくないマップをフィルタリング除去するために使用されるメトリックの類似値を有する場合、候補マップの特性が、候補マップとして留保される、またはフィルタリング除去されるマップを決定するために使用されてもよい。例えば、より大きいまたはより稠密な候補マップは、より小さい候補マップより優先されてもよい。
そのような改変、修正、および改良は、本開示の一部であることが意図され、本開示の精神および範囲内であると意図される。さらに、本開示の利点が示されるが、本開示の全ての実施形態が、全ての説明される利点を含むわけではないことを理解されたい。いくつかの実施形態は、本明細書およびいくつかの事例において有利として説明される任意の特徴を実装しなくてもよい。故に、前述の説明および図面は、一例にすぎない。
いくつかの実施形態は、3次元(3D)環境についての情報を捕捉し、画像を出力するように構成される、センサであって、各画像は、複数のピクセルを備える、センサと、コンピュータ実行可能命令を実行し、センサによって出力された画像を処理するように構成される、少なくとも1つのプロセッサとを含む、ポータブル電子システムに関する。コンピュータ実行可能命令は、センサによって捕捉された複数の画像を受信するステップと、複数の画像の少なくともサブセットに関して、画像のサブセットの画像毎に、複数のピクセル内の1つ以上の特徴を識別するステップであって、各特徴は、1つ以上のピクセルに対応する、ステップと、1つ以上の特徴の特徴毎に、特徴記述子を算出するステップと、サブセットの画像毎に、少なくとも部分的に、画像内の算出された特徴記述子に基づいて、画像を表すためのフレーム記述子を算出するステップとのための命令を備える。
いくつかの実施形態では、センサは、少なくとも百万ピクセル回路を備える。複数の画像毎のフレーム記述子は、512またはより少ない数を備える。
いくつかの実施形態では、コンピュータ実行可能命令はさらに、3D環境の少なくとも一部のマップを構築するステップと、個別のフレームのための特徴記述子と、少なくとも部分的に個別のフレームから生成されたマップの部分を関連付けるステップとのための命令を備える。
いくつかの実施形態では、コンピュータ実行可能命令は、複数の画像のサブセットとして、少なくとも部分的に、3D環境に対する画像の場所および複数の画像の複数のピクセルに基づいて、複数の画像から1つ以上のキーフレームを選択するステップのための命令を備える。
いくつかの実施形態では、コンピュータ実行可能命令は、1つ以上のキーフレームのキーフレームのために3D環境のマップと関連付けられる、1つ以上のフレームを識別するステップのための命令を備え、1つ以上のフレームは、キーフレームのためのフレーム記述子からの閾値距離未満のフレーム記述子を有する。
いくつかの実施形態では、フレーム記述子を算出するためのコンピュータ実行可能命令は、人工ニューラルネットワークを備える。
いくつかの実施形態では、人工ニューラルネットワークは、類似および異なる画像に基づいて訓練され、画像内の特徴を表す複数の値を入力として受信し、特徴を表す複数の値の加重された組み合わせを出力として提供するように構成される、多層パーセプトロンユニットと、多層パーセプトロンユニットの出力のサブセットをフレーム記述子として選択するように構成される、最大プーリングユニットとを備える。
いくつかの実施形態は、コンピューティングシステムを動作させ、ユーザによって装着されるデバイスによって収集されたセンサデータに基づいて、3次元(3D)環境の少なくとも一部のマップを生成する方法に関する。本方法は、ユーザによって装着されるデバイスによって捕捉された複数の画像を受信するステップと、1つ以上のキーフレームを複数の画像から決定するステップと、第1の人工ニューラルネットワークを用いて、1つ以上のキーフレーム内の1つ以上の着目点を識別するステップと、第1の人工ニューラルネットワークを用いて、個々の着目点のための特徴記述子を算出するステップと、1つ以上のキーフレーム毎に、第2の人工ニューラルネットワークを用いて、少なくとも部分的に、キーフレーム内の識別された着目点のための算出された特徴記述子に基づいて、キーフレームを表すためのフレーム記述子を算出するステップとを含む。
いくつかの実施形態では、第1および第2の人工ニューラルネットワークは、人工ニューラルネットワークのサブネットワークである。
いくつかの実施形態では、フレーム記述子は、個々のキーフレームに一意である。
いくつかの実施形態では、1つ以上のキーフレームはそれぞれ、1メガバイトより高い分解能を有する。1つ以上のキーフレーム毎のフレーム記述子は、512の数未満の列である。
いくつかの実施形態では、各特徴記述子は、32バイトの列である。
いくつかの実施形態では、フレーム記述子は、特徴記述子を最大プーリングすることによって生成される。
いくつかの実施形態では、本方法は、ユーザによって装着されるデバイスによって捕捉された新しい画像を受信するステップと、マップを生成するために使用されるキーフレームを備える、データベース内の1つ以上の最も近くのキーフレームを識別するステップであって、1つ以上の最も近くのキーフレームは、新しい画像のためのフレーム記述子の所定の距離内のフレーム記述子を有する、ステップとを含む。
いくつかの実施形態では、本方法は、識別された1つ以上の最も近くのキーフレームに対応する、マップの3Dマップ点に対して特徴マッチングを実施するステップと、特徴マッチング結果に基づいて、ユーザによって装着されるデバイスの姿勢を算出するステップとを含む。
いくつかの実施形態では、複数の画像から1つ以上のキーフレームを決定するステップは、第1の画像のピクセルと第1の画像直後に撮影された第2の画像のピクセルを比較するステップと、第1の画像のピクセルと第2の画像のピクセルとの間の差異が閾値を上回るまたは下回るとき、第2の画像をキーフレームとして識別するステップとを含む。
いくつかの実施形態では、本方法は、複数の画像セットを備えるデータセットを生成することによって、第2の人工ニューラルネットワークを訓練するステップであって、複数の画像セットはそれぞれ、クエリ画像、正のサンプル画像、および負のサンプル画像を含む、ステップと、データセット内の複数の画像セットの画像セット毎に、クエリ画像と正のサンプル画像および負のサンプル画像を比較することによって、損失を算出するステップと、クエリ画像のために第2の人工ニューラルネットワークによって生成されたフレーム記述子と正のサンプル画像のためのフレーム記述子との間の距離が、クエリ画像のためのフレーム記述子と負のサンプル画像のためのフレーム記述子との間の距離を上回るように、算出された損失に基づいて、第2の人工ニューラルネットワークを修正するステップとを含む。
いくつかの実施形態は、クロスリアリティシステムのためのコンピューティング環境に関する。コンピューティング環境は、複数のマップを記憶するデータベースを含む。各マップは、3D環境の領域を表す情報を備える。各領域を表す情報は、領域の画像を表すフレーム記述子を備え、非一過性コンピュータ記憶媒体は、少なくとも1つのプロセッサによって実行されると、コンピューティング環境内において、画像内の複数の特徴を識別することによって、ポータブルデバイスによって捕捉された画像を処理し、複数の特徴毎に、特徴記述子を算出し、少なくとも部分的に、画像内の1つ以上の識別された着目点のための算出された特徴記述子に基づいて、画像を表すためのフレーム記述子を算出し、算出されたフレーム記述子とマップのデータベース内に記憶されたフレーム記述子との間の比較に基づいて、データベース内のマップを選択する、コンピュータ実行可能命令を記憶する。
いくつかの実施形態では、フレーム記述子は、データベース内に記憶されたフレームに一意である。
いくつかの実施形態では、画像は、1メガバイトより高い分解能を有する。画像を表すために算出されたフレーム記述子は、512の数未満である、列である。
いくつかの実施形態では、コンピュータ実行可能命令は、複数の画像セットを備える、データセットを処理するステップであって、複数の画像セットはそれぞれ、クエリ画像、正のサンプル画像、および負のサンプル画像を含む、ステップと、データセット内の複数の画像セットの画像のセットのための損失を算出するステップと、クエリ画像と正のサンプル画像および負のサンプル画像を比較するステップと、クエリ画像のための人工ニューラルネットワークによって生成されたフレーム記述子と正のサンプル画像のためのフレーム記述子との間の距離がクエリ画像のためのフレーム記述子と負のサンプル画像のためのフレーム記述子との間の距離未満であるように、算出された損失に基づいて、人工ニューラルネットワークを修正するステップとによって訓練された、人工ニューラルネットワークを備える。
いくつかの実施形態では、人工ニューラルネットワークを修正するステップは、コンピューティング環境内のポータブルデバイス上の人工ニューラルネットワークのコピーを修正するステップを含む。
いくつかの実施形態では、コンピューティング環境は、クラウドプラットフォームと、クラウドプラットフォームと通信する、複数のポータブルデバイスとを備える。クラウドプラットフォームは、データベースと、マップを選択するためのコンピュータ実行可能命令とを備える。ポータブルデバイスによって捕捉された画像を処理するためのコンピュータ実行可能命令は、ポータブルデバイス上に記憶される。
いくつかの実施形態は、第1のプロセッサと、第1のプロセッサに接続される、第1のコンピュータ可読媒体と、第1のコンピュータ可読媒体上に記憶される、第1の原点座標フレームと、コンピュータ可読媒体上に記憶される、第1の目的地座標フレームと、ローカルコンテンツを表すデータを受信する、第1のデータチャネルと、第1のプロセッサによって実行可能であって、ローカルコンテンツの位置付けを第1の原点座標フレームから第1の目的地座標フレームに変換する、第1の座標フレーム変換器と、ローカルコンテンツの位置付けを第1の原点座標フレームから第1の目的地座標フレームに変換後、ローカルコンテンツを第1のユーザに表示するように適合される、第1のディスプレイシステムとを含む、第1のXRデバイスを含む、XRシステムに関する。
いくつかの実施形態は、第1の原点座標フレームを記憶するステップと、第1の目的地座標フレームを記憶するステップと、ローカルコンテンツを表すデータを受信するステップと、ローカルコンテンツの位置付けを第1の原点座標フレームから第1の目的地座標フレームに変換するステップと、ローカルコンテンツの位置付けを第1の原点座標フレームから第1の目的地座標フレームに変換後、ローカルコンテンツを第1のユーザに表示するステップとを含む、視認方法に関する。
いくつかの実施形態は、複数の持続的座標フレーム(PCF)を有する規準マップである、第1のマップを記憶する、マップ記憶ルーチンであって、第1のマップの各PCFは、座標のセットを有する、マップ記憶ルーチンと、実オブジェクトの場所を検出するように位置付けられる、実オブジェクト検出デバイスと、実オブジェクト検出デバイスに接続され、実オブジェクトの場所に基づいて、第2のマップのPCFを検出する、PCF識別システムであって、第2のマップの各PCFは、座標のセットを有する、PCF識別システムと、規準マップおよび第2のマップに接続され、第2のマップの第1のPCFを規準マップの第1のPCFにマッチングさせ、第2のマップの第2のPCFを規準マップの第2のPCFにマッチングさせることによって、第2のマップを規準マップに対して位置特定するように実行可能である、位置特定モジュールとを含む、XRシステムに関する。
いくつかの実施形態では、実オブジェクト検出デバイスは、実オブジェクト検出カメラである。
いくつかの実施形態では、XRシステムはさらに、規準マップおよび第2のマップに接続され、規準マップの第3のPCFを第2のマップに組み込むように実行可能である、規準マップ組込器を備える。
いくつかの実施形態では、XRシステムはさらに、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの1つのPCFに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムとを備える。
いくつかの実施形態では、XRシステムはさらに、ローカルコンテンツのローカル座標フレームを第2のマップの世界座標フレームに変換する、ローカル/世界座標変換器を備える。
いくつかの実施形態では、XRシステムはさらに、第2のマップのPCFに基づいて、第1の世界座標フレームを計算する、第1の世界フレーム決定ルーチンと、世界座標フレームを記憶する、第1の世界フレーム記憶命令と、頭部搭載可能フレームの移動に応じて変化する、頭部座標フレームを計算する、頭部フレーム決定ルーチンと、第1の頭部座標フレームを記憶する、頭部フレーム記憶命令と、世界座標フレームを頭部座標フレームに変換する、世界/頭部座標変換器とを備える。
いくつかの実施形態では、頭部座標フレームは、頭部搭載可能フレームが移動すると、世界座標フレームに対して変化する。
いくつかの実施形態では、XRシステムはさらに、第2のマップの少なくとも1つのPCFに関連する、少なくとも1つの音要素を備える。
いくつかの実施形態では、第1および第2のマップは、XRデバイスによって作成される。
いくつかの実施形態では、XRシステムはさらに、第1および第2のXRデバイスを備える。各XRデバイスは、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの1つのPCFに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムとを含む。
いくつかの実施形態では、第1のXRデバイスは、第1のマップのためのPCFを作成し、第2のXRデバイスは、第2のマップのためのPCFを作成し、位置特定モジュールは、第2のXRデバイスの一部を形成する。
いくつかの実施形態では、第1および第2のマップは、それぞれ、第1および第2のセッションにおいて作成される。
いくつかの実施形態では、XRシステムはさらに、サーバと、XRデバイスの一部を形成し、第1のマップをネットワークを経由してサーバからダウンロードする、マップダウンロードシステムとを備える。
いくつかの実施形態では、位置特定モジュールは、第2のマップを規準マップに対して位置特定するように繰り返し試みる。
いくつかの実施形態では、XRシステムはさらに、第2のマップをネットワークを経由してサーバにアップロードする、マップ発行器を備える。
いくつかの実施形態は、複数のPCFを有する規準マップである、第1のマップを記憶するステップであって、規準マップの各PCFは、座標のセットを有する、ステップと、実オブジェクトの場所を検出するステップと、実オブジェクトの場所に基づいて、第2のマップのPCFを検出するステップであって、第2のマップの各PCFは、座標のセットを有する、ステップと、第2のマップの第1のPCFを第1のマップの第1のPCFにマッチングさせ、第2のマップの第2のPCFを規準マップの第2のPCFにマッチングさせることによって、第2のマップを規準マップに対して位置特定するステップとを含む、視認方法に関する。
いくつかの実施形態は、プロセッサと、プロセッサに接続される、コンピュータ可読媒体と、コンピュータ可読媒体上の複数の規準マップと、各個別の規準マップと関連付けられるコンピュータ可読媒体上の個別の規準マップ識別子であって、相互に異なり、規準マップを一意に識別する、規準マップ識別子と、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、位置識別子をXRデバイスから受信し、記憶する、位置検出器と、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、位置識別子と規準マップ識別子を比較し、第1のフィルタリングされた選択を形成する、1つ以上の規準マップを決定する、第1のフィルタと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、第1のフィルタリングされた選択に基づいて、規準マップのうちの1つ以上のものをXRデバイスに伝送する、マップ伝送機とを有し得る、サーバを備える、XRシステムに関する。
いくつかの実施形態では、規準マップ識別子はそれぞれ、経度および緯度を含み、位置識別子は、経度および緯度を含む。
いくつかの実施形態では、第1のフィルタは、位置識別子の経度および緯度を含む、経度および緯度を網羅する、少なくとも1つのマッチングする規準マップと、第1のマッチングする規準マップに隣接する経度および緯度を網羅する、少なくとも1つの近傍マップとを選択する、近傍エリアフィルタである。
いくつかの実施形態では、位置識別子は、WiFiフィンガプリントを含む。XRシステムはさらに、WiFiフィンガプリントフィルタであって、コンピュータ可読媒体上にあって、プロセッサによって、WiFiフィンガプリントに基づいて、緯度および経度を決定し、WiFiフィンガプリントフィルタからの緯度および経度と規準マップの緯度および経度を比較し、第1のフィルタリングされた選択内の第2のフィルタリングされた選択を形成する、1つ以上の規準マップを決定し、マップ伝送機は、第2の選択に基づいて、1つ以上の規準マップを伝送し、第2の選択外の第1の選択に基づく規準マップを伝送しないように実行可能である、第2のフィルタを備える。
いくつかの実施形態では、第1のフィルタは、コンピュータ可読媒体上にあって、プロセッサによって、WiFiフィンガプリントに基づいて、緯度および経度を決定し、WiFiフィンガプリントフィルタからの緯度および経度と規準マップの緯度および経度を比較し、第1のフィルタリングされた選択を形成する、1つ以上の規準マップを決定するように実行可能である、WiFiフィンガプリントフィルタである。
いくつかの実施形態では、XRシステムはさらに、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、画像の複数の特徴を受信し、各特徴を個別の数の列に変換する、多層知覚ユニットと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、各数の列の最大値を画像を表すグローバル特徴列に組み合わせる、最大プールユニットであって、各規準マップは、グローバル特徴列のうちの少なくとも1つを有し、XRデバイスから受信された位置識別子は、多層知覚ユニットおよび最大プールユニットによって、画像のグローバル特徴列を決定するために進展される、XRデバイスによって捕捉された画像の特徴を含む、最大プールユニットと、画像のグローバル特徴列と規準マップのグローバル特徴列を比較し、第2のフィルタリングされた選択内の第3のフィルタリングされた選択を形成する、1つ以上の規準マップを決定する、キーフレームフィルタであって、マップ伝送機は、第3の選択に基づいて、1つ以上の規準マップを伝送し、第3の選択外の第2の選択に基づく規準マップを伝送しない、キーフレームフィルタとを備える。
いくつかの実施形態では、XRシステムは、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、画像の複数の特徴を受信し、各特徴を個別の数の列に変換する、多層知覚ユニットと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、各数の列の最大値を画像を表すグローバル特徴列に組み合わせる、最大プールユニットであって、各規準マップは、グローバル特徴列のうちの少なくとも1つを有し、XRデバイスから受信された位置識別子は、多層知覚ユニットおよび最大プールユニットによって、画像のグローバル特徴列を決定するために進展される、XRデバイスによって捕捉された画像の特徴を含む、最大プールユニットとをさらに備え、第1のフィルタは、画像のグローバル特徴列と規準マップのグローバル特徴列を比較し、1つ以上の規準マップを決定する、キーフレームフィルタである。
いくつかの実施形態では、XRシステムは、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの1つのPCFに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムとを含む、XRデバイスを備える。
いくつかの実施形態では、XRデバイスは、複数のPCFを有する規準マップである、第1のマップを記憶する、マップ記憶ルーチンであって、第1のマップの各PCFは、座標のセットを有する、マップ記憶ルーチンと、実オブジェクトの場所を検出するように位置付けられる、実オブジェクト検出デバイスと、実オブジェクト検出デバイスに接続され、実オブジェクトの場所に基づいて、第2のマップのPCFを検出する、PCF識別システムであって、第2のマップの各PCFは、座標のセットを有する、PCF識別システムと、規準および第2のマップに接続され、第2のマップの第1のPCFを規準マップの第1のPCFにマッチングさせ、第2のマップの第2のPCFを規準マップの第2のPCFにマッチングさせることによって、第2のマップを規準マップに対して位置特定するように実行可能である、位置特定モジュールとを含む。
いくつかの実施形態では、実オブジェクト検出デバイスは、実オブジェクト検出カメラである。
いくつかの実施形態では、XRシステムは、規準マップおよび第2のマップに接続され、規準マップの第3のPCFを第2のマップに組み込むように実行可能である、規準マップ組込器を備える。
いくつかの実施形態は、複数の規準マップをコンピュータ可読媒体上に記憶するステップであって、各規準マップは、個別の規準マップと関連付けられる個別の規準マップ識別子を有し、規準マップ識別子は、相互に異なり、規準マップを一意に識別する、ステップと、コンピュータ可読媒体に接続されるプロセッサを用いて、位置識別子をXRデバイスから受信し、記憶するステップと、プロセッサを用いて、位置識別子と規準マップ識別子を比較し、第1のフィルタリングされた選択を形成する、1つ以上の規準マップを決定するステップと、プロセッサを用いて、第1のフィルタリングされた選択に基づいて、複数の規準マップをXRデバイスに伝送するステップとを含む、視認方法に関する。
いくつかの実施形態は、プロセッサと、プロセッサに接続される、コンピュータ可読媒体と、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、画像の複数の特徴を受信し、各特徴を個別の数の列に変換する、多層知覚ユニットと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、各数の列の最大値を画像を表すグローバル特徴列に組み合わせる、最大プールユニットとを含む、XRシステムに関する。
いくつかの実施形態では、XRシステムは、コンピュータ可読媒体上の複数の規準マップであって、各規準マップは、それと関連付けられる該グローバル特徴列のうちの少なくとも1つを有する、複数の規準マップと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、画像のグローバル特徴列を決定するために、多層知覚ユニットおよび最大プールユニットによって処理される、XRデバイスによって捕捉された画像の特徴をXRデバイスから受信する、位置検出器と、画像のグローバル特徴列と規準マップのグローバル特徴列を比較し、フィルタリングされた選択の一部を形成する、1つ以上の規準マップを決定する、キーフレームフィルタと、コンピュータ可読媒体上にあって、プロセッサによって実行可能であって、フィルタリングされた選択に基づいて、規準マップのうちの1つ以上のものをXRデバイスに伝送する、マップ伝送機とを備える。
いくつかの実施形態では、XRシステムは、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの1つのPCFに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムとを備える。
いくつかの実施形態では、XRシステムは、頭部搭載可能フレームを備える、頭部ユニットであって、実オブジェクト検出デバイスが頭部搭載可能フレームに搭載される、頭部ユニットと、ローカルコンテンツの画像データを受信する、データチャネルと、データチャネルに接続され、ローカルコンテンツを規準マップの1つのPCFに関連させるように実行可能である、ローカルコンテンツ位置付けシステムと、ローカルコンテンツ位置付けシステムに接続され、ローカルコンテンツを表示する、ディスプレイシステムであって、マッチングさせるステップは、第2のマップの該グローバル特徴列を規準マップの該グローバル特徴列にマッチングさせることによって実行される、ディスプレイシステムとを含む、XRデバイスを備える。
いくつかの実施形態は、プロセッサを用いて、画像の複数の特徴を受信するステップと、プロセッサを用いて、各特徴を個別の数の列に変換するステップと、プロセッサを用いて、各数の列の最大値を画像を表すグローバル特徴列に組み合わせるステップとを含む、視認方法に関する。
いくつかの実施形態は、コンピューティングシステムを動作させ、データベース内に記憶される1つ以上の環境マップを識別し、ユーザによって装着されるデバイスによって収集されたセンサデータに基づいて算出された追跡マップとマージする方法であって、デバイスは、追跡マップを算出する間、コンピュータネットワークへのアクセスポイントの信号を受信し、アクセスポイントとの通信の特性に基づいて、追跡マップの少なくとも1つのエリア属性を決定するステップと、少なくとも1つのエリア属性に基づいて、追跡マップの地理的場所を決定するステップと、決定された地理的場所に対応するデータベース内に記憶される環境マップのセットを識別するステップと、追跡マップおよび環境マップのセットの環境マップと関連付けられるネットワークアクセスポイントの1つ以上の識別子の類似性に基づいて、環境マップのセットをフィルタリングするステップと、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づいて、環境マップのセットをフィルタリングするステップと、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づいて、環境マップのセットをフィルタリングするステップとを含む、方法に関する。
いくつかの実施形態では、ネットワークアクセスポイントの1つ以上の識別子の類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセット内に、ネットワークアクセスポイントの1つ以上の識別子に基づいて、追跡マップの少なくとも1つのエリア属性との最高Jaccard類似性を伴う環境マップを留保するステップを含む。
いくつかの実施形態では、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセット内に、追跡マップの特性のベクトルと環境マップのセット内の環境マップを表すベクトルとの間に最小ベクトル距離を伴う環境マップを留保するステップを含む。
いくつかの実施形態では、追跡マップおよび環境マップのコンテンツを表すメトリックは、マップのコンテンツから算出された値のベクトルを含む。
いくつかの実施形態では、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づいて、環境マップのセットをフィルタリングするステップは、環境マップのセットの環境マップ内にもまた表される、追跡マップによって表される物理的世界の体積を算出するステップと、環境マップのセット内に、セットからフィルタリング除去された環境マップより大きい算出された体積を伴う環境マップを留保するステップとを含む。
いくつかの実施形態では、環境マップのセットは、最初に、1つ以上の識別子の類似性に基づいて、続いて、コンテンツを表すメトリックの類似性に基づいて、続いて、追跡マップの一部と環境マップの一部との間のマッチング度に基づいて、フィルタリングされる。
いくつかの実施形態では、1つ以上の識別子の類似性と、コンテンツを表すメトリックの類似性と、追跡マップの一部と環境マップの一部との間のマッチング度とに基づく、環境マップのセットのフィルタリングは、フィルタリングを実施するために要求される処理に基づく順序で実施される。
いくつかの実施形態では、環境マップは、1つ以上の識別子の類似性と、コンテンツを表すメトリックの類似性と、追跡マップの一部と環境マップの一部との間のマッチング度とに基づく、環境マップのセットのフィルタリングに基づいて選択され、情報は、選択された環境マップからユーザデバイス上にロードされる。
いくつかの実施形態では、環境マップは、1つ以上の識別子の類似性と、コンテンツを表すメトリックの類似性と、追跡マップの一部と環境マップの一部との間のマッチング度と、に基づく、環境マップのセットのフィルタリングに基づいて選択され、追跡マップは、選択された環境マップとマージされる。
いくつかの実施形態は、センサを備える複数のユーザデバイスとの通信のために構成される、拡張現実システムのためのクラウドコンピューティング環境であって、複数のユーザデバイスが使用されたエリアを示す、エリア識別を記憶する、ユーザデータベースであって、エリア識別は、使用時にユーザデバイスによって検出された無線ネットワークのパラメータを備える、ユーザデータベースと、複数のユーザデバイスによって供給されるデータおよび関連付けられるメタデータから構築された複数の環境マップを記憶する、マップデータベースであって、関連付けられるメタデータは、そこからマップが構築されたデータを供給した、複数のユーザデバイスのエリア識別から導出されたエリア識別を備え、エリア識別は、そこからマップが構築されたデータを供給した、ユーザデバイスによって検出された無線ネットワークのパラメータを備える、マップデータベースと、クラウドコンピューティング環境内の少なくとも1つのプロセッサによって実行されると、メッセージを、ユーザデバイスによって検出された無線ネットワークのパラメータを備える、複数のユーザデバイスから受信し、ユーザデバイスのためのエリア識別子を算出し、受信されたパラメータおよび/または算出されたエリア識別子に基づいて、ユーザデータベースを更新し、環境マップのための要求を複数のユーザデバイスから受信し、環境マップを要求するユーザデバイスと関連付けられるエリア識別子を決定し、少なくとも部分的に、エリア識別子に基づいて、環境マップのセットをマップデータベースから識別し、環境マップのセットをフィルタリングし、フィルタリングされた環境マップのセットをユーザデバイスに伝送し、環境マップのセットをフィルタリングするステップは、そこから環境マップのための要求が生じた、ユーザデバイスによって検出された無線ネットワークのパラメータと、環境マップのセット内の環境マップのためのマップデータベース内の無線ネットワークのパラメータとの類似性に基づく、コンピュータ実行可能命令を記憶する、非一過性コンピュータ記憶媒体とを備える、クラウドコンピューティング環境に関する。
いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも1つのプロセッサによって実行されると、追跡マップを環境マップを要求するユーザデバイスから受信するように構成され、環境マップのセットをフィルタリングするステップはさらに、追跡マップおよび環境マップのセットの環境マップのコンテンツを表すメトリックの類似性に基づく。
いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも1つのプロセッサによって実行されると、追跡マップを環境マップを要求するユーザデバイスから受信するように構成され、環境マップのセットをフィルタリングするステップはさらに、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づく。
いくつかの実施形態では、無線ネットワークのパラメータは、それにユーザデバイスが接続される、ネットワークの基本サービスセット識別子(BSSID)を備える。
いくつかの実施形態では、無線ネットワークのパラメータの類似性に基づいて、環境マップのセットをフィルタリングするステップは、環境マップを要求するユーザデバイスと関連付けられるユーザデータベース内に記憶される複数のBSSIDと、環境マップのセットの環境マップと関連付けられるマップデータベース内に記憶されるBSSIDとの類似性を算出するステップを含む。
いくつかの実施形態では、エリア識別子は、経度および緯度によって、地理的場所を示す。
いくつかの実施形態では、エリア識別子を決定するステップは、ユーザデータベースからのエリア識別子にアクセスするステップを含む。
いくつかの実施形態では、エリア識別子を決定するステップは、複数のユーザデバイスから受信されたメッセージ内のエリア識別子を受信するステップを含む。
いくつかの実施形態では、無線ネットワークのパラメータは、Wi-Fiおよび5G NRを含む、プロトコルに準拠する。
いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも1つのプロセッサによって実行されると、追跡マップをユーザデバイスから受信するように構成され、環境マップのセットをフィルタリングするステップはさらに、追跡マップの一部と環境マップのセットの環境マップの一部との間のマッチング度に基づく。
いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも1つのプロセッサによって実行されると、追跡マップをユーザデバイスから受信し、追跡マップを供給するユーザデバイスに基づいて、追跡マップと関連付けられる、エリア識別子を決定し、少なくとも部分的に、追跡マップと関連付けられるエリア識別子に基づいて、第2の環境マップのセットをマップデータベースから選択し、受信された追跡マップに基づいて、マップデータベースを更新し、更新するステップは、受信された追跡マップと第2の環境マップのセット内の1つ以上の環境マップをマージするステップを含む、ように構成される。
いくつかの実施形態では、コンピュータ実行可能命令はさらに、クラウドコンピューティング環境内の少なくとも1つのプロセッサによって実行されると、受信された追跡マップの一部と第2の環境マップのセットの環境マップの一部との間のマッチング度に基づいて、第2の環境マップのセットをフィルタリングするように構成され、追跡マップと第2の環境マップのセット内の1つ以上の環境マップをマージするステップは、追跡マップとフィルタリングされた第2の環境マップのセット内の1つ以上の環境マップをマージするステップを含む。
いくつかの実施形態は、実世界オブジェクトの複数の表面を検出する、実オブジェクト検出デバイスと、実オブジェクト検出デバイスに接続され、実世界オブジェクトに基づいて、マップを生成する、PCF識別システムと、マップに基づいて、第1のPCFを生成し、第1のPCFとマップを関連付ける、持続的座標フレーム(PCF)生成システムと、それぞれ、第1および第2のXRデバイス上にある、第1および第2の記憶媒体と、第1のPCFを、それぞれ、第1および第2のXRデバイスの第1および第2の記憶媒体内に記憶する、第1および第2のXRデバイスの少なくとも第1および第2のプロセッサとを備える、XRシステムに関する。
いくつかの実施形態では、XRシステムは、少なくとも1つのプロセッサによって実行可能であって、複数のカメラ画像を複数の個別のキーフレームに変換する、キーフレーム生成器と、少なくとも1つのプロセッサによって実行可能であって、複数のキーフレームを平均することによって、持続的姿勢を生成する、持続的姿勢計算機と、少なくとも1つのプロセッサによって実行可能であって、追跡マップを持続的姿勢に変換し、追跡マップに対する原点における持続的姿勢を決定する、追跡マップおよび持続的姿勢変換器と、少なくとも1つのプロセッサによって実行可能であって、持続的姿勢を第1のPCFに変換し、持続的姿勢に対する第1のPCFを決定する、持続的姿勢およびPCF変換器と、少なくとも1つのプロセッサによって実行可能であって、第1のPCFを画像データに変換する、PCFおよび画像データ変換器と、第1のPCFに対する画像データをユーザに表示する、ディスプレイデバイスとを備える。
いくつかの実施形態では、検出デバイスは、第1のXRデバイスプロセッサに接続される、第1のXRデバイスの検出デバイスである。
いくつかの実施形態では、マップは、第1のXRデバイス上の第1のマップであって、第1のマップを生成するプロセッサは、第1のXRデバイスの第1のXRデバイスプロセッサである。
いくつかの実施形態では、第1のPCFを生成するプロセッサは、第1のXRデバイスの第1のXRデバイスプロセッサである。
いくつかの実施形態では、第1のPCFと第1のマップを関連付けるプロセッサは、第1のXRデバイスの第1のXRデバイスプロセッサである。
いくつかの実施形態では、XRシステムは、第1のXRデバイスプロセッサによって実行可能である、アプリケーションと、第1のXRデバイスプロセッサによって実行可能であって、第1のPCF追跡器をアプリケーションからオンに切り替えるためのオンプロンプトを含む、第1のPCF追跡器であって、第1のPCF追跡器がオンに切り替えられる場合のみ、第1のPCFを生成する、第1のPCF追跡器とを備える。
いくつかの実施形態では、第1のPCF追跡器は、第1のPCF追跡器をアプリケーションからオフに切り替えるためのオフプロンプトを有し、第1のPCF追跡器は、第1のPCF追跡器がオフに切り替えられると、第1のPCF生成を終了する。
いくつかの実施形態では、XRシステムは、第1のXRデバイスプロセッサによって実行可能であって、第1のPCFをサーバに伝送する、マップ発行器と、サーバのサーバプロセッサによって実行可能であって、第1のPCFをサーバの記憶デバイス上に記憶する、マップ記憶ルーチンと、サーバのサーバプロセッサを用いて、第1のPCFを第2のXRデバイスに伝送するステップと、第2のXRデバイスの第2のXRデバイスプロセッサによって実行可能であって、第1のPCFをサーバからダウンロードする、マップダウンロードシステムとを備える。
いくつかの実施形態では、XRシステムは、第2のXRデバイスプロセッサによって実行可能である、アプリケーションと、第2のXRデバイスプロセッサによって実行可能であって、第2のPCF追跡器をアプリケーションからオンに切り替えるためのオンプロンプトを含む、第2のPCF追跡器であって、第2のPCF追跡器がオンに切り替えられる場合のみ、第2のPCFを生成する、第2のPCF追跡器とを備える。
いくつかの実施形態では、第2のPCF追跡器は、第2のPCF追跡器をアプリケーションからオフに切り替えるためのオフプロンプトを有し、第2のPCF追跡器は、第2のPCF追跡器がオフに切り替えられると、第2のPCF生成を終了する。
いくつかの実施形態では、XRシステムは、第2のXRデバイスプロセッサによって実行可能であって、第2のPCFをサーバに伝送する、マップ発行器を備える。
いくつかの実施形態では、XRシステムは、第1のXRデバイスプロセッサによって実行可能であって、持続的姿勢をサーバからダウンロードする、持続的姿勢入手器と、第1のXRデバイスプロセッサによって実行可能であって、持続的姿勢に基づいて、PCFを第1のXRデバイスの第1の記憶デバイスから読み出す、PCF確認器と、第1のXRデバイスプロセッサによって実行可能であって、第1の記憶デバイスから読み出されたPCFに基づいて、座標フレームを計算する、座標フレーム計算機とを備える。
いくつかの実施形態は、少なくとも1つの検出デバイスを用いて、実世界オブジェクトの複数の表面を検出するステップと、少なくとも1つのプロセッサを用いて、実世界オブジェクトに基づいて、マップを生成するステップと、少なくとも1つのプロセッサを用いて、マップに基づいて、第1のPCFを生成するステップと、少なくとも1つのプロセッサを用いて、第1のPCFとマップを関連付けるステップと、第1および第2のXRデバイスの少なくとも第1および第2のプロセッサを用いて、第1のPCFを、それぞれ、第1および第2のXRデバイスの第1および第2の記憶媒体内に記憶するステップとを含む、視認方法に関する。
いくつかの実施形態では、視認方法は、少なくとも1つのプロセッサを用いて、複数のカメラ画像を複数の個別のキーフレームに変換するステップと、少なくとも1つのプロセッサを用いて、複数のキーフレームを平均することによって、持続的姿勢を生成するステップと、少なくとも1つのプロセッサを用いて、追跡マップを持続的姿勢に変換し、追跡マップに対する原点における持続的姿勢を決定するステップと、少なくとも1つのプロセッサによって、持続的姿勢を第1のPCFに変換し、持続的姿勢に対する第1のPCFを決定するステップと、少なくとも1つのプロセッサを用いて、第1のPCFを画像データに変換するステップと、ディスプレイデバイスを用いて、第1のPCFに対する画像データをユーザに表示するステップとを含む。
いくつかの実施形態では、検出デバイスは、第1のXRデバイスプロセッサに接続される、第1のXRデバイスの検出デバイスである。
いくつかの実施形態では、マップは、第1のXRデバイス上の第1のマップであって、第1のマップを生成するプロセッサは、第1のXRデバイスの第1のXRデバイスプロセッサである。
いくつかの実施形態では、第1のPCFを生成するプロセッサは、第1のXRデバイスの第1のXRデバイスプロセッサである。
いくつかの実施形態では、第1のPCFと第1のマップを関連付けるプロセッサは、第1のXRデバイスの第1のXRデバイスプロセッサである。
いくつかの実施形態では、視認方法は、第1のXRデバイスプロセッサを用いて、アプリケーションを実行するステップと、第1のXRデバイスプロセッサを用いて、アプリケーションからのオンプロンプトで、第1のPCF追跡器をオンに切り替えるステップであって、第1のPCF追跡器は、第1のPCF追跡器がオンに切り替えられる場合のみ、第1のPCFを生成する、ステップとを含む。
いくつかの実施形態では、視認方法は、第1のXRデバイスプロセッサを用いて、アプリケーションからのオフプロンプトで、第1のPCF追跡器をオフに切り替え得るステップであって、第1のPCF追跡器は、第1のPCF追跡器がオフに切り替えられると、第1のPCF生成を終了するステップを含む。
いくつかの実施形態では、視認方法は、第1のXRデバイスプロセッサを用いて、第1のPCFをサーバに伝送するステップと、サーバのサーバプロセッサを用いて、第1のPCFをサーバの記憶デバイス上に記憶するステップと、サーバのサーバプロセッサを用いて、第1のPCFを第2のXRデバイスに伝送するステップと、第2のXRデバイスの第2のXRデバイスプロセッサを用いて、第1のPCFをサーバから受信するステップとを含む。
いくつかの実施形態では、視認方法は、第2のXRデバイスプロセッサを用いて、アプリケーションを実行するステップと、第2のXRデバイスプロセッサを用いて、アプリケーションからのオンプロンプトで、第2のPCF追跡器をオンに切り替えるステップであって、第2のPCF追跡器は、第2のPCF追跡器がオンに切り替えられる場合のみ、第2のPCFを生成する、ステップとを含む。
いくつかの実施形態では、視認方法は、第1のXRデバイスプロセッサを用いて、アプリケーションからのオフプロンプトで、第2のPCF追跡器をオフに切り替えるステップであって、第2のPCF追跡器は、第2のPCF追跡器がオフに切り替えられると、第2のPCF生成を終了するステップを含む。
いくつかの実施形態では、視認方法は、第2のXRデバイスプロセッサを用いて、第2のPCFをサーバにアップロードするステップを含む。
いくつかの実施形態では、視認方法は、第1のXRデバイスプロセッサを用いて、持続的姿勢をサーバから決定するステップと、第1のXRデバイスプロセッサを用いて、持続的姿勢に基づいて、PCFを第1のXRデバイスの第1の記憶デバイスから読み出すステップと、第1のXRデバイスプロセッサを用いて、第1の記憶デバイスから読み出されたPCFに基づいて、座標フレームを計算するステップとを含む。
いくつかの実施形態は、第1のXRデバイスプロセッサと、第1のXRデバイスプロセッサに接続される、第1のXRデバイス記憶デバイスと、第1のXRデバイスプロセッサによって実行可能であって、持続的姿勢をサーバからダウンロードする、ダウンロードシステムと、第1のXRデバイスプロセッサによって実行可能であって、持続的姿勢に基づいて、PCFを第1のXRデバイスの第1の記憶デバイスから読み出す、PCF読出器と、第1のXRデバイスプロセッサによって実行可能であって、第1の記憶デバイスから読み出されたPCFに基づいて、座標フレームを計算する、座標フレーム計算機とを含む、第1のXRデバイスプロセッサ上の命令のセットとを含み得る、第1のXRデバイスを備えるXRシステムに関する。
いくつかの実施形態は、第1のXRデバイスの第1のXRデバイスプロセッサを用いて、持続的姿勢をサーバからダウンロードするステップと、第1のXRデバイスプロセッサを用いて、持続的姿勢に基づいて、PCFを第1のXRデバイスの第1の記憶デバイスから読み出すステップと、第1のXRデバイスプロセッサを用いて、第1の記憶デバイスから読み出されたPCFに基づいて、座標フレームを計算するステップとを含む、視認方法に関する。
いくつかの実施形態は、サーバプロセッサと、サーバプロセッサに接続される、サーバ記憶デバイスと、サーバのサーバプロセッサを用いて実行可能であって、マップと関連付けられた第1のPCFをサーバのサーバ記憶デバイス上に記憶する、マップ記憶ルーチンと、サーバプロセッサを用いて、サーバプロセッサを用いて実行可能であって、マップおよび第1のPCFを第1のXRデバイスに伝送する、マップ伝送機とを含み得る、サーバを含む、XRデバイスに関する。
いくつかの実施形態は、サーバのサーバプロセッサを用いて、マップと関連付けられた第1のPCFをサーバのサーバ記憶デバイス上に記憶するステップと、サーバのサーバプロセッサを用いて、マップおよび第1のPCFを第1のXRデバイスに伝送するステップとを含む、視認方法に関する。
いくつかの実施形態は、XRデバイスのプロセッサによって、ユーザの頭部に固着される頭部搭載型フレーム上の捕捉デバイスを用いて、環境を捕捉し、頭部搭載型フレームの配向を決定することによって、頭部姿勢の追跡に入るステップと、プロセッサによって、頭部搭載型フレームの配向決定不能に起因して、頭部姿勢が喪失されたかどうかを決定するステップと、頭部姿勢が、喪失された場合、プロセッサによって、姿勢復元モードに入り、頭部搭載型フレームの配向を決定することによって、頭部姿勢を確立するステップとを含む、視認方法に関する。
いくつかの実施形態では、頭部姿勢が、喪失されていない場合、プロセッサによって、頭部姿勢の追跡に入る。
いくつかの実施形態では、姿勢復元は、プロセッサによって、環境の捕捉を改良するための提案とともに、メッセージをユーザに表示するステップを含む。
いくつかの実施形態では、提案は、光を増加させるステップおよびテクスチャを精緻化するステップのうちの少なくとも1つである。
いくつかの実施形態では、視認方法は、プロセッサによって、復元が失敗したかどうかを決定するステップと、復元が、失敗した場合、プロセッサによって、頭部姿勢を確立するステップを含む、新しいセッションを開始するステップとを含む。
いくつかの実施形態では、視認方法は、プロセッサによって、新しいセッションが開始されるであろうことのメッセージをユーザに表示するステップを含む。
いくつかの実施形態では、視認方法は、頭部姿勢が、喪失されていない場合、プロセッサによって、頭部姿勢の追跡に入るステップを含む。
いくつかの実施形態は、コンピューティングシステムを動作させ、仮想オブジェクトを、1つ以上の物理的オブジェクトを備える、場面内にレンダリングする方法に関する。本方法は、場面に関する複数の画像をユーザによって装着される第1のデバイスの1つ以上のセンサから捕捉するステップと、少なくとも部分的に、複数の画像に基づいて、1つ以上の持続的姿勢を算出するステップと、複数の画像の情報が、持続的座標フレームを介して、第1のデバイスおよび/または第2のデバイス上で起動する1つ以上のアプリケーションによって、異なる時間にアクセスされ得るように、少なくとも部分的に、算出された1つ以上の持続的姿勢に基づいて、持続的座標フレームを生成するステップとを含む。
いくつかの実施形態では、少なくとも部分的に、複数の画像に基づいて、1つ以上の持続的姿勢を算出するステップは、1つ以上の特徴を複数の画像のそれぞれから抽出するステップと、1つ以上の特徴毎に、記述子を生成するステップと、少なくとも部分的に、記述子に基づいて、複数の画像毎に、キーフレームを生成するステップと、少なくとも部分的に、1つ以上のキーフレームに基づいて、1つ以上の持続的姿勢を生成するステップとを含む。
いくつかの実施形態では、少なくとも部分的に、算出された1つ以上の持続的姿勢に基づいて、持続的座標フレームを生成するステップは、第1のデバイスが以前の持続的座標フレームの場所から所定の距離を進行すると、持続的座標フレームを生成するステップを含む。
いくつかの実施形態では、所定の距離は、2~20メートルであって、デバイスの算出リソースの消費および仮想オブジェクトの設置誤差の両方に基づく。
いくつかの実施形態では、本方法は、第1のデバイスが電源投入されると、初期持続的姿勢を生成するステップと、第1のデバイスが、円形の中心としての初期持続的姿勢および閾値距離に等しい半径を伴う、円形の周に到達すると、第1のデバイスの現在の場所において第1の持続的姿勢を生成するステップとを含む。
いくつかの実施形態では、円形は、第1の円形である。本方法はさらに、デバイスが、円形の中心としての第1の持続的姿勢および閾値距離の2倍に等しい半径を伴う、第2の円形の周に到達すると、第1のデバイスの現在の場所で第2の持続的姿勢を生成するステップを含む。
いくつかの実施形態では、第1のデバイスが、既存の持続的姿勢を初期持続的姿勢からの閾値距離内に見出すとき、第1の持続的姿勢は、生成されない。
いくつかの実施形態では、第1のデバイスは、第1の持続的姿勢に、第1の持続的姿勢までの所定の距離内にある、複数のキーフレームのうちの1つ以上のものを結び付ける。
いくつかの実施形態では、第1のデバイス上で起動するアプリケーションが持続的姿勢を要求しない限り、第1の持続的姿勢は、生成されない。
いくつかの実施形態は、ユーザによって携行可能な電子システムに関する。電子システムは、場面内の1つ以上の物理的オブジェクトに関する画像を捕捉するように構成される、1つ以上のセンサと、コンピュータ実行可能命令を実行し、仮想コンテンツを場面内にレンダリングするように構成される、アプリケーションと、コンピュータ実行可能命令を実行し、仮想コンテンツについての画像データをアプリケーションに提供するように構成される、少なくとも1つのプロセッサであって、コンピュータ実行可能命令は、少なくとも部分的に、捕捉された画像に基づいて、持続座標フレームを生成するための命令を備える、少なくとも1つのプロセッサとを含む。
本開示の前述の実施形態は、多数の方法のいずれかにおいて実装されることができる。例えば、実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせを使用して実装されてもよい。ソフトウェア内に実装されるとき、ソフトウェアコードが、単一コンピュータ内に提供される、または複数のコンピュータ間に分散されるかどうかにかかわらず、任意の好適なプロセッサまたはプロセッサの集合上で実行されることができる。そのようなプロセッサは、いくつか挙げると、CPUチップ、GPUチップ、マイクロプロセッサ、マイクロコントローラ、またはコプロセッサ等、当技術分野において公知の市販の集積回路コンポーネントを含む、集積回路コンポーネント内の1つ以上のプロセッサとともに、集積回路として実装されてもよい。いくつかの実施形態では、プロセッサは、ASIC等のカスタム回路内に、またはプログラマブル論理デバイスを構成することから生じる半カスタム回路内に実装されてもよい。さらなる代替として、プロセッサは、市販、半カスタム、またはカスタムかどうかにかかわらず、より大きい回路または半導体デバイスの一部であってもよい。具体的実施例として、いくつかの市販のマイクロプロセッサは、1つまたはそれらのコアのサブセットがプロセッサを構成し得るように、複数のコアを有する。但し、プロセッサは、任意の好適なフォーマットにおける回路を使用して実装されてもよい。
さらに、コンピュータは、ラックマウント式コンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、またはタブレットコンピュータ等のいくつかの形態のうちのいずれかで具現化され得ることを理解されたい。加えて、コンピュータは、携帯情報端末(PDA)、スマートフォン、または任意の好適な携帯用または固定電子デバイスを含む、概してコンピュータと見なされないが好適な処理能力を伴う、デバイスで具現化されてもよい。
また、コンピュータは、1つ以上の入力および出力デバイスを有してもよい。これらのデバイスは、とりわけ、ユーザインターフェースを提示するために使用されることができる。ユーザインターフェースを提供するために使用され得る、出力デバイスの実施例は、出力の視覚的提示のためのプリンタまたはディスプレイ画面、または出力の可聴提示のためのスピーカまたは他の音生成デバイスを含む。ユーザインターフェースのために使用され得る、入力デバイスの実施例は、キーボード、およびマウス、タッチパッド、およびデジタル化タブレット等のポインティングデバイスを含む。別の実施例として、コンピュータは、発話認識を通して、または他の可聴フォーマットにおいて、入力情報を受信してもよい。図示される実施形態では、入力/出力デバイスは、コンピューティングデバイスと物理的に別個として図示される。しかしながら、いくつかの実施形態では、入力および/または出力デバイスは、プロセッサと同一ユニットまたはコンピューティングデバイスの他の要素の中に物理的に統合されてもよい。例えば、キーボードは、タッチスクリーン上のソフトキーボードとして実装され得る。いくつかの実施形態では、入力/出力デバイスは、コンピューティングデバイスから完全に接続解除され、無線接続を通して機能的に統合されてもよい。
そのようなコンピュータは、企業ネットワークまたはインターネット等、ローカル面積ネットワークまたは広域ネットワークとしての形態を含む、任意の好適な形態の1つ以上のネットワークによって相互接続されてもよい。そのようなネットワークは、任意の好適な技術に基づいてもよく、任意の好適なプロトコルに従って動作してもよく、無線ネットワーク、有線ネットワーク、または光ファイバネットワークを含んでもよい。
また、本明細書で概説される種々の方法およびプロセスは、種々のオペレーティングシステムまたはプラットフォームのうちのいずれか1つを採用する、1つ以上のプロセッサ上で実行可能である、ソフトウェアとしてコード化されてもよい。加えて、そのようなソフトウェアは、いくつかの好適なプログラミング言語および/またはプログラミングまたはスクリプト作成ツールのうちのいずれかを使用して、書き込まれてもよく、また、フレームワークまたは仮想マシン上で実行される実行可能機械言語コードまたは中間コードとしてコンパイルされてもよい。
本側面では、本開示は、1つ以上のコンピュータまたは他のプロセッサ上で実行されるときに、上記で議論される本開示の種々の実施形態を実装する方法を行う、1つ以上のプログラムで符号化される、コンピュータ可読記憶媒体(または複数のコンピュータ可読媒体)(例えば、コンピュータメモリ、1つ以上のフロッピー(登録商標)ディスク、コンパクトディスク(CD)、光学ディスク、デジタルビデオディスク(DVD)、磁気テープ、フラッシュメモリ、フィールドプログラマブルゲートアレイまたは他の半導体デバイス内の回路構成、または他の有形コンピュータ記憶媒体)として具現化されてもよい。前述の実施例から明白なように、コンピュータ可読記憶媒体は、非一過性形態においてコンピュータ実行可能命令を提供するために十分な時間の間、情報を留保し得る。そのようなコンピュータ可読記憶媒体または複数の媒体は、上記に記載されるように、その上に記憶される1つまたは複数のプログラムが、本開示の種々の側面を実装するように1つ以上の異なるコンピュータまたは他のプロセッサ上にロードされ得るように、トランスポータブルであることができる。本明細書で使用されるように、用語「コンピュータ可読記憶媒体」は、製造(すなわち、製造品)または機械と見なされ得るコンピュータ可読媒体のみを包含する。いくつかの実施形態では、本開示は、伝搬信号等のコンピュータ可読記憶媒体以外のコンピュータ可読媒体として具現化されてもよい。
用語「プログラム」または「ソフトウェア」は、上記に記載されるように、本開示の種々の側面を実装するようにコンピュータまたは他のプロセッサをプログラムするために採用され得る、任意のタイプのコンピュータコードまたはコンピュータ実行可能命令のセットを指すために、一般的意味において本明細書で使用される。加えて、本実施形態の一側面によると、実行されると、本開示の方法を行う、1つ以上のコンピュータプログラムは、単一のコンピュータまたはプロセッサ上に常駐する必要はないが、本開示の種々の側面を実装するように、いくつかの異なるコンピュータまたはプロセッサの間でモジュール様式において分散され得ることを理解されたい。
コンピュータ実行可能命令は、1つ以上のコンピュータまたは他のデバイスによって実行される、プログラムモジュール等の多くの形態であってもよい。概して、プログラムモジュールは、特定のタスクを行う、または特定の抽象データタイプを実装する、ルーチン、プログラム、オブジェクト、構成要素、データ構造等を含む。典型的には、プログラムモジュールの機能性は、種々の実施形態では、所望に応じて、組み合わせられる、または分散されてもよい。
また、データ構造は、任意の好適な形態でコンピュータ可読媒体に記憶されてもよい。例証を簡単にするために、データ構造は、データ構造内の場所を通して関係付けられるフィールドを有することが示されてもよい。そのような関係は、同様に、フィールド間の関係を伝えるコンピュータ可読媒体内の場所を伴うフィールドのために記憶装置を割り当てることによって、達成されてもよい。しかしながら、ポインタ、タグ、またはデータ要素間の関係を確立する他の機構の使用を通すことを含む、任意の好適な機構が、データ構造のフィールド内の情報の間の関係を確立するために使用されてもよい。
本開示の種々の側面は、単独で、組み合わせて、または前述の実施形態に具体的に議論されない種々の配列において使用されてもよく、したがって、その用途は、前述の説明に記載される、または図面に図示されるコンポーネントの詳細および配列に限定されない。例えば、一実施形態に説明される側面は、他の実施形態に説明される側面と任意の様式で組み合わせられてもよい。
また、本開示は、その実施例が提供されている、方法として具現化されてもよい。方法の一部として行われる作用は、任意の好適な方法で順序付けられてもよい。故に、例証的実施形態では、連続作用として示されるが、いくつかの作用を同時に行うことを含み得る、作用が図示されるものと異なる順序で行われる、実施形態が構築されてもよい。
請求項要素を修飾するための請求項における「第1の」、「第2の」、「第3の」等の順序の用語の使用は、単独では、別の要素と比べた1つの請求項要素のいかなる優先順位、先行、または順序、または方法の行為が行われる時間順序も含意しないが、順序の用語は、請求項要素を区別するために、(順序の用語の使用のためであるが)ある名前を有する1つの請求項要素と、同一の名前を有する別の要素を区別する標識としてのみ使用される。
また、本明細書で使用される語句および専門用語は、説明目的のためのものであって、限定と見なされるべきではない。本明細書の「~を含む」、「~を備える」、または「~を有する」、「~を含有する」、「~を伴う」、およびその変形の使用は、その後列挙されたアイテムおよびその均等物および付加的アイテムを包含することを意味する。

Claims (28)

  1. 電子システムであって、前記電子システムは、
    3D環境(3次元環境)についての情報を捕捉するように構成されている1つ以上のセンサであって、前記捕捉された情報は、複数の画像を備える、1つ以上のセンサと、
    コンピュータ実行可能な命令を実行することにより、前記複数の画像に基づいて、前記3D環境の少なくとも一部のマップを生成するように構成されている少なくとも1つのプロセッサと
    を備え、
    前記コンピュータ実行可能な命令は、
    前記複数の画像内の複数の特徴を識別することであって、前記複数の特徴は、前記3D環境内の複数のオブジェクトの複数の部分に対応する、ことと、
    前記複数の画像内の前記複数の特徴に少なくとも部分的に基づいて、前記複数の画像の中から複数のキーフレームを選択することと、
    前記選択されたキーフレームの前記識別された複数の特徴に少なくとも部分的に基づいて、1つ以上の座標フレームを生成することであって、前記1つ以上の座標フレームは、前記3D環境の前記マップ内の前記3D環境の1つ以上の場所を記述したものである、ことと、
    前記1つ以上の座標フレームを1つ以上の持続的座標フレームとして記憶することであって、前記1つ以上の持続的座標フレームは、前記3D環境の前記マップ内のそれぞれのセットの特徴の場所に対して前記3D環境の前記1つ以上の場所を記述したものであり、前記1つ以上の持続的座標フレームは、前記1つ以上の座標フレームに関連付けられている前記3D環境の前記マップ内の前記それぞれのセットの特徴の前記場所に基づいて定義されている、ことと
    を行うための命令をさらに備える、電子システム。
  2. 前記1つ以上のセンサは、前記複数の画像の各画像が複数のピクセルを備えるように2次元アレイで配列されている複数のピクセル回路を備え、
    各特徴は、複数のピクセルに対応する、請求項1に記載の電子システム。
  3. 前記複数の画像内の複数の特徴を識別することは、前記識別された特徴として、持続的オブジェクトの部分を描写するピクセルの群との類似性の測定値に基づいて、前記ピクセルの群の所定の最大値未満の数を選択することを含む、請求項1に記載の電子システム。
  4. 前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレームのそれぞれに対して、
    そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセットを表す記述子
    を記憶することを含む、請求項1に記載の電子システム。
  5. 前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレームのそれぞれに対して、
    そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセット
    を記憶することを含む、請求項1に記載の電子システム。
  6. 前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレームのそれぞれに対して、
    前記3D環境のマップの座標フレームと前記持続的座標フレームとの間の変換と、
    そこから前記座標フレームが生成された選択されたキーフレームの前記3D環境内の場所を示す地理的情報と
    を記憶することを含む、請求項1に記載の電子システム。
  7. 前記地理的情報は、前記場所のWiFiフィンガプリントを備える、請求項6に記載の電子システム。
  8. 前記コンピュータ実行可能な命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える、請求項1に記載の電子システム。
  9. 前記人工ニューラルネットワークは、第1の人工ニューラルネットワークであり、
    前記コンピュータ実行可能な命令は、前記キーフレーム内の前記識別された特徴のための前記算出された特徴記述子に少なくとも部分的に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成されている第2の人工ニューラルネットワークを実装するための命令を備える、請求項8に記載の電子システム。
  10. 前記コンピュータ実行可能な命令は、
    アプリケーションプログラミングインターフェースであって、前記アプリケーションプログラミングインターフェースは、ポータブル電子システム上で実行されるアプリケーションに、前記1つ以上の持続的座標フレームの持続的座標フレームを特徴付ける情報を提供するように構成されている、アプリケーションプログラミングインターフェースと、
    第2の複数の画像に基づいて、前記3D環境のマップを精緻化するための命令と、
    前記第2の複数の画像に少なくとも部分的に基づいて、前記持続的座標フレームのうちの1つ以上のものを調節することと、
    前記アプリケーションプログラミングインターフェースを通して前記調節された持続的座標フレームの通知を提供するための命令と
    をさらに備える、請求項1に記載の電子システム。
  11. 前記1つ以上の持続的座標フレームを調節することは、前記3D環境のマップの原点に対する前記1つ以上の持続的座標フレームの平行移動および回転を調節することを含む、請求項10に記載の電子システム。
  12. 前記電子システムは、ウェアラブルデバイスを備え、前記1つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
    前記マップは、前記ウェアラブルデバイス上で算出された追跡マップであり、
    前記マップの原点は、前記ウェアラブルデバイスが電源投入された場所に基づいて決定される、請求項11に記載の電子システム。
  13. 前記電子システムは、ウェアラブルデバイスを備え、前記1つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
    前記コンピュータ実行可能な命令は、
    前記ウェアラブルデバイスの運動を追跡することと、
    閾値距離を超える前記ウェアラブルデバイスの運動を示す前記追跡された運動に基づいて、1つ以上の座標フレームを生成するための命令および/または1つ以上の持続的座標フレームを記憶するための命令の実行のタイミングを制御することであって、前記閾値距離は、2~20メートルである、ことと
    を行うための命令をさらに備える、請求項1に記載の電子システム。
  14. 前記1つ以上のセンサは、前記複数の画像の各画像が複数のピクセルを備えるように2次元アレイで配列されている複数のピクセル回路を備え、
    各特徴は、複数のピクセルに対応する、請求項3に記載の電子システム。
  15. 前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレームのそれぞれに対して、
    そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセットを表す記述子
    を記憶することを含む、請求項3に記載の電子システム。
  16. 前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレームのそれぞれに対して、
    そこから前記座標フレームが生成された選択されたキーフレーム内の前記特徴の少なくともサブセット
    を記憶することを含む、請求項3に記載の電子システム。
  17. 前記1つ以上の座標フレームを記憶することは、前記1つ以上の座標フレームのそれぞれに対して、
    前記3D環境のマップの座標フレームと前記持続的座標フレームとの間の変換と、
    そこから前記座標フレームが生成された選択されたキーフレームの前記3D環境内の場所を示す地理的情報と
    を記憶することを含む、請求項3に記載の電子システム。
  18. 前記コンピュータ実行可能な命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える、請求項3に記載の電子システム。
  19. 前記人工ニューラルネットワークは、第1の人工ニューラルネットワークであり、
    前記コンピュータ実行可能な命令は、前記キーフレーム内の前記識別された特徴のための前記算出された特徴記述子に少なくとも部分的に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成されている第2の人工ニューラルネットワークを実装するための命令を備える、請求項18に記載の電子システム。
  20. 前記コンピュータ実行可能な命令は、
    アプリケーションプログラミングインターフェースであって、前記アプリケーションプログラミングインターフェースは、ポータブル電子システム上で実行されるアプリケーションに、前記1つ以上の持続的座標フレームの持続的座標フレームを特徴付ける情報を提供するように構成されている、アプリケーションプログラミングインターフェースと、
    第2の複数の画像に基づいて、前記3D環境のマップを精緻化するための命令と、
    前記第2の複数の画像に少なくとも部分的に基づいて、前記持続的座標フレームのうちの1つ以上のものを調節することと、
    前記アプリケーションプログラミングインターフェースを通して前記調節された持続的座標フレームの通知を提供するための命令と
    をさらに備える、請求項3に記載の電子システム。
  21. 前記1つ以上の持続的座標フレームを調節することは、前記3D環境のマップの原点に対する前記1つ以上の持続的座標フレームの平行移動および回転を調節することを含む、請求項20に記載の電子システム。
  22. 前記電子システムは、ウェアラブルデバイスを備え、前記1つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
    前記マップは、前記ウェアラブルデバイス上で算出された追跡マップであり、
    前記マップの原点は、前記ウェアラブルデバイスが電源投入された場所に基づいて決定される、請求項21に記載の電子システム。
  23. 前記電子システムは、ウェアラブルデバイスを備え、前記1つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
    前記コンピュータ実行可能な命令は、
    前記ウェアラブルデバイスの運動を追跡することと、
    閾値距離を超える前記ウェアラブルデバイスの運動を示す前記追跡された運動に基づいて、1つ以上の座標フレームを生成するための命令および/または1つ以上の持続的座標フレームを記憶するための命令の実行のタイミングを制御することであって、前記閾値距離は、2~20メートルである、ことと
    を行うための命令をさらに備える、請求項3に記載の電子システム。
  24. 前記コンピュータ実行可能な命令は、人工ニューラルネットワークを用いて個々の特徴のための特徴記述子を算出するための命令を備える、請求項13に記載の電子システム。
  25. 前記人工ニューラルネットワークは、第1の人工ニューラルネットワークであり、
    前記コンピュータ実行可能な命令は、前記キーフレーム内の前記識別された特徴のための前記算出された特徴記述子に少なくとも部分的に基づいて、キーフレームを表すためのフレーム記述子を算出するように構成されている第2の人工ニューラルネットワークを実装するための命令を備える、請求項24に記載の電子システム。
  26. 前記コンピュータ実行可能な命令は、
    アプリケーションプログラミングインターフェースであって、前記アプリケーションプログラミングインターフェースは、ポータブル電子システム上で実行されるアプリケーションに、前記1つ以上の持続的座標フレームの持続的座標フレームを特徴付ける情報を提供するように構成されている、アプリケーションプログラミングインターフェースと、
    第2の複数の画像に基づいて、前記3D環境のマップを精緻化するための命令と、
    前記第2の複数の画像に少なくとも部分的に基づいて、前記持続的座標フレームのうちの1つ以上のものを調節することと、
    前記アプリケーションプログラミングインターフェースを通して前記調節された持続的座標フレームの通知を提供するための命令と
    をさらに備える、請求項13に記載の電子システム。
  27. 前記1つ以上の持続的座標フレームを調節することは、前記3D環境のマップの原点に対する前記1つ以上の持続的座標フレームの平行移動および回転を調節することを含む、請求項26に記載の電子システム。
  28. 前記電子システムは、ウェアラブルデバイスを備え、前記1つ以上のセンサは、前記ウェアラブルデバイス上に搭載され、
    前記マップは、前記ウェアラブルデバイス上で算出された追跡マップであり、
    前記マップの原点は、前記ウェアラブルデバイスが電源投入された場所に基づいて決定される、請求項27に記載の電子システム。
JP2021518528A 2018-10-05 2019-10-04 クロスリアリティシステム Active JP7526169B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024087120A JP2024103610A (ja) 2018-10-05 2024-05-29 クロスリアリティシステム

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201862742237P 2018-10-05 2018-10-05
US62/742,237 2018-10-05
US201962812935P 2019-03-01 2019-03-01
US62/812,935 2019-03-01
US201962815955P 2019-03-08 2019-03-08
US62/815,955 2019-03-08
US201962868786P 2019-06-28 2019-06-28
US62/868,786 2019-06-28
US201962870954P 2019-07-05 2019-07-05
US62/870,954 2019-07-05
US201962884109P 2019-08-07 2019-08-07
US62/884,109 2019-08-07
PCT/US2019/054819 WO2020072972A1 (en) 2018-10-05 2019-10-04 A cross reality system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024087120A Division JP2024103610A (ja) 2018-10-05 2024-05-29 クロスリアリティシステム

Publications (3)

Publication Number Publication Date
JP2022509731A JP2022509731A (ja) 2022-01-24
JPWO2020072972A5 JPWO2020072972A5 (ja) 2022-10-11
JP7526169B2 true JP7526169B2 (ja) 2024-07-31

Family

ID=70055505

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021518528A Active JP7526169B2 (ja) 2018-10-05 2019-10-04 クロスリアリティシステム
JP2024087120A Pending JP2024103610A (ja) 2018-10-05 2024-05-29 クロスリアリティシステム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024087120A Pending JP2024103610A (ja) 2018-10-05 2024-05-29 クロスリアリティシステム

Country Status (4)

Country Link
EP (1) EP3861533A4 (ja)
JP (2) JP7526169B2 (ja)
CN (1) CN113544748A (ja)
WO (1) WO2020072972A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210148074A (ko) * 2020-05-26 2021-12-07 베이징 센스타임 테크놀로지 디벨롭먼트 컴퍼니 리미티드 Ar 시나리오 콘텐츠의 생성 방법, 전시 방법, 장치 및 저장 매체
US11556961B2 (en) * 2020-07-23 2023-01-17 At&T Intellectual Property I, L.P. Techniques for real-time object creation in extended reality environments
CN112465890A (zh) * 2020-11-24 2021-03-09 深圳市商汤科技有限公司 深度检测方法、装置、电子设备和计算机可读存储介质
US11200754B1 (en) * 2020-12-22 2021-12-14 Accenture Global Solutions Limited Extended reality environment generation
CN113313809A (zh) * 2021-06-03 2021-08-27 中国建设银行股份有限公司 一种渲染方法和装置
WO2023043607A1 (en) * 2021-09-16 2023-03-23 Chinook Labs Llc Aligning scanned environments for multi-user communication sessions

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160179830A1 (en) 2014-12-19 2016-06-23 Qualcomm Incorporated Scalable 3d mapping system
JP2017107604A (ja) 2013-03-11 2017-06-15 マジック リープ, インコーポレイテッド 拡張現実および仮想現実のためのシステムおよび方法
JP2017529635A (ja) 2014-06-14 2017-10-05 マジック リープ, インコーポレイテッドMagic Leap,Inc. 仮想および拡張現実を作成する方法およびシステム
US20180053315A1 (en) 2016-05-31 2018-02-22 Microsoft Technology Licensing, Llc Systems and methods for utilizing anchor graphs in mixed reality environments

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7542034B2 (en) * 2004-09-23 2009-06-02 Conversion Works, Inc. System and method for processing video images
US20080090659A1 (en) * 2006-10-12 2008-04-17 Maximino Aguilar Virtual world event notification from a persistent world game server in a logically partitioned game console
JP4292426B2 (ja) * 2007-05-15 2009-07-08 ソニー株式会社 撮像装置および撮像データ補正方法
GB2506338A (en) * 2012-07-30 2014-04-02 Sony Comp Entertainment Europe A method of localisation and mapping
US10025486B2 (en) * 2013-03-15 2018-07-17 Elwha Llc Cross-reality select, drag, and drop for augmented reality systems
US10262462B2 (en) * 2014-04-18 2019-04-16 Magic Leap, Inc. Systems and methods for augmented and virtual reality
US9196022B2 (en) * 2014-03-10 2015-11-24 Omnivision Technologies, Inc. Image transformation and multi-view output systems and methods
US10007868B2 (en) * 2016-09-19 2018-06-26 Adobe Systems Incorporated Font replacement based on visual similarity

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017107604A (ja) 2013-03-11 2017-06-15 マジック リープ, インコーポレイテッド 拡張現実および仮想現実のためのシステムおよび方法
JP2017529635A (ja) 2014-06-14 2017-10-05 マジック リープ, インコーポレイテッドMagic Leap,Inc. 仮想および拡張現実を作成する方法およびシステム
US20160179830A1 (en) 2014-12-19 2016-06-23 Qualcomm Incorporated Scalable 3d mapping system
US20180053315A1 (en) 2016-05-31 2018-02-22 Microsoft Technology Licensing, Llc Systems and methods for utilizing anchor graphs in mixed reality environments

Also Published As

Publication number Publication date
EP3861533A4 (en) 2022-12-21
EP3861533A1 (en) 2021-08-11
JP2022509731A (ja) 2022-01-24
JP2024103610A (ja) 2024-08-01
WO2020072972A1 (en) 2020-04-09
WO2020072972A8 (en) 2021-09-23
CN113544748A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
US11978159B2 (en) Cross reality system
JP7525603B2 (ja) 位置特定サービスおよび共有場所ベースのコンテンツを伴うクロスリアリティシステム
US11995782B2 (en) Cross reality system with localization service
JP7445642B2 (ja) クロスリアリティシステム
US11257294B2 (en) Cross reality system supporting multiple device types
US20240062491A1 (en) Cross reality system with accurate shared maps
US20230119217A1 (en) Cross reality system with fast localization
JP2023514206A (ja) 大規模環境のためのクロスリアリティシステム
JP2022551735A (ja) 無線フィンガプリントを用いたクロスリアリティシステム
CN115398314A (zh) 使用多分辨率帧描述符进行地图处理的交叉现实系统
JP7526169B2 (ja) クロスリアリティシステム
JP2023515577A (ja) 大規模環境再構築のためのクロスリアリティシステム
JP2024150590A (ja) 位置特定サービスおよび共有場所ベースのコンテンツを伴うクロスリアリティシステム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220929

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240229

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240719

R150 Certificate of patent or registration of utility model

Ref document number: 7526169

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150