JP2022519310A

JP2022519310A - 受動深度抽出を伴う軽量のクロスリアリティデバイス

Info

Publication number: JP2022519310A
Application number: JP2021545849A
Authority: JP
Inventors: マルティンゲオルクツァーネアト，; アレクサンデルイリッチ，; ベラスケス，ミゲルアンドレスグラナドス; ゴンザレス，ハビエルビクトリオゴメス
Original assignee: Magic Leap Inc
Current assignee: Magic Leap Inc
Priority date: 2019-02-07
Filing date: 2020-02-07
Publication date: 2022-03-22
Also published as: EP3922010A4; EP3922010A1; CN113711587A; WO2020163662A1; US11889209B2; US20220132056A1; US20240137665A1

Abstract

複数のカメラと、プロセッサとを含む、ウェアラブルディスプレイシステムが、開示される。グレースケールカメラおよびカラーカメラが、両カメラと関連付けられる、中心視野と、２つのカメラのうちの１つと関連付けられる、周辺視野とを提供するように配列されることができる。２つのカメラのうちの１つ以上のものは、プレノプティックカメラであってもよい。ウェアラブルディスプレイシステムは、少なくとも１つのプレノプティックカメラを使用して、ライトフィールド情報を入手し、第１のライトフィールド情報と、グレースケールカメラおよびカラーカメラによって入手された画像から立体視的に決定される、第１の深度情報とを使用して、世界モデルを作成してもよい。ウェアラブルディスプレイシステムは、少なくとも１つのプレノプティックカメラと、世界モデルとを使用して、頭部姿勢を追跡することができる。

Description

本願は、概して、少なくとも１つのプレノプティックカメラを含む、ウェアラブルクロスリアリティディスプレイシステムに関する。

コンピュータは、ヒューマンユーザインターフェースを制御し、ユーザによって知覚されるにつれて、ＸＲ環境の一部または全部がコンピュータによって生成される、Ｘリアリティ（ＸＲまたはクロスリアリティ）環境を作成し得る。これらのＸＲ環境は、ＸＲ環境の一部または全部が、部分的に、環境を説明するデータを使用して、コンピュータによって生成され得る、仮想現実（ＶＲ）、拡張現実（ＡＲ）、または複合現実（ＭＲ）環境であり得る。本データは、例えば、ユーザが、仮想オブジェクトと相互作用し得るように、ユーザが、物理的世界の一部として、感知または知覚するような方法でレンダリングされ得る、仮想オブジェクトを説明し得る。ユーザは、例えば、頭部搭載型ディスプレイデバイス等のユーザインターフェースデバイスを通してレンダリングおよび提示されているデータの結果として、これらの仮想オブジェクトを体験し得る。データは、ユーザに見えるために表示され得る、またはユーザに聞こえるために再生される、オーディオを制御し得る、または触知的（または触覚的）インターフェースを制御し、ユーザが、仮想オブジェクトを感じるにつれて、ユーザが感知または知覚する、タッチ感覚を体験することを可能にし得る。

ＸＲシステムは、科学的可視化、医療訓練、工学設計、およびプロトタイプ化、遠隔操作およびテレプレゼンス、および個人的娯楽の分野に及ぶ、多くの用途のために有用であり得る。ＡＲおよびＭＲは、ＶＲと対照的に、物理的世界の実オブジェクトと関連して、１つ以上の仮想オブジェクトを含む。実オブジェクトと相互作用する、仮想オブジェクトの体験は、概して、ＸＲシステムを使用する際、ユーザの享受を向上させ、また、物理的世界が改変され得る様子についての現実的かつ容易に理解可能な情報を提示する、種々の用途のための可能性を広げる。

本願の側面は、少なくとも１つのプレノプティックカメラを含む、ウェアラブルクロスリアリティディスプレイシステムに関する。本明細書に説明される技法は、ともに、別個に、または任意の好適な組み合わせにおいて、使用されてもよい。

いくつかの実施形態によると、ウェアラブルディスプレイシステムであって、グローバルシャッタを伴う、１つの第１のカメラと、ロールシャッタを伴う、１つの第２のカメラとを備える、ヘッドセットであって、第１のカメラおよび第２のカメラは、中心視野の重複ビューを提供するように位置付けられる、ヘッドセットと、第１のカメラおよび第２のカメラに動作可能に結合され、ロールシャッタ画像歪曲のために、補償ルーチンを実施し、第２のカメラを使用して入手された画像を調節し、部分的に、第１のカメラを使用して入手された画像から立体視的に決定される深度情報と、調節された画像とを使用して、世界モデルを作成するように構成される、プロセッサとを備える、ウェアラブルディスプレイシステムが提供される。

いくつかの実施形態では、第１のカメラおよび第２のカメラは、非対称的に内向きに角度付けられてもよい。

いくつかの実施形態では、第１のカメラの視野は、第２のカメラの視野より大きくてもよい。

いくつかの実施形態では、第１のカメラは、２０～４０度内向きに角度付けられ、第２のカメラは、１～２０度内向きに角度付けられてもよい。

いくつかの実施形態では、第１のカメラは、１～５分（ａｒｃｍｉｎｕｔｅ）／ピクセルの角度ピクセル分解能を有してもよい。

いくつかの実施形態では、プロセッサはさらに、サイズ低減ルーチンを実施し、第２のカメラを使用して入手された画像を調節するように構成されてもよい。

いくつかの実施形態では、サイズ低減ルーチンは、第２のカメラによって入手された画像内のピクセルをビニングすることによって、低減されたサイズ画像を生成するステップを含んでもよい。

いくつかの実施形態では、補償ルーチンは、第１のカメラを使用して入手された第１の画像と第２のカメラを使用して入手された第２の画像を比較し、第２の画像の少なくとも一部内の歪みを検出するステップと、第２の画像の少なくとも一部を調節し、検出された歪みを補償するステップとを含んでもよい。

いくつかの実施形態では、第１のカメラを使用して入手された第１の画像と第２のカメラを使用して入手された第２の画像を比較するステップは、第１のカメラによって取得される第１の画像と第２のカメラによって取得される第２の画像との間のライン毎比較を実施するステップを含んでもよい。

いくつかの実施形態では、プロセッサはさらに、電力節約基準または世界モデル完全性基準のうちの少なくとも１つに基づいて、第２のカメラを無効にする、または第２のカメラのフレームレートを変調させるように構成されてもよい。

いくつかの実施形態では、第１のカメラまたは第２のカメラのうちの少なくとも１つは、プレノプティックカメラを備えてもよく、プロセッサはさらに、部分的に、第１のカメラまたは第２のカメラのうちの少なくとも１つによって入手されたライトフィールド情報を使用して、世界モデルを作成するように構成されてもよい。

いくつかの実施形態では、第１のカメラは、プレノプティックカメラを備えてもよく、プロセッサはさらに、プレノプティックカメラを使用して入手された深度情報を使用して、世界モデル更新ルーチンを実施するように構成されてもよい。

いくつかの実施形態では、プロセッサは、ヘッドセットに機械的に結合されてもよい。

いくつかの実施形態では、ヘッドセットは、プロセッサに機械的に結合される、ディスプレイデバイスを備えてもよい。

いくつかの実施形態では、ローカルデータ処理モジュールが、プロセッサを備えてもよく、ローカルデータ処理モジュールは、通信リンクを通して、ディスプレイデバイスに動作可能に結合され、ヘッドセットは、ディスプレイデバイスを備える。

いくつかの実施形態によると、ウェアラブルディスプレイシステムを使用して、世界モデルを作成する方法であって、ウェアラブルディスプレイシステムは、グローバルシャッタを伴う、１つの第１のカメラと、ロールシャッタを伴う、１つの第２のカメラとを備える、ヘッドセットであって、第１のカメラおよび第２のカメラは、中心視野の重複ビューを提供するように位置付けられる、ヘッドセットと、第１のカメラおよび第２のカメラに動作可能に結合される、プロセッサとを備え、本方法は、プロセッサを使用して、ロールシャッタ画像歪曲のために、補償ルーチンを実施し、第２のカメラを使用して入手された画像を調節するステップと、部分的に、第１のカメラを使用して入手された画像から立体視的に決定される、深度情報と、調節された画像とを使用して、世界モデルを作成するステップとを含む、方法が、提供されてもよい。

いくつかの実施形態によると、ウェアラブルディスプレイシステムであって、中心視野の重複ビューを提供するように位置付けられる、グレースケールカメラおよびカラーカメラを有する、ヘッドセットと、グレースケールカメラおよびカラーカメラに動作可能に結合され、グレースケールカメラおよびカラーカメラによって入手された画像から立体視的に決定される、第１の深度情報を使用して、世界モデルを作成し、グレースケールカメラおよび世界モデルを使用して、頭部姿勢を追跡するように構成される、プロセッサとを備える、ウェアラブルディスプレイシステムが、提供されてもよい。

いくつかの実施形態によると、ウェアラブルディスプレイシステムを使用して、頭部姿勢を追跡する方法であって、ウェアラブルディスプレイシステムは、中心視野の重複ビューを提供するように位置付けられる、グレースケールカメラおよびカラーカメラを有する、ヘッドセットと、グレースケールカメラおよびカラーカメラに動作可能に結合される、プロセッサとを備え、本方法は、プロセッサを使用して、グレースケールカメラおよびカラーカメラによって入手された画像から立体視的に決定される、第１の深度情報を使用して、世界モデルを作成するステップと、グレースケールカメラおよび世界モデルを使用して、頭部姿勢を追跡するステップとを含む、方法が、提供されてもよい。

いくつかの実施形態によると、ウェアラブルディスプレイシステムであって、フレームと、フレームに機械的に結合される、第１のカメラと、フレームに機械的に結合される、第２のカメラとであって、第１のカメラおよび第２のカメラは、第１のカメラおよび第２のカメラの両方と関連付けられる、中心視野を提供するように位置付けられ、第１のカメラおよび第２のカメラのうちの少なくとも１つは、プレノプティックカメラを備える、第１のカメラおよび第２のカメラと、第１のカメラおよび第２のカメラに動作可能に結合され、オブジェクトが中心視野内にあるかどうかを決定し、オブジェクトが中心視野内にあるとき、オブジェクトが深度基準を充足させるかどうかを決定し、追跡されるオブジェクトが、中心視野内にあって、深度基準を充足させないとき、第１のカメラおよび第２のカメラによって入手された画像から立体視的に決定される、深度情報を使用して、オブジェクトを追跡し、追跡されるオブジェクトが、中心視野内にあって、深度基準を充足させるとき、第１のカメラまたは第２のカメラのうちの１つによって入手されたライトフィールド情報から決定される、深度情報を使用して、オブジェクトを追跡するように構成される、プロセッサとを備える、ウェアラブルディスプレイシステムが、提供されてもよい。

いくつかの実施形態によると、ウェアラブルディスプレイシステムを使用して、オブジェクトを追跡する方法であって、ウェアラブルディスプレイシステムは、フレームと、フレームに機械的に結合される、第１のカメラと、フレームに機械的に結合される、第２のカメラとであって、第１のカメラおよび第２のカメラは、第１のカメラおよび第２のカメラの両方と関連付けられる、中心視野を提供するように位置付けられ、第１のカメラおよび第２のカメラのうちの少なくとも１つは、プレノプティックカメラを備える、第１のカメラおよび第２のカメラと、第１のカメラおよび第２のカメラに動作可能に結合される、プロセッサとを備え、本方法は、プロセッサを使用して、オブジェクトが中心視野内にあるかどうかを決定するステップと、オブジェクトが中心視野内にあるとき、オブジェクトが深度基準を充足させるかどうかを決定するステップと、追跡されるオブジェクトが、中心視野内にあって、深度基準を充足させないとき、第１のカメラおよび第２のカメラによって入手された画像から立体視的に決定される、深度情報を使用して、オブジェクトを追跡するステップと、追跡されるオブジェクトが、中心視野内にあって、深度基準を充足させるとき、第１のカメラまたは第２のカメラのうちの１つによって入手されたライトフィールド情報から決定される、深度情報を使用して、オブジェクトを追跡するステップとを含む、方法が、提供される。

いくつかの実施形態によると、ウェアラブルディスプレイシステムであって、フレームと、フレームに機械的に結合される、２つのカメラであって、第１の視野を有する、グローバルシャッタを伴う、第１のカメラと、第２の視野を有する、ロールシャッタを伴う、第２のカメラとを備え、第１のカメラおよび第２のカメラは、第１の視野が第２の視野と重複する、中心視野と、中心視野の外側の周辺視野とを提供するように位置付けられる、２つのカメラと、第１のカメラおよび第２のカメラに動作可能に結合される、プロセッサとを備える、ウェアラブルディスプレイシステムが、提供されてもよい。

前述の説明は、例証として提供され、限定することを意図するものではない。

添付の図面は、縮尺通りに描かれることを意図していない。図面では、種々の図に図示される、各同じまたはほぼ同じコンポーネントは、同様の数字で表される。明確性の目的のために、全てのコンポーネントが、全ての図面において標識されているわけではない。

図１は、いくつかの実施形態による、簡略化された拡張現実（ＡＲ）場面の実施例を図示する、スケッチである。

図２は、いくつかの実施形態による、ＡＲディスプレイシステムの実施例を図示する、概略図である。

図３Ａは、いくつかの実施形態による、ユーザが物理的世界環境を通して移動するにつれてＡＲコンテンツをレンダリングする、ＡＲディスプレイシステムを装着しているユーザを図示する、概略図である。

図３Ｂは、いくつかの実施形態による、視認光学系アセンブリおよび付帯コンポーネントを図示する、概略図である。

図４は、いくつかの実施形態による、画像感知システムを図示する、概略図である。

図５Ａは、いくつかの実施形態による、図４におけるピクセルセルを図示する、概略図である。

図５Ｂは、いくつかの実施形態による、図５Ａのピクセルセルの出力イベントを図示する、概略図である。

図６は、いくつかの実施形態による、画像センサを図示する、概略図である。

図７は、いくつかの実施形態による、画像センサを図示する、概略図である。

図８は、いくつかの実施形態による、画像センサを図示する、概略図である。

図９は、いくつかの実施形態による、画像感知のための方法の簡略化されたフローチャートである。

図１０は、いくつかの実施形態による、図９のパッチ識別の行為の簡略化されたフローチャートである。

図１１は、いくつかの実施形態による、図９のパッチ軌道推定の行為の簡略化されたフローチャートである。

図１２は、いくつかの実施形態による、１つの視点に対する図１１のパッチ軌道推定を図示する、概略図である。

図１３は、いくつかの実施形態による、視点変化に対する図１１のパッチ軌道推定を図示する、概略図である。

図１４は、いくつかの実施形態による、画像感知システムを図示する、概略図である。

図１５は、いくつかの実施形態による、図１４におけるピクセルセルを図示する、概略図である。

図１６は、いくつかの実施形態による、ピクセルサブアレイの概略図である。

図１７Ａは、いくつかの実施形態による、整合されている、２つのスタックされた透過性回折マスク（ＴＤＭ）の形態における、到着角／強度コンバータを伴う、プレノプティックデバイスの断面図である。

図１７Ｂは、いくつかの実施形態による、整合されていない、２つのスタックされたＴＤＭの形態における、到着角／強度コンバータを伴う、プレノプティックデバイスの断面図である。

図１８Ａは、いくつかの実施形態による、カラーピクセルセルと、到着角ピクセルセルとを伴う、ピクセルサブアレイである。

図１８Ｂは、いくつかの実施形態による、カラーピクセルセルと、到着角ピクセルセルとを伴う、ピクセルサブアレイである。

図１８Ｃは、いくつかの実施形態による、白色ピクセルセルと、到着角ピクセルセルとを伴う、ピクセルサブアレイである。

図１９Ａは、いくつかの実施形態による、単一ＴＤＭを伴う、光検出器アレイの上面図である。

図１９Ｂは、いくつかの実施形態による、単一ＴＤＭを伴う、光検出器アレイの側面図である。

図２０Ａは、いくつかの実施形態による、ＴＤＭの形態における、複数の到着角／強度コンバータを伴う、光検出器アレイの上面図である。

図２０Ｂは、いくつかの実施形態による、複数のＴＤＭを伴う、光検出器アレイの側面図である。

図２０Ｃは、いくつかの実施形態による、複数のＴＤＭを伴う、光検出器アレイの側面図である。

図２１は、いくつかの実施形態による、２つのカメラと、付帯コンポーネントとを含む、ヘッドセットを例証する概略図である。

図２２は、いくつかの実施形態による、較正ルーチンの簡略化されたフローチャートである。

図２３Ａ－２３Ｃは、いくつかの実施形態による、図２１のヘッドセットと関連付けられる、例示的視野略図を描写する。図２３Ａ－２３Ｃは、いくつかの実施形態による、図２１のヘッドセットと関連付けられる、例示的視野略図を描写する。図２３Ａ－２３Ｃは、いくつかの実施形態による、図２１のヘッドセットと関連付けられる、例示的視野略図を描写する。

図２４は、いくつかの実施形態による、パス可能世界モデルを作成および更新するための方法の簡略化されたフローチャートである。

図２５は、いくつかの実施形態による、頭部姿勢追跡のための方法の簡略化されたフローチャートである。

図２６は、いくつかの実施形態による、オブジェクト追跡のための方法の簡略化されたフローチャートである。

図２７は、いくつかの実施形態による、手追跡のプロセスの簡略化されたフローチャートである。

本発明者らは、ウェアラブルＸＲディスプレイシステムのための、そのようなシステムの享受性および有用性を向上させる、設計および動作技法を認識し、その真価を認めた。これらの設計および／または動作技法は、限定された数のカメラを使用して、手の追跡、頭部姿勢の追跡、および世界の再構築を含む、複数の機能を実施するための情報を取得することを可能にし得、これは、仮想オブジェクトを、それらが物理的オブジェクトと現実的に相互作用するように現れるように現実的にレンダリングするために使用されてもよい。ウェアラブルクロスリアリティディスプレイシステムは、軽量であり得、動作時、低電力を消費し得る。本システムは、特定の構成のセンサを使用して、短待ち時間を伴って、物理的世界内の物理的オブジェクトについての画像情報を入手し得る。本システムは、表示されるＸＲ環境の正確度および／または現実性を改良するために、種々のルーチンを実施してもよい。そのようなルーチンは、軽量フレームが、使用の間、歪曲する場合でも、立体視深度測定の正確度を改良するための較正ルーチンと、ユーザの周囲の物理的世界のモデル内の不完全な深度情報を検出し、それに対処するためのルーチンとを含んでもよい。

既知のＸＲシステムヘッドセットの重量は、ユーザ享受を限定し得る。そのようなＸＲヘッドセットは、３４０グラムを上回る重量であり得る（時として、７００グラムを上回ることさえある）。眼鏡は、対照的に、５０グラム未満の重量であり得る。そのような比較的に重いヘッドセットを長時間にわたって装着することは、ユーザを疲労させ、または彼らの注意を逸らし、所望の没入型のＸＲ体験から注意を逸らさせ得る。しかしながら、本発明者らは、ヘッドセット重量を低減させる、いくつかの設計がまた、ヘッドセット柔軟性を増加させ、軽量ヘッドセットを、使用の間または経時的に、センサ位置または配向の変化を受けやすくし得ることを認識および理解している。例えば、ユーザが、カメラセンサを含む、軽量ヘッドセットを装着する際、これらのカメラセンサの相対的配向は、偏移し得る。立体視結像のために使用される、カメラの間隔における変動は、それらのヘッドセットが、相互に対して既知の位置関係を有するカメラに依存する、正確な立体視情報を入手する能力に影響を及ぼし得る。故に、ヘッドセットが装着される際に繰り返され得る、較正ルーチンは、立体視結像技法を使用して、ヘッドセットの装着者の周囲の世界についての情報を正確に入手し得る、軽量ヘッドセットを可能にし得る。

ＸＲシステムに物理的世界内のオブジェクトについての情報を入手するためのコンポーネントを装備する必要性はまた、これらのシステムの有用性およびユーザ享受を限定し得る。入手された情報は、コンピュータ生成仮想オブジェクトを、適切な位置に、物理的オブジェクトに対する適切な外観を伴って、現実的に提示するために使用されるが、情報を入手する必要性は、ＸＲシステムのサイズ、電力消費、および現実性に関する限界を課す。

ＸＲシステムは、例えば、ユーザによって装着されるセンサを使用して、ユーザの視野内の物理的世界オブジェクトの位置についての情報を含む、ユーザの周囲の物理的世界内のオブジェクトについての情報を取得し得る。物理的オブジェクトが、ユーザの視野の中に入る、またはそこから退出する、またはユーザの視野内の物理的オブジェクトの位置が変化するように、オブジェクトが物理的世界内で移動するか、またはユーザが物理的世界に対するその姿勢を変化させるかのいずれかの結果として、オブジェクトがユーザの視野に対して移動し得るため、課題が生じる。現実的ＸＲディスプレイを提示するために、物理的世界内の物理的オブジェクトのモデルは、これらの変化を捕捉するために十分に頻繁に更新され、十分に短待ち時間で処理され、その情報に基づいて表示される仮想オブジェクトが、仮想オブジェクトが表示されるにつれて、物理的オブジェクトに対する適切な位置および外観を有するであろうように、レンダリングを含む、完全待ち時間経路を網羅するように将来的に正確に予測されなければならない。そうでなければ、仮想オブジェクトは、物理的オブジェクトと整合されずに現れ、物理的および仮想オブジェクトを含む、組み合わせられる場面は、現実的に現れないであろう。例えば、仮想オブジェクトは、それらが、物理的オブジェクト上に静置するのではなく、空間中に浮遊しているかのように見え得る、または物理的オブジェクトに対して周囲でバウンスするように現れ得る。視覚的追跡の誤差は、特に、ユーザが、高速で移動しているとき、場面内に著しい進展が存在する場合、増幅される。

そのような問題は、新しいデータを高レートで入手する、センサによって回避され得る。しかしながら、そのようなセンサによって消費された電力は、より大きいバッテリの必要性につながる、システムの重量を増加させる、またはそのようなシステムの使用の長さを限定し得る。同様に、高レートで生成されたデータを処理するために必要とされるプロセッサは、バッテリを枯渇させ、付加的重量をウェアラブルシステムに追加させ、そのようなシステムの有用性または享受性をさらに限定し得る。既知のアプローチは、例えば、十分な視覚的詳細を捕捉するためのより高い分解能で、増加された一時的分解能のためのより高いフレームレートセンサを動作させることである。代替ソリューションは、本ソリューションを、直接、センサに対する物理的オブジェクトの位置を示し得る、ＩＲ飛行時間センサで補完し得、短待ち時間をもたらす、単純処理が、本情報を使用して、仮想オブジェクトを表示する際に実施され得る。しかしながら、そのようなセンサは、特に、それらが太陽光下で動作する場合、実質的量の電力を消費する。

本発明者らは、ＸＲシステムが、較正ルーチンを繰り返し実施することによって、使用の間または経時的センサ位置または配向の変化に対処し得ることを認識し、その真価を認めた。本較正ルーチンは、ヘッドセット内に含まれるセンサの現在の相対的分離および配向を決定し得る。ウェアラブルＸＲシステムは、次いで、立体視深度情報を算出するとき、ヘッドセットセンサの本相対的分離および配向を考慮し得る。そのような較正能力を用いることで、ＸＲシステムは、能動深度センサを用いずに、または能動深度感知の随時の使用のみを用いて、物理的世界内のオブジェクトまでの距離を示す、深度情報を正確に入手し得る。能動深度感知は、実質的電力を消費し得るため、能動深度感知を低減または排除することは、より少ない電力を引き出す、デバイスを可能にし、これは、バッテリを再充電せずに、本デバイスの動作時間を増加させる、またはバッテリのサイズを低減させる結果として、本デバイスのサイズを低減させることができる。

本発明者らはまた、画像センサとそれらのセンサからの画像情報を処理するための適切な技法の適切な組み合わせによって、ＸＲシステムが、使用されるセンサの数を低減させ、リソース集約的センサを排除する、無効にする、または選択的にアクティブ化し、および／またはセンサの全体的使用量を低減させることによって、低減された電力消費でも、物理的オブジェクトについての情報を短待ち時間で入手し得ることを認識し、その真価を認めた。具体的実施例として、ＸＲシステムは、２つのカメラを伴う、ヘッドセットを含んでもよい。カメラの第１のものは、グレースケール画像を生産してもよく、グローバルシャッタを有してもよい。これらのグレースケール画像は、いくつかのインスタンスでは、３分の１未満のビット数で表される、類似分解能のカラー画像より小さいサイズであってもよい。本グレースケールカメラは、類似分解能のカラーカメラより少ない電力を要求し得る。カメラの第２のものは、ＲＧＢカメラであってもよい。ウェアラブルクロスリアリティディスプレイシステムは、本カメラを選択的に使用し、ユーザのＸＲ体験を損なわせることなく、電力消費を低減させ、バッテリ寿命を延長させるように構成されることができる。

本明細書に説明される技法は、多くのタイプのデバイスとともに、または別個に、多くのタイプの場面のために、使用されてもよい。図１は、そのような場面を図示する。図２、３Ａ、および３Ｂは、本明細書に説明される技法に従って動作し得る、１つ以上のプロセッサと、メモリと、センサと、ユーザインターフェースとを含む、例示的ＡＲシステムを図示する。

図１を参照すると、ＡＲ場面４が、描写されており、ＡＲシステムのユーザには、人々、木々、背景における建物、およびコンクリートプラットフォーム８を特徴とする、物理的世界の公園状設定６が見える。これらの物理的オブジェクトに加え、ＡＲ技術のユーザはまた、ここでは、物理的世界コンクリートプラットフォーム８上に立っている、ロボット像１０として図示される、仮想オブジェクトと、マルハナバチの擬人化のように見える、飛んでいる漫画のようなアバタキャラクタ２とが「見える」と知覚するが、これらの要素（例えば、アバタキャラクタ２およびロボット像１０）は、物理的世界内には存在しない。ヒト視知覚および神経系の著しい複雑性に起因して、他の仮想または物理的世界の画像要素の中で仮想画像要素の快適で、自然な感覚で、かつ豊かな提示を促進する、ＡＲシステムを生産することは、困難である。

そのような場面は、ユーザの周囲の実際の環境を表す画像情報を提示し、実際の環境内にはない、仮想オブジェクトを表す情報にオーバーレイすることによって、ユーザに提示され得る。ＡＲシステムでは、ユーザは、物理的世界内のオブジェクトを見ることが可能であり得、ＡＲシステムは、それらが、適切な場所に、仮想オブジェクトが物理的世界内のオブジェクトと共存するように現れる、適切な視覚的特性を伴って、現れるように、仮想オブジェクトをレンダリングする、情報を提供する。ＡＲシステムでは、例えば、ユーザは、ユーザに物理的世界内のオブジェクトが見え得るように、透明画面を通して見ることになり得る。ＡＲシステムは、ユーザに物理的世界および仮想オブジェクトの両方が見えるように、仮想オブジェクトをその画面上にレンダリングし得る。いくつかの実施形態では、画面は、一対のゴーグルまたは眼鏡のように、ユーザによって装着されてもよい。

場面は、視覚、聴覚、および／または触覚を含む、１つ以上のユーザの感覚を刺激し得る、ユーザインターフェースを含む、複数のコンポーネントを含む、システムを介して、ユーザに提示されてもよい。加えて、本システムは、場面の物理的部分内のユーザの位置および／または運動を含む、場面の物理的部分のパラメータを測定し得る、１つ以上のセンサを含んでもよい。さらに、本システムは、メモリ等の関連付けられるコンピュータハードウェアとともに、１つ以上のコンピューティングデバイスを含んでもよい。これらのコンポーネントは、単一デバイスの中に統合される、またはさらに、複数の相互接続されるデバイスを横断して分散されてもよい。いくつかの実施形態では、これらのコンポーネントのいくつかまたは全ては、ウェアラブルデバイスの中に統合されてもよい。

いくつかの実施形態では、ＡＲ体験が、ウェアラブルディスプレイシステムを通して、ユーザに提供されてもよい。図２は、ウェアラブルディスプレイシステム８０（以降、「システム８０」と称される）の実施例を図示する。システム８０は、頭部搭載型ディスプレイデバイス６２（以降、「ディスプレイデバイス６２」と称される）と、ディスプレイデバイス６２の機能をサポートするための種々の機械的および電子的モジュールおよびシステムとを含む。ディスプレイデバイス６２は、フレーム６４に結合されてもよく、これは、ディスプレイシステムのユーザまたは視認者６０（以降、「ユーザ６０」と称される）によって装着可能であって、ディスプレイデバイス６２をユーザの眼６０の正面に位置付けるように構成される。種々の実施形態によると、ディスプレイデバイス６２は、シーケンシャルディスプレイであってもよい。ディスプレイデバイス６２は、単眼または両眼であってもよい。

いくつかの実施形態では、スピーカ６６が、フレーム６４に結合され、ユーザ６０の外耳道に近接して位置付けられる。いくつかの実施形態では、示されない、別のスピーカが、ユーザ６０の別の外耳道に隣接して位置付けられ、ステレオ／調節可能音制御を提供する。

システム８０は、ローカルデータ処理モジュール７０を含んでもよい。ローカルデータ処理モジュール７０は、有線導線または無線コネクティビティ等によって、通信リンク６８を通して、ディスプレイデバイス６２に動作可能に結合されてもよい。ローカルデータ処理モジュール７０は、フレーム６４に固定して取り付けられる、ユーザ６０によって装着されるヘルメットまたは帽子に固定して取り付けられる、ヘッドホンに内蔵される、または別様に、ユーザ６０に除去可能に取り付けられる（例えば、リュック式構成において、ベルト結合式構成において）等、種々の構成において搭載されてもよい。いくつかの実施形態では、ローカルデータ処理モジュール７０は、ローカルデータ処理モジュール７０のコンポーネントが、ディスプレイデバイス６２内に統合される、またはそれに対してディスプレイデバイス６２が、広域ネットワークを通した無線通信を通して等、結合される、遠隔サーバまたは他のコンポーネントの内に実装され得るため、存在しなくてもよい。

ローカルデータ処理モジュール７０は、プロセッサおよび不揮発性メモリ（例えば、フラッシュメモリ）等のデジタルメモリを含んでもよく、その両方とも、データの処理、キャッシュ、および記憶を補助するために利用されてもよい。データは、ａ）センサ（例えば、フレーム６４に動作可能に結合される、または別様に、画像捕捉デバイス（カメラ等）、マイクロホン、慣性測定ユニット、加速度計、コンパス、ＧＰＳユニット、無線デバイス、および／またはジャイロスコープ等のユーザ６０に取り付けられ得る）から捕捉されるデータ、および／またはｂ）可能性として、処理または読出後にディスプレイデバイス６２への通過のために、遠隔処理モジュール７２および／または遠隔データリポジトリ７４を使用して入手および／または処理される、データを含んでもよい。ローカルデータ処理モジュール７０は、それぞれ、これらの遠隔モジュール７２、７４が、相互に動作可能に結合され、リソースとしてローカル処理およびデータモジュール７０に利用可能であるように、有線または無線通信リンク等を介して、通信リンク７６、７８によって、遠隔処理モジュール７２および遠隔データリポジトリ７４に動作可能に結合されてもよい。

いくつかの実施形態では、ローカルデータ処理モジュール７０は、データおよび／または画像情報を分析および処理するように構成される、１つ以上のプロセッサ（例えば、中央処理ユニットおよび／または１つ以上のグラフィック処理ユニット（ＧＰＵ））を含んでもよい。いくつかの実施形態では、遠隔データリポジトリ７４は、デジタルデータ記憶設備を含んでもよく、これは、インターネットまたは「クラウド」リソース構成における他のネットワーキング構成を通して利用可能であってもよい。いくつかの実施形態では、全てのデータが、記憶され、全ての算出が、ローカルデータ処理モジュール７０において実施され、遠隔モジュールからの完全に自律的な使用を可能にする。

いくつかの実施形態では、ローカルデータ処理モジュール７０は、バッテリ８２に動作可能に結合される。いくつかの実施形態では、バッテリ８２は、市販のバッテリ等のリムーバブル電源である。他の実施形態では、バッテリ８２は、リチウムイオンバッテリである。いくつかの実施形態では、バッテリ８２は、システム８０の非動作時間の間にユーザ６０によって充電可能な内部リチウムイオンバッテリと、ユーザ６０が、電源に繋ぎ、リチウムイオンバッテリを充電する必要なく、またはシステム８０をシャットオフし、バッテリを交換する必要なく、より長い時間周期にわたってシステム８０を動作させ得るように、リムーバブルバッテリとの両方を含む。

図３Ａは、ユーザ３０が物理的世界環境３２（以降、「環境３２」と称される）を通して移動するにつれて、ＡＲコンテンツをレンダリングする、ＡＲディスプレイシステムを装着している、ユーザ３０を図示する。ユーザ３０は、ＡＲディスプレイシステムを位置３４に位置付け、ＡＲディスプレイシステムは、位置３４に対するパス可能世界（例えば、物理的世界内の実オブジェクトの変化に伴って記憶および更新され得る、物理的世界内の実オブジェクトのデジタル表現）の周囲情報を記録する。位置３４はそれぞれさらに、環境３２に関連する「姿勢」および／またはマッピングされた特徴または指向性オーディオ入力と関連付けられ得る。ＡＲディスプレイシステムをその頭部上に装着しているユーザは、特定の方向に眼を向け、その頭部を傾斜させ、環境に対するシステムの頭部姿勢を作成し得る。各位置および／または同一位置内の姿勢では、ＡＲディスプレイシステム上のセンサは、環境３２についての異なる情報を捕捉し得る。故に、位置３４において収集された情報は、データ入力３６に集約され、少なくとも、例えば、図２の遠隔処理モジュール７２上で処理することによって実装され得る、パス可能世界モジュール３８によって、処理され得る。

パス可能世界モジュール３８は、少なくとも部分的に、データ入力３６から決定されるように、ＡＲコンテンツ４０が物理的世界に関連して設置され得る場所および方法を決定する。ＡＲコンテンツは、ユーザにＡＲコンテンツおよび物理的世界の両方が見え得るような方法において、ＡＲコンテンツを提示することによって、物理的世界内に「設置」される。そのようなインターフェースは、例えば、ユーザに透けて見え、物理的世界を視認し得、仮想オブジェクトがユーザの視野内の制御された場所に現れるように制御され得る、眼鏡を用いて、作成されてもよい。ＡＲコンテンツは、物理的世界内のオブジェクトと相互作用するかのようにレンダリングされる。ユーザインターフェースは、物理的世界内のオブジェクトのユーザのビューが、ＡＲコンテンツが、適切なとき、それらのオブジェクトのユーザのビューを不明瞭にする、外観を作成するように隠され得るようなものである。例えば、ＡＲコンテンツは、環境３２内の要素４２（例えば、テーブル）の一部を適切に選択し、その要素４２上に静置している、または別様に、それと相互作用するかのように成形および位置付けられる、ＡＲコンテンツ４０を表示および表示することによって、設置されてもよい。ＡＲコンテンツはまた、まだ視野４４内にない構造内に、または物理的世界のマッピングされたメッシュモデル４６に対して、設置されてもよい。

描写されるように、要素４２は、固定されているかのように取り扱われ、パス可能世界モジュール３８内に記憶され得る、物理的世界内の複数の要素であり得るものの実施例である。いったんパス可能世界モジュール３８内に記憶されると、それらの固定要素についての情報は、ユーザ３０が、ユーザ３０にそれが見える度に、システムが固定要素４２にマッピングする必要なく、コンテンツを固定要素４２上で知覚し得るように、情報をユーザに提示するために使用されてもよい。固定要素４２は、したがって、前のモデル化セッションからマッピングされたメッシュモデルである、または別個のユーザから決定されるが、但し、複数のユーザによる将来的参照のためにパス可能世界モジュール３８上に記憶され得る。したがって、パス可能世界モジュール３８は、環境３２を以前にマッピングされた環境から認識し、最初に、ユーザ３０のデバイスが環境３２をマッピングすることなく、ＡＲコンテンツを表示し、算出プロセスおよびサイクルを節約し、任意のレンダリングされたＡＲコンテンツの待ち時間を回避し得る。

同様に、物理的世界のマッピングされたメッシュモデル４６は、ＡＲディスプレイシステムによって作成されることができ、ＡＲコンテンツ４０と相互作用し、それを表示するための適切な表面およびメトリックが、再マップまたはモデル化する必要なく、ユーザ３０または他のユーザによる将来的読出のために、マッピングされ、パス可能世界モジュール３８内に記憶されることができる。いくつかの実施形態では、データ入力３６は、パス可能世界モジュール３８に、１つ以上の固定要素のうちのどの固定要素４２が利用可能か、どのＡＲコンテンツ４０が固定要素４２上に最後に設置されたか、およびその同一コンテンツを表示すべきかどうか（そのようなＡＲコンテンツは、ユーザが特定のパス可能世界モデルを視認しているかどうかにかかわらず、「持続的」コンテンツである）を示すための地理的場所、ユーザ識別、および現在のアクティビティ等の入力である。

オブジェクトが固定されるべきと見なされる、実施形態でも、パス可能世界モジュール３８は、物理的世界の変化の可能性を考慮するために、随時、更新されてもよい。固定されるオブジェクトのモデルは、非常に低周波数で更新されてもよい。物理的世界内の他のオブジェクトは、移動している、または別様に、固定されると見なされなくてもよい。ＡＲ場面を現実的感覚を伴ってレンダリングするために、ＡＲシステムは、固定されるオブジェクトを更新するために使用されるものよりはるかに高い周波数で、これらの非固定オブジェクトの位置を更新してもよい。物理的世界内のオブジェクトの全ての正確な追跡を可能にするために、ＡＲシステムは、１つ以上の画像センサを含む、複数のセンサからの情報を引き出してもよい。

図３Ｂは、視認光学系アセンブリ４８と、付帯する随意のコンポーネントとの概略図である。具体的構成は、下記の図２１に説明される。ユーザの眼４９に対して配向されると、いくつかの実施形態では、２つの眼追跡カメラ５０は、眼形状、眼瞼オクルージョン、瞳孔方向、およびユーザの眼４９上の閃光等のユーザの眼４９のメトリックを検出する。いくつかの実施形態では、センサのうちの１つは、飛行時間センサ等の深度センサ５１であって、信号を世界に放出し、近隣のオブジェクトからのそれらの信号の反射を検出し、所与のオブジェクトまでの距離を決定してもよい。深度センサは、例えば、オブジェクトが、それらのオブジェクトの運動またはユーザの姿勢の変化のいずれかの結果として、ユーザの視野に進入したかどうかを迅速に決定し得る。しかしながら、ユーザの視野内のオブジェクトの位置についての情報が、代替として、または加えて、他のセンサを用いて収集されてもよい。いくつかの実施形態では、世界カメラ５２は、周辺視野より大きいビューを記録し、環境３２をマッピングし、ＡＲコンテンツに影響を及ぼし得る、入力を検出する。いくつかの実施形態では、世界カメラ５２および／またはカメラ５３は、グレースケールおよび／またはカラー画像センサであってもよく、これは、グレースケールおよび／またはカラー画像フレームを、固定された時間インターバルにおいて出力してもよい。カメラ５３はさらに、ユーザの視野内の物理的世界画像を具体的時間に捕捉してもよい。フレームベースの画像センサのピクセルは、その値が不変である場合でも、反復的にサンプリングされてもよい。世界カメラ５２、カメラ５３、および深度センサ５１はそれぞれ、５４、５５、および５６の個別の視野を有し、図３Ａに描写される物理的世界環境３２等の物理的世界場面からのデータを収集および記録する。

慣性測定ユニット５７は、視認光学系アセンブリ４８の移動および／または配向を決定してもよい。いくつかの実施形態では、各コンポーネントは、少なくとも１つの他のコンポーネントに動作可能に結合される。例えば、深度センサ５１は、眼追跡カメラ５０に動作可能に結合され、ユーザの眼４９が見ている、物理的世界内の点および／または領域の実際の距離を確認してもよい。

視認光学系アセンブリ４８は、図３Ｂに図示されるコンポーネントのうちのいくつかを含んでもよいことを理解されたい。例えば、視認光学系アセンブリ４８は、異なる数のコンポーネントを含んでもよい。いくつかの実施形態では、例えば、視認光学系アセンブリ４８は、描写される４つの世界カメラの代わりに、１つの世界カメラ５２、２つの世界カメラ５２、またはそれよりも多くの世界カメラを含んでもよい。代替として、または加えて、カメラ５２および５３は、その完全視野の可視光画像を捕捉する必要はない。視認光学系アセンブリ４８は、他のタイプのコンポーネントを含んでもよい。いくつかの実施形態では、視認光学系アセンブリ４８は、１つ以上の動的視覚センサを含んでもよく、そのピクセルは、閾値を超える光強度の相対的変化に非同期的に応答してもよい。

いくつかの実施形態では、視認光学系アセンブリ４８は、飛行時間情報に基づく、深度センサ５１を含まなくてもよい。いくつかの実施形態では、例えば、視認光学系アセンブリ４８は、１つ以上のプレノプティックカメラを含んでもよく、そのピクセルは、光強度だけではなく、また、入射光の角度も捕捉してもよい。例えば、プレノプティックカメラは、透過性回折マスク（ＴＤＭ）でオーバーレイされた画像センサを含んでもよい。代替として、または加えて、プレノプティックカメラは、角度感知ピクセルおよび／または位相検出自動焦点ピクセル（ＰＤＡＦ）および／またはマイクロレンズアレイ（ＭＬＡ）を含有する、画像センサを含んでもよい。そのようなセンサは、深度センサ５１の代わりに、またはそれに加え、深度情報のソースとしての役割を果たし得る。

また、図３Ｂにおけるコンポーネントの構成は、実施例として図示されることを理解されたい。視認光学系アセンブリ４８は、ユーザが特定のセットのコンポーネントのために最大視野を有し得るように、任意の好適な構成を伴うコンポーネントを含んでもよい。例えば、視認光学系アセンブリ４８が、１つの世界カメラ５２を有する場合、世界カメラは、側面上の代わりに、視認光学系アセンブリの中心領域内に設置されてもよい。

視認光学系アセンブリ４８内のこれらのセンサからの情報は、システム内のプロセッサのうちの１つ以上のものに結合されてもよい。プロセッサは、ユーザに物理的世界内のオブジェクトと相互作用する仮想コンテンツを知覚させるようにレンダリングされ得る、データを生成してもよい。そのレンダリングは、物理的および仮想オブジェクトの両方を描写する画像データを生成することを含む、任意の好適な方法で実装されてもよい。他の実施形態では、物理的および仮想コンテンツは、ユーザがそれを通して物理的世界を見る、ディスプレイデバイスの不透明度を変調させることによって、１つの場面内に描写されてもよい。不透明度は、仮想オブジェクトの外観を作成し、また、ユーザに、仮想オブジェクトによってオクルードされる、物理的世界内のオブジェクトが見えないように遮断するように、制御されてもよい。いくつかの実施形態では、画像データは、ユーザインターフェースを通して視認され得る、物理的世界と現実的に相互作用するように修正され得る、仮想コンテンツのみを含んでもよい（例えば、コンテンツをクリッピングし、オクルージョンを考慮する）。コンテンツがユーザに提示される方法にかかわらず、物理的世界のモデルは、仮想オブジェクトの形状、位置、運動、および可視性を含む、物理的オブジェクトによって影響され得る、仮想オブジェクトの特性が、正しく算出され得るように使用されてもよい。

物理的世界のモデルは、ユーザのウェアラブルデバイス上のセンサから収集されたデータから作成されてもよい。いくつかの実施形態では、モデルは、ユーザの全てから遠隔の（かつ「クラウド内」にあり得る）コンピューティングデバイス内に集約され得る、複数のユーザによって収集されたデータから作成されてもよい。

いくつかの実施形態では、センサのうちの少なくとも１つは、コンパクトかつ低電力のコンポーネントを使用して、短待ち時間を伴って、高周波数で、場面内の物理的オブジェクト、特に、非固定オブジェクトについての情報を入手するように構成されてもよい。そのセンサは、パッチ追跡を採用して、データ出力の量を限定してもよい。

図４は、いくつかの実施形態による、画像感知システム４００を描写する。画像感知システム４００は、画像センサ４０２を含んでもよく、これは、画像アレイ４０４を含んでもよく、これは、複数のピクセルを含有してもよく、それぞれ、従来の画像センサにおけるように、光に応答する。センサ４０２はさらに、各ピクセルにアクセスするための回路網を含んでもよい。ピクセルにアクセスすることは、そのピクセルによって生成された入射光についての情報を取得することを伴い得る。代替として、または加えて、ピクセルにアクセスすることは、あるイベントの検出に応じて、出力のみを提供するようにそれを構成すること等によって、そのピクセルを制御することを伴い得る。

図示される実施形態では、画像アレイ４０４は、ピクセルの複数の行および列を伴う、アレイとして構成される。そのような実施形態では、アクセス回路網は、行アドレスエンコーダ／デコーダ４０６と、列アドレスエンコーダ／デコーダ４０８として実装されてもよい。画像センサ４０２はさらに、アクセス回路網への入力を生成し、情報が画像アレイ４０４内のピクセルから読み取られる、タイミングおよび順序を制御する、回路網を含有してもよい。図示される実施形態では、その回路網は、パッチ追跡エンジン４１０である。各行内のピクセルによって捕捉された画像情報を連続的に出力し得る、従来の画像センサと対照的に、画像センサ４０２は、規定されたパッチ内の画像情報を出力するように制御されてもよい。さらに、画像アレイに対するそれらのパッチの場所は、経時的に変化してもよい。図示される実施形態では、パッチ追跡エンジン４１０は、画像アレイアクセス情報を出力し、パッチの場所に対応する、画像アレイ４０４の部分からの画像情報の出力を制御してもよく、アクセス情報は環境内のオブジェクトの運動および／またはそれらのオブジェクトに対する画像センサの運動の推定値に基づいて、動的に変化してもよい。

いくつかの実施形態では、画像センサ４０２は、ピクセルに関する画像性質（例えば、強度）の変化が存在するときのみ、画像情報がセンサによって提供されるように、動的視覚センサ（ＤＶＳ）の機能を有してもよい。例えば、画像センサ４０２は、ピクセルのオンおよびオフ状態を定義する、１つ以上の閾値を適用してもよい。画像センサは、ピクセルが状態を変化させたことを検出し、状態を変化させた、それらのピクセルのみ、またはパッチ内のそれらのピクセルのみに関して、出力を選択的に提供してもよい。これらの出力は、アレイ内の全てのピクセルの読取の一部としてではなく、それらが検出されるにつれて、非同期的に行われてもよい。出力は、例えば、ピクセルアドレス（例えば、行および列）およびイベントのタイプ（オンまたはオフ）を含み得る、アドレス－イベント表現（ＡＥＲ）４１８の形態であってもよい。オンイベントは、個別のピクセルアドレスにおけるピクセルセルが、光強度の増加を感知することを示し得、オフイベントは、個別のピクセルアドレス内のピクセルセルが、光強度の減少を感知することを示し得る。増加または減少は、絶対レベルに対するものであってもよい、またはピクセルからの最後の出力におけるレベルに対する変化であってもよい。その変化は、例えば、固定オフセットとして、またはピクセルからの最後の出力における値のパーセンテージとして、表されてもよい。

パッチ追跡に関連するＤＶＳ技法の使用は、ＸＲシステムにおいて使用するために好適な画像センサを可能にし得る。画像センサ内で組み合わせられると、生成されるデータの量は、パッチ内にあって、イベントの出力をトリガするであろう、変化を検出する、ピクセルセルからのデータに限定され得る。

いくつかのシナリオでは、高分解能画像情報が、望ましい。しかしながら、高分解能画像情報を生成するために、百万ピクセルを上回るセルを伴う、大センサは、ＤＶＳ技法が使用されるとき、大量の画像情報を生成し得る。本発明者らは、ＤＶＳセンサが、背景内の移動または追跡されているオブジェクトの運動の結果とするもの以外の画像の変化を反映させる、多数のイベントを生産し得ることを認識および理解している。現在、ＤＶＳセンサの分解能は、生成されるイベントの数を限定するように、１ＭＢを下回るように、例えば、１２８×１２８、２４０×１８０、および３４６×２６０に限定される。そのようなセンサは、オブジェクトを追跡するための分解能を犠牲にし、例えば、手の微細な指の移動を検出しない場合がある。さらに、画像センサが、画像情報を他のフォーマットにおいて出力する場合、センサアレイの分解能を管理可能な数のイベントを出力するように限定することはまた、ＤＶＳ機能とともに、高分解能画像フレームを生成するための画像センサの使用を限定し得る。本明細書に説明されるようなセンサは、いくつかの実施形態では、最大８メガピクセルまたは１２メガピクセルを含む、ＶＧＡより高い分解能を有し得る。それでもなお、本明細書に説明されるようなパッチ追跡が、１秒あたり画像センサによって出力されるイベントの数を限定するために使用されてもよい。結果として、少なくとも２つのモードで動作する、画像センサが、有効にされてもよい。例えば、メガピクセル分解能を伴う画像センサは、追跡されている具体的パッチ内のイベントを出力する、第１のモードで動作してもよい。第２のモードでは、高分解能画像フレームまたは画像フレームの一部を出力してもよい。そのような画像センサは、システムの機能に基づいて、これらの異なるモードで動作するようにＸＲシステム内で制御されてもよい。

画像アレイ４０４は、アレイ内に配列される、複数のピクセルセル５００を含んでもよい。図５Ａは、ピクセルセル５００の実施例を描写し、これは、本実施形態では、ＤＶＳ技法を実装する、結像アレイにおいて使用するために構成される。ピクセルセル５００は、感光回路５０２と、差分回路５０６と、比較器５０８とを含んでもよい。感光回路５０２は、光ダイオードに衝打する光を測定可能電気信号に変換する、光ダイオード５０４を含んでもよい。本実施例では、変換は、電気電流Ｉに行われる。トランスコンダクタンス増幅器５１０は、光電流Ｉを電圧に変換する。その変換は、ｌｏｇＩの関数等に従って、線形または非線形であってもよい。具体的伝達関数にかかわらず、トランスコンダクタンス増幅器５１０の出力は、光ダイオード５０４において検出された光の量を示す。光ダイオードが、実施例として図示されるが、入射光に応答して測定可能出力を生産する、他の光感知コンポーネントが、光ダイオードの代わりに、または加えて、感光回路内に実装されてもよいことを理解されたい。

図５Ａの実施形態では、ピクセルの出力が十分に変化したかどうかを決定し、そのピクセルセルに関する出力をトリガするための回路網が、ピクセル自体の中に組み込まれる。本実施例では、その機能は、差分回路５０６と、比較器５０８とによって実装される。差分回路５０６は、例えば、差分回路の出力を平衡し、イベントの生成後、レベルをリセットすることによって、ピクセルセル間のＤＣ不整合を低減させるように構成されてもよい。本実施例では、差分回路５０６は、最後の出力以降の光ダイオード５０４の出力の変化を示す、出力を生産するように構成される。差分回路は、利得－Ａを有する、増幅器５１２と、ネットワーク内に接続される単一回路要素または１つ以上のコンデンサとして実装され得る、コンデンサ５１４と、リセットスイッチ５１６とを含んでもよい。

動作時、ピクセルセルは、スイッチ５１６を瞬間的に閉鎖することによって、リセットされるであろう。そのようなリセットは、回路の動作の開始時およびイベントが検出された以降、随時、生じてもよい。ピクセル５００が、リセットされると、コンデンサ５１４を横断した電圧は、トランスコンダクタンス増幅器５１０の出力から減算されると、ゼロ電圧が増幅器５１２の入力に生じるようなものとなる。スイッチ５１６が、開放すると、トランスコンダクタンス増幅器５１０の出力は、コンデンサ５１４を横断した電圧降下と組み合わせて、ゼロ電圧が増幅器５１２の入力に存在するようになるであろう。トランスコンダクタンス増幅器５１０の出力は、光ダイオード５０４に衝打する光の量の変化の結果として変化する。トランスコンダクタンス増幅器５１０の出力が、増加または減少すると、増幅器５１２の出力は、増幅器５１２の利得によって増幅された変化量だけ正または負に揺動するであろう。

比較器５０８は、イベントが生成されるかどうかと、例えば、差分回路の出力電圧Ｖと所定の閾値電圧Ｃを比較することによって、イベントの符号とを決定してもよい。いくつかの実施形態では、比較器５０８は、トランジスタを備える、２つの比較器を含んでもよく、一方の対は、増幅器５１２の出力が正の変化を示すとき動作してもよく、増加変化（オンイベント）を検出してもよく、他方の比較器は、増幅器５１２の出力が負の変化を示すときに動作してもよく、減少変化（オフイベント）を検出してもよい。しかしながら、増幅器５１２は、負の利得を有してもよいことを理解されたい。そのような実施形態では、トランスコンダクタンス増幅器５１０の出力の増加は、増幅器５１２の出力における負の電圧変化として検出され得る。同様に、正および負の電圧は、接地に対するものである、または任意の好適な基準レベルであってもよいことを理解されたい。それにかかわらず、閾値電圧Ｃの値は、トランジスタの特性（例えば、トランジスタサイズ、トランジスタ閾値電圧）によって、および／または比較器５０８に適用され得る基準電圧の値によって制御されてもよい。

図５Ｂは、ピクセルセル５００の時間ｔにわたるイベント出力（オン、オフ）の実施例を描写する。図示される実施例では、時間ｔ１において、差分回路の出力は、Ｖ１の値を有し、時間ｔ２において、差分回路の出力は、Ｖ２の値を有し、時間ｔ３において、差分回路の出力は、Ｖ３の値を有する。時間ｔ１と時間ｔ２との間では、光ダイオードは、光強度のある程度の増加を感知するが、Ｖの変化が閾値電圧Ｃの値を超えないため、ピクセルセルは、イベントを出力しない。時間ｔ２では、ピクセルセルは、Ｖ２が閾値電圧Ｃの値だけＶ１より大きいため、オンイベントを出力する。時間ｔ２と時間ｔ３との間では、光ダイオードは、光強度のある程度の減少を感知するが、Ｖの変化が閾値電圧Ｃの値を超えないため、ピクセルセルは、イベントを出力しない。時間ｔ３では、Ｖ３が閾値電圧Ｃの値だけＶ２未満であるため、ピクセルセルは、オフイベントを出力する。

各イベントは、ＡＥＲ４１８における出力をトリガし得る。出力は、例えば、イベントがオンまたはオフイベントであるかどうかのインジケーションと、その行および列等のピクセルの識別とを含んでもよい。他の情報が、代替として、または加えて、出力とともに含まれてもよい。例えば、タイムスタンプが、含まれ得、これは、後の伝送または処理のために、イベントが待ち行列に入れられる場合、有用であり得る。別の実施例として、増幅器５１０の出力における電流レベルが、含まれ得る。そのような情報は、随意に、例えば、さらなる処理が、オブジェクトの運動を検出することに加え、実施されるべきである場合、含まれ得る。

イベント出力の周波数、したがって、ピクセルセルの感度は、閾値電圧Ｃの値によって制御されてもよいことを理解されたい。例えば、イベント出力の周波数は、閾値電圧Ｃの値を増加させることによって低減される、または閾値電圧Ｃを低減させることによって増加されてもよい。また、閾値電圧Ｃは、例えば、オンイベントを検出するための比較器およびオフイベントを検出するための比較器に関する異なる基準電圧を設定することによって、オンイベントおよびオフイベントに関して異なり得ることを理解されたい。また、ピクセルセルがまた、イベントの検出を示す、符号信号の代わりに、またはそれに加え、光強度変化のサイズを示す、値を出力してもよいことを理解されたい。

図５Ａおよび５Ｂのピクセルセル５００は、いくつかの実施形態による、実施例として図示される。他の設計もまた、ピクセルセルのために好適であり得る。いくつかの実施形態では、ピクセルセルは、感光回路と、差分回路とを含むが、比較器回路を１つ以上の他のピクセルセルと共有してもよい。いくつかの実施形態では、ピクセルセルは、変化の値を計算するように構成される、回路網、例えば、ピクセルレベルにおける能動ピクセルセンサを含んでもよい。

イベントがピクセルセル毎に検出される様式にかかわらず、イベントの検出のみに応じて出力するようにピクセルを構成する能力は、非固定（すなわち、移動可能な）オブジェクトの位置のモデルを維持するために要求される、情報の量を限定するために使用されてもよい。例えば、パッチ内のピクセルは、比較的に小変化が生じるとき、閾値電圧Ｃがトリガされるように設定されてもよい。パッチ外の他のピクセルは、３または５倍等、より大きい閾値を有してもよい。いくつかの実施形態では、任意のパッチ外のピクセルに関する閾値電圧Ｃは、ピクセルが、事実上、無効にされ、変化の量にかかわらず、任意の出力を生産しないように大きく設定されてもよい。他の実施形態では、パッチ外のピクセルは、他の方法において無効にされてもよい。そのような実施形態では、閾値電圧は、全てのピクセルに関して固定されてもよいが、ピクセルは、それらがパッチ内にあるかどうかに基づいて、選択的に有効または無効にされてもよい。

さらに他の実施形態では、１つ以上のピクセルに関する閾値電圧は、画像アレイから出力されたデータの量を変調させるように、適応的に設定されてもよい。例えば、ＡＲシステムは、１秒あたりある数のイベントを処理するための処理容量を有し得る。いくつかまたは全てのピクセルに関する閾値は、出力されている１秒あたりのイベントの数が上限を超えるとき、増加されてもよい。代替として、または加えて、閾値は、１秒あたりのイベントの数が下限を下回って降下したとき、降下され、より正確な処理のために、より多くのデータを有効にし得る。１秒あたりのイベントの数は、具体的実施例として、２００～２，０００イベントであってもよい。そのようなイベントの数は、例えば、１秒あたり３千万以上のピクセル値を構成するであろう、画像センサから走査出力されるピクセル値の全ての処理と比較して、１秒あたり処理されるべきデータの数の実質的低減を構成する。そのイベントの数は、より少ないが、それでもなお、１秒あたり数万のピクセル値またはそれを上回り得る、パッチ内のピクセルのみの処理と比較して、さらなる低減である。

複数のピクセル毎に閾値電圧を有効にし、および／または設定するための制御信号が、任意の好適な方法において生成されてもよい。しかしながら、図示される実施形態では、それらの制御信号は、パッチ追跡エンジン４１０によって、または処理モジュール７２または他のプロセッサ内の処理に基づいて、設定される。

図４に戻って参照すると、画像感知システム４００は、パッチ追跡エンジン４１０が、パッチを実装するように、少なくとも、受信された入力に基づいて、有効および／または無効にされるべき画像アレイ４０４の少なくとも１つの領域を動的に選択し得るように、任意の好適なコンポーネントからの入力を受信してもよい。パッチ追跡エンジン４１０は、パッチの１つ以上のパラメータを記憶する、メモリを有する、デジタル処理回路網であってもよい。パラメータは、例えば、パッチの境界であってもよく、画像アレイの運動とパッチと関連付けられる移動可能なオブジェクトの画像の画像アレイ内の運動との間のスケール係数についての情報等の他の情報を含んでもよい。パッチ追跡エンジン４１０はまた、計算を記憶された値および入力として供給される他の測定された値上で実施するように構成される、回路網を含んでもよい。

図示される実施形態では、パッチ追跡エンジン４１０は、入力として、現在のパッチの指定を受信する。パッチは、パッチの行および列アドレスの範囲を規定すること等によって、画像アレイ４０４内のそのサイズおよび位置に基づいて指定されてもよい。そのような仕様は、物理的世界についての情報を処理する、処理モジュール７２（図２）または他のコンポーネントの出力として提供されてもよい。処理モジュール７２は、物理的世界に対する適切な外観を伴って仮想オブジェクトをレンダリングするために、例えば、物理的世界内の各移動可能なオブジェクトまたは追跡されている移動可能なオブジェクトのサブセットの現在の場所を包含するようにパッチを指定してもよい。例えば、ＡＲ場面が、仮想オブジェクトとして、移動する玩具車等の物理的オブジェクト上に平衡される、玩具人形を含むべき場合、パッチは、その玩具車を包含するように指定されてもよい。パッチは、現実的ＡＲ場面をレンダリングするために、そのオブジェクトについての最新情報を有する必要性があまり存在し得ないため、背景内で移動している別の玩具車に関しては指定され得ない。

パッチが選択される方法にかかわらず、パッチの現在の位置についての情報は、パッチ追跡エンジン４１０に供給されてもよい。いくつかの実施形態では、パッチは、パッチの場所が、単に、開始および終了行および列として規定され得るように、矩形であってもよい。他の実施形態では、パッチは、円形等の他の形状を有してもよく、パッチは、中心点および半径等によって、他の方法で規定されてもよい。

いくつかの実施形態では、軌道情報もまた、パッチについて供給されてもよい。軌道は、例えば、画像アレイ４０４の座標に対するパッチの運動を規定し得る。処理モジュール７２は、例えば、物理的世界内の移動可能なオブジェクトの運動および／または物理的世界に対する画像アレイ４０４の運動のモデルを構築してもよい。一方または両方の運動は、オブジェクトの画像が投影される、画像アレイ４０４内の場所に影響を及ぼし得るので、画像アレイ４０４内のパッチの軌道が、一方または両方に基づいて算出されてもよい。軌道は、線形、二次、三次、または他の多項式方程式のパラメータ等の任意の好適な方法で規定されてもよい。

他の実施形態では、パッチ追跡エンジン４１０は、物理的世界についての情報を提供するセンサからの入力に基づいて、パッチの場所を動的に算出してもよい。センサからの情報は、直接、センサから供給されてもよい。代替として、または加えて、センサ情報は、パッチ追跡エンジン４１０に供給される前に、物理的世界についての情報を抽出するために処理されてもよい。抽出された情報は、例えば、物理的世界に対する画像アレイ４０４の運動、画像アレイ４０４とその画像がパッチ内に該当するオブジェクトとの間の距離、または画像アレイ４０４および／またはオブジェクトが移動するにつれて、画像アレイ４０４内のパッチと物理的世界内のオブジェクトの画像を動的に整合させるために使用され得る、他の情報を含んでもよい。

入力コンポーネントの実施例は、画像センサ４１２と、慣性センサ４１４とを含んでもよい。画像センサ４１２の実施例は、眼追跡カメラ５０、深度センサ５１、世界カメラ５２、および／またはカメラ５２を含んでもよい。慣性センサ４１４の実施例は、慣性測定ユニット５７を含んでもよい。いくつかの実施形態では、入力コンポーネントは、データを比較的に高レートで提供するように選択されてもよい。慣性測定ユニット５７は、例えば、８００～１，２００測定／秒等の２００～２，０００測定／秒の出力レートを有してもよい。パッチ位置も、同様に高レートで更新されてもよい。慣性測定ユニット５７をパッチ追跡エンジン４１０への入力のソースとして使用することによって、パッチの場所は、１つの具体的実施例として、８００～１，２００回／秒、更新され得る。このように、移動可能なオブジェクトは、処理される必要があるイベントの数を限定する、比較的に小パッチを使用して、高正確度を伴って追跡され得る。そのようなアプローチは、画像センサの相対的位置の変化と移動可能なオブジェクトとの間の非常に短待ち時間につながり得、同様に、望ましいユーザ体験を提供するように、仮想オブジェクトのレンダリングの更新の短待ち時間を伴う。

いくつかのシナリオでは、パッチを用いて追跡されている移動可能なオブジェクトは、物理的世界内の定常オブジェクトであってもよい。ＡＲシステムは、例えば、物理的世界から撮影された複数の画像を分析することから定常オブジェクトを識別し、定常オブジェクトのうちの１つ以上のものの特徴を、画像センサをその上に有するウェアラブルデバイスの運動を決定するための基準点として選択してもよい。センサアレイに対するこれらの基準点の場所の頻繁かつ短待ち時間の更新は、ウェアラブルデバイスのユーザの頭部姿勢の頻繁かつ短待ち時間の算出を提供するために使用されてもよい。頭部姿勢が、ウェアラブル上のユーザインターフェースを介して、仮想オブジェクトを現実的にレンダリングするために使用され得るため、頭部姿勢の頻繁かつ短待ち時間の更新は、ＡＲシステムのユーザ体験を改良する。したがって、パッチの位置を制御する、パッチ追跡エンジン４１０への入力を有することは、１つ以上の慣性測定ユニット等の高出力レートを伴うセンサのみから生じ、ＡＲシステムの望ましいユーザ体験につながり得る。

しかしながら、いくつかの実施形態では、他の情報も、パッチ追跡エンジン４１０に供給され、それが、軌道を算出し、および／またはパッチに適用することを可能にしてもよい。本他の情報は、パス可能世界モジュール３８および／またはマッピングされたメッシュモデル４６等の記憶された情報４１６を含んでもよい。本情報は、物理的世界に対するオブジェクトの１つ以上の前の位置を、これらの前の位置の変化および／または前の位置に対する現在の位置の変化の考慮が、物理的世界内のオブジェクトの軌道を示し得、これが、次いで、画像アレイ４０４を横断してパッチの軌道にマッピングされ得るように示してもよい。物理的世界のモデル内の他の情報が、代替として、または加えて、使用されてもよい。例えば、移動可能なオブジェクトのサイズおよび／または画像アレイ４０４に対する距離または位置に関する他の情報が、そのオブジェクトと関連付けられる画像アレイ４０４を横断したパッチの場所または軌道のいずれかを算出するために使用されてもよい。

軌道が決定される様式にかかわらず、パッチ追跡エンジン４１０は、その軌道を適用し、１回／秒または８００回／秒超より高速等、高レートで画像アレイ４０４内のパッチの更新された場所を算出してもよい。レートは、いくつかの実施形態では、２，０００回／秒未満であるように、処理能力によって限定され得る。

移動可能なオブジェクトの変化を追跡するための処理は、完全未満の物理的世界を再構築することであり得ることを理解されたい。しかしながら、３０秒毎または５秒毎等、移動可能なオブジェクトの位置における更新間のインターバルより長いインターバルで、物理的世界の再構築が存在してもよい。追跡すべきオブジェクトの場所およびそれらのオブジェクトについての情報を捕捉するであろうパッチの場所は、物理的世界の再構築が存在するとき、再計算されてもよい。

図４は、パッチを動的に生成することと、そのパッチ内からの画像情報の選択的出力を制御することとの両方のための処理回路網が、アレイから出力された画像情報が選択された情報に限定されるように、直接、画像アレイ４０４を制御するように構成される、実施形態を図示する。そのような回路網は、例えば、画像アレイ４０４を格納する、同一半導体チップの中に統合されてもよい、または画像アレイ４０４のための別個のコントローラチップに統合されてもよい。しかしながら、画像アレイ４０４のための制御信号を生成する回路網は、ＸＲシステム全体を通して分散されてもよいことを理解されたい。例えば、機能のいくつかまたは全ては、処理モジュール７２内のプログラミングまたはシステム内の他のプロセッサによって実施されてもよい。

画像感知システム４００は、複数のピクセル毎に、画像情報を出力してもよい。画像情報の各ピクセルは、画像アレイ４０４のピクセルセルのうちの１つに対応し得る。画像感知システム４００から出力される画像情報は、パッチ追跡エンジン４１０によって選択された画像アレイ４０４の少なくとも１つの領域に対応する、１つ以上のパッチ毎の画像情報であり得る。いくつかの実施形態では、画像アレイ４０４の各ピクセルが、図５Ａに図示されるものと異なる構成を有するとき等、出力された画像情報内のピクセルは、光強度の変化が１つ以上のパッチ内の画像センサ４００によって検出されたピクセルを識別し得る。

いくつかの実施形態では、画像感知システム４００から出力された画像情報は、パッチ追跡エンジン４１０によって選択された画像アレイの少なくとも１つの領域に対応する、１つ以上のパッチのそれぞれ外のピクセルに関する画像情報であり得る。例えば、シカが、流れる川を伴う、物理的世界内で走っているとし得る。川の波の詳細は、着目され得ないが、画像アレイ４０２のピクセルセルをトリガし得る。パッチ追跡エンジン４１０は、川を包囲するパッチを作成し、川を包囲するパッチに対応する、画像アレイ４０２の一部を無効にしてもよい。

変化されたピクセルの識別に基づいて、さらなる処理が、実施されてもよい。例えば、変化されたピクセルによって結像されている物理的世界の部分に対応する、世界モデルの部分は、更新されてもよい。これらの更新は、他のセンサを用いて収集された情報に基づいて実施されてもよい。いくつかの実施形態では、さらなる処理が、パッチ内の複数の変化されたピクセル上で調整される、またはそれによってトリガされてもよい。例えば、更新は、いったんパッチ内の１０％またはある他の閾値量のピクセルが、変化を検出すると、実施されてもよい。

いくつかの実施形態では、他のフォーマットにおける画像情報が、画像センサから出力されてもよく、変化情報と組み合わせて使用され、世界モデルへの更新を行ってもよい。いくつかの実施形態では、画像センサから出力される画像情報のフォーマットは、ＶＲシステムの動作の間、随時、変化してもよい。いくつかの実施形態では、例えば、ピクセルセル５００は、比較器５０８内で生産されるような差分出力を生産するように動作されてもよい場合がある。増幅器５１０の出力は、他の時には、光ダイオード５０４上に入射する光の大きさを出力するように切替可能であってもよい。例えば、増幅器５１０の出力は、感知ラインに切替可能に接続されてもよく、これは、ひいては、増幅器５１０の出力の大きさに基づいて、入射光の大きさのデジタルインジケーションを提供し得る、Ａ／Ｄコンバータに接続される。

画像センサは、本構成では、ＡＲシステムの一部として動作され、大抵の場合、差分的に出力し、閾値を上回る変化が検出されるピクセルに関するイベントのみを出力する、または閾値を上回る変化が検出されるパッチ内のピクセルに関するイベントのみを出力してもよい。５～３０秒毎等、周期的に、画像アレイ内の全てのピクセルに関する情報大きさを伴う、完全画像フレームが、出力されてもよい。短待ち時間および正確な処理が、このように達成され得、差分情報は、ユーザ知覚に影響を及ぼす可能性が最も高い変化が生じた世界モデルの選択された部分を迅速に更新するために使用される一方、完全画像は、世界モデルのより大きい部分をより多く更新するために使用されてもよい。世界モデルへの完全更新は、より低速のレートにおいてのみ生じるが、モデルを更新する際の任意の遅延は、ＡＲ場面のユーザの知覚に有意義に影響を及ぼし得ない。

画像センサの出力モードは、センサが、ピクセルのいくつかまたは全てに関する強度情報およびアレイ内のピクセルのいくつかまたは全てに関する変化のインジケーションのうちの１つ以上のものを出力するように、画像センサの動作全体を通して、随時、変化されてもよい。

パッチからの画像情報が、画像アレイから出力される情報を限定することによって、画像センサから選択的に出力されることは、要件ではない。いくつかの実施形態では、画像情報は、画像アレイ内の全てのピクセルによって出力されてもよく、アレイの具体的領域についての情報のみが、画像センサから出力されてもよい。図６は、いくつかの実施形態による、画像センサ６００を描写する。画像センサ６００は、画像アレイ６０２を含んでもよい。本実施形態では、画像アレイ６０２は、ピクセル値の行および列を走査出力する、従来の画像アレイに類似してもよい。そのような画像アレイの動作は、他のコンポーネントによって適合されてもよい。画像センサ６００はさらに、パッチ追跡エンジン６０４および／または比較器６０６を含んでもよい。画像センサ６００は、出力６１０を画像プロセッサ６０８に提供してもよい。プロセッサ６０８は、例えば、処理モジュール７２（図２）の一部であってもよい。

パッチ追跡エンジン６０４は、パッチ追跡エンジン４１０に類似する、構造および機能を有してもよい。これは、画像アレイ６０２の少なくとも１つの選択された領域を規定する信号を受信し、次いで、その領域によって表されるオブジェクトの画像の画像アレイ６０２内の、算出された軌道に基づいて、その領域の動的場所を規定する、制御信号を生成するように構成されてもよい。いくつかの実施形態では、パッチ追跡エンジン６０４は、領域または複数の領域に関する軌道情報を含み得る、画像アレイ６０２の少なくとも１つの選択された領域を規定する、信号を受信してもよい。パッチ追跡エンジン６０４は、軌道情報に基づいて、少なくとも１つの選択された領域内のピクセルセルを動的に識別する、算出を実施するように構成されてもよい。パッチ追跡エンジン６０４の実装における変形例も、可能性として考えられる。例えば、パッチ追跡エンジンは、画像アレイ６０２の運動および／またはパッチと関連付けられるオブジェクトの投影された運動を示す、センサに基づいて、パッチの場所を更新してもよい。

図６に図示される実施形態では、画像センサ６００は、識別されたパッチ内のピクセルに関する差分情報を出力するように構成される。比較器６０６は、パッチ内のピクセルを識別する、制御信号を、パッチ追跡エンジン６０４から受信するように構成されてもよい。比較器６０６は、パッチ追跡エンジン６０４によって示されるようなパッチ内のアドレスを有する、画像アレイ６０２から出力されているピクセルに選択的に作用してもよい。比較器６０６は、画像アレイ６０２の少なくとも１つの領域によって検出される、感知される光の変化を示す、信号を生成するように、ピクセルセルに作用してもよい。実装の一実施例として、比較器６０６は、アレイ内のピクセルセルのリセット値を記憶する、メモリ要素を含有してもよい。それらのピクセルの現在の値が、画像アレイ６０２から走査出力されるにつれて、比較器６０６内の回路網は、記憶された値と現在の値を比較し、差異が閾値を超えると、インジケーションを出力してもよい。デジタル回路網が、例えば、値を記憶し、そのような比較を行うために使用されてもよい。本実施例では、画像センサ６００の出力は、画像センサ４００の出力のように処理されてもよい。

いくつかの実施形態では、画像アレイ６０２、パッチ追跡エンジン６０４、および比較器６０６は、ＣＭＯＳ集積回路等の単一集積回路内に実装されてもよい。いくつかの実施形態では、画像アレイ６０２は、単一集積回路内に実装されてもよい。パッチ追跡エンジン６０４および比較器６０６は、例えば、画像アレイ６０２のためのドライバとして構成される、第２の単一集積回路内に実装されてもよい。代替として、または加えて、パッチ追跡エンジンおよび／または比較器６０６の機能のいくつかまたは全ては、ＡＲシステム内の他のデジタルプロセッサに分散されてもよい。

他の構成または処理回路網もまた、可能性として考えられる。図７は、いくつかの実施形態による、画像センサ７００を描写する。画像センサ７００は、画像アレイ７０２を含んでもよい。本実施形態では、画像アレイ７０２は、図５Ａにおけるピクセル５００に関して示されるような差分構成を伴う、ピクセルセルを有してもよい。しかしながら、本明細書の実施形態は、差分ピクセルセルに限定されず、パッチ追跡は、強度情報を出力する、画像センサを用いて実装されてもよい。

図７の図示される実施形態では、パッチ追跡エンジン７０４は、追跡されている１つ以上のパッチ内のピクセルセルのアドレスを示す、制御信号を生産する。パッチ追跡エンジン７０４は、パッチ追跡エンジン６０４のように構築され、動作してもよい。ここでは、パッチ追跡エンジン７０４は、制御信号をピクセルフィルタ７０６に提供し、これは、出力７１０に、パッチ内のそれらのピクセルのみからの画像情報を通過させる。示されるように、出力７１０は、画像プロセッサ７０８に結合され、これはさらに、本明細書に説明されるような技法を使用して、または他の好適な方法において、パッチ内のピクセルに関する画像情報を処理してもよい。

さらなる変形例が、図８に図示され、これは、いくつかの実施形態による、画像センサ８００を描写する。画像センサ８００は、画像アレイ８０２を含んでもよく、これは、ピクセルに関する強度値を走査出力する、従来の画像アレイであってもよい。その画像アレイは、比較器８０６の使用を通して、本明細書に説明されるような差分画像情報を提供するように適合されてもよい。比較器８０６は、比較器６０６と同様に、ピクセルに関する記憶された値に基づいて、差異情報を算出してもよい。それらの差異値の選択されたものは、ピクセルフィルタ８０８によって、出力８１２に通過されてもよい。ピクセルフィルタ７０６と同様に、ピクセルフィルタ８０８は、パッチ追跡エンジン８０４からの制御入力を受信してもよい。パッチ追跡エンジン８０４は、パッチ追跡エンジン７０４に類似してもよい。出力８１２は、画像プロセッサ８１０に結合されてもよい。画像センサ８００の上記に述べられたコンポーネントのいくつかまたは全ては、単一集積回路内に実装されてもよい。代替として、コンポーネントは、１つ以上の集積回路または他のコンポーネントを横断して分散されてもよい。

本明細書に説明されるような画像センサは、拡張現実システムの一部として動作され、移動可能なオブジェクトについての情報または物理的環境についての情報と組み合わせて仮想オブジェクトの画像を現実的にレンダリングする際に有用な物理的世界についての他の情報を維持してもよい。図９は、いくつかの実施形態による、画像感知のための方法９００を描写する。

方法９００の少なくとも一部は、例えば、画像センサ４００、６００、７００、または８００を含む、画像センサを動作させるために実施されてもよい。方法９００は、例えば、画像センサ４１２、慣性センサ４１４、および記憶された情報４１６を含む、１つ以上の入力からの画像情報を受信するステップ（行為９０２）から開始してもよい。方法９００は、少なくとも部分的に、受信された情報に基づいて、画像感知システムの画像出力上の１つ以上のパッチを識別するステップ（行為９０４）を含んでもよい。行為９０４の実施例は、図１０に図示される。いくつかの実施形態では、方法９００は、１つ以上のパッチに関する移動する軌道を算出するステップ（行為９０６）を含んでもよい。行為９０６の実施例は、図１１に図示される。

方法９００はまた、少なくとも部分的に、識別された１つ以上のパッチおよび／またはその推定される移動する軌道に基づいて、画像感知システムを設定するステップ（行為９０８）を含んでもよい。設定は、例えば、比較器６０６、ピクセルフィルタ７０６等を通して、少なくとも部分的に、識別された１つ以上のパッチおよび／またはその推定される移動する軌道に基づいて、画像感知システムのピクセルセルの一部を有効にすることによって達成されてもよい。いくつかの実施形態では、比較器６０６は、画像上の選択されたパッチに対応するピクセルセルに関する、第１の基準電圧値と、画像上の任意の選択されたパッチに対応しないピクセルセルに関する、第２の基準電圧値とを受信してもよい。比較器６０６は、第２の基準電圧を伴う比較器セルを有する、ピクセルセルによって感知される合理的光強度変化が、ピクセルセルによる出力をもたらし得ないように、第２の基準電圧を第１の基準電圧よりはるかに高くなるように設定してもよい。いくつかの実施形態では、ピクセルフィルタ７０６は、画像上の任意の選択されたパッチに対応しないアドレス（例えば、行および列）を伴う、ピクセルセルからの出力を無効にしてもよい。

図１０は、いくつかの実施形態による、パッチ識別９０４を描写する。パッチ識別９０４は、少なくとも部分的に、色、光強度、到着角、深度、および意味論に基づいて、１つ以上の入力からの１つ以上の画像をセグメント化するステップ（行為１００２）を含んでもよい。

パッチ識別９０４はまた、１つ以上の画像内の１つ以上のオブジェクトを認識するステップ（行為１００４）を含んでもよい。いくつかの実施形態では、オブジェクト認識１００４は、少なくとも部分的に、例えば、手、眼、顔特徴を含む、オブジェクトの所定の特徴に基づいてもよい。いくつかの実施形態では、オブジェクト認識１００４は、１つ以上の仮想オブジェクトに基づいてもよい。例えば、仮想動物キャラクタが、物理的鉛筆上を歩行している。オブジェクト認識１００４は、仮想動物キャラクタをオブジェクトとして標的化してもよい。いくつかの実施形態では、オブジェクト認識１００４は、少なくとも部分的に、画像感知システムによって受信された人工知能（ＡＩ）訓練に基づいてもよい。例えば、画像感知システムは、異なるタイプおよび色におけるネコの画像、したがって、ネコの学習された特性を読み取ることによって訓練され、物理的世界内でネコを識別することが可能となり得る。

パッチ識別９０４は、１つ以上のオブジェクトに基づいて、パッチを生成するステップ（行為１００６）を含んでもよい。いくつかの実施形態では、オブジェクトパッチ化１００６は、１つ以上のオブジェクトに関する凸包または境界ボックスを算出することによって、パッチを生成してもよい。

図１１は、いくつかの実施形態による、パッチ軌道推定９０６を描写する。パッチ軌道推定９０６は、１つ以上のパッチに関する経時的移動を予測するステップ（行為１１０２）を含んでもよい。１つ以上のパッチに関する移動は、例えば、移動するオブジェクトおよび／または移動するユーザを含む、複数の理由によって生じ得る。運動予測１１０２は、受信された画像および／または受信されたＡＩ訓練に基づいて、移動するオブジェクトおよび／または移動するユーザに関する移動速度を導出するステップを含んでもよい。

パッチ軌道推定９０６は、少なくとも部分的に、予測される移動に基づいて、１つ以上のパッチに関する経時的軌道を算出するステップ（行為１１０４）を含んでもよい。いくつかの実施形態では、軌道は、運動下のオブジェクトが同一速度で同一方向に移動し続けるであろうと仮定して、一次線形方程式をモデル化することによって算出されてもよい。いくつかの実施形態では、軌道は、曲線適合によって、または、パターン検出を含む、ヒューリスティックを使用して、算出されてもよい。

図１２および１３は、パッチ軌道の計算において適用され得る、係数を図示する。図１２は、移動可能なオブジェクトの実施例を描写し、これは、本実施例では、ＡＲシステムのユーザに対して移動する、移動するオブジェクト１２０２（例えば、手）である。本実施例では、ユーザは、頭部搭載型ディスプレイ６２の一部として、画像センサを装着している。本実施例では、ユーザの眼４９は、画像アレイ１２００が１つの視点１２０４に対する眼４９に関する視野（ＦＯＶ）を捕捉するように、真っ直ぐ見ている。オブジェクト１２０２は、ＦＯＶ内にあって、したがって、アレイ１２００内の対応するピクセルに強度変動を作成することによって現れる。

アレイ１２００は、アレイ内に配列される、複数のピクセル１２０８を有する。手１２０２を追跡するシステムに関して、時間ｔ０においてオブジェクト１２０２を包含するそのアレイ内のパッチ１２０６は、複数のピクセルの一部を含み得る。オブジェクト１２０２が、移動している場合、そのオブジェクトを捕捉するパッチの場所は、経時的に変化するであろう。その変化は、パッチ１２０６から後の時間において使用されるパッチＸおよびＹへのパッチ軌道内に捕捉され得る。

パッチ軌道は、行為９０６等において、パッチ内のオブジェクト、例えば、図示される実施例では、指先に関する特徴１２１０を識別することによって、推定されてもよい。運動ベクトル１２１２が、特徴に関して算出されてもよい。本実施例では、軌道は、一次線形方程式としてモデル化され、予測は、オブジェクト１２０２が、その同一パッチ軌道１２１４上で経時的に継続し、２つの連続時間のそれぞれにおける、パッチ場所ＸおよびＹにつながるという仮定に基づく。

パッチ場所が変化するにつれて、移動するオブジェクト１２０２の画像は、パッチ内に留まる。画像情報は、パッチ内のピクセルを用いて集められた情報に限定されるが、その画像情報は、移動するオブジェクト１２０２の運動を表すために十分である。これは、画像情報が強度情報または差分回路によって生産されるような差分情報であるかどうかにかかわらず、該当するであろう。差分回路の場合、例えば、強度の増加を示すイベントが、移動するオブジェクト１２０２の画像がピクセルにわたって移動するにつれて生じ得る。逆に言えば、移動するオブジェクト１２０２の画像が、あるピクセルから通り過ぎると、強度の減少を示すイベントが、生じ得る。増加および減少イベントを伴う、ピクセルのパターンは、イベントを示す、比較的に少量のデータに起因して、短待ち時間を伴って、迅速に更新され得る、移動するオブジェクト１２０２の運動の信頼性があるインジケーションとして使用されてもよい。具体的実施例として、そのようなシステムは、ユーザの手を追跡し、仮想オブジェクトのレンダリングを改変し、ユーザが仮想オブジェクトと相互作用していることのユーザのための感覚を作成する、現実的ＸＲシステムにつながり得る。

パッチの位置は、他の理由からも変化し得、その任意のものまたは全てが、軌道算出に反映され得る。１つのそのような他の変化は、ユーザが画像センサを装着しているときのユーザの移動である。図１３は、ユーザおよび画像センサに関する変化する視点を作成する、移動するユーザの実施例を描写する。図１３では、ユーザは、最初に、視点１３０２を伴って、オブジェクトを真っ直ぐ見ているとし得る。本構成では、画像アレイのピクセルアレイ１３００は、ユーザの正面のオブジェクトを捕捉するであろう。ユーザの正面のオブジェクトは、パッチ１３１２内にあり得る。

ユーザは、次いで、その頭部を方向転換させること等によって、視点を変化させ得る。視点は、視点１３０４に変化し得る。以前にユーザの真正面にあった、オブジェクトが、移動しない場合でも、視点１３０４におけるユーザの視野内の異なる位置を有するであろう。また、ユーザによって装着される画像センサの視野内の異なる点、したがって、画像アレイ１３００内の異なる位置にあるであろう。そのオブジェクトは、例えば、場所１３１４における、パッチ内に含有され得る。

ユーザが、その視点を視点１３０６にさらに変化させ、画像センサが、ユーザに伴って移動する場合、以前にユーザの真正面にあった、オブジェクトの場所は、ユーザによって装着される画像センサの視野内の異なる点、したがって、画像アレイ１３００内の異なる位置で結像されるであろう。そのオブジェクトは、例えば、場所１３１６におけるパッチ内に含有され得る。

見られ得るように、ユーザが、その視点をさらに変化させるにつれて、オブジェクトを捕捉するために必要とされる、画像アレイ内のパッチの位置は、さらに移動する。場所１３１２から、場所１３１４、場所１３１６への本運動の軌道は、推定され、パッチの将来的位置を追跡するために使用されてもよい。

軌道は、他の方法で推定されてもよい。例えば、ユーザが、視点１３０２を有するとき、慣性センサを用いた測定は、ユーザの頭部の加速および速度を示し得る。本情報は、ユーザの頭部の運動に基づいて、画像アレイ内のパッチの軌道を予測するために使用されてもよい。

パッチ軌道推定９０６は、少なくとも部分的に、これらの慣性測定に基づいて、ユーザが、時間ｔ１では、視点１３０４を、時間ｔ２では、視点１３０６を有するであろうことを予測し得る。故に、パッチ軌道推定９０６は、パッチ１３０８が、時間ｔ１では、パッチ１３１０に、時間ｔ２では、パッチ１３１２に移動し得ることを予測し得る。

そのようなアプローチの実施例として、ＡＲシステム内で頭部姿勢の正確かつ短待ち時間推定を提供するために使用されてもよい。パッチは、ユーザの環境内の定常オブジェクトの画像を包含するように位置付けられてもよい。具体的実施例として、画像情報の処理は、追跡するために、認識可能かつ定常のオブジェクトとして、壁上に吊架されている写真フレームの角を識別してもよい。その処理は、パッチをそのオブジェクト上に中心合わせさせてもよい。図１２に関連して上記に説明される、移動するオブジェクト１２０２の場合と同様に、オブジェクトとユーザの頭部との間の相対的移動は、ユーザと追跡されるオブジェクトとの間の相対的運動を算出するために使用され得る、イベントを生産するであろう。本実施例では、追跡されるオブジェクトが、定常であるため、相対的運動は、ユーザによって装着されている、結像アレイの運動を示す。その運動は、したがって、物理的世界に対するユーザの頭部姿勢の変化を示し、ユーザの頭部姿勢の正確な算出を維持するために使用されることができ、これは、仮想オブジェクトを現実的にレンダリングする際に使用され得る。本明細書に説明されるような結像アレイが、更新あたり比較的に少量のデータを用いて、高速更新を提供することができるため、仮想オブジェクトをレンダリングするための算出は、正確なままである（それらは、迅速に実施され、頻繁に更新されることができる）。

図１１に戻って参照すると、パッチ軌道推定９０６は、少なくとも部分的に、算出されたパッチ軌道に基づいて、パッチのうちの少なくとも１つのサイズを調節するステップ（行為１１０６）を含んでもよい。例えば、パッチのサイズは、移動可能なオブジェクトの画像またはそれに関して画像情報が生成されるべきオブジェクトの少なくとも一部が投影されるであろう、ピクセルを含むように、十分な大きさに設定されてもよい。パッチは、パッチの軌道を推定する際、任意の誤差が存在する場合、パッチが、それでもなお、画像の関連部分を含み得るように、着目オブジェクトの部分の画像の投影されたサイズより若干大きく設定されてもよい。オブジェクトが、画像センサに対して移動するにつれて、ピクセル単位のそのオブジェクトの画像のサイズは、距離、入射角、オブジェクトの配向、または他の要因に基づいて変化し得る。オブジェクトと関連付けられるパッチを定義するプロセッサが、オブジェクトに関連するパッチのサイズを、他のセンサデータに基づいて、測定すること、または世界モデルに基づいて、算出すること等によって、パッチのサイズを設定してもよい。その形状等のパッチの他のパラメータも同様に、設定または更新されてもよい。

図１４は、いくつかの実施形態による、ＸＲシステムにおいて使用するために構成される、画像感知システム１４００を描写する。画像感知システム４００（図４）のように、画像感知システム１４００は、パッチ内の値を選択的に出力するための回路網を含み、同様に上記に説明されるように、パッチ内のピクセルに関するイベントを出力するように構成されてもよい。加えて、画像感知システム１４００は、測定された強度値を選択的に出力するように構成され、これは、完全画像フレームに関して出力されてもよい。

図示される実施形態では、上記に説明されるＤＶＳ技法を用いて生成される、イベントと、強度値とに関して、別個の出力が、示される。ＤＶＳ技法を用いて生成される出力は、ＡＥＲ４１８に関連して上記に説明されるような表現を使用して、ＡＥＲ１４１８として出力されてもよい。強度値を表す、出力は、ここでは、ＡＰＳ１４２０として指定される、出力を通して出力されてもよい。それらの強度出力は、パッチに関するものであってもよい、または画像フレーム全体に関するものであってもよい。ＡＥＲおよびＡＰＳ出力は、同時にアクティブであってもよい。しかしながら、図示される実施形態では、画像センサ１４００は、任意の所与の時間において、イベントを出力するためのモードまたは強度情報が出力されるモードで動作する。そのような画像センサが使用される、本システムは、イベント出力および／または強度情報を選択的に使用してもよい。

画像感知システム１４００は、画像センサ１４０２を含んでもよく、これは、画像アレイ１４０４を含んでもよく、これは、複数のピクセル１５００を含有してもよく、それぞれ、光に応答する。センサ１４０２はさらに、ピクセルセルにアクセスするための回路網を含んでもよい。センサ１４０２はさらに、情報が画像アレイ１４０４内のピクセルセルから読み取られる、モードを制御するために、アクセス回路網への入力を生成する、回路網を含んでもよい。

図示される実施形態では、画像アレイ１４０４は、両方とも読取モードにおいてアクセス可能である、ピクセルセルの複数の行および列を伴う、アレイとして構成される。そのような実施形態では、アクセス回路網は、行アドレスエンコーダ／デコーダ１４０６、列選択スイッチ１４２２を制御する、列アドレスエンコーダ／デコーダ１４０８、および／または１つ以上の対応するピクセルセルによって感知される入射光についての情報を一時的に保持し得る、レジスタ１４２４を含んでもよい。パッチ追跡エンジン１４１０は、随時、画像情報を提供しているピクセルセルを制御するために、アクセス回路網への入力を生成してもよい。

いくつかの実施形態では、画像センサ１４０２は、ロールシャッタモード、グローバルシャッタモード、または両方で動作するように構成されてもよい。例えば、パッチ追跡エンジン１４１０は、アクセス回路網への入力を生成し、画像アレイ１４０２の読取モードを制御してもよい。

センサ１４０２が、ロールシャッタ読取モードで動作するとき、ピクセルセルの単一列が、例えば、複数の列スイッチの単一列スイッチ１４２２を閉鎖することによって、各システムクロックの間に選択される。そのシステムクロックの間、ピクセルセルの選択された列は、暴露され、ＡＰＳ１４２０に読み取られる。ロールシャッタモードによって画像フレームを生成するために、センサ１４０２内のピクセルセルの列は、１列ずつ読み取られ、次いで、画像プロセッサによって処理され、画像フレームを生成する。

センサ１４０２が、グローバルシャッタモードで動作するとき、ピクセルセルの列は、複数の列内のピクセルセルによって捕捉された情報が、ＡＰＳ１４２０ｂに同時に読み取られ得るように、例えば、単一システムクロック内において、同時に暴露され、情報をレジスタ１４２４内に保存する。そのような読取モードは、さらなるデータ処理を必要とせずに、画像フレームの直接出力を可能にする。図示される実施例では、ピクセルセルによって感知される入射光についての情報は、個別のレジスタ１４２４内に保存される。複数のピクセルセルは、１つのレジスタ１４２４を共有してもよいことを理解されたい。

いくつかの実施形態では、センサ１４０２は、ＣＭＯＳ集積回路等の単一集積回路内に実装されてもよい。いくつかの実施形態では、画像アレイ１４０４は、単一集積回路内に実装されてもよい。パッチ追跡エンジン１４１０、行アドレスエンコーダ／デコーダ１４０６、列アドレスエンコーダ／デコーダ１４０８、列選択スイッチ１４２２、および／またはレジスタ１４２４は、例えば、画像アレイ１４０４のためのドライバとして構成される、第２の単一集積回路内に実装されてもよい。代替として、または加えて、パッチ追跡エンジン１４１０、行アドレスエンコーダ／デコーダ１４０６、列アドレスエンコーダ／デコーダ１４０８、列選択スイッチ１４２２、および／またはレジスタ１４２４の機能のいくつかまたは全ては、ＡＲシステム内の他のデジタルプロセッサに分散されてもよい。

図１５は、例示的ピクセルセル１５００を図示する。図示される実施形態では、各ピクセルセルは、イベントまたは強度情報のいずれかを出力するように設定されてもよい。しかしながら、いくつかの実施形態では、画像センサは、両方のタイプの情報を並行して出力するように構成されてもよいことを理解されたい。

イベント情報および強度情報は両方とも、図５Ａに関連して上記に説明されるように、光検出器５０４の出力に基づく。ピクセルセル１５００は、イベント情報を生成するための回路網を含む。その回路網は、同様に上記に説明されるように、感光回路５０２と、差分回路５０６と、比較器５０８とを含む。スイッチ１５２０は、第１の状態にあるとき、光検出器５０４をイベント生成回路網に接続する。スイッチ１５２０または他の制御回路網は、ＡＲシステムが動作時の実質的時間周期の間、比較的に少量の画像情報が提供されるように、ＡＲシステムを制御する、プロセッサによって制御されてもよい。

スイッチ１５２０または他の制御回路網はまた、強度情報を出力するようにピクセルセル１５００を構成するように制御されてもよい。図示される情報では、強度情報が、画像アレイ内のピクセル毎のピクセル強度値のストリームとして連続的に表される、完全画像フレームとして提供される。本モードで動作するために、各ピクセルセル内のスイッチ１５２０は、増幅器５１０を通して通過後、出力ラインに接続され得るように、光検出器５０４の出力を暴露する、第２の位置に設定されてもよい。

図示される実施形態では、出力ラインは、列ライン１５１０として図示される。画像アレイ内の列毎に、１つのそのような列ラインが存在してもよい。列内の各ピクセルセルは、列ライン１５１０に結合されてもよいが、ピクセルアレイは、一度に１つのピクセルセルが、列ライン１５１０に結合されるように制御されてもよい。各ピクセルセル内に１つのそのようなスイッチが存在する、スイッチ１５３０は、ピクセルセル１５００がその個別の列ライン１５１０に接続されるときを制御する。行アドレスデコーダ４１０等のアクセス回路網は、スイッチ１５３０を閉鎖し、一度に１つのみのピクセルセルが各列ラインに接続されることを確実にしてもよい。スイッチ１５２０および１５３０は、画像アレイの一部である１つ以上のトランジスタまたは類似コンポーネントを使用して実装されてもよい。

図１５は、いくつかの実施形態による、各ピクセルセル内に含まれ得る、さらなるコンポーネントを示す。サンプルホールド回路（Ｓ／Ｈ）１５３２は、光検出器５０４と列ライン１５１０との間に接続されてもよい。存在するとき、Ｓ／Ｈ１５３２は、画像センサ１４０２が、グローバルシャッタモードで動作することを可能にし得る。グローバルシャッタモードでは、トリガ信号は、並行して、アレイ内の各ピクセルセルに送信される。各ピクセルセル内では、Ｓ／Ｈ１５３２は、トリガ信号の時点における強度を示す、値を捕捉する。Ｓ／Ｈ１５３２は、その値を記憶し、次の値が捕捉されるまで、その値に基づいて、出力を生成する。

図１５に示されるように、Ｓ／Ｈ１５３２によって記憶される値を表す信号は、スイッチ１５３０が閉鎖されると、列ライン１５１０に結合されてもよい。列ラインに結合される信号は、処理され、画像アレイの出力を生産してもよい。その信号は、例えば、列ライン１５１０の終了時、バッファされ、および／または増幅器１５１２内で増幅され、次いで、アナログ／デジタルコンバータ（Ａ／Ｄ）１５１４に適用されてもよい。Ａ／Ｄ１５１４の出力は、他の読取回路１５１６を通して、出力１４２０に通過されてもよい。読取回路１５１６は、例えば、列スイッチ１４２２を含んでもよい。読取回路１５１６内の他のコンポーネントは、Ａ／Ｄ１５１４のマルチビット出力をシリアライズする等の他の機能を実施してもよい。

当業者は、本明細書に説明される機能を実施するための回路を実装する方法を理解するであろう。Ｓ／Ｈ１５３２は、例えば、１つ以上のコンデンサおよび１つ以上のスイッチとして実装されてもよい。しかしながら、Ｓ／Ｈ１５３２は、他のコンポーネントを使用して、または図１５Ａに図示されるもの以外の回路構成において、実装されてもよいことを理解されたい。図示されるようなもの以外の他のコンポーネントもまた、実装されてもよいことを理解されたい。例えば、図１５は、列あたり１つの増幅器および１つのＡ／Ｄコンバータを示す。他の実施形態では、複数の列を横断して共有される、１つのＡ／Ｄコンバータが存在してもよい。

グローバルシャッタのために構成される、ピクセルアレイでは、各Ｓ／Ｈ１５３２は、同一瞬間における画像情報を反映させる強度値を記憶してもよい。これらの値は、読取相の間、各ピクセル内に記憶される値が連続的に読み取られるにつれて、記憶されてもよい。連続読取は、例えば、行内の各ピクセルセルのＳ／Ｈ１５３２をその個別の列ラインに接続することによって達成されてもよい。列ライン上の値は、次いで、一度に１つずつ、ＡＰＳ出力１４２０に通過されてもよい。そのような情報のフローは、列スイッチ１４２２の開閉をシーケンス化することによって制御されてもよい。その動作は、例えば、列アドレスデコーダ１４０８によって制御されてもよい。いったん１つの行のピクセル毎の値が、読み取られると、次の行内のピクセルセルが、その場所内の列ラインに接続されてもよい。それらの値は、一度に１つの列ずつ、読み取られてもよい。一度に１つの行に関する値を読み出すプロセスは、画像アレイ内の全てのピクセルに関する強度値が読み取られるまで、繰り返されてもよい。強度値が１つ以上のパッチに関して読み取られる、実施形態では、プロセスは、パッチ内のピクセルセルに関する値が読み取られると、完了するであろう。

ピクセルセルは、任意の好適な順序で読み取られてもよい。行は、例えば、２つおきの行がシーケンスで読み取られるように、インターリーブされてもよい。ＡＲシステムは、それでもなお、データをデインターリービングすることによって、画像データのフレームとして、画像データを処理し得る。

Ｓ／Ｈ１５３２が存在しない、実施形態では、値は、依然として、値の行および列が走査出力されるにつれて、順次、各ピクセルセルから読み取られてもよい。しかしながら、各ピクセルセルから読み取られた値は、その値が、例えば、Ａ／Ｄ１５１４に適用されるとき等、そのセル内の値が読取プロセスの一部として捕捉された時点における、セルの光検出器において検出された光の強度を表し得る。結果として、ロールシャッタでは、画像フレームのピクセルは、若干異なる時間における、画像アレイ上に入射する画像を表し得る。完全フレームを３０Ｈｚのレートで出力する、画像センサに関して、フレームに関する最初のピクセル値が捕捉されるときとフレームに関する最後のピクセル値が捕捉されるときとの間の時間における差異は、１／３０秒と異なり得、これは、多くの用途にとって、知覚不能である。

オブジェクトを追跡する等のいくつかのＸＲ機能に関して、ＸＲシステムは、ロールシャッタを使用して、画像センサを用いて収集された画像情報上で算出を実施してもよい。そのような算出は、連続画像フレーム間を補間し、ピクセル毎に、連続フレーム間の時間内のある点におけるピクセルの推定される値を表す、補間される値を算出し得る。同一時間が、算出を介して、補間される画像フレームが、グローバルシャッタを有する画像センサを用いて生産され得るような同一時点を表すピクセルを含有するように、全てのピクセルのために使用されてもよい。代替として、グローバルシャッタ画像アレイが、ＸＲシステムの一部を形成する、ウェアラブルデバイス内の１つ以上の画像センサのために使用されてもよい。完全または部分的画像フレームのためのグローバルシャッタは、ロールシャッタを用いて捕捉された画像情報内の捕捉時間における変動を補償するように実施され得る、他の処理の補間を回避し得る。補間算出は、したがって、画像情報が、手または他の移動可能なオブジェクトを追跡する、またはＡＲシステム内のウェアラブルデバイスのユーザの頭部姿勢を決定する、またはさらに、画像情報が収集される際に移動している場合がある、ウェアラブルデバイス上のカメラを使用して、物理的環境の正確な表現を構築するために処理するために生じ得るようなオブジェクトの運動を追跡するために使用される場合でも、回避され得る。

区別されたピクセルセル

いくつかの実施形態では、センサアレイ内のピクセルセルはそれぞれ、同一であり得る。各ピクセルセルは、例えば、可視光の広スペクトルに応答してもよい。各光検出器は、したがって、可視光の強度を示す、画像情報を提供し得る。本シナリオでは、画像アレイの出力は、画像アレイ上に入射する可視光の量を示す、「グレースケール」出力であってもよい。

他の実施形態では、ピクセルセルは、区別されてもよい。例えば、センサアレイ内の異なるピクセルセルは、スペクトルの特定の部分内の光の強度を示す、画像情報を出力してもよい。ピクセルセルを区別するための好適な技法は、フィルタ要素を、ピクセルセル内の光検出器につながる、光経路内に位置付けることである。フィルタ要素は、例えば、特定の色の可視光が通過することを可能にする、帯域通過であってもよい。そのようなカラーフィルタをピクセルセルにわたって適用することは、フィルタに対応する色の光の強度を示す、画像情報を提供するように、そのピクセルセルを構成する。

フィルタは、ピクセルセルの構造にかかわらず、ピクセルセルにわたって適用されてもよい。それらは、例えば、グローバルシャッタまたはロールシャッタを伴う、センサアレイ内のピクセルセルにわたって適用されてもよい。同様に、フィルタは、ＤＶＳ技法を使用して強度または強度の変化を出力するように構成される、ピクセルセルに適用されてもよい。

いくつかの実施形態では、原色の光を選択的に通過させる、フィルタ要素が、センサアレイ内の各ピクセルセル内の光検出器にわたって搭載されてもよい。例えば、赤色、緑色、または青色光を選択的に通過させる、フィルタが、使用されてもよい。センサアレイは、複数のサブアレイを有してもよく、各サブアレイは、原色のそれぞれの光を感知するように構成される、１つ以上のピクセルを有する。このように、各サブアレイ内のピクセルセルは、画像センサによって結像されているオブジェクトについての強度および色情報の両方を提供する。

本発明者らは、ＸＲシステムでは、いくつかの機能が、色情報を要求する一方、いくつかの機能が、グレースケール情報で実施され得ることを認識し、その真価を認めた。画像センサを装備し、ＸＲシステムの動作に関する画像情報を提供する、ウェアラブルデバイスは、複数のカメラを有してもよく、そのうちのいくつかは、色情報を提供し得る、画像センサとともに形成されてもよい。カメラのその他は、グレースケールカメラであってもよい。本発明者らは、グレースケールカメラが、色を感知するように構成される匹敵する画像センサとともに形成されるカメラと同一分解能を伴って、物理的世界の同一範囲を表すために、より少ない電力を消費し、低光量条件下でより敏感であって、データをより高速で出力し、および／またはより少ないデータを出力し得ることを認識し、その真価を認めた。しかし、グレースケールカメラは、ＸＲシステム内で実施される、多くの機能のために十分な画像情報を出力し得る。故に、ＸＲシステムは、主に、グレースケールカメラまたは複数のカメラを使用して、カラーカメラを選択的に使用して、グレースケールおよびカラーカメラの両方とともに構成されてもよい。

例えば、ＸＲシステムは、画像情報を収集および処理し、パス可能世界モデルを作成してもよい。その処理は、色情報を使用し得、これは、オブジェクトを区別する、同一オブジェクトと関連付けられる表面を識別する、および／またはオブジェクトを認識する等、いくつかの機能の有効性を向上させ得る。そのような処理は、例えば、ユーザが、最初に、システムをオンにする、別の部屋の中に歩いて行くこと等によって、新しい環境に移動する、またはユーザの環境の変化が、別様に検出されるとき、随時、実施または更新されてもよい。

他の機能は、色情報の使用を通して有意に改良されない。例えば、いったんパス可能世界モデルが、作成されると、ＸＲシステムは、１つ以上のカメラからの画像を使用して、パス可能世界モデル内の特徴に対するウェアラブルデバイスの配向を決定してもよい。そのような機能は、例えば、頭部姿勢追跡の一部として行われてもよい。そのような機能のために使用されるカメラのいくつかまたは全ては、グレースケールであってもよい。頭部姿勢追跡が、ＸＲシステムが動作するにつれて、頻繁に実施されるため、いくつかの実施形態では、本機能のために、１つ以上のグレースケールカメラを持続的に使用することは、相当な電力節約、低減された算出、または他の利点を提供し得る。

同様に、複数回、ＸＲシステムの動作の間、本システムは、２つ以上のカメラからの立体視情報を使用して、移動可能なオブジェクトまでの距離を決定してもよい。そのような機能は、ユーザの手または他の移動可能なオブジェクトを追跡することの一部として、画像情報を高レートで処理することを要求し得る。本機能のために１つ以上のグレースケールカメラを使用することは、高分解能画像情報の処理と関連付けられるより短い待ち時間または他の利点を提供し得る。

ＸＲシステムのいくつかの実施形態では、ＸＲシステムは、カラーおよび少なくとも１つのグレースケールカメラの両方を有してもよく、それらのカメラからの画像情報が使用されるべき機能に基づいて、グレースケールおよび／またはカラーカメラを選択的に有効にしてもよい。

画像センサ内のピクセルセルは、ピクセルセルが敏感である光のスペクトルに基づく以外の方法で区別されてもよい。いくつかの実施形態では、ピクセルセルのいくつかまたは全ては、ピクセルセル上に入射する光の到着角を示す、強度を有する、出力を生産してもよい。到着角情報は、結像されているオブジェクトまでの距離を算出するために処理されてもよい。

そのような実施形態では、画像センサは、深度情報を受動的に入手してもよい。受動深度情報は、ピクセルセルが、そのピクセルセルに衝打する光の到着角を示す、情報を出力するように、コンポーネントをアレイ内のピクセルセルへの光経路内に設置することによって取得されてもよい。そのようなコンポーネントの実施例は、透過性回折マスク（ＴＤＭ）フィルタである。

到着角情報は、計算を通して、そこから光が反射されている、オブジェクトまでの距離を示す、距離情報に変換されてもよい。いくつかの実施形態では、到着角情報を提供するように構成される、ピクセルセルは、１つ以上の色の光強度を捕捉するピクセルセルとともに散在されてもよい。結果として、到着角情報、したがって、距離情報は、オブジェクトについての他の画像情報と組み合わせられてもよい。

いくつかの実施形態では、センサのうちの１つ以上のものは、コンパクトかつ低電力のコンポーネントを使用して、短待ち時間を伴って、高周波数で、場面内の物理的オブジェクトについての情報を入手するように構成されてもよい。画像センサは、例えば、５０ｍＷ未満を引き出し、デバイスが、ウェアラブルシステムの一部として使用されるために十分に小さい、バッテリで給電されることを可能にし得る。そのセンサは、１つ以上の色の情報の強度および／または強度情報の変化を示す、画像情報の代わりに、またはそれに加え、深度情報を受動的に入手するように構成される、画像センサであってもよい。そのようなセンサはまた、差分出力を提供するために、パッチ追跡を使用することによって、またはＤＶＳ技法を使用することによって、少量のデータを提供するように構成されてもよい。

受動深度情報は、アレイ内のピクセルセルのうちの１つ以上のものを、結像されているオブジェクトから発出するライトフィールドを示す、情報を出力するように適合させる、コンポーネントとともに、本明細書に説明される技法のうちの任意の１つ以上のものを組み込む、画像アレイ等の画像アレイを構成することによって取得されてもよい。その情報は、そのピクセルに衝打する光の到着角に基づいてもよい。いくつかの実施形態では、上記に説明されるもの等のピクセルセルは、プレノプティックコンポーネントをピクセルセルへの光経路内に設置することによって、到着角のインジケーションを出力するように構成されてもよい。プレノプティックコンポーネントの実施例は、透過性回折マスク（ＴＤＭ）である。到着角情報は、計算を通して、そこから光が反射されているオブジェクトまでの距離を示す、距離情報に変換され、捕捉されている画像を形成してもよい。いくつかの実施形態では、到着角情報を提供するように構成される、ピクセルセルは、グレースケールで、または１つ以上の色の光強度を捕捉する、ピクセルセルとともに散在されてもよい。結果として、到着角情報はまた、オブジェクトについての他の画像情報と組み合わせられてもよい。

図１６は、いくつかの実施形態による、ピクセルサブアレイ１００を図示する。図示される実施形態では、サブアレイは、２つのピクセルセルを有するが、サブアレイ内のピクセルセルの数は、本発明に関する限定ではない。ここでは、第１のピクセルセル１２１および第２のピクセルセル１２２が、示され、そのうちの一方は、到着角情報を捕捉するように構成される（第１のピクセルセル１２１）が、到着角情報を測定するように構成される、ピクセルセルのアレイ内の数および場所は、変動され得ることを理解されたい。本実施例では、他のピクセルセル（第２のピクセルセル１２２）は、光の１つの色の強度を測定するように構成されるが、他の構成も、可能性として考えられ、光の異なる色に敏感であるピクセルセル、またはグレースケールカメラにおけるような光の広スペクトルに敏感である１つ以上のピクセルセルを含む。

図１６のピクセルサブアレイ１００の第１のピクセルセル１２１は、到着角／強度コンバータ１０１と、光検出器１０５と、差分読取回路網１０７とを含む。ピクセルサブアレイ１００の第２のピクセルセル１２２は、カラーフィルタ１０２と、光検出器１０６と、差分読取回路網１０８とを含む。図１６に図示されるコンポーネントが全て、全ての実施形態内に含まれる必要はないことを理解されたい。例えば、いくつかの実施形態は、差分読取回路網１０７および／または１０８を含まなくてもよく、いくつかの実施形態は、カラーフィルタ１０２を含まなくてもよい。さらに、図１６に示されない、付加的コンポーネントが、含まれてもよい。例えば、いくつかの実施形態は、特定の偏光の光が光検出器に到達することを可能にするように配列される、偏光器を含んでもよい。別の実施例として、いくつかの実施形態は、差分読取回路網１０７の代わりに、または加えて、走査出力回路網を含んでもよい。別の実施例として、第１のピクセルセル１２１はまた、第１のピクセル１２１が、第１のピクセル１２１上に入射する光の特定の色の到着角および強度の両方を測定するように、カラーフィルタを含んでもよい。

第１のピクセル１２１の到着角／強度コンバータ１０１は、光検出器によって測定され得る、入射光１１１の角度θを強度に変換する、光学コンポーネントである。いくつかの実施形態では、到着角／強度コンバータ１０１は、屈折光学系を含んでもよい。例えば、１つ以上のレンズが、光の入射角を像面上の位置に変換するために使用されてもよく、その入射光の量は、１つ以上のピクセルセルによって検出される。いくつかの実施形態では、到着角／位置強度コンバータ１０１は、回折光学系を含んでもよい。例えば、１つ以上の回折格子（例えば、透過回折マスク（ＴＤＭ））が、光の入射角を、ＴＤＭの下方の光検出器によって測定され得る、強度に変換してもよい。

第１のピクセルセル１２１の光検出器１０５は、到着角／強度コンバータ１０１を通して通過する、入射光１１０を受け取り、光検出器１０５上に入射する光の強度に基づいて、電気信号を生成する。光検出器１０５は、到着角／強度コンバータ１０１と関連付けられる、像面に位置する。いくつかの実施形態では、光検出器１０５は、ＣＭＯＳ画像センサ等の画像センサの単一ピクセルであってもよい。

第１のピクセル１２１の差分読取回路網１０７は、信号を光検出器１０５から受信し、光検出器からの電気信号の振幅が、上記に説明されるようなＤＶＳ技法を実装する、光検出器１０５からの前の信号の振幅と異なるときのみ、イベントを出力する。

第２のピクセルセル１２２は、特定の波長の範囲内の光のみが、カラーフィルタ１０２を通して通過し、光検出器１０６上に入射するように、入射光１１２をフィルタリングするためのカラーフィルタ１０２を含む。カラーフィルタ１０２は、例えば、赤色、緑色、または青色光のうちの１つが、それを通過することを可能にし、他の波長の光を拒絶する、帯域通過フィルタであってもよく、および／または光検出器１０６に到達するＩＲ光をスペクトルの特定の部分のみに限定してもよい。

本実施例では、第２のピクセルセル１２２はまた、光検出器１０６と、差分読取回路網１０８とを含み、これは、第１のピクセルセル１２１の光検出器１０５および差分読取回路網１０７と同様に作用してもよい。

上記に述べられたように、いくつかの実施形態では、画像センサは、ピクセルのアレイを含んでもよく、各ピクセルは、光検出器および読取回路と関連付けられる。ピクセルのあるサブセットは、ピクセル上に入射する検出された光の角度を決定するために使用される、到着角／強度コンバータと関連付けられてもよい。ピクセルの他のサブセットは、観察されている場面についての色情報を決定するために使用される、カラーフィルタと関連付けられてもよい、または他の特性に基づいて、光を選択的に通過または遮断してもよい。

いくつかの実施形態では、光の到着角は、単一光検出器と、２つの異なる深度における回折格子とを使用して決定されてもよい。例えば、光が、到着角を位置に変換する、第１のＴＤＭ上に入射し得、第２のＴＤＭが、特定の角度で入射する光を選択的に通過させるために使用されてもよい。そのような配列は、平面波が回折格子上に入射すると、回折格子の画像が回折格子からある距離に作成される、近距離回折効果である、Ｔａｌｂｏｔ効果を利用してもよい。第２の回折格子が、第１の回折格子の画像が形成される、像面に設置される場合、到着角は、第２の格子後に位置付けられる単一光検出器によって測定される、光の強度から決定されてもよい。

図１７Ａは、２つの格子に関する増加された屈折率の隆起および／または領域が水平方向に整合される（Δｓ＝０）（Δｓは、第１のＴＤＭ１４１と第２のＴＤＭ１４３との間の水平オフセットである）ように相互に整合される、第１のＴＤＭ１４１と、第２のＴＤＭ１４３とを含む、ピクセルセル１４０の第１の配列を図示する。第１のＴＤＭ１４１および第２のＴＤＭ１４３は両方とも、同一格子周期ｄを有してもよく、２つの格子は、距離／深度ｚによって分離されてもよい。第２のＴＤＭ１４３が第１のＴＤＭ１４１に対して位置する、Ｔａｌｂｏｔ長として知られる、深度ｚは、分析されている光の格子周期ｄおよび波長λによって決定され得、以下の式によって与えられる。

図１７Ａに図示されるように、ゼロ度の到着角を伴う入射光１４２は、第１のＴＤＭ１４１によって回折される。第２のＴＤＭ１４３は、第１のＴＤＭ１４１の画像が、作成され、入射光１４２の大部分が第２のＴＤＭ１４３を通して通過する結果をもたらすように、Ｔａｌｂｏｔ長に等しい深度に位置する。随意の誘電層１４５は、第２のＴＤＭ１４３を光検出器１４７から分離させてもよい。光が誘電層１４５を通して通過するにつれて、光検出器１４７は、光を検出し、光検出器上に入射する光の強度に比例する性質（例えば、電圧または電流）を伴う、電気信号を生成する。他方では、非ゼロ到着角θを伴う入射光１４４もまた、第１のＴＤＭ１４１によって回折されるが、第２のＴＤＭ１４３は、入射光１４４の少なくとも一部が光検出器１４７に到達しないように防止する。光検出器１４７に到達する入射光の量は、到着角θに依存し、より大きい角度では、より少ない光が、光検出器に到達する。光１４４から生じる破線は、光検出器１４７に到達する光の量が減衰されることを図示する。ある場合には、光１４４は、回折格子１４３によって完全に遮断されてもよい。したがって、入射光の到着角についての情報は、２つのＴＤＭを使用した単一光検出器１４７を使用して、取得されてもよい。

いくつかの実施形態では、到着角／強度コンバータを伴わない、隣接するピクセルセルによって取得される情報は、入射光の強度のインジケーションを提供し得、到着角／強度コンバータを通して通過する、入射光の部分を決定するために使用されてもよい。本画像情報から、光検出器１４７によって検出される光の到着角は、下記にさらに詳細に説明されるように、算出されてもよい。

図１７Ｂは、２つの格子に関する増加された屈折率の隆起および／または領域が、水平方向に整合されない（Δｓ≠０）（Δｓは、第１のＴＤＭ１５１と第２のＴＤＭ１５３との間の水平オフセットである）ように相互に不整合される、第１のＴＤＭ１５１および第２のＴＤＭ１５３を含む、ピクセルセル１５０の第２の配列を図示する。第１のＴＤＭ１５１および第２のＴＤＭ１５３は両方とも、同一格子周期ｄを有してもよく、２つの格子は、距離／深度ｚによって分離されてもよい。２つのＴＤＭが整合される、図１７Ａに関連して議論される状況と異なり、不整合は、第２のＴＤＭ１５３を通して通過する、ゼロと異なる角度の入射光をもたらす。

図１７Ｂに図示されるように、ゼロ度の到着角を伴う入射光１５２は、第１のＴＤＭ１５１によって回折される。第２のＴＤＭ１５３は、Ｔａｌｂｏｔ長に等しい深度に位置するが、２つの格子の水平オフセットに起因して、光１５２の少なくとも一部は、第２のＴＤＭ１５３によって遮断される。光１５２から生じる破線は、光検出器１５７に到達する光の量が減衰されることを図示する。ある場合には、光１５２は、回折格子１５３によって完全に遮断されてもよい。他方では、非ゼロ到着角θを伴う入射光１５４は、第１のＴＤＭ１５１によって回折されるが、第２のＴＤＭ１５３を通して通過する。随意の誘電層１５５を横断後、光検出器１５７は、光検出器１５７上に入射する光を検出し、光検出器上に入射する光の強度に比例する性質（例えば、電圧または電流）を伴う、電気信号を生成する。

ピクセルセル１４０および１５０は、異なる入射角に関して検出された光の異なる強度を伴う、異なる出力関数を有する。しかしながら、いずれの場合も、関係は、固定され、ピクセルセルの設計に基づいて、または較正プロセスの一部としての測定によって決定されてもよい。精密な伝達関数にかかわらず、測定された強度は、到着角に変換されてもよく、これは、ひいては、結像されているオブジェクトまでの距離を決定するために使用されてもよい。

いくつかの実施形態では、画像センサの異なるピクセルセルは、ＴＤＭの異なる配列を有してもよい。例えば、ピクセルセルの第１のサブセットは、各ピクセルと関連付けられる２つのＴＤＭの格子間の第１の水平オフセットを含んでもよい一方、ピクセルセルの第２のサブセットは、各ピクセルセルと関連付けられる２つのＴＤＭの格子間の第２の水平オフセットを含んでもよく、第１のオフセットは、第２のオフセットと異なる。異なるオフセットを伴う、ピクセルセルの各サブセットは、異なる到着角または異なる到着角の範囲を測定するために使用されてもよい。例えば、ピクセルの第１のサブセットは、図１７Ａのピクセルセル１４０に類似するＴＤＭの配列を含んでもよく、ピクセルの第２のサブセットは、図１７Ｂのピクセルセル１５０に類似するＴＤＭの配列を含んでもよい。

いくつかの実施形態では、画像センサの全てのピクセルセルが、ＴＤＭを含むわけではない。例えば、ピクセルセルのサブセットは、カラーフィルタを含んでもよい一方、ピクセルセルの異なるサブセットは、到着角情報を決定するためのＴＤＭを含んでもよい。他の実施形態では、カラーフィルタは、ピクセルセルの第１のサブセットが、単に、入射光の全体的強度を測定し、ピクセルセルの第２のサブセットが、到着角情報を測定するように、使用されない。いくつかの実施形態では、ＴＤＭを伴わない、近隣のピクセルセルからの光の強度に関する情報が、１つ以上のＴＤＭを伴う、ピクセルセル上に入射する光に関する到着角を決定するために使用されてもよい。例えば、Ｔａｌｂｏｔ効果を利用するように配列される、２つのＴＤＭを使用すると、第２のＴＤＭ後の光検出器上に入射する光の強度は、第１のＴＤＭ上に入射する光の到着角のシヌソイド関数である。故に、第１のＴＤＭ上に入射する光の総強度が、既知である場合、光の到着角が、光検出器によって検出された光の強度から決定されてもよい。

いくつかの実施形態では、サブアレイ内のピクセルセルの構成は、適切な分解能を伴う、種々のタイプの画像情報を提供するように選択されてもよい。図１８Ａ－Ｃは、画像センサのピクセルサブアレイ内のピクセルセルの例示的配列を図示する。図示される実施例は、非限定的であって、代替ピクセル配列も本発明者らによって検討されることを理解されたい。本配列は、画像アレイを横断して繰り返されてもよく、これは、数百万のピクセルを含有してもよい。サブアレイは、入射光についての到着角情報を提供する、１つ以上のピクセルセルと、入射光についての強度情報を提供する、１つ以上の他のピクセルセル（カラーフィルタの有無にかかわらず）とを含んでもよい。

図１８Ａは、相互に異なり、正方形ではなく、矩形である、第１のピクセルセルのセット１６１と、第２のピクセルセルのセット１６３とを含む、ピクセルサブアレイ１６０の実施例である。「Ｒ」と標識されたピクセルセルは、赤色入射光が、フィルタを通して、関連付けられた光検出器に通過するように、赤色フィルタを伴う、ピクセルセルであって、「Ｂ」と標識されたピクセルセルは、青色入射光が、フィルタを通して、関連付けられた光検出器に通過するように、青色フィルタを伴う、ピクセルセルであって、「Ｇ」と標識されたピクセルセルは、緑色入射光が、フィルタを通して、関連付けられた光検出器に通過するように、緑色フィルタを伴う、ピクセルである。例示的サブアレイ１６０では、赤色または青色ピクセルセルより多くの緑色ピクセルセルが存在し、種々のタイプのピクセルセルが同一割合で存在する必要はないことを図示する。

Ａ１およびＡ２と標識されたピクセルセルは、到着角情報を提供する、ピクセルである。例えば、ピクセルセルＡ１およびＡ２は、到着角情報を決定するための１つ以上の格子を含んでもよい。到着角情報を提供する、ピクセルセルは、同様に構成されてもよい、または異なる範囲の到着角または異なる軸に対する到着角に敏感であるように等、異なるように構成されてもよい。いくつかの実施形態では、Ａ１およびＡ２と標識されたピクセルは、２つのＴＤＭを含み、ピクセルセルＡ１およびＡ２のＴＤＭは、異なる方向に、例えば、相互に垂直に配向されてもよい。他の実施形態では、ピクセルセルＡ１およびＡ２のＴＤＭは、相互に平行に配向されてもよい。

ピクセルサブアレイ１６０を使用する、実施形態では、カラー画像データおよび到着角情報の両方が、取得されてもよい。ピクセルセルのセット１６１上に入射する光の到着角を決定するために、セット１６１上に入射する総光強度が、ＲＧＢピクセルセルからの電気信号を使用して推定される。Ａ１／Ａ２ピクセルによって検出される光の強度が、到着角の関数として、予測可能方法において変動するという事実を使用して、到着角は、総強度（ピクセルのグループ内のＲＧＢピクセルセルから推定される）とＡ１および／またはＡ２ピクセルセルによって測定された強度を比較することによって決定されてもよい。例えば、Ａ１および／またはＡ２ピクセル上に入射する光の強度は、入射光の到着角に対して正弦曲線状に変動し得る。ピクセルセルのセット１６３上に入射する光の到着角は、セット１６３のピクセルによって生成された電気信号を使用して、類似方法によって決定される。

図１８Ａは、サブアレイの具体的実施形態を示し、他の構成も、可能性として考えられることを理解されたい。いくつかの実施形態では、例えば、サブアレイは、ピクセルセルのセット１６１または１６３のみであってもよい。

図１８Ｂは、第１のピクセルセルのセット１７１と、第２のピクセルセルのセット１７２と、第３のピクセルセルのセット１７３と、第４のピクセルセルのセット１７４とを含む、代替ピクセルサブアレイ１７０である。ピクセルセルの各セット１７１－１７４は、正方形であって、その中に同一配列のピクセルセルを有するが、異なる角度の範囲にわたる、または異なる平面に対する、到着角情報を決定するためのピクセルセルを有する可能性がある（例えば、ピクセルＡ１およびＡ２のＴＤＭは、相互に垂直に配向されてもよい）。ピクセルの各セット１７１－１７４は、１つの赤色ピクセルセル（Ｒ）と、１つの青色ピクセルセル（Ｂ）と、１つの緑色ピクセルセル（Ｇ）と、１つの到着角ピクセルセル（Ａ１またはＡ２）とを含む。例示的ピクセルサブアレイ１７０では、等数の赤色／緑色／青色ピクセルセルが各セット内に存在することに留意されたい。さらに、ピクセルサブアレイは、１つ以上の方向に繰り返され、より大きいピクセルのアレイを形成してもよいことを理解されたい。

ピクセルサブアレイ１７０を使用する、実施形態では、カラー画像データおよび到着角情報の両方が、取得されてもよい。ピクセルセルのセット１７１上に入射する光の到着角を決定するために、セット１７１上に入射する総光強度が、ＲＧＢピクセルセルからの信号を使用して推定されてもよい。到着角ピクセルセルによって検出された光の強度が、到着角に対して正弦波または他の予測可能応答を有するという事実を使用して、到着角は、総強度（ＲＧＢピクセルセルから推定される）とＡ１ピクセルによって測定された強度を比較することによって決定されてもよい。ピクセルセルのセット１７２－１７４上に入射する光の到着角は、各個別のピクセルのセットのピクセルセルによって生成された電気信号を使用して、類似方法において決定されてもよい。

図１８Ｃは、第１のピクセルセルのセット１８１と、第２のピクセルセルのセット１８２と、第３のピクセルセルのセット１８３と、第４のピクセルセルのセット１８４とを含む、代替ピクセルサブアレイ１８０である。ピクセルセルの各セット１８１－１８４は、正方形であって、その中に同一配列のピクセルセルを有し、カラーフィルタは、使用されない。ピクセルセルの各セット１８１－１８４は、２つの「白色」ピクセル（例えば、赤色、青色、および緑色光が、グレースケール画像を形成するために検出されるように、カラーフィルタがない）と、第１の方向に配向される、ＴＤＭを伴う、１つの到着角ピクセルセル（Ａ１）と、第２の間隔を伴って、または第１の方向に対して第２の方向（例えば、垂直）に配向される、ＴＤＭを伴う、１つの到着角ピクセルセル（Ａ２）とを含む。例示的ピクセルサブアレイ１７０では、色情報が存在しないことに留意されたい。結果として生じる画像は、グレースケールであって、受動深度情報が、カラーまたはグレースケール画像アレイ内で本明細書に説明されるような技法を使用して入手され得ることを図示する。本明細書に説明される他のサブアレイ構成と同様に、ピクセルサブアレイ配列は、１つ以上の方向に繰り返され、より大きいピクセルのアレイを形成してもよい。

ピクセルサブアレイ１８０を使用する、実施形態では、グレースケール画像データおよび到着角情報の両方が、取得されてもよい。ピクセルセルのセット１８１上に入射する光の到着角を決定するために、セット１８１上に入射する総光強度が、２つの白カラーピクセルからの電気信号を使用して推定される。Ａ１およびＡ２ピクセルによって検出された光の強度が、到着角に対して正弦波または他の予測可能応答を有するという事実を使用して、到着角は、総強度（白色ピクセルから推定される）とＡ１および／またはＡ２ピクセルセルによって測定された強度を比較することによって決定されてもよい。ピクセルセルのセット１８２－１８４上に入射する光の到着角は、各個別のピクセルのセットのピクセルによって生成された電気信号を使用して、類似方法において決定されてもよい。

上記の実施例では、ピクセルセルは、正方形として図示されており、正方形グリッドにおいて配列される。実施形態は、そのように限定されない。例えば、いくつかの実施形態では、ピクセルセルは、矩形形状であってもよい。さらに、サブアレイは、三角形である、または対角線上に配列される、または他の幾何学形状を有してもよい。

いくつかの実施形態では、到着角情報は、画像プロセッサ７０８またはローカルデータ処理モジュール７０と関連付けられるプロセッサを使用して取得され、これはさらに、到着角に基づいて、オブジェクトの距離を決定してもよい。例えば、到着角情報は、１つ以上の他のタイプの情報と組み合わせられ、オブジェクトの距離を取得してもよい。いくつかの実施形態では、メッシュモデル４６のオブジェクトは、ピクセルアレイからの到着角情報と関連付けられてもよい。メッシュモデル４６は、ユーザからの距離を含む、オブジェクトの場所を含んでもよく、これは、到着角情報に基づいて、新しい距離値に更新されてもよい。

到着角情報を使用して、距離値を決定することは、特に、オブジェクトがユーザに近いシナリオにおいて有用であり得る。これは、画像センサからの距離の変化が、ユーザから遠くに位置付けられるオブジェクトに関する類似大きさの距離変化より大きい、近隣のオブジェクトに関する光の到着角の変化をもたらすためである。故に、到着角に基づく受動距離情報を利用する、処理モジュールは、オブジェクトの推定される距離に基づいて、その情報を選択的に使用してもよく、１つ以上の他の技法を利用して、いくつかの実施形態では、最大１メートル、最大３メートル、または最大５メートル等の閾値距離を越える、オブジェクトまでの距離を決定してもよい。具体的実施例として、ＡＲシステムの処理モジュールは、ウェアラブルデバイスのユーザの３メートル以内のオブジェクトに関する到着角情報を使用して、受動距離測定を使用するようにプログラムされてもよいが、その範囲外のオブジェクトに関しては、２つのカメラによって捕捉された画像を使用して、立体視画像処理を使用してもよい。

同様に、到着角情報を検出するように構成される、ピクセルは、画像アレイに対する法線からある角度範囲内の距離の変化に最も敏感であり得る。処理モジュールは、同様に、その角度の範囲内の到着角測定から導出される距離情報を使用するが、その範囲外の距離を決定するためには、他のセンサおよび／または他の技法を使用するように構成されてもよい。

画像センサからオブジェクトの距離を決定する一例示的用途は、手の追跡である。手の追跡は、ＡＲシステムにおいて、例えば、システム８０のためのジェスチャベースのユーザインターフェースを提供するために、および／またはユーザが、システム８０によって提供されるＡＲ体験において、環境内の仮想オブジェクトを移動させることを可能にするために、使用されてもよい。正確な深度決定に関する到着角情報を提供する、画像センサと、ユーザの手の運動を決定するためのプロセスへのデータの量を低減させるための差分読取回路網の組み合わせは、効率的インターフェースを提供し、それによってユーザは、仮想オブジェクトと相互作用し、および／またはシステム８０への入力を提供することができる。ユーザの手の場所を決定する処理モジュールは、ウェアラブルデバイスの画像センサの視野内のユーザの手の場所に応じて異なる技法を使用して入手された、距離情報を使用してもよい。手の追跡は、いくつかの実施形態によると、画像感知プロセスの間、パッチ追跡の形態として実装されてもよい。

深度情報が有用であり得る、別の用途は、オクルージョン処理である。オクルージョン処理は、深度情報を使用して、物理的世界のモデルのある部分が、ユーザの周囲の物理的環境についての画像情報を収集する１つ以上の画像センサによって捕捉されている画像情報に基づいて更新される必要がない、または更新されることができないことを決定する。例えば、第１のオブジェクトが、センサから第１の距離に存在することが決定される場合、システム８０は、第１の距離を上回る距離にわたって、物理的世界のモデルを更新しないことを決定してもよい。例えば、モデルが、第２のオブジェクトをセンサから第２の距離に含み、第２の距離が第１の距離を上回る場合でも、そのオブジェクトに関するモデル情報は、第１のオブジェクトの背後にある場合、更新されなくてもよい。いくつかの実施形態では、システム８０は、第１のオブジェクトの場所に基づいて、オクルージョンマスクを生成し、オクルージョンマスクによってマスクされないモデルの部分のみを更新してもよい。いくつかの実施形態では、システム８０は、１つを上回るオブジェクトのために、１つを上回るオクルージョンマスクを生成してもよい。各オクルージョンマスクは、センサからの個別の距離と関連付けられてもよい。オクルージョンマスク毎に、個別のオクルージョンマスクと関連付けられる距離を上回るセンサからの距離にある、オブジェクトと関連付けられるモデル情報は、更新されないであろう。任意の所与の時間において更新される、モデルの部分を限定することによって、ＡＲ環境を生成する速さおよびＡＲ環境を生成するために必要とされる算出リソースの量は、低減される。

図１８Ａ－Ｃに示されないが、画像センサのいくつかの実施形態は、カラーフィルタに加え、またはその代わりに、ＩＲフィルタを伴う、ピクセルを含んでもよい。例えば、ＩＲフィルタは、９４０ｎｍとほぼ等しい等の波長の光が、通過し、関連付けられる光検出器によって検出されることを可能にし得る。ウェアラブルのいくつかの実施形態は、ＩＲフィルタ（例えば、９４０ｎｍ）と関連付けられるものと同一波長の光を放出する、ＩＲ光源（例えば、ＩＲＬＥＤ）を含んでもよい。ＩＲ光源およびＩＲピクセルは、センサからのオブジェクトの距離を決定する代替方法として使用されてもよい。一例として、限定ではなく、ＩＲ光源は、パルス状であってもよく、飛行時間測定が、センサからのオブジェクト距離を決定するために使用されてもよい。

いくつかの実施形態では、システム８０は、１つ以上の動作モードで動作することが可能であり得る。第１のモードは、深度決定が、例えば、到着角／強度コンバータを伴うピクセルを使用して決定された光の到着角に基づいて、受動深度測定を使用して行われる、モードであってもよい。第２のモードは、深度決定が、例えば、画像センサのＩＲピクセルを使用して測定されたＩＲ光の飛行時間に基づいて、能動深度測定を使用して行われる、モードであってもよい。第３のモードは、２つの別個の画像センサからの立体視測定を使用して、オブジェクトの距離を決定してもよい。そのような立体視測定は、オブジェクトがセンサから非常に遠いとき、到着角／強度コンバータを伴うピクセルを使用して決定された光の到着角を使用するより正確であり得る。深度を決定する他の好適な方法も、深度決定のための１つ以上の付加的動作モードのために使用されてもよい。

いくつかの実施形態では、受動深度決定を、そのような技法がより少ない電力を利用するため、使用することが好ましくあり得る。しかしながら、本システムは、ある条件下では、能動モードで動作すべきであることを決定し得る。例えば、センサによって検出されている可視光の強度が、閾値を下回る場合、暗すぎて、受動深度決定を正確に実施することができない場合がある。別の実施例として、オブジェクトが、受動深度決定のために遠すぎて、正確ではない場合がある。したがって、本システムは、深度が、２つの空間的に分離される画像センサを使用して、場面の立体視測定に基づいて決定される、第３のモードで動作することを選択するようにプログラムされてもよい。別の実施例として、到着角／強度コンバータを伴うピクセルを使用して決定された光の到着角に基づいて、オブジェクトの深度を決定することは、画像センサの周縁では、不正確な場合がある。故に、オブジェクトが、画像センサの周縁の近くのピクセルによって検出されている場合、本システムは、能動深度決定を使用して、第２のモードで動作することを選択してもよい。

上記に説明される画像センサの実施形態は、スタックされたＴＤＭを伴う、個々のピクセルセルを使用して、ピクセルセル上に入射する光の到着角を決定したが、他の実施形態は、グループの全てのピクセルにわたって単一ＴＤＭを伴う、複数のピクセルセルのグループを使用して、到着角情報を決定してもよい。ＴＤＭは、センサアレイを横断して光のパターンを投影してもよく、そのパターンは、入射光の到着角に依存する。１つのＴＤＭと関連付けられる、複数の光検出器は、複数の光検出器の各光検出器が、像面（光を感知する光検出器を備える、像面）内の異なる位置に位置するため、そのパターンをより正確に検出し得る。各光検出器によって感知される相対的強度は、入射光の到着角を示し得る。

図１９Ａは、いくつかの実施形態による、単一透過性回折マスク（ＴＤＭ）と関連付けられる、複数の光検出器（画像センサのピクセルセルのサブアレイであり得る、光検出器アレイ１２０の形態にある）の上部平面図実施例である。図１９Ｂは、図１９Ａの線Ａに沿った、図１９Ａと同一光検出器アレイの断面図である。光検出器アレイ１２０は、示される実施例では、１６個の別個の光検出器１２１を含み、これは、画像センサのピクセルセル内にあってもよい。光検出器アレイ１２０は、光検出器の上方に配置される、ＴＤＭ１２３を含む。ピクセルセルの各グループは、明確性および単純性のために、４つのピクセルとともに図示される（例えば、４つのピクセル×４つのピクセルのグリッドを形成する）ことを理解されたい。いくつかの実施形態は、４つを上回るピクセルセルを含んでもよい。例えば、１６個のピクセルセル、６４個のピクセルセル、または任意の他の数のピクセルが、各グループ内に含まれてもよい。

ＴＤＭ１２３は、光検出器１２１から距離ｘに位置する。いくつかの実施形態では、ＴＤＭ１２３は、図１９Ｂに図示されるように、誘電層１２５の上部表面上に形成される。例えば、ＴＤＭ１２３は、図示されるように、隆起から、または誘電層１２５の表面の中にエッチングされる、谷によって、形成されてもよい。他の実施形態では、ＴＤＭ１２３は、誘電層内に形成されてもよい。例えば、誘電層の部分は、誘電層の他の部分に対してより高いまたはそれより低い屈折率を有するように修正され、ホログラフィック位相格子をもたらしてもよい。上方から光検出器アレイ１２０上に入射する光は、ＴＤＭによって回折され、光検出器１２１が位置する、ＴＤＭ１２３から距離ｘの像面における位置に変換されるような入射光の到着角をもたらす。光検出器のアレイの各光検出器１２１において測定された入射光の強度は、入射光の到着角を決定するために使用されてもよい。

図２０Ａは、いくつかの実施形態による、複数のＴＤＭと関連付けられる、複数の光検出器（光検出器アレイ１３０の形態にある）の実施例を図示する。図２０Ｂは、図２０Ａの線Ｂを通る、図２０Ａと同一光検出器アレイの断面図である。図２０Ｃは、図２０Ａの線Ｃを通る、図２０Ａと同一光検出器アレイの断面図である。光検出器アレイ１３０は、示される実施例では、１６個の別個の光検出器を含み、これは、画像センサのピクセルセル内にあってもよい。図示されるように、４つのピクセルセルの４つのグループ１３１ａ、１３１ｂ、１３１ｃ、１３１ｄが存在する。光検出器アレイ１３０は、４つの別個のＴＤＭ１３３ａ、１３３ｂ、１３３ｃ、１３３ｄを含み、各ＴＤＭは、ピクセルセルの関連付けられるグループの上方に提供される。ピクセルセルの各グループは、明確性および単純性のために、４つのピクセルセルとともに図示されることを理解されたい。いくつかの実施形態は、４つを上回るピクセルセルを含んでもよい。例えば、１６個のピクセルセル、６４個のピクセルセル、または任意の他の数のピクセルセルが、各グループ内に含まれてもよい。

各ＴＤＭ１３３ａ－ｄは、光検出器１３１ａ－ｄから距離ｘに位置する。いくつかの実施形態では、ＴＤＭ１３３ａ－ｄは、図２０Ｂに図示されるように、誘電層１３５の上部表面上に形成される。例えば、ＴＤＭ１２３ａ－ｄは、図示されるように、隆起から、または誘電層１３５の表面の中にエッチングされる、谷によって、形成されてもよい。他の実施形態では、ＴＤＭ１３３ａ－ｄは、誘電層内に形成されてもよい。例えば、誘電層の部分は、誘電層の他の部分に対してより高いまたはそれより低い屈折率を有するように修正され、ホログラフィック位相格子をもたらしてもよい。上方から光検出器アレイ１３０上に入射する光は、ＴＤＭによって回折され、光検出器１３１ａ－ｄが位置する、ＴＤＭ１３３ａ－ｄから距離ｘの像面における位置に変換されるような入射光の到着角をもたらす。光検出器のアレイの各光検出器１３１ａ－ｄにおいて測定された入射光の強度は、入射光の到着角を決定するために使用されてもよい。

ＴＤＭ１３３ａ－ｄは、相互から異なる方向に配向されてもよい。例えば、ＴＤＭ１３３ａは、ＴＤＭ１３３ｂと垂直である。したがって、光検出器グループ１３１ａを使用して検出された光の強度は、ＴＤＭ１３３ａと垂直な平面における入射光の到着角を決定するために使用されてもよく、光検出器グループ１３１ｂを使用して検出された光の強度は、ＴＤＭ１３３ｂと垂直な平面における入射光の到着角を決定するために使用されてもよい。同様に、光検出器グループ１３１ｃを使用して検出された光の強度は、ＴＤＭ１３３ｃと垂直な平面における入射光の到着角を決定するために使用されてもよく、光検出器グループ１３１ｄを使用して検出された光の強度は、ＴＤＭ１３３ｄと垂直な平面における入射光の到着角を決定するために使用されてもよい。

深度情報を受動的に入手するように構成される、ピクセルセルは、クロスリアリティシステムにおいて有用な動作をサポートするための本明細書に説明されるような特徴とともに、画像アレイ内に統合されてもよい。いくつかの実施形態によると、深度情報を入手するように構成される、ピクセルセルは、グローバルシャッタを伴うカメラを実装するために使用される、画像センサの一部として実装されてもよい。そのような構成は、例えば、完全フレーム出力を提供してもよい。完全フレームは、深度および強度を示す、異なるピクセルに関する画像情報を同時に含み得る。本構成の画像センサを用いることで、プロセッサは、完全場面に関する深度情報を一度に入手し得る。

他の実施形態では、深度情報を提供する、画像センサのピクセルセルは、上記に説明されるようなＤＶＳ技法に従って動作するように構成されてもよい。そのようなシナリオでは、イベントは、ピクセルセルによって示されるように、オブジェクトの深度の変化を示し得る。画像アレイによって出力されるイベントは、深度の変化が検出された、ピクセルセルを示し得る。代替として、または加えて、イベントは、そのピクセルセルに関する深度情報の値を含んでもよい。本構成の画像センサを用いることで、プロセッサは、高一時的分解能を提供するように、非常に高レートで、深度情報更新を入手し得る。

さらに他の実施形態では、画像センサは、完全フレームまたはＤＶＳモードのいずれかで動作するように構成されてもよい。そのような実施形態では、画像センサからの画像情報を処理する、プロセッサは、プロセッサによって実施されている機能に基づいて、画像センサの動作モードをプログラムで制御してもよい。例えば、オブジェクトを追跡することを伴う機能を実施している間、プロセッサは、画像情報をＤＶＳイベントとして出力するように、画像センサを構成してもよい。他方では、世界再構築を更新するために処理している間、プロセッサは、完全フレーム深度情報を出力するように、画像センサを構成してもよい。

ウェアラブル構成

複数の画像センサが、ＸＲシステム内で使用されてもよい。画像センサは、レンズ等の光学コンポーネントおよび制御回路網と組み合わせられ、カメラを作成してもよい。それらの画像センサは、グレースケール結像、カラー結像、グローバルシャッタ、ＤＶＳ技法、プレノプティックピクセルセル、および／または動的パッチ等の上記に説明される技法のうちの１つ以上のものを使用して、結像情報を入手してもよい。使用される結像技法にかかわらず、結果として生じるカメラは、支持部材に搭載され、ヘッドセットを形成してもよく、これは、プロセッサを含む、またはそれに接続されてもよい。

図２１は、開示される実施形態と一致する、ウェアラブルディスプレイシステムのヘッドセット２１００を図示する、概略図である。図２１に示されるように、ヘッドセット２１００は、視覚的情報をユーザの眼に伝送および／または表示するように構成される、光学接眼レンズまたはディスプレイであり得る、単眼２１１０ａおよび単眼２１１０ｂを備える、ディスプレイデバイスを含んでもよい。ヘッドセット２１００はまた、図３Ｂに関して上記に説明されるフレーム６４に類似し得る、フレーム２１０１を含んでもよい。ヘッドセット２１００はさらに、２つのカメラ（カメラ２１２０およびカメラ２１４０）と、エミッタ２１３０ａ、エミッタ２１３０ｂ、慣性測定ユニット２１７０ａ（ＩＭＵ２１７０ａ）、および慣性測定ユニット２１７０ｂ（ＩＭＵ２１７０ｂ）等の付加的コンポーネントとを含んでもよい。

カメラ２１２０およびカメラ２１４０は、世界カメラであって、それらは、ヘッドセット２１００を装着しているユーザによって見られるような物理的世界を結像するように配向される。いくつかの実施形態では、それらの２つのカメラは、物理的世界についての画像情報を入手するために十分であり得、それらの２つのカメラは、世界に面したカメラのみであってもよい。ヘッドセット２１００はまた、図３Ｂに関して上記に議論されるように、眼追跡カメラ等の付加的コンポーネントを含んでもよい。

単眼２１１０ａおよび単眼２１１０ｂは、接着剤、締結具、または圧力嵌合の技法を使用して、フレーム２１０１等の支持部材に機械的に結合されてもよい。同様に、２つのカメラおよび付帯コンポーネント（例えば、エミッタ、慣性測定ユニット、眼追跡カメラ等）は、接着剤、締結具、圧力嵌合等の技法を使用して、フレーム２１０１に機械的に結合されてもよい。これらの機械的結合は、直接または間接であってもよい。例えば、１つ以上のカメラおよび／または付帯コンポーネントのうちの１つ以上のものは、直接、フレーム２１０１に取り付けられてもよい。付加的実施例として、１つ以上のカメラおよび／または付帯コンポーネントのうちの１つ以上のものは、直接、単眼に取り付けられてもよく、これは、次いで、フレーム２１０１に取り付けられてもよい。取付の機構は、限定することを意図するものではない。

代替として、単眼サブアセンブリが、形成され、次いで、フレーム２１０１に取り付けられてもよい。各サブアセンブリは、例えば、それに対して単眼２１１０ａまたは２１１０ｂが取り付けられる、支持部材を含んでもよい。ＩＭＵおよび１つ以上のカメラは、同様に、支持部材に取り付けられてもよい。カメラおよびＩＭＵの両方を同一支持部材に取り付けることは、カメラについての慣性情報が、ＩＭＵの出力に基づいて取得されることを可能にし得る。同様に、単眼をカメラと同一支持部材に取り付けることは、世界についての画像情報が、単眼上にレンダリングされた情報と空間的に相関されることを可能にし得る。

ヘッドセット２１００は、軽量であってもよい。例えば、ヘッドセット２１００は、３０～３００グラムの重量であってもよい。ヘッドセット２１００は、プラスチックまたは薄金属構成要素等、使用時、撓曲する、材料から作製されてもよい。そのような材料は、長時間にわたってユーザによって装着され得る、軽量かつ快適なヘッドセットを可能にし得る。そのような軽量ヘッドセットを伴うＸＲシステムは、それでもなお、ヘッドセットが装着されるにつれて繰り返され、使用時、ヘッドセットの撓曲から生じるであろう、任意の不正確度を補償し得る、較正ルーチンを使用して、（カメラ間の分離が把握されることを要求する）高正確度立体視画像分析をサポートし得る。いくつかの実施形態では、軽量ヘッドセットは、バッテリパックを含んでもよい。バッテリパックは、１つ以上のバッテリを含んでもよく、これは、再充電可能または非再充電可能であってもよい。バッテリパックは、軽量フレームの中に構築されてもよい、またはリムーバブルであってもよい。バッテリパックおよび軽量フレームは、単一ユニットとして形成されてもよい、またはバッテリパックは、軽量フレームと別個にユニットとして形成されてもよい。

カメラ２１２０は、画像センサと、レンズとを含んでもよい。画像センサは、グレースケール画像を生産するように構成されてもよい。画像センサは、１メガピクセル～４メガピクセルのサイズの画像を入手するように構成されてもよい。例えば、画像センサは、１，０１６本の線の水平分解能×１，０１６本の線の垂直分解能を伴う、画像を入手するように構成されてもよい。画像センサは、繰り返しまたは周期的に、画像を入手するように構成されてもよい。例えば、画像センサは、６０Ｈｚ等、３０Ｈｚ～１２０Ｈｚの周波数において、画像を入手するように構成されてもよい。画像センサは、ＣＭＯＳ画像センサであってもよい。画像センサは、グローバルシャッタとともに構成されてもよい。図１４および図１５に関して上記に議論されるように、グローバルシャッタは、各ピクセルが、同時に、強度測定を入手することを可能にし得る。いくつかの実施形態では、カメラ２１２０は、プレノプティックカメラとして構成されることができる。例えば、図３Ｂおよび図１５－２０Ｃに関して上記に議論されるように、あるコンポーネントが、画像センサの１つ以上のピクセルセルへの光経路内に、これらのピクセルセルが、ピクセルセル上に入射する光の到着角を示す強度を有する、出力を生産するように設置されることができる。そのような実施形態では、画像センサは、深度情報を受動的に入手し得る。光経路内への設置のために好適なコンポーネントの実施例は、ＴＤＭフィルタである。プロセッサは、到着角情報を使用して、結像されているオブジェクトまでの距離を算出するように構成されることができる。例えば、到着角情報は、そこから光が反射されている、オブジェクトまでの距離を示す、距離情報に変換されることができる。いくつかの実施形態では、到着角情報を提供するように構成される、ピクセルセルは、１つ以上の色の光強度を捕捉するピクセルセルとともに散在されてもよい。結果として、到着角情報、したがって、距離情報は、オブジェクトについての他の画像情報と組み合わせられてもよい。いくつかの実施形態では、カメラ２１２０は、パッチ追跡機能性を提供するように構成されてもよい。ヘッドセット２１００のプロセッサは、カメラ２１２０に、画像捕捉をピクセルのサブセットに制限するように命令を提供するように構成されることができる。いくつかの実施形態では、画像センサは、ＩＭＸ４１８画像センサまたは均等物であることができる。

カメラ２１２０は、開示される実施形態と一致する、広視野を有するように構成されることができる。例えば、カメラ２１２０は、等距離レンズ（例えば、魚眼レンズ）を含んでもよい。カメラ２１２０は、ヘッドセット２１００上の内側に角度付けられてもよい。例えば、カメラ２１２０と関連付けられる視野である、視野２１２１の中心を通る垂直平面は、ヘッドセット２１００の正中線を通る垂直平面と交差し、それとある角度を形成してもよい。この角度は、１°～４０°であり得る。いくつかの実施形態では、視野２１２１は、水平視野と、垂直視野とを有してもよい。水平視野の範囲は、９０度～１７５度であってもよい一方、垂直視野の範囲は、７０～１２５度であってもよい。いくつかの実施形態では、カメラ２１２０は、ピクセルあたり１～５分の角度ピクセル分解能を保有するように構成されることができる。

エミッタ２１３０ａおよびエミッタ２１３０ｂは、低光量条件下での結像および／またはヘッドセット２１００による能動深度感知を可能にし得る。エミッタ２１３０ａおよびエミッタ２１３０ｂは、光を特定の波長で放出するように構成されてもよい。本光は、ユーザの周囲の物理的世界内の物理的オブジェクトによって反射されることができる。ヘッドセット２１００は、本明細書に説明されるような画像センサを含む、本反射された光を検出するためのセンサとともに、構成されてもよい。いくつかの実施形態では、これらのセンサは、カメラ２１２０またはカメラ２１４０のうちの少なくとも１つの中に組み込まれてもよい。例えば、図１８Ａ－１８Ｃに関して上記に説明されるように、これらのカメラは、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂに対応する、検出器とともに構成されてもよい。例えば、これらのカメラは、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂによって放出される光を検出するように構成される、ピクセルを含んでもよい。

エミッタ２１３０ａおよびエミッタ２１３０ｂは、開示される実施形態と一致する、ＩＲ光を放出するように構成されてもよい。ＩＲ光は、９００ナノメートル～１マイクロメートルの波長を有してもよい。ＩＲ光は、９４０ｎｍ光源であってもよく、例えば、放出される光エネルギーは、約９４０ｎｍに集中される。他の波長の光を放出するエミッタも、代替として、または加えて、使用されてもよい。屋内専用使用のために意図されるシステムに関して、例えば、約８５０ｎｍに集中される光を放出するエミッタが、使用されてもよい。ＤＶＳカメラ２１２０またはカメラ２１４０のうちの少なくとも１つは、カメラの画像センサ内のピクセルの少なくともサブセットにわたって配置される、１つ以上のＩＲフィルタを含んでもよい。フィルタは、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂによって放出される波長における光を通過させる一方、ある他の波長における光を減衰させ得る。例えば、ＩＲフィルタは、ノッチフィルタであって、エミッタのものに合致する波長を伴うＩＲ光を通過させ得る。ノッチフィルタは、他のＩＲ光を実質的に減衰させ得る。いくつかの実施形態では、ノッチフィルタは、ＩＲノッチフィルタであって、ＩＲ光を遮断し、エミッタからの光が通過することを可能にし得る。ＩＲノッチフィルタはまた、ＩＲ帯域外の光が通過することを可能にし得る。そのようなノッチフィルタは、画像センサが、可視光と、画像センサの視野内のオブジェクトから反射されたエミッタからの光の両方を受け取ることを可能にし得る。このように、ピクセルのサブセットは、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂによって放出されるＩＲ光のための検出器としての役割を果たし得る。

いくつかの実施形態では、ＸＲシステムのプロセッサは、低光量条件下での結像を可能にするため等、エミッタを選択的に有効にしてもよい。プロセッサは、１つ以上の画像センサによって生成された画像情報を処理してもよく、エミッタが有効にされずに、それらの画像センサによって出力される画像が物理的世界内のオブジェクトについての適正な情報を提供するかどうかを検出してもよい。プロセッサは、画像が低周囲光条件の結果として適正な画像情報を提供しないことを検出することに応答して、エミッタを有効にしてもよい。例えば、エミッタは、立体視情報が、オブジェクトを追跡するために使用されており、周囲光の欠如が、追跡されているオブジェクトの特徴間に、立体視画像技法を使用して距離を正確に決定するために不十分なコントラストを伴う、画像をもたらすとき、オンにされてもよい。

代替として、または加えて、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂは、光を短パルスにおいて放出すること等によって、能動深度測定を行う際に使用するために構成されてもよい。ウェアラブルディスプレイシステムは、エミッタ２１３０ａの照明野２１３１ａおよび／またはエミッタ２１３０ｂの照明野２１３１ｂ内のオブジェクトからのそのようなパルスの反射を検出することによって、飛行時間測定を実施するように構成されてもよい。これらの飛行時間測定は、オブジェクトを追跡する、またはパス可能世界モデルを更新するための付加的深度情報を提供し得る。他の実施形態では、１つ以上のエミッタは、パターン化された光を放出するように構成されてもよく、ＸＲシステムは、そのパターン化された光によって照明されたオブジェクトの画像を処理するように構成されてもよい。そのような処理は、パターン内の変動を検出し得、これは、オブジェクトまでの距離を明らかにし得る。

いくつかの実施形態では、エミッタと関連付けられる照明野の範囲は、少なくとも、オブジェクトについての画像情報を入手するためのカメラの視野を照明するために十分であり得る。例えば、エミッタは、集合的に、中心視野２１５０を照明してもよい。図示される実施形態では、エミッタ２１３０ａおよびエミッタ２１３０ｂは、集合的に、能動照明が提供され得る、範囲に及ぶ、照明野２１３１ａおよび照明野２１３１ｂを照明するように位置付けられてもよい。本例示的実施形態では、２つのエミッタが、示されるが、より多いまたはより少ないエミッタが、所望の範囲に及ぶために使用されてもよいことを理解されたい。

いくつかの実施形態では、エミッタ２１３０ａおよび２１３０ｂ等のエミッタは、デフォルトによって、オフにされ得るが、付加的照明が、受動結像を用いて入手され得るものより多くの情報を入手するために望ましいとき、有効にされてもよい。ウェアラブルディスプレイシステムは、付加的深度情報が要求されるとき、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂを有効にするように構成されてもよい。例えば、ウェアラブルディスプレイシステムが、立体視画像情報を使用して、手または頭部姿勢を追跡するための適正な深度情報を入手することができないことを検出すると、ウェアラブルディスプレイシステムは、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂを有効にするように構成されてもよい。ウェアラブルディスプレイシステムは、付加的深度情報が要求されないとき、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂを無効にし、それによって、電力消費を低減させ、バッテリ寿命を改良するように構成されてもよい。

さらに、ヘッドセットが、ＩＲ光を検出するように構成される画像センサとともに構成される場合でも、ＩＲエミッタが、ヘッドセット２１００上にまたはヘッドセット２１００上にのみ搭載されることは、要件ではない。いくつかの実施形態では、ＩＲエミッタは、ヘッドセット２１００が使用され得る、室内等の空間内に配設された外部デバイスであってもよい。そのようなエミッタは、ヒトの眼に不可視である、９４０ｎｍで、ＡｒＵｃｏパターン等において、ＩＲ光を投影してもよい。そのようなパターンを伴う光は、ヘッドセット２１００が、ＩＲパターンを提供する電力を供給する必要がないが、それでもなお、その画像情報上で実施される処理が空間内のオブジェクトまでの距離またはその場所を決定し得るように、パターンが提示される結果として、ＩＲ画像情報を提供し得る、「計装／補助追跡」を促進し得る。外部照明源を伴うシステムはまた、より多くのデバイスが、その空間で動作することを可能にし得る。それぞれ、固定位置関係を伴わずに、空間を動き回る、複数のヘッドセットが、同一空間内で動作している場合、１つのヘッドセットによって放出される光が、別のヘッドセットの画像センサ上に投影され、したがって、その動作を妨害するであろう、リスクが存在する。ヘッドセット間のそのような干渉のリスクは、空間内で動作し得る、ヘッドセットの数を、例えば、３または４つに限定し得る。ヘッドセット上の画像センサによって結像され得るオブジェクトを照明する、１つ以上のＩＲエミッタを空間内で用いることで、いくつかの実施形態では、１０を上回る、より多くのヘッドセットが、干渉なく、同一空間内で動作し得る。

図３Ｂに関して上記に開示されるように、カメラ２１４０は、視野２１４１内の物理的世界の画像を捕捉するように構成されてもよい。カメラ２１４０は、画像センサと、レンズとを含んでもよい。画像センサは、カラー画像を生産するように構成されてもよい。画像センサは、４メガピクセル～１６メガピクセルのサイズの画像を入手するように構成されてもよい。例えば、画像センサは、１２メガピクセル画像を入手してもよい。画像センサは、繰り返しまたは周期的に、画像を入手するように構成されてもよい。例えば、画像センサは、６０Ｈｚ等、３０Ｈｚ～１２０Ｈｚの周波数において、画像を入手するように構成されてもよい。

画像センサは、ＣＭＯＳ画像センサであり得る。画像センサは、ロールシャッタとともに構成されてもよい。図１４および図１５に関して上記に議論されるように、ロールシャッタは、異なるサブセット内のピクセルが異なる時間に集められた光強度データを反映させるように、画像センサ内のピクセルのサブセットを反復的に読み取ってもよい。例えば、画像センサは、画像センサ内のピクセルの第１の行を第１の時間に、画像センサ内のピクセルの第２の行をある後の時間に読み取るように構成されてもよい。いくつかの実施形態では、カメラ２１４０は、プレノプティックカメラとして構成されることができる。例えば、図３Ｂおよび図１５－２０Ｃに関して上記に議論されるように、あるコンポーネントが、画像センサの１つ以上のピクセルセルへの光経路内に、これらのピクセルセルが、ピクセルセル上に入射する光の到着角を示す強度を有する、出力を生産するように設置されることができる。そのような実施形態では、画像センサは、深度情報を受動的に入手し得る。光経路内への設置のために好適なコンポーネントの実施例は、透過性回折マスク（ＴＤＭ）フィルタである。プロセッサは、本到着角情報を使用して、結像されているオブジェクトまでの距離を算出するように構成されることができる。例えば、到着角情報は、そこから光が反射されている、オブジェクトまでの距離を示す、距離情報に変換されることができる。いくつかの実施形態では、到着角情報を提供するように構成される、ピクセルセルは、１つ以上の色の光強度を捕捉するピクセルセルとともに散在されてもよい。結果として、到着角情報、したがって、距離情報は、オブジェクトについての他の画像情報と組み合わせられてもよい。いくつかの実施形態では、カメラ２１４０は、パッチ追跡機能性を提供するように構成されてもよい。ヘッドセット２１００のプロセッサは、カメラ２１４０に、画像捕捉をピクセルのサブセットに制限するように命令を提供するように構成されることができる。いくつかの実施形態では、センサは、ＣＭＯＳセンサであってもよい。いくつかの実施形態では、画像センサは、ＩＭＸ３８０画像センサまたは均等物であることができる。

カメラ２１４０は、カメラ２１２０と反対のヘッドセット２１００の側上に位置付けられることができる。例えば、図２１に示されるように、カメラ２１４０が、単眼２１１０ａと同一のヘッドセット２１００の側上にあるとき、カメラ２１２０は、単眼２１１０ｂと同一のヘッドセットの側上にあることができる。カメラ２１４０は、ヘッドセット２１００上に内向きに角度付けられることができる。例えば、カメラ２１４０と関連付けられる視野である、視野２１４１の中心を通る垂直平面は、ヘッドセット２１００の正中線を通る垂直平面と交差し、それとある角度を形成することができる。本角度は、１～２０度であることができる。カメラ２１４０の視野２１４１は、水平視野と、垂直視野とを有してもよい。水平視野の範囲は、７５～１２５度であってもよい一方、垂直視野の範囲は、６０～１２５度であってもよい。

カメラ２１４０およびカメラ２１２０は、ヘッドセット２１００の正中線に向かって内向きに非対称的に角度付けられることができる。カメラ２１４０の角度は、ヘッドセット２１００の正中線に向かって内向きに１～２０度であることができる。カメラ２１２０の角度は、ヘッドセット２１００の正中線に向かって内向きに２０～４０度であることができ、カメラ２１４０の角度と異なることができる。視野２１２０の角度範囲は、視野２１４１の角度範囲を超え得る。

カメラ２１２０およびカメラ２１４０は、中心視野２１５０の重複ビューを提供するように構成されることができる。中心視野２１５０の角度範囲は、４０～１２０度であることができる。例えば、中心視野２１５０の角度範囲は、約６０度（例えば、６０±６度）であることができる。中心視野２１５０は、非対称であることができる。例えば、中心視野２１５０は、図２１に示されるように、カメラ２１４０を含む、ヘッドセット２１００の側に向かってさらに延在することができる。中心視野２１５０に加え、カメラ２１２０およびカメラ２１４０は、少なくとも２つの周辺視野を提供するように位置付けられることができる。周辺視野２１６０ａは、カメラ２１２０と関連付けられることができ、視野２１４１と重複しない、視野２１２１のその部分を含むことができる。いくつかの実施形態では、周辺視野２１６０ａの水平角度範囲は、２０～８０度の範囲であることができる。例えば、周辺視野２１６０ａの角度範囲は、約４０度（例えば、４０±４度）であることができる。周辺視野２１６０ｂ（図２１に描写されない）は、カメラ２１４０と関連付けられることができ、視野２１２１と重複しない、視野２１４１のその部分を含むことができる。いくつかの実施形態では、周辺視野２１６０ｂの水平角度範囲は、１０～４０度の範囲であることができる。例えば、周辺視野２１６０ａの角度範囲は、約２０度（例えば、２０±２度）であることができる。周辺視野の場所は、異なることができる。例えば、ヘッドセット２１００のある構成に関して、周辺視野２１６０ｂは、その距離内において、視野２１４１が、視野２１２１内に全体的に該当し得るため、ヘッドセット２１００の０．２５メートル以内に延在しなくてもよい。対照的に、周辺視野２１６０ａは、ヘッドセット２１００の０．２５メートル以内に延在してもよい。そのような構成では、カメラ２１２０のより広い視野およびより大きい内向き角度は、ヘッドセット２１００の０．２５メートル以内でさえ、視野２１２０が、図２１に示されるように、少なくとも部分的に、視野２１４０外に該当することを確実にし得る。

ＩＭＵ２１７０ａおよび／またはＩＭＵ２１７０ｂは、加速および／または速度および／または傾き情報をウェアラブルディスプレイシステムに提供するように構成されてもよい。例えば、ヘッドセット２１００を装着しているユーザが移動するにつれて、ＩＭＵ２１７０ａおよび／またはＩＭＵ２１７０ｂは、ユーザの頭部の加速および／または速度を説明する情報を提供してもよい。

ウェアラブルディスプレイシステムは、プロセッサに結合されてもよく、これは、カメラを用いて入手された画像情報を処理し、本明細書に説明されるように、情報をカメラを用いて捕捉された画像から抽出、および／または仮想オブジェクトをディスプレイデバイス上にレンダリングするように構成されてもよい。プロセッサは、フレーム２１０１に機械的に結合されてもよい。代替として、プロセッサは、単眼２１１０ａまたは単眼２１１０ｂを含む、ディスプレイデバイス等のディスプレイデバイスに機械的に結合されてもよい。さらなる代替として、プロセッサは、通信リンクを通して、ヘッドセット２１００および／またはディスプレイデバイスに動作可能に結合されてもよい。例えば、ＸＲシステムは、ローカルデータ処理モジュールを含んでもよい。本ローカルデータ処理モジュールは、プロセッサを含んでもよく、物理的接続（例えば、ワイヤまたはケーブル）または無線（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）、Ｗｉ－Ｆｉ、Ｚｉｇｂｅｅ（登録商標）、または同等物）接続を通して、ヘッドセット２１００またはディスプレイデバイスに接続されてもよい。

プロセッサは、世界再構築、頭部姿勢追跡、およびオブジェクト追跡動作を実施するように構成されてもよい。例えば、プロセッサは、カメラ２１２０およびカメラ２１４０を使用して、パス可能世界モデルを作成するように構成されてもよい。パス可能世界モデルを作成する際、プロセッサは、カメラ２１２０およびカメラ２１４０によって入手された同一の物理的オブジェクトの複数の画像を使用して、深度情報を立体視的に決定するように構成されてもよい。付加的実施例として、プロセッサは、カメラ２１２０を使用するが、カメラ２１４０を使用せずに、既存のパス可能世界モデルを更新するように構成されてもよい。上記に述べられたように、カメラ２１２０は、カラーカメラ２１４０より比較的に低い分解能を伴う、グレースケールカメラであってもよい。その結果、カメラ２１４０ではなく、カメラ２１２０によって入手される画像情報を使用して、パス可能世界モデルを更新することは、低減された電力消費および改良されたバッテリ寿命を伴って、迅速に実施され得る。いくつかの実施形態では、プロセッサは、随時または周期的に、カメラ２１２０およびカメラ２１４０を使用して、パス可能世界モデルを更新するように構成されてもよい。例えば、プロセッサは、パス可能世界品質基準がもはや充足されていない、カメラ２１４０によって入手される画像の最後の入手および／または使用以降、所定の時間インターバルが経過している、および／または変化が、現在、カメラ２１２０およびカメラ２１４０の視野内の物理的世界の一部内のオブジェクトに生じていることを決定するように構成されてもよい。

プロセッサは、プレノプティックカメラを使用して、画像センサ上に入射する光に関する到着角情報等のライトフィールド情報を入手するように構成されることができる。いくつかの実施形態では、本プレノプティックカメラは、カメラ２１２０およびカメラ２１４０のうちの少なくとも１つであることができる。開示される実施形態と一致して、深度情報が、本明細書に説明される、または処理を向上させ得るとき、そのような深度情報は、プレノプティックカメラによって取得されるライトフィールド情報から決定される、またはそれによって補完され得る。例えば、カメラ２１４０が、ＴＤＭフィルタを含むとき、プロセッサは、カメラ２１２０および２１４０から取得される画像を、カメラ２１４０から取得されるライトフィールド情報とともに使用して、パス可能世界モデルを作成するように構成されることができる。代替として、または加えて、カメラ２１２０が、ＴＤＭフィルタを含むとき、プロセッサは、カメラ２１２０から取得されるカメラのライトフィールド情報を使用してもよい。パス可能世界モデルの作成に続いて、プロセッサは、少なくとも１つのプレノプティックカメラおよびパス可能世界モデルを使用して、頭部姿勢を追跡するように構成されることができる。

プロセッサは、サイズ低減ルーチンを実施し、カメラ２１４０を使用して入手された画像を調節するように構成されることができる。カメラ２１４０は、カメラ２１２０より大きい画像を生成してもよい。例えば、カメラ２１４０は、１２メガピクセル画像を生成してもよい一方、カメラ２１２０は、１メガピクセル画像を生成してもよい。カメラ２１４０によって生成された画像は、パス可能世界作成、頭部追跡、またはオブジェクト追跡動作を実施するために必要なものより多くの情報を含み得る。本付加的情報の処理は、付加的電力を要求する、バッテリ寿命を低減させる、または待ち時間を増加させ得る。したがって、プロセッサは、カメラ２１４０によって入手される画像内のピクセルを破棄する、または組み合わせるように構成されることができる。例えば、プロセッサは、入手された画像の１６分の１の数のピクセルを伴う、画像を出力するように構成されることができる。本出力画像内の各ピクセルは、入手された画像内の対応する４×４セットのピクセルに基づく値（例えば、これらの１６ピクセルの値の平均）を有することができる。

プロセッサは、カメラ２１２０およびカメラ２１４０からの画像を使用して、中心視野２１５０内のオブジェクト追跡を実施するように構成されてもよい。いくつかの実施形態では、プロセッサは、２つのカメラによって入手された第１の画像から立体視的に決定される、深度情報を使用して、オブジェクト追跡を実施してもよい。非限定的実施例として、追跡されるオブジェクトは、ウェアラブルディスプレイシステムのユーザの手であってもよい。プロセッサは、カメラ２１２０およびカメラ２１４０のうちの１つから入手された画像を使用して、周辺視野内のオブジェクト追跡を実施するように構成されてもよい。

ＸＲシステムは、いくつかの実施形態によると、ハードウェアアクセラレータを備えてもよい。ハードウェアアクセラレータは、特定用途向け集積回路（ＡＳＩＣ）または他の半導体デバイスとして実装されてもよく、カメラ２１２０およびカメラ２１４０からの画像情報を受信するように、ヘッドセット２１００内に統合される、または別様に、それに結合されてもよい。本ハードウェアアクセラレータは、これらの２つの世界カメラによって入手される画像を使用して、深度情報の立体視決定を補助し得る。カメラ２１２０からの画像は、グレースケール画像であってもよく、カメラ２１４０からの画像は、カラー画像であってもよい。ハードウェア加速を使用することは、深度情報の決定を加速し、電力消費を低減させ、したがって、バッテリ寿命を増加させ得る。

例示的較正プロセス

図２２は、いくつかの実施形態による、較正ルーチン（方法２２００）の簡略化されたフローチャートを描写する。プロセッサは、ウェアラブルディスプレイシステムが装着されている間、較正ルーチンを実施するように構成されてもよい。較正ルーチンは、ヘッドセット２１００の軽量構造から生じる歪曲に対処し得る。いくつかの実施形態では、較正ルーチンは、使用の間のフレーム２１０１の温度変化または機械的歪みに起因して生じる、フレーム２１０１内の歪曲に対処し得る。例えば、プロセッサは、較正ルーチンが、ウェアラブルディスプレイシステムの使用の間、フレーム２１０１内の歪曲を補償するように、較正ルーチンを繰り返し実施してもよい。補償ルーチンは、自動的に、または手動入力（例えば、較正ルーチンを実施するためのユーザ要求）に応答して、実施されてもよい。較正ルーチンは、カメラ２１２０およびカメラ２１４０の相対的位置および配向を決定するステップを含んでもよい。プロセッサは、カメラ２１２０およびカメラ２１４０によって入手された画像を使用して、較正ルーチンを実施するように構成されてもよい。いくつかの実施形態では、プロセッサはさらに、ＩＭＵ２１７０ａおよびＩＭＵ２１７０ｂの出力を使用するように構成されてもよい。

ブロック２２０１から開始後、方法２２００は、ブロック２２１０に進み得る。ブロック２２１０では、プロセッサは、カメラ２１２０およびカメラ２１４０から入手された画像内の対応する特徴を識別してもよい。対応する特徴は、物理的世界内のオブジェクトの一部であってもよい。いくつかの実施形態では、オブジェクトは、較正目的のために、ユーザによって中心視野２１５０内に設置されてもよく、所定の相対的位置を有し得る、画像内で容易に識別可能な特徴を有してもよい。しかしながら、本明細書に説明される較正技法は、較正時に中心視野２１５０内に存在するオブジェクト上の特徴に基づいて、較正が、ヘッドセット２１００の使用の間、繰り返されることを可能にするように実施されてもよい。種々の実施形態では、プロセッサは、視野２１２１および視野２１４１の両方内で検出された特徴を自動的に選択するように構成されてもよい。いくつかの実施形態では、プロセッサは、視野２１２１および視野２１４１内の特徴の推定される場所を使用して、特徴間の対応を決定するように構成されることができる。そのような推定は、これらの特徴を含有するオブジェクトのために構築されたパス可能世界モデルまたは特徴についての他の情報に基づいてもよい。

方法２２００は、ブロック２２３０に進み得る。ブロック２２３０では、プロセッサは、慣性測定データを受信してもよい。慣性測定データは、ＩＭＵ２１７０ａおよび／またはＩＭＵ２１７０ｂから受信されてもよい。慣性測定データは、傾きおよび／または加速および／または速度測定を含んでもよい。いくつかの実施形態では、ＩＭＵ２１７０ａおよび２１７０ｂは、直接または間接的に、それぞれ、カメラ２１４０およびカメラ２１２０に機械的に結合されてもよい。そのような実施形態では、ＩＭＵ２１７０ａおよび２１７０ｂによって行われる、傾き等の慣性測定における差異は、カメラ２１４０およびカメラ２１２０の位置および／または配向における差異を示し得る。故に、ＩＭＵ２１７０ａおよび２１７０ｂの出力は、カメラ２１４０およびカメラ２１２０の相対的位置の初期推定を行うための基礎を提供し得る。

ブロック２２３０後、方法２２００は、ブロック２２５０に進み得る。ブロック２２５０では、プロセッサは、カメラ２１２０およびカメラ２１４０の相対的位置および配向の初期推定値を算出してもよい。本初期推定値は、ＩＭＵ２１７０ｂおよび／またはＩＭＵ２１７０ａから受信された測定を使用して算出されてもよい。いくつかの実施形態では、例えば、ヘッドセットは、カメラ２１２０およびカメラ２１４０の公称相対的位置および配向を用いて設計されてもよい。プロセッサは、ＩＭＵ２１７０ａとＩＭＵ２１７０ｂとの間の受信された測定における差異が、カメラ２１２０およびカメラ２１４０の位置および／または配向を改変し得る、フレーム２１０１内の歪曲に起因すると見なすように構成されてもよい。例えば、ＩＭＵ２１７０ａおよびＩＭＵ２１７０ｂは、これらのセンサによる傾きおよび／または加速および／または速度測定が、所定の関係を有するように、直接または間接的に、フレーム２１０１に機械的に結合されてもよい。フレーム２１０１が歪曲された状態になると、本関係は、影響され得る。非限定的実施例として、ＩＭＵ２１７０ａおよびＩＭＵ２１７０ｂは、フレーム２１０１の歪曲が存在しないとき、これらのセンサが、ヘッドセットの移動の間、類似傾き、加速、または速度ベクトルを測定するように、フレーム２１０１に機械的に結合されてもよい。本非限定的実施例では、ＩＭＵ２１７０ａをＩＭＵ２１７０ｂに対して回転させる、捻転または屈曲は、ＩＭＵ２１７０ｂに関する対応するベクトル測定に対してＩＭＵ２１７０ａに関する傾き、加速、または速度ベクトル測定の対応する回転をもたらし得る。プロセッサは、したがって、ＩＭＵ２１７０ａおよびＩＭＵ２１７０ｂが、それぞれ、カメラ２１４０およびカメラ２１２０に機械的に結合されるため、カメラ２１２０およびカメラ２１４０のための公称相対的位置および配向をＩＭＵ２１７０ａとＩＭＵ２１７０ｂとの間の測定された関係と一致するように調節してもよい。

他の技法も、代替として、または加えて、初期推定を行うために使用されてもよい。較正方法２２００が、ＸＲシステムの動作の間、繰り返し実施される、実施形態では、初期推定値は、例えば、直近の算出された推定値であってもよい。

ブロック２２５０後、サブプロセスが、開始され、カメラ２１２０およびカメラ２１４０の相対的位置および配向のさらなる推定値が、行われる。推定値のうちの１つが、カメラ２１２０およびカメラ２１４０によって入手される画像から立体視深度情報を算出するために、カメラ２１２０およびカメラ２１４０の相対的位置および配向として選択される。そのサブプロセスは、容認可能推定値が識別されるまで、さらなる推定が各反復において行われるように、反復的に実施されてもよい。図２２の実施例では、そのサブプロセスは、ブロック２２７０、２２７２、２２７４、および２２９０を含む。

ブロック２２７０では、プロセッサは、カメラおよび比較されている特徴の推定される相対的配向に関する誤差を算出してもよい。本誤差を算出する際、プロセッサは、カメラ２１２０およびカメラ２１４０および較正のために使用されている推定される場所特徴の推定される相対的配向に基づいて、識別された特徴が現れるべき方法または識別された特徴がカメラ２１２０およびカメラ２１４０を用いて入手された対応する画像内に位置すべき場所を推定するように構成されてもよい。いくつかの実施形態では、本推定値は、２つのカメラのそれぞれを用いて入手された画像内の対応する特徴の外観または見掛け場所と比較され、推定される相対的配向毎に、誤差を生成し得る。そのような誤差は、線形代数技法を使用して算出されてもよい。例えば、画像内の複数の特徴のそれぞれの算出場所と実際の場所との間の平均二乗偏差が、誤差のためのメトリックとして使用されてもよい。

ブロック２２７０後、方法２２００は、ブロック２２７２に進み得、そこで、誤差が承認基準を満たすかどうかに関するチェックが、行われてもよい。その基準は、例えば、誤差の全体的大きさであってもよい、または反復間の誤差の変化であってもよい。誤差が承認基準を満たす場合、方法２２００は、ブロック２２９０に進む。

ブロック２２９０では、プロセッサは、ブロック２２７２において算出された誤差に基づいて、推定される相対的配向のうちの１つを選択してもよい。選択された推定される相対的位置および配向は、最低誤差を有する、推定される相対的位置および配向であってもよい。いくつかの実施形態では、プロセッサは、カメラ２１２０およびカメラ２１４０の現在の相対的位置および配向として、本最低誤差と関連付けられる、推定される相対的位置および配向を選択するように構成されてもよい。ブロック２２９０後、方法２２００は、ブロック２２９９に進み得る。方法２２００は、ブロック２２９９において終了し、カメラ２１２０およびカメラ２１４０の選択された位置および配向は、それらのカメラを用いて形成される画像に基づいて、立体視画像情報を算出するために使用されてもよい。

誤差が、ブロック２２７２において、承認基準を満たさない場合、方法２２００は、ブロック２２７４に進み得る。ブロック２２７４では、ブロック２２７０において誤差を算出する際に使用される推定値は、更新されてもよい。それらの更新は、カメラ２１２０およびカメラ２１４０の推定される相対的位置および／または配向に対するものであってもよい。較正のために使用されている特徴のセットの相対的位置が推定される、実施形態では、ブロック２２７４において選択された更新された推定値は、代替として、または加えて、セット内の特徴の場所の位置に対する更新を含んでもよい。そのような更新は、複数の変数を伴う方程式のセットを解法するために使用される、線形代数技法に従って行われてもよい。具体的実施例として、推定される位置または配向のうちの１つ以上のものは、増加または減少され得る。その変化が、サブプロセスの１回の反復において、算出された誤差を減少させる場合、後続反復では、同一の推定される位置または配向が、同一方向にさらに変化されてもよい。逆に言えば、変化が、誤差を増加された場合、後続反復では、それらの推定される位置または配向は、対向方向に変化されてもよい。較正プロセスにおいて使用されているカメラおよび特徴の推定される位置および配向は、順次または組み合わせて、このように変動され得る。

いったん更新された推定値が、算出されると、サブプロセスは、ブロック２２７０に戻る。そこで、サブプロセスのさらなる反復が、推定される相対的位置に関する誤差の算出とともに開始される。このように、推定される位置および配向は、容認可能誤差を提供する、更新された相対的位置および配向が、選択されるまで、更新される。しかしながら、ブロック２２７２における処理は、容認可能誤差を見出さずに、ある数の反復を完了させる等、反復サブプロセスを終了させるために、他の基準を適用してもよいことを理解されたい。

方法２２００は、カメラ２１２０およびカメラ２１４０に関連して説明されるが、類似較正は、立体視結像のために使用される、任意の対のカメラのために、または相対的位置および配向が所望される、複数のカメラの任意のセットのために、実施されてもよい。

例示的カメラ構成

いくつかの実施形態に従うと、ＸＲシステムの複数の機能をサポートするための視野および照明野を提供するように、コンポーネントがヘッドセット２１００に組み込まれる。図２３Ａ－２３Ｃは、いくつかの実施形態による、図２１のヘッドセット２１００と関連付けられる、視野または照明の例示的略図である。例示的略図はそれぞれ、異なる配向およびヘッドセットからの距離からの視野または照明を描写する。図２３Ａは、上昇された軸外目線からの、ヘッドセットから１メートルの距離における、視野または照明を描写する。図２３Ａは、カメラ２１２０およびカメラ２１４０のための視野間の重複、特に、視野２１２１および視野２１４１がヘッドセット２１００の正中線を交差するように、カメラ２１２０およびカメラ２１４０が角度付けられる方法を描写する。描写される構成では、視野２１４１は、視野２１２１を越えて延在し、周辺視野２１６０ｂを形成する。描写されるように、エミッタ２１３０ａおよびエミッタ２１３０ｂのための照明野は、主として、重複する。このように、エミッタ２１３０ａおよびエミッタ２１３０ｂは、低周囲光の条件下での中心視野２１５０内のオブジェクトのための結像または深度測定をサポートするように構成されてもよい。図２３Ｂは、上下目線からの、ヘッドセットから０．３メートルの距離における、視野または照明を描写する。図２３Ｂは、視野２１２１および視野２１４１の重複が、ヘッドセットから０．３メートルに存在することを描写する。しかしながら、描写される構成では、視野２１４１は、視野２１２１を越えてそれほど遠くまで延在せず、周辺視野２１６０ｂの範囲を限定し、周辺視野２１６０ａと周辺視野２１６０ｂとの間の非対称性を実証する。図２３Ｃは、正面視目線からの、ヘッドセットから０．２５メートルの距離における、視野または照明を描写する。図２３Ｃは、視野２１２１および視野２１４１の重複が、ヘッドセットから０．２５メートルに存在することを描写する。しかしながら、視野２１４１は、視野２１２１内に全体的に含有され、したがって、描写される構成では、周辺視野２１６０ｂは、ヘッドセット２１００からの本距離には存在しない。

図２３Ａ－２３Ｃから理解され得るように、視野２１２１および視野２１４１の重複は、立体視結像技法が、エミッタ２１３０ａおよびエミッタ２１３０ｂからのＩＲ照明の有無にかかわらず、カメラ２１２０およびカメラ２１４０を用いて入手されたグレースケール画像を使用して採用され得る、中心視野を作成する。本中心視野では、カメラ２１４０からの色情報は、カメラ２１２０からのグレースケール画像情報と組み合わせられてもよい。加えて、重複しないが、単眼グレースケール画像情報またはカラー画像情報が、それぞれ、カメラ２１２０またはカメラ２１４０のうちの１つから利用可能である、周辺視野が存在する。異なる演算が、本明細書に説明されるように、中心および周辺視野のために入手された画像情報上で実施されてもよい。

世界モデル生成

いくつかの実施形態では、中心視野内で入手された画像情報が、世界モデルを構築または更新するために使用されてもよい。図２４は、いくつかの実施形態による、パス可能世界モデルを作成または更新するための方法２４００の簡略化されたフローチャートである。図２１に関して上記に開示されるように、ウェアラブルディスプレイシステムは、プロセッサを使用して、パス可能世界モデルを決定および更新するように構成されてもよい。いくつかの実施形態では、プロセッサは、カメラ２１２０およびカメラ２１４０の出力に基づいて、本パス可能世界モデルを決定および更新してもよい。しかしながら、カメラ２１２０は、グローバルシャッタとともに構成されてもよく、カメラ２１４０は、ロールシャッタとともに構成されてもよい。プロセッサは、したがって、補償ルーチンを実施し、カメラ２１４０によって入手された画像内のロールシャッタ歪曲を補償してもよい。種々の実施形態では、プロセッサは、エミッタ２１３０ａおよび２１３０ｂを使用せずに、本パス可能世界モデルを決定および更新してもよい。しかしながら、いくつかの実施形態では、パス可能世界モデルは、不完全な場合がある。例えば、プロセッサは、壁または他の平坦表面に関する深度を不完全に決定し得る。付加的実施例として、パス可能世界モデルは、窓、ドア、ボール、テーブル、および同等物等の多くの角、湾曲表面、透明表面、または大表面を伴う、オブジェクトを不完全に表し得る。プロセッサは、そのような不完全な情報を識別し、付加的情報を入手し、付加的深度情報を使用して、世界モデルを更新するように構成されてもよい。いくつかの実施形態では、エミッタ２１３０ａおよび２１３０ｂは、選択的に有効にされ、そこからパス可能世界モデルを構築または更新するための付加的画像情報を収集してもよい。いくつかのシナリオでは、プロセッサは、入手された画像内のオブジェクト認識を実施し、認識されるオブジェクトのためのテンプレートを選択し、テンプレートに基づいて、情報をパス可能世界モデルに追加するように構成されてもよい。このように、ウェアラブルディスプレイシステムは、エミッタ２１３０ａおよび２１３０ｂのような電力集約的コンポーネントを殆どまたは全く利用せずに、パス可能世界モデルを改良し、それによって、バッテリ寿命を延長させ得る。

方法２４００は、ウェアラブルディスプレイシステムの動作の間、１回またはそれを上回って、開始されてもよい。プロセッサは、ユーザが、最初に、システムをオンにする、別の部屋の中に歩いて行く等によって、新しい環境に移動するとき、または概して、プロセッサが、ユーザの物理的環境の変化を検出するとき、パス可能世界モデルを作成するように構成されてもよい。代替として、または加えて、方法２４００は、ウェアラブルディスプレイシステムの動作の間、または物理的世界の有意な変化が、検出されるとき、または世界モデルが物理的世界と同期していないことを示す入力等のユーザ入力に応答して、周期的に、実施されてもよい。

いくつかの実施形態では、パス可能世界モデルの全部または一部は、記憶される、ＸＲシステムの他のユーザによって提供される、または別様に、取得されてもよい。したがって、世界モデルの作成が、説明されるが、方法２４００は、他のソースから導出される世界モデルの他の部分とともに、世界モデルの一部のために使用されてもよいことを理解されたい。

ブロック２４０５では、プロセッサは、補償ルーチンを実施し、カメラ２１４０によって入手される画像内のロールシャッタ歪曲を補償することができる。上記に説明されるように、カメラ２１２０内の画像センサ等のグローバルシャッタを伴う画像センサによって入手された画像は、同時に入手されたピクセル値を含む。対照的に、ロールシャッタを伴う画像センサによって入手された画像は、異なる時間に入手されたピクセル値を含む。ヘッドセットの相対的移動およびカメラ２１４０による画像の入手の間の環境は、空間歪曲を画像の中に導入し得る。これらの空間歪曲は、カメラ２１４０によって入手された画像とカメラ２１２０によって入手された画像の比較に依存する、方法の正確度に影響を及ぼし得る。

補償ルーチンを実施するステップは、プロセッサを使用して、カメラ２１２０を使用して入手される画像とカメラ２１４０を使用して入手される画像を比較するステップを含むことができる。プロセッサは、本比較を実施し、カメラ２１４０を使用して入手される画像内の任意の歪曲を識別する。そのような歪曲は、本画像の少なくとも一部内の歪みを含み得る。例えば、ヘッドセット２１００が側方平行移動している間、カメラ２１４０内の画像センサが、画像センサの上部から画像センサの底部へと行毎にピクセル値を入手している場合、オブジェクトまたはオブジェクトの一部の外観は、平行移動の速度および各行の値の入手間の時間差に依存する量だけ、ピクセルの連続行においてオフセットされ得る。類似歪曲は、ヘッドセットが回転されるときにも生じ得る。これらの歪曲は、画像内のオブジェクトまたはオブジェクトの一部の場所および／または配向に全体的歪みをもたらし得る。プロセッサは、カメラ２１２０によって入手される画像とカメラ２１４０によって入手される画像との間のライン毎比較を実施し、歪みの量を決定するように構成されることができる。カメラ２１４０によって入手される画像は、次いで、歪曲を除去するように変換されることができる（例えば、検出された歪みを除去するために）。

ブロック２４１０では、パス可能世界モデルが、作成されてもよい。図示される実施形態では、プロセッサは、カメラ２１２０およびカメラ２１４０を使用して、パス可能世界モデルを作成してもよい。上記に説明されるように、パス可能世界モデルを生成する際、プロセッサは、パス可能世界モデルを構築するとき、カメラ２１２０およびカメラ２１４０から入手された画像を使用して、物理的世界内のオブジェクトに関する深度情報を立体視的に決定するように構成されてもよい。いくつかの実施形態では、プロセッサは、カメラ２１４０からの色情報を受信してもよい。本色情報は、オブジェクトを区別するため、または同一オブジェクトと関連付けられる表面を識別するために使用されてもよい。色情報はまた、オブジェクトを認識するために使用されてもよい。図３Ａに関して上記に開示されるように、プロセッサは、物理的世界についての情報とヘッドセット２１００の場所および配向についての情報を関連付けることによって、パス可能世界モデルを作成することができる。非限定的実施例として、プロセッサは、ヘッドセット２１００からビュー（例えば、視野２１２０および／または視野２１４０）内の特徴までの距離を決定するように構成されることができる。プロセッサは、ビューの現在の場所および配向を推定するように構成されることができる。プロセッサは、そのような距離を、場所および配向情報とともに蓄積するように構成されることができる。複数の場所および配向から入手された特徴までの距離を三角測量することによって、環境内の特徴の位置および配向が、決定されることができる。種々の実施形態では、パス可能世界モデルは、環境内のそのような特徴の位置および配向を説明する、ラスタ画像、点および記述子群、および多角形／幾何学的定義の組み合わせであることができる。いくつかの実施形態では、ヘッドセット２１００から中心視野２１５０内の特徴までの距離は、カメラ２１２０から入手された画像およびカメラ２１４０から入手された補償画像を使用して、立体視的に決定されることができる。種々の実施形態では、ライトフィールド情報が、本決定を補完または精緻化するために使用されることができる。例えば、到着角情報が、計算を通して、そこから光が反射されている、オブジェクトまでの距離を示す、距離情報に変換されてもよい。

ブロック２４１５では、プロセッサは、カメラ２１４０を無効にする、またはカメラ２１４０のフレームレートを低減させてもよい。例えば、カメラ２１４０のフレームレートは、３０Ｈｚから１Ｈｚに低減されることができる。上記に開示されるように、カラーカメラ２１４０は、グレースケールカメラ２１２０より多くの電力を消費し得る。カメラ２１４０を無効にする、またはそれに関するフレームレートを低減させることによって、プロセッサは、電力消費を低減させ、ウェアラブルディスプレイシステムのバッテリ寿命を延長さ得ることができる。故に、プロセッサは、カメラ２１４０を無効にし、またはカメラ２１４０のフレームレートを低減させ、電力を節約してもよい。本より低い電力状態は、世界モデル内の更新が要求され得ることを示す、条件が検出されるまで、維持されてもよい。そのような条件は、時間の経過、またはユーザの周囲の環境についての情報を集めるセンサから、またはユーザから等の入力に基づいて、検出されてもよい。

代替として、または加えて、いったんパス可能世界モデルが、十分に完成されると、物理的環境内の特徴の位置および配向が、カメラ２１２０からの画像を使用して十分に決定可能になり得る。非限定的実施例として、パス可能世界モデルは、モデル内に表されるユーザの場所の周囲の空間のパーセンテージに基づいて、またはパス可能世界モデルに合致する新しい画像情報の量に基づいて、十分に完成されたと識別されてもよい。本後者のアプローチに関して、新しく入手された画像は、パス可能世界内の場所と関連付けられてもよい。それらの画像内の特徴が、パス可能世界モデル内の目印として識別された特徴に合致する特徴を有する場合、世界モデルは、完成と見なされ得る。網羅または合致率は、１００％完成である必要はない。むしろ、基準毎に、以前に識別された目印に合致する特徴の９５％を上回るまたは９０％を上回る網羅率等、好適な閾値が、適用されてもよい。パス可能世界モデルが完成であると決定される方法にかかわらず、いったん完成されると、プロセッサは、既存のパス可能世界情報を使用して、物理的世界内の特徴の場所および配向の推定値を精緻化することができる。本プロセスは、物理的世界内の特徴が、該当するとしても、プロセッサがカメラ２１２０によって入手される画像を処理するレートと比較して、位置および／または配向をゆっくりと変化させているという仮定を反映させ得る。

ブロック２４２０では、パス可能世界モデルを作成後、プロセッサは、それを用いてパス可能世界モデルを更新するために、表面および／またはオブジェクトを識別してもよい。いくつかの実施形態では、プロセッサは、カメラ２１２０から入手されたグレースケール画像を使用して、そのような表面またはオブジェクトを識別してもよい。例えば、いったん、パス可能世界内の特定の場所における表面を示す、世界モデルが、ブロック２４１０において作成されると、カメラ２１２０から入手されたグレースケール画像が、ほぼ同一特性の表面を検出し、パス可能世界モデル内のその表面の位置を更新することによって、パス可能世界モデルが更新されるべきであることを決定するために使用されてもよい。例えば、パス可能世界モデル内の表面とほぼ同一形状を伴う、ほぼ同一場所における表面は、パス可能世界モデル内のその表面に匹敵し得、パス可能世界モデルは、故に、更新されてもよい。別の実施例として、パス可能世界モデル内に表される、オブジェクトの位置も、カメラ２１２０から入手されたグレースケール画像に基づいて更新されてもよい。

いくつかの実施形態では、プロセッサは、カメラ２１２０から取得されるライトフィールド情報を使用して、物理的世界内のオブジェクトに関する深度情報を決定してもよい。深度情報の決定は、ヘッドセット２１００により近い物理的世界内のオブジェクトに関してより正確であり得る、到着角情報に基づいて実施されることができる。故に、いくつかの実施形態では、プロセッサは、ライトフィールド情報を使用して、深度基準を充足させる、パス可能世界モデルの部分のみを更新するように構成されてもよい。深度基準は、最大区別可能距離に基づいてもよい。例えば、プロセッサは、ヘッドセット２１００から異なる距離におけるオブジェクトを、それらの距離が閾値距離を越えるとき、区別することが不可能であり得る。深度基準は、最大誤差閾値に基づいてもよい。例えば、推定される距離における誤差は、最大誤差閾値に対応する特定の距離を伴う、距離の増加に伴って増加し得る。いくつかの実施形態では、深度基準は、最小距離に基づいてもよい。例えば、プロセッサは、ヘッドセット２１００から最小距離内のオブジェクトに関する距離情報を正確に決定することが不可能であり得る。故に、ヘッドセットから１５ｃｍ以上の世界モデルの部分は、深度基準を充足させ得る。いくつかの実施形態では、パス可能世界モデルは、ボクセルの３次元「ブリック」から成ってもよい。そのような実施形態では、パス可能世界モデルを更新するステップは、更新のためのボクセルのブリックを識別するステップを含んでもよい。いくつかの実施形態では、プロセッサは、視認錐台を決定するように構成されることができる。視認錐台は、１．５ｍ等の最大深度を有してもよい。プロセッサは、視認錐台内のブリックを識別するように構成されてもよい。プロセッサは、次いで、識別されたブリック内のボクセルに関するパス可能世界情報を更新してもよい。いくつかの実施形態では、プロセッサは、ステップ２４５０において入手されたライトフィールド情報を使用して、本明細書に説明されるように、ボクセルに関するパス可能世界情報を更新するように構成されることができる。

いくつかの実施形態において、更新プロセスは、オブジェクトが中心視野または周辺視野内にあるかどうかに基づいて、異なるように実施され得る。例えば、更新は、中心視野内の検出された表面に関して実施されてもよい。周辺視野では、更新は、例えば、プロセッサが、プロセッサが、パス可能世界モデルに対する任意の更新がそのオブジェクトと一致することを確認し得るようなモデルを有する、オブジェクトに関してのみ実施され得る。代替として、または加えて、新しいオブジェクトまたは表面が、グレースケール画像上の処理に基づいて認識されてもよい。そのような処理が、ブロック２４１０における処理よりオブジェクトまたは表面のあまり正確ではない表現につながる場合でも、より高速かつより低い電力処理のための正確度のトレードオフは、いくつかのシナリオでは、より良好な全体的システムにつながり得る。さらに、より低い正確度情報は、単眼グレースケール画像のみを用いて生成された世界モデルの部分と、グレースケールカメラ２１２０と組み合わせたカラーカメラ２１４０の使用を通して立体視的に生成された部分とを置換するように、方法２４００を周期的に繰り返すことによって、周期的に、より高い正確度情報によって置換されてもよい。

いくつかの実施形態では、プロセッサは、更新された世界モデルが品質基準を充足させるかどうかを決定するように構成されてもよい。世界モデルが、品質基準を充足させるとき、プロセッサは、カメラ２１４０が、無効にされた、または低減されたフレームレートを有する状態で、世界モデルの更新を継続してもよい。更新された世界モデルが、品質基準を充足させないとき、方法２４００は、カメラ２１４０を有効にする、またはカメラ２１４０のフレームレートを増加させてもよい。方法２４００はまた、ステップ２４１０に戻り、パス可能世界モデルを再作成してもよい。

ブロック２４２５では、パス可能世界モデルを更新後、プロセッサは、パス可能世界モデルが不完全な深度情報を含むかどうかを識別してもよい。不完全な深度情報は、複数の方法のいずれかにおいて生じ得る。例えば、いくつかのオブジェクトは、検出可能構造を画像内にもたらさない。例えば、非常に暗い、物理的世界内の領域は、周囲照明を用いて入手された画像からの深度情報を抽出するために十分な分解能で結像され得ない。別の実施例として、窓またはガラステーブルの表面は、可視画像内のコンピュータ化された処理によって現れない、または認識され得ない。さらに別の実施例として、テーブルの表面または壁等の大均一表面は、立体視画像処理を可能にするために、２つの立体視画像内で相関し得る、十分な特徴を欠いている場合がある。結果として、プロセッサは、立体視処理を使用して、そのようなオブジェクトの場所を決定することが不可能であり得る。これらのシナリオでは、「穴」が世界モデル内に存在し、パス可能世界モデルを使用して、「穴」を通して通過する特定の方向における、表面までの距離を決定しようとするプロセスは、任意の深度情報を入手することが不可能であろう。

パス可能世界モデルが、不完全な深度情報を含まないとき、方法２４００は、カメラ２１２０から取得されるグレースケール画像を使用して、パス可能世界モデルを更新するステップに戻り得る。

不完全な深度情報の識別に続き、方法２４００を制御するプロセッサは、１つ以上のアクションを講じ、付加的深度情報を入手してもよい。方法２４００は、ブロック２４３１、ブロック２４３３、および／またはブロック２４３５に進み得る。ブロック２４３１では、プロセッサは、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂを有効にしてもよい。上記に開示されるように、カメラ２１２０およびはカメラ２１４０のうちの１つ以上のものは、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂによって放出される光を検出するように構成されてもよい。プロセッサは、次いで、エミッタ２１３０ａおよび／または２１３０ｂに、物理的世界内のオブジェクトの入手された画像を向上させ得る、光を放出させることによって、深度情報を入手してもよい。カメラ２１２０およびカメラ２１４０が、放出される光に敏感であるとき、例えば、カメラ２１２０およびカメラ２１４０を用いて入手される画像は、立体視情報を抽出するために処理されてもよい。他の分析技法も、代替として、または加えて、エミッタ２１３０ａおよび／またはエミッタ２１３０ｂが有効にされると、深度情報を取得するために使用されてもよい。飛行時間測定および／または構造化された光技法が、代替として、または加えて、いくつかの実施形態では、使用されてもよい。

ブロック２４３３では、プロセッサは、以前に入手された深度情報からの付加的深度情報を決定してもよい。いくつかの実施形態では、例えば、プロセッサは、カメラ２１２０および／またはカメラ２１４０を用いて形成される画像内のオブジェクトを識別し、識別されたオブジェクトのモデルに基づいて、パス可能世界モデル内の任意の穴を充填するように構成されてもよい。例えば、処理は、物理的世界内の平面表面を検出してもよい。平面表面は、カメラ２１２０および／またはカメラ２１４０を用いて入手された既存の深度情報、またはパス可能世界モデル内に記憶される深度情報を使用して、検出されてもよい。平面表面は、世界モデルの一部が不完全な深度情報を含むことの決定に応答して、検出されてもよい。プロセッサは、検出された平面表面に基づいて、付加的深度情報を推定するように構成されてもよい。例えば、プロセッサは、識別された平面表面を不完全な深度情報の領域を通して延在させるように構成されてもよい。いくつかの実施形態では、プロセッサは、平面表面を延在させるとき、パス可能世界モデルの囲繞する部分に基づいて、欠測深度情報を補間するように構成されてもよい。

いくつかの実施形態では、付加的実施例として、プロセッサは、不完全な深度情報を含む、世界モデルの部分内のオブジェクトを検出するように構成されてもよい。いくつかの実施形態では、本検出は、ニューラルネットワークまたは他の機械学習ツールを使用して、オブジェクトを認識するステップを伴ってもよい。いくつかの実施形態では、プロセッサは、記憶されたテンプレートのデータベースにアクセスし、識別されたオブジェクトに対応する、オブジェクトテンプレートを選択するように構成されてもよい。例えば、識別されたオブジェクトが、窓であるとき、プロセッサは、記憶されたテンプレートのデータベースにアクセスし、対応するウィンドウテンプレートを選択するように構成されてもよい。非限定的実施例として、テンプレートは、窓、ドア、ボール、または同等物のタイプ等のオブジェクトのクラスを表す、３次元モデルであってもよい。プロセッサは、更新された世界モデル内のオブジェクトの画像に基づいて、オブジェクトテンプレートのインスタンスを構成してもよい。例えば、プロセッサは、テンプレートをスケーリング、回転、および平行移動させ、更新された世界モデル内のオブジェクトの検出された場所に合致させてもよい。付加的深度情報が、次いで、認識されるオブジェクトの表面を表す、構成されるテンプレートの境界に基づいて、推定されてもよい。

ブロック２４３５では、プロセッサは、ライトフィールド情報を入手することができる。いくつかの実施形態では、本ライトフィールド情報は、画像とともに入手されることができ、到着角情報を含むことができる。いくつかの実施形態では、カメラ２１２０は、プレノプティックカメラとして構成され、本ライトフィールド情報を入手することができる。

ブロック２４３１、ブロック２４３３、および／またはブロック２４３５後、方法２４００は、ブロック２４４０に進み得る。ブロック２４９０では、プロセッサは、ブロック２４３１および／またはブロック２４７３において取得される付加的深度情報を使用して、パス可能世界モデルを更新してもよい。例えば、プロセッサは、能動ＩＲ照明を用いて行われた測定から取得される付加的深度情報を既存のパス可能世界モデルの中に混成するように構成されてもよい。同様に、例えば、到着角情報に基づいて、三角測量を使用してライトフィールド情報から決定される、付加的深度情報が、既存のパス可能世界モデルの中に混成されることができる。付加的実施例として、プロセッサは、検出された平面表面を延在させることによって取得される補間された深度情報を既存のパス可能世界モデルの中に混成する、または構成されるテンプレートの境界から推定される付加的深度情報を既存のパス可能世界モデルの中に混成するように構成されてもよい。

情報は、付加的深度情報および／またはパス可能世界モデル内の情報の性質に応じて、１つ以上の方法において混成されてもよい。混成は、例えば、パス可能世界モデルに、パス可能世界モデル内に穴が存在する、場所に関して収集された付加的深度情報を追加することによって実施されてもよい。代替として、付加的深度情報は、パス可能世界モデル内の対応する場所における情報を上書きしてもよい。さらに別の代替として、混成は、パス可能世界モデル内にすでにある情報と付加的深度情報との間で選択するステップを伴ってもよい。そのような選択は、例えば、パス可能世界モデル内にすでにあるか、または付加的深度情報を収集するために使用されているカメラに最も近い表面を表す、付加的深度情報内のものであるかのいずれかの深度情報を選択するステップに基づいてもよい。

いくつかの実施形態では、パス可能世界モデルは、接続される点のメッシュによって表されてもよい。世界モデルを更新することは、世界モデルに追加されるべきオブジェクトまたは表面のメッシュ表現を算出し、次いで、そのメッシュ表現と世界モデルのメッシュ表現を組み合わせることによって行われてもよい。本発明者らは、本順序で処理を実施することが、オブジェクトまたは表面を世界モデルに追加し、次いで、更新されたモデルのためのメッシュを算出するよりも少ない処理を要求し得ることを認識し、その真価を認めた。

図２４は、世界モデルが、ブロック２４２０および２４４０の両方で更新され得ることを示す。各ブロックにおける処理は、例えば、世界モデルに追加されるべきオブジェクトまたは表面のメッシュ表現を生成し、生成されたメッシュと世界モデルのメッシュを組み合わせることによって、同一方法で、または異なる方法で、実施されてもよい。いくつかの実施形態では、本マージ動作は、ブロック２４２０およびブロック２４４０において識別されたオブジェクトまたは表面の両方に関して、１回、実施されてもよい。そのような組み合わせられる処理は、例えば、ブロック２４４０に関連して説明されるように実施されてもよい。

いくつかの実施形態では、方法２４００は、１つ以上のグレースケールカメラを用いて入手された情報に基づいて、世界モデルを更新するプロセスを繰り返すように、ブロック２４２０に戻ってもよい。ブロック２４２０における処理は、ブロック２４１０における処理より少ない画像およびより小さい画像上で実施され得るため、より高いレートで繰り返されてもよい。本処理は、３～７回／秒等、１０回／秒未満のレートで実施されてもよい。

方法２４００は、終了条件が検出されるまで、このように繰り返されてもよい。例えば、方法２４００は、所定の時間周期にわたって、ユーザ入力が受信されるまで、またはヘッドセット２１００のカメラの視野内の物理的世界モデルの部分の特定のタイプまたは特定の大きさの変化が検出されるまで、繰り返されてもよい。方法２４００は、次いで、ブロック２４９９において終了してもよい。方法２４００は、より高い分解能カラーカメラを用いて入手されたものを含む、世界モデルの新しい情報がブロック２４０５において捕捉されるように、再び開始されてもよい。方法２４００は、カラーカメラを使用して、世界モデルがグレースケール画像情報のみに基づいて更新されるレートより低速の平均レートでブロック２４０５において処理を繰り返し、世界モデルの一部を作成するように、終了され、再開されてもよい。カラーカメラを使用した処理は、例えば、１回／秒またはより低速の平均レートで繰り返されてもよい。

頭部姿勢追跡

ＸＲシステムは、ＸＲディスプレイシステムを装着しているユーザの頭部の位置および配向を追跡してもよい。ユーザの頭部姿勢を決定することは、パス可能世界モデル内の情報が、オブジェクトをウェアラブルディスプレイデバイス上にレンダリングする際に使用され得るように、パス可能世界モデル内の情報が、ユーザのウェアラブルディスプレイデバイスの基準フレームに変換されることを可能にする。頭部姿勢が、頻繁に更新されるにつれて、カメラ２１２０のみを使用して、頭部姿勢追跡を実施することは、電力節約、低減された算出量、または他の利点を提供し得る。ＸＲシステムは、したがって、頭部追跡正確度を電力消費および算出要件に対して平衡させるように、必要に応じて、カラーカメラ２１４０を無効にする、またはそのフレームレートを低減させるように構成されてもよい。

図２５は、いくつかの実施形態による、頭部姿勢追跡のための方法２５００の簡略化されたフローチャートである。方法２５００は、世界モデルを作成するステップと、頭部姿勢を追跡するステップと、頭部姿勢追跡基準が充足されるかどうかを決定するステップとを含むことができる。頭部姿勢追跡基準が、充足されないとき、方法２５００はさらに、カメラ２１４０を有効にし、立体視的に決定された深度情報を使用して、頭部姿勢を追跡するステップを含むことができる。

ブロック２５１０では、プロセッサは、パス可能世界モデルを作成することができる。いくつかの実施形態では、プロセッサは、方法２４００のブロック２４０５－２４１５に関して上記に説明されるように、パス可能世界モデルを作成するように構成されることができる。例えば、プロセッサは、画像をカメラ２１２０およびカメラ２１４０から入手するように構成されることができる。いくつかの実装では、プロセッサは、カメラ２１４０内のロールシャッタ歪曲を補償することができる。プロセッサは、次いで、２１２０からの画像と２１４０からの補償された画像とを使用して、物理的世界内の特徴に関する深度を決定することができる。これらの深度を使用して、プロセッサは、パス可能世界モデルを作成することができる。パス可能世界モデルを作成後、いくつかの実施形態では、プロセッサは、カメラ２１４０を無効にする、またはそのフレームレートを低減させるように構成されることができる。パス可能世界モデルを生成後、カメラ２１４０を無効にする、またはそのフレームレートを低減させることによって、ＸＲシステムは、電力消費およびコンピューティング要件を低減させることができる。

ブロック２５１０においてパス可能世界モデルを作成後、方法２５００は、ブロック２５２０に進むことができる。ブロック２５２０では、プロセッサは、頭部姿勢を追跡することができる。いくつかの実施形態では、プロセッサは、リアルタイムまたは近リアルタイムユーザ頭部姿勢をカメラ２１２０によって入手された情報から計算するように構成されることができる。本情報は、カメラ２１２０によって入手されたグレースケール画像であることができる。加えて、または代替として、本情報は、到着角情報等のライトフィールド情報であることができる。

ブロック２５３０では、方法２５００は、頭部姿勢が追跡品質基準を充足させるかどうかを決定することができる。追跡基準は、推定される頭部姿勢の安定性、推定される頭部姿勢の雑音度、推定される頭部姿勢の世界モデルとの一貫性、または同様の要因に依存し得る。具体的実施例として、算出された頭部姿勢は、頭部姿勢における誤差が識別され得るように、慣性測定ユニットの出力またはヒト頭部の運動の範囲のモデル等、不正確性を示し得る、他の情報と比較されてもよい。具体的追跡基準は、使用される追跡方法論に基づいて、変動し得る。例えば、イベントベースの情報を使用する方法論では、完全フレーム画像内の対応する特徴の場所と比較したイベントベースの出力によって示されるような特徴の場所間の対応が、使用されてもよい。代替として、または加えて、その周囲に対する特徴の視覚的弁別性が、追跡基準として使用されてもよい。例えば、視野が、具体的特徴の移動を識別することを困難にする、１つ以上のオブジェクトで充填されるとき、イベントベースの方法論のための追跡基準は、不良追跡を示し得る。オクルードされる視野のパーセンテージが、使用され得る基準の実施例である。例えば、４０％を上回る等の閾値が、頭部姿勢追跡のための画像ベースの方法論の使用から切り替えるべきことのインジケーションとして使用されてもよい。さらなる実施例として、再投影誤差が、頭部姿勢追跡品質の測定値として使用されてもよい。そのような基準は、入手されている画像内の特徴と以前に決定されたパス可能世界モデルを合致させることによって算出されてもよい。画像内の特徴の場所は、頭部姿勢に基づく幾何学的変換算出を使用して、パス可能世界モデル内の場所に関連されてもよい。例えば、算出された場所とパス可能世界モデル内の特徴との間の平均二乗誤差として表される、偏差が、したがって、偏差が追跡基準として使用され得るように、頭部姿勢内の誤差を示し得る。

頭部姿勢を追跡する困難度は、ユーザの頭部の場所および配向およびパス可能世界モデルのコンテンツに依存し得る。したがって、いくつかのインスタンスでは、プロセッサは、ライトフィールド情報および／またはカメラ２１２０によって入手されたグレースケール画像のみを使用して、頭部姿勢を追跡することが不可能である、または不可能になり得る。追跡品質基準が、充足されるとき、方法２５００は、ブロック２５２０に戻り、頭部姿勢の追跡を継続することができる。

方法２５００は、追跡品質基準が充足されないとき、ブロック２５４０に進み得る。ブロック２５４０では、プロセッサは、カメラ２１４０を有効にするように構成されることができる。カメラ２１４０を有効にした後、方法２５００は、ブロック２５５０に進むことができる。ブロック２５５０では、プロセッサは、カメラ２１４０およびカメラ２１２０によって入手された画像を使用して、深度情報を立体視的に決定することができる。いくつかの実施形態では、プロセッサが、深度情報を決定後、方法２５００は、ブロック２５２０に戻ることができ、プロセッサは、頭部姿勢の追跡を再開することができる。いくつかの実施形態では、プロセッサは、頭部姿勢の追跡を再開するとき、カメラ２１４０を無効にするように構成されてもよい。種々の実施形態では、プロセッサは、ある持続時間または時間にわたって、または品質基準が充足されるまで、カメラ２１４０およびカメラ２１２０によって入手された画像を使用して、頭部姿勢の追跡を継続するように構成されてもよい。

方法２５００は、図２５に示されるように、深度情報を立体視的に決定する試みが不成功であるとき、ブロック２５９９に進み得る。方法２５００は、代替として、カメラ２１４０を有効にした後でも、追跡品質基準が充足されないとき、ブロック２５００に進んでもよい。

オブジェクト追跡

上記に説明されるように、ＸＲシステムのプロセッサは、物理的世界内のオブジェクトを追跡し、物理的オブジェクトに対する仮想オブジェクトの現実的レンダリングをサポートし得る。追跡は、例えば、ＸＲシステムのユーザの手等の移動可能なオブジェクトに関連して説明された。例えば、ＸＲシステムは、中心視野２１５０、周辺視野２１６０ａ、および／または周辺視野２１６０ｂ内のオブジェクトを追跡してもよい。移動可能なオブジェクトの位置を迅速に更新することは、レンダリングが、仮想オブジェクトによる物理的オブジェクトのオクルージョンまたはその逆または物理的オブジェクト内の仮想オブジェクト間の相互作用を反映させ得るため、仮想オブジェクトを現実的にレンダリングすることを可能にする。いくつかの実施形態では、例えば、物理的オブジェクトの場所に関する更新は、約３０回／秒または６０回／秒等、少なくとも１０回／秒、いくつかの実施形態では、少なくとも２０回／秒の平均レートにおいて、算出されてもよい。追跡されるオブジェクトが、ユーザの手であるとき、追跡は、ユーザによるジェスチャ制御を有効にし得る。例えば、あるジェスチャは、ＸＲシステムへのコマンドに対応し得る。

いくつかの実施形態では、ＸＲシステムは、ＩＲ光に敏感である画像センサを用いて結像されるとき、高コントラストを提供する特徴を有する、オブジェクトを追跡するように構成されてもよい。いくつかの実施形態では、高コントラスト特徴を伴う、オブジェクトは、マーカをオブジェクトに追加することによって作成されてもよい。例えば、物理的オブジェクトは、ＩＲ光を用いて結像されると、高コントラスト領域として現れる、１つ以上のマーカを装備してもよい。マーカは、ＩＲ光に高度に反射性または高度に吸収性である、受動マーカであってもよい。いくつかの実施形態では、着目周波数範囲にわたる光の少なくとも２５％が、吸収または反射されてもよい。代替として、または加えて、マーカは、ＩＲＬＥＤ等のＩＲ光を放出する、能動マーカであってもよい。例えば、ＤＶＳカメラを用いて、そのような特徴を追跡することによって、物理的オブジェクトの位置を正確に表す情報が、迅速に決定され得る。

頭部姿勢追跡と同様に、追跡されるオブジェクト位置は、頻繁に更新され、したがって、カメラ２１２０のみを使用してオブジェクト追跡を実施することは、電力節約を提供する、算出要件を低減させる、または他の利点を提供し得る。ＸＲシステムは、したがって、電力消費および算出要件に対してオブジェクト追跡正確度を平衡させるために、必要に応じて、カラーカメラ２１４０を無効にする、またはそのフレームレートを低減させるように構成されてもよい。

図２６は、いくつかの実施形態による、オブジェクト追跡のための方法２６００の簡略化されたフローチャートである。方法２６００に従って、プロセッサは、追跡されるオブジェクトが周辺視野（例えば、周辺視野２１６０ａまたは周辺視野２１６０ｂ）または中心視野２１５０内にあるかどうかに応じて、オブジェクト追跡を異なるように実施することができる。プロセッサはさらに、追跡されるオブジェクトが深度基準を充足させるかどうかに応じて、中心視野２１５０内のオブジェクト追跡を異なるように実施することができる。利用可能なバッテリ電力、または実施されているＸＲシステムの動作、およびそれらの動作がオブジェクト場所を追跡する、または高精度を伴ってオブジェクト場所を追跡する必要性等、他の基準が、代替として、または加えて、プロセッサによって適用され、オブジェクト追跡方法論を動的に選択してもよい。

方法２６００は、ブロック２６０１から開始することができる。いくつかの実施形態では、カメラ２１４０は、無効にされる、または低減されたフレームレートを有してもよい。プロセッサは、カメラ２１４０を無効にさせ、またはカメラ２１４０のフレームレートを低減させ、電力消費を低減させ、バッテリ寿命を改良してもよい。種々の実施形態では、プロセッサは、物理的世界（例えば、ユーザの手）内のオブジェクトを追跡してもよい。プロセッサは、オブジェクトの１つ以上の前の場所に基づいて、オブジェクトの次の場所またはオブジェクトの軌道を予測するように構成されてもよい。

ブロック２６０１から開始後、方法２６００は、ブロック２６１０に進むことができる。ブロック２６１０では、プロセッサは、オブジェクトが中心視野２１５０内にあるかどうかを決定するように構成されることができる。いくつかの実施形態では、プロセッサは、本決定をオブジェクトの現在の場所（例えば、オブジェクトが、現在、中心視野２１５０内にあるかどうか）に基づかせることができる。種々の実施形態では、プロセッサは、本決定をオブジェクトの場所の推定値に基づかせることができる。例えば、プロセッサは、中心視野２１５０から離れているオブジェクトが、周辺視野２１６０ａまたは周辺視野２１６０ｂに進入し得ることを決定することができる。オブジェクトが、中心視野２１５０内にないとき、プロセッサは、ブロック２６２０に進むように構成されることができる。

ブロック２６２０では、プロセッサは、カメラ２１４０を有効にする、またはカメラ２１４０のフレームレートを増加させることができる。プロセッサは、プロセッサが、オブジェクトは、左中心視野２１５０からまもなく離れるであろう、または離れ、周辺視野２１６０ｂに進入したことを推定するとき、カメラ２１４０を有効にするように構成されることができる。プロセッサは、プロセッサが、カメラ２１４０から受信された１つ以上の画像に基づいて、オブジェクトは、周辺視野２１６０ｂ内にあることを決定するとき、カメラ２１４０のフレームレートを増加させるように構成されることができる。プロセッサは、オブジェクトが周辺視野２１６０ｂ内にあるとき、カメラ２１４０を使用して、オブジェクトを追跡するように構成されることができる。

プロセッサは、ステップ２６３０ａおよび２６３０ｂにおいて、オブジェクトが深度基準を充足させるかどうかを決定することができる。いくつかの実施形態では、深度基準は、方法２４００のブロック２４６０に関して上記に説明される深度基準と同一または類似してもよい。例えば、深度基準は、それを越えるとプロセッサがオブジェクト間の異なる距離を区別することができない、最大誤差レートまたは最大距離に関してもよい。

カメラ２１４０は、いくつかの実施形態では、プレノプティックカメラとして構成されてもよい。そのような実施形態では、プロセッサは、ステップ２６３０ａにおいて、オブジェクトが周辺視野２１６０ｂ内にあるとき、距離基準が充足されるかどうかを決定してもよい。距離基準が、充足されるとき、プロセッサは、ブロック２６４０ａにおいて、ライトフィールド情報を使用して、オブジェクトを追跡するように構成されることができる。カメラ２１２０は、いくつかの実施形態では、プレノプティックカメラとして構成されてもよい。そのような実施形態では、プロセッサは、ブロック２６３０ｂにおいて、オブジェクトが中心視野２１５０内にあるとき、距離基準が充足されるかどうかを決定してもよい。距離基準が、充足されるとき、プロセッサは、ブロック２６４０ｂにおいて、ライトフィールド情報を使用して、オブジェクトを追跡するように構成されることができる。距離基準が、充足されないとき、方法２６００は、ブロック２６４５に進むことができる。

ブロック２６４５では、プロセッサは、カメラ２１４０を有効にする、またはカメラ２１４０のフレームレートを増加させるように構成されることができる。プロセッサが、カメラ２１４０を有効にする、またはカメラ２１４０のフレームレートを増加させた後、方法２６００は、ブロック２６５０に進むことができる。ブロック２６５０では、プロセッサは、立体投影的に決定される深度情報を使用して、オブジェクトを追跡するように構成されることができる。プロセッサは、深度情報をカメラ２１２０およびカメラ２１４０によって入手された画像から決定するように構成されることができる。ステップ２６４０ａ、２６４０ｂ、または２６５０後、方法２６００は、ブロック２６９９に進む。ステップ２６９９では、方法２６００は、終了することができる。

手を追跡するステップはさらに、一般的オブジェクトを追跡するステップ以外のステップを含み得る。図２７は、いくつかの実施形態による、手を追跡する方法２７００の簡略化されたフローチャートである。方法２７００において追跡されるオブジェクトは、ユーザの手であることができる。種々の実施形態では、プロセッサは、ユーザの手が中心視野２１５０内にあるとき、カメラ２１２０およびカメラ２１４０を使用して、ユーザの手が周辺視野２１６０ａ内にあるとき、カメラ２１２０のみを使用して、ユーザの手が周辺視野２１６０ｂ内にあるとき、カメラ２１４０のみを使用して、手の追跡を実施するように構成されてもよい。必要な場合、ＸＲシステムは、カメラ２１４０を有効にし、またはそのフレームレートを増加させ、視野２１６０ｂ内の追跡を有効にすることができる。このように、ウェアラブルディスプレイシステムは、本構成では、利用可能な低減された数のカメラを使用して、適正な手の追跡を提供し、低減された電力消費および増加されたバッテリ寿命を可能にするように構成されてもよい。

方法２７００は、ＸＲシステムのプロセッサの制御下で、実施されてもよい。本方法は、ヘッドセット２１００上のカメラのうちの任意の１つを用いて入手された画像の分析の結果として、手等の追跡されるべきオブジェクトの検出に応じて、開始されてもよい。その分析は、手の特性である、測光特性を有する、画像の領域に基づいて、オブジェクトを手として認識するステップを伴い得る。代替として、または加えて、立体視画像分析に基づいて入手された深度情報が、手を検出するために使用されてもよい。具体的実施例として、深度情報は、手の３Ｄモデルに合致する形状を有する、オブジェクトが存在することを示し得る。このように手の存在を検出することはまた、手のモデルのパラメータを手の配向に合致するように設定するステップを伴い得る。いくつかの実施形態では、そのようなモデルはまた、１つ以上のグレースケールカメラからの測光情報を使用して、どのように手がオリジナル位置から移動したかを決定することによって、高速の手の追跡のために使用されてもよい。

ＸＲシステムが、ユーザの手が１つ以上のカメラの視野に進入することが予期されるように、ユーザがその手で押下を試みる可能性が高い、仮想ボタンをレンダリングする等、オブジェクトを追跡するステップを伴う動作を実施する等、他のトリガ条件が、方法２７００を開始してもよい。方法２７００は、３０～１００回／秒、例えば、４０～６０回／秒等、比較的に高レートで繰り返されてもよい。結果として、追跡されているオブジェクトに関する更新された位置情報が、物理的オブジェクトと相互作用する仮想オブジェクトをレンダリングするために処理するために、短待ち時間で利用可能にされ得る。

ブロック２７０１から開始後、方法２７００は、ブロック２７１０に進み得る。ブロック２７１０では、プロセッサは、潜在的手の場所を決定してもよい。いくつかの実施形態では、潜在的手の場所は、入手された画像内の検出されたオブジェクトの場所であってもよい。手が深度情報を手の３Ｄモデルに合致させることに基づいて検出される、実施形態では、同一情報が、ブロック２７１０において、手の初期位置として使用されてもよい。

ブロック２７１０後、方法２７００は、ブロック２７２０に進み得る。ブロック２７２０では、プロセッサは、オブジェクト追跡ロバスト性または微細なオブジェクト追跡詳細が要求されるかどうかを決定してもよい。そのような特殊な場合では、方法２７００は、ブロック２７３０に進み得る。ブロック２７３０では、プロセッサは、オブジェクトに関する深度情報を取得してもよい。その深度情報は、そこから画像情報を収集するカメラと追跡されているオブジェクトとの間の距離が算出され得る、立体視画像分析に基づいて、取得されてもよい。プロセッサは、例えば、中心視野内の特徴を選択し、選択された特徴に関する深度情報を決定してもよい。プロセッサは、カメラ２１２０および２１４０によって入手された画像を使用して、特徴に関する深度情報を立体視的に決定してもよい。

いくつかの実施形態では、選択された特徴は、骨および関節によって定義されるようなヒトの手の異なるセグメントを表し得る。特徴選択は、画像情報をヒトの手のモデルに合致させることに基づいてもよい。そのような合致は、例えば、ヒューリスティックに行われてもよい。ヒトの手は、例えば、１６等の有限数のセグメントによって表されてもよく、手の画像内の点は、各セグメント上の特徴が選択され得るように、それらのセグメントのうちの１つにマッピングされてもよい。代替として、または加えて、そのような合致は、深層ニューラルネットまたは分類／決定森を使用して、分析において一連のはい／いいえ決定を適用し、手の異なる部分を識別し、手の異なる部分を表す特徴を選択してもよい。合致は、例えば、画像内の特定の点が、掌部分、手の甲、非親指の指、親指、指先、および／または指関節に属するかどうかを識別してもよい。任意の好適な分類子が、本分析段階のために使用されることができる。例えば、深層学習モジュールまたはニューラルネットワーク機構が、分類森の代わりに、またはそれに加え、使用されることができる。加えて、回帰森（例えば、Ｈｏｕｇｈ変換等を使用して）が、分類森に加え、使用されることができる。

選択される特徴の具体的数およびそれらの特徴を選択するために使用される技法にかかわらず、ブロック２７３０後、方法２７００は、ブロック２７４０に進み得る。ブロック２７４０では、プロセッサは、その後、深度情報に基づいて、手のモデルを構成してもよい。いくつかの実施形態では、手のモデルは、例えば、手内のセグメントとしての手内の骨のそれぞれと、隣接するセグメント間の可能性が高い角度の範囲を定義する各関節とを表す、ヒトの手についての構造情報を反映させてもよい。選択された特徴の深度情報に基づいて、場所を手のモデル内のセグメントのそれぞれに割り当てることによって、ＸＲシステムによる後続処理のために、手の位置についての情報が、提供され得る。

いくつかの実施形態では、ブロック２７３０および２７４０における処理は、反復的に実施されてもよく、それに関して深度情報が収集される、特徴の選択は、手のモデルの構成に基づいて精緻化される。手のモデルは、プロセッサが、手の成分を表す、特徴の選択を精緻化するために使用するように構成され得る、形状制約および運動制約を含んでもよい。例えば、手のセグメントを表すために選択される特徴が、手のモデルの制約に違反する、そのセクションの位置または運動を示すとき、そのセグメントを表すための異なる特徴が、選択されてもよい。

いくつかの実施形態では、手の追跡プロセスの連続反復が、深度情報の代わりに、またはそれに加え、測光画像情報を使用して実施されてもよい。各反復では、手の３Ｄモデルは、手の潜在的運動を反映させるように更新されてもよい。潜在的運動は、深度情報、測光情報、または手の軌道の投影等から決定されてもよい。深度情報が、使用される場合、深度情報は、処理を加速させるために、手のモデルの初期構成を設定するために使用されるものより限定された特徴のセットに関するものであってもよい。

３Ｄの手のモデルが更新される方法にかかわらず、更新されたモデルは、光画像情報に基づいて、精緻化されてもよい。モデルは、例えば、手の仮想画像をレンダリングし、手の画像が現れることが予期される方法を表すために使用されてもよい。その予期される画像は、画像センサを用いて入手された測光画像情報と比較されてもよい。３Ｄモデルは、予期される測光情報と入手された測光情報との間の誤差を低減させるように調節されてもよい。調節された３Ｄモデルは、次いで、手の位置のインジケーションを提供する。本更新プロセスが、繰り返されるにつれて、３Ｄモデルは、手が移動するにつれて、手の位置のインジケーションを提供する。

ＸＲシステムは、代替として、ロバスト性または微細な詳細が要求されない、または追跡されているオブジェクトが中心視野２１５０外にあり得ることを決定してもよい。そのような場合、ブロック２７５０では、ＸＲシステムは、グレースケール画像情報をカメラ２１２０から入手するように構成されてもよい。プロセッサは、次いで、ヒトの手の構造を表す、本画像内の特徴を選択してもよい。そのような特徴は、ブロック２７３０における処理に関して上記に説明されるように、ヒューリスティックに、またはＡＩ技法を使用して、識別されてもよい。例えば、上記に説明されるように、特徴は、各セグメント上の特徴が選択され得るように、有限数のセグメントによってヒトの手を表し、画像内の点をそれらのセグメントの個別のものにマッピングすることによって、ヒューリスティックに選択されてもよい。代替として、または加えて、そのような合致は、深層ニューラルネットワークまたは分類／決定森を使用して、一連のはい／いいえ決定を分析内に適用し、手の異なる部分を識別し、手の異なる部分を表す特徴を選択してもよい。任意の好適な分類子が、本分析段階のために使用されることができる。例えば、深層学習モジュールまたはニューラルネットワーク機構が、分類森の代わりに、またはそれに加え、使用されることができる。加えて、回帰森（例えば、Ｈｏｕｇｈ変換等を使用する）が、分類森に加え、使用されることができる。

ブロック２７６０では、プロセッサは、その後、選択された特徴および画像毎のそれらの選択された特徴の運動を、深度情報の利点を伴わずに、手のモデルに合致させるように試み得る。本合致は、ブロック２７４０において生成されたものほどあまりロバストではない情報をもたらし得る、またはあまり正確ではない場合がある。それでもなお、単眼情報に基づいて識別された情報は、ＸＲシステムの動作に関する有用な情報を提供し得る。

画像部分をブロック２７４０または２７６０における手のモデルの部分に合致させた後、プロセッサは、ブロック２７０において、決定された手のモデル情報を使用して、手のジェスチャを認識してもよい。本ジェスチャ認識は、米国特許公開第２０１６／００２６２５３号（手の追跡およびＸＲシステム内の画像情報から入手された手についての情報の使用に関連して教示する、全てに関して、参照することによって本明細書に組み込まれる）に説明される手の追跡方法を使用して実施されてもよい。

ブロック２７７０後、方法２７００は、ブロック２７９９において終了してもよい。しかしながら、オブジェクトの追跡は、ＸＲシステムの動作の間、持続的に生じ得る、またはオブジェクトが１つ以上のカメラの視野内にある、インターバルの間、生じ得ることを理解されたい。故に、いったん方法２７００の１回の反復が、完了されると、別の反復が、実施されてもよく、本プロセスは、オブジェクトの追跡が実施されている、インターバルにわたって、実施されてもよい。いくつかの実施形態では、１回の反復において使用される情報は、後続反復において使用されてもよい。種々の実施形態では、例えば、プロセッサは、以前に検出された手の場所に基づいて、ユーザの手の更新された場所を推定するように構成されてもよい。例えば、プロセッサは、前の場所およびユーザの手の速度に基づいて、ユーザの手が次に来るであろう場所を推定してもよい。そのような情報は、パッチ追跡技法に関連して上記に説明されるように、オブジェクトの場所を検出するために処理される、画像情報の量を絞り込むために使用されてもよい。

したがって、いくつかの実施形態のいくつかの側面を説明したが、種々の改変、修正、および改良が、当業者に容易に想起されるであろうことを理解されたい。

一実施例として、実施形態は、拡張（ＡＲ）環境に関連して説明される。本明細書に説明される技法のいくつかまたは全ては、ＭＲ環境、またはより一般的に、他のＸＲ環境において適用されてもよいことを理解されたい。

また、１つのパッチが、画像アレイに適用され、１つの移動可能なオブジェクトについての画像情報の選択的出力を制御する、画像アレイの実施形態が、説明される。物理的実施形態内には、１つを上回る移動可能なオブジェクトが存在してもよいことを理解されたい。さらに、いくつかの実施形態では、移動可能なオブジェクトが位置する場所以外の領域内の画像情報の頻繁な更新を選択的に取得することが望ましくあり得る。例えば、パッチは、仮想オブジェクトがレンダリングされるべき、物理的世界の領域についての画像情報を選択的に取得するように設定されてもよい。故に、いくつかの画像センサは、それらのパッチの軌道を追跡するための回路網の有無にかかわらず、２つ以上のパッチに関する情報を選択的に提供することが可能であり得る。

なおもさらなる実施例として、画像アレイは、入射光の大きさに関連する情報を出力するものとして説明される。大きさは、光周波数のスペクトルを横断した電力の表現であり得る。そのスペクトルは、白黒カメラ等における可視光の任意の色に対応する周波数において、比較的に広捕捉エネルギーであり得る。代替として、スペクトルは、可視光の単色に対応する、狭いものであってもよい。画像アレイ上に入射する光を特定の色の光に限定するためのフィルタが、本目的のために使用されてもよい。ピクセルが、具体的色の光を受け取るように限定される場合、異なるピクセルは、異なる色に限定されてもよい。そのような実施形態では、同一色に敏感であるピクセルの出力は、ともに処理されてもよい。

画像アレイ内のパッチを設定し、次いで、着目オブジェクトのためのパッチを更新するためのプロセスが、説明された。本プロセスは、例えば、画像センサの視野に進入するにつれて、移動可能なオブジェクト毎に、実施されてもよい。パッチは、着目オブジェクトが、パッチがもはや追跡されないように、または画像情報がパッチのために出力されないように、視野から退出すると、解除されてもよい。随時、パッチは、パッチと関連付けられるオブジェクトの場所を決定し、パッチの位置をその場所に対応するように設定すること等によって、更新されてもよいことを理解されたい。類似調節は、パッチの算出された軌道に行われることができる。オブジェクトのための運動ベクトルおよび／または画像センサの運動ベクトルが、他のセンサ情報から算出され、パッチ追跡のために画像センサまたは他のコンポーネントの中にプログラムされる値をリセットするために使用されてもよい。

例えば、オブジェクトの場所、運動、および他の特性は、広角ビデオカメラまたは立体視情報を伴う一対のビデオカメラの出力を分析することによって、決定されてもよい。これらの他のセンサからのデータは、世界モデルを更新するために使用されてもよい。更新に関連して、パッチ位置および／または軌道情報が、更新されてもよい。そのような更新は、パッチの位置がパッチ追跡エンジンによって更新されるより低いレートで生じ得る。パッチ追跡エンジンは、例えば、約１～３０回／秒のレートで、新しいパッチ位置を算出してもよい。他の情報に基づく、パッチ位置の更新は、１回／秒～約１回／３０秒インターバル等のより低速のレートで生じ得る。

変形例のなおもさらなる実施例として、図２は、遠隔処理モジュールと別個に頭部搭載型ディスプレイを伴う、システムを示す。本明細書に説明されるような画像センサは、システムのコンパクトな設計につながり得る。そのようなセンサは、より少ないデータを生成し、これは、ひいては、より低い処理要件およびより少ない電力消費につながる。処理および電力のより少ない必要性は、バッテリのサイズを低減させること等によって、サイズ低減を可能にする。故に、いくつかの実施形態では、拡張現実システム全体が、遠隔処理モジュールを伴わずに、頭部搭載型ディスプレイ内に統合されてもよい。頭部搭載型ディスプレイは、一対のゴーグルとして構成されてもよい、または図２に示されるように、サイズおよび形状が一対の眼鏡に類似してもよい。

さらに、画像センサが可視光に応答する、実施形態が、説明される。本明細書に説明される技法は、可視光を伴う動作に限定されないことを理解されたい。それらは、代替として、または加えて、ＩＲ光またはＵＶ等のスペクトルの他の部分における「光」に応答してもよい。さらに、本明細書に説明されるような画像センサは、自然に生じる光に応答する。代替として、または加えて、センサは、照明源を伴うシステム内で使用されてもよい。いくつかの実施形態では、画像センサの感度は、照明源が光を放出する、スペクトルの部分に対して調整されてもよい。

別の実施例として、変化が画像センサから出力されるべきである、画像アレイの選択された領域は、画像分析が実施されるべき「パッチ」を規定することによって規定されることが説明される。しかしながら、パッチおよび選択された領域は、異なるサイズであってもよいことを理解されたい。選択された領域は、例えば、予測される軌道から逸脱する、追跡されている画像内のオブジェクトの運動を考慮し、および／またはパッチの縁の周囲の処理を可能にするために、パッチより大きくてもよい。

さらに、パス可能世界モデル生成、オブジェクト追跡、頭部姿勢追跡、および手の追跡等の複数のプロセスが、説明される。これら、およびいくつかの実施形態では、他のプロセスは、同一または異なるプロセッサによって実行されてもよい。プロセッサは、これらのプロセスの同時動作を有効にするように動作されてもよい。しかしながら、各プロセスは、異なるレートで実施されてもよい。異なるプロセスが、異なるレートにおいて、画像センサまたは他のセンサからのデータを要求する場合、センサデータの入手は、その動作のために適切なレートにおいて、各プロセスにデータを提供するために、別のプロセス等によって管理されてもよい。

そのような改変、修正、および改良は、本開示の一部であるように意図され、本開示の精神および範囲内であるように意図される。例えば、いくつかの実施形態では、画像センサのピクセルのカラーフィルタ１０２は、別個のコンポーネントではなく、代わりに、ピクセルサブアレイ１００の他のコンポーネントのうちの１つの中に組み込まれてもよい。例えば、到着角／位置強度コンバータおよびカラーフィルタの両方を伴う、単一ピクセルを含む、実施形態では、到着角／強度コンバータは、特定の波長をフィルタリングする材料から形成される、透過性光学コンポーネントであってもよい。

いくつかの実施形態では、グレースケールカメラは、プレノプティックカメラを備えてもよく、プロセッサはさらに、プレノプティックカメラを使用して、ライトフィールド情報を入手し、世界モデル更新ルーチンを、ライトフィールド情報を使用して、深度基準を充足させる、世界モデルの部分上で実施するように構成されてもよい。

いくつかの実施形態では、ヘッドセットから１．５メートル未満の世界モデルの部分は、深度基準を充足させ得る。

いくつかの実施形態では、プロセッサはさらに、カラーカメラを無効にする、またはカラーカメラのフレームレートを低減させるように構成されてもよい。

いくつかの実施形態では、プロセッサはさらに、頭部姿勢追跡品質基準を評価し、評価に基づいて、カラーカメラを有効にし、グレースケールカメラおよびカラーカメラによって入手された画像から立体投影的に決定される、深度情報を使用して、頭部姿勢を追跡するように構成されてもよい。

いくつかの実施形態では、グレースケールカメラは、プレノプティックカメラを備えてもよい。

頭部姿勢追跡は、グレースケールカメラによって入手されたライトフィールド情報を使用してもよい。

いくつかの実施形態では、プレノプティックカメラは、透過回折マスクを備えてもよい。

いくつかの実施形態では、グレースケールカメラのための水平視野の範囲は、９０～１７５度であってもよく、中心視野の範囲は、４０～１２０度であってもよい。

いくつかの実施形態では、世界モデルは、３次元ブリックを備えてもよく、３次元ブリックは、ボクセルを備え、世界モデル更新ルーチンは、視認錐台内のブリックを識別するステップであって、視認錐台は、最大深度を有する、ステップと、プレノプティックカメラを使用して入手された深度情報を使用して、識別されたブリック内のボクセルを更新するステップとを含んでもよい。

いくつかの実施形態では、プロセッサはさらに、オブジェクトが中心視野内にあるかどうかを決定し、本決定に基づいて、オブジェクトが中心視野内にあるとき、グレースケールカメラおよびカラーカメラによって入手された画像から立体投影的に決定される深度情報を使用して、オブジェクトを追跡し、オブジェクトが中心視野の外側のカラーカメラの周辺視野内にあるとき、カラーカメラによって入手された１つ以上の画像を使用して、オブジェクトを追跡するように構成されてもよい。

いくつかの実施形態では、ヘッドセットは、３０～３００グラムの重量であってもよく、プロセッサはさらに、較正ルーチンを実施し、グレースケールカメラおよびカラーカメラの相対的配向を決定するように構成されてもよい。

いくつかの実施形態では、較正ルーチンは、２つのカメラのそれぞれを用いて入手された画像内の対応する特徴を識別するステップと、２つのカメラの複数の推定される相対的配向毎に、誤差を算出するステップであって、誤差は、２つのカメラのそれぞれを用いて入手された画像内に現れるような対応する特徴と、２つのカメラの推定される相対的配向に基づいて算出された識別された特徴の推定値との間の差異を示す、ステップと、算出された誤差に基づいて、複数の推定される相対的配向の相対的配向を決定された相対的配向として選択するステップとを含んでもよい。

いくつかの実施形態では、プロセッサはさらに、ウェアラブルディスプレイシステムの使用の間、較正ルーチンがフレーム内の歪曲を補償するように、ウェアラブルディスプレイシステムが装着されている間、較正ルーチンを繰り返し実施するように構成されてもよい。

いくつかの実施形態では、較正ルーチンは、温度の変化によって生じる、フレーム内の歪曲を補償してもよい。

いくつかの実施形態では、較正ルーチンは、機械的歪みによって生じる、フレーム内の歪曲を補償してもよい。

いくつかの実施形態では、ローカルデータ処理モジュールが、プロセッサを備えてもよく、ローカルデータ処理モジュールは、通信リンクを通して、ディスプレイデバイスに動作可能に結合され、ヘッドセットは、ディスプレイデバイスを備えてもよい。

いくつかの実施形態によると、ウェアラブルディスプレイシステムであって、フレームと、フレームに機械的に結合される、第１のカメラと、フレームに機械的に結合される、第２のカメラとであって、第１のカメラおよび第２のカメラは、第１のカメラおよび第２のカメラの両方と関連付けられる、中心視野を提供するように位置付けられ、第１のカメラおよび第２のカメラのうちの少なくとも１つは、プレノプティックカメラを備える、第１のカメラおよび第２のカメラと、第１のカメラおよび第２のカメラに動作可能に結合され、オブジェクトが中心視野内にあるかどうかを決定し、オブジェクトが中心視野内にあるとき、オブジェクトが深度基準を充足させるかどうかを決定し、追跡されるオブジェクトが、中心視野内にあって、深度基準を充足させないとき、第１のカメラおよび第２のカメラによって入手された画像から立体視的に決定される、深度情報を使用して、オブジェクトを追跡し、追跡されるオブジェクトが、中心視野内にあって、深度基準を充足させるとき、第１のカメラまたは第２のカメラのうちの１つによって入手されたライトフィールド情報から決定される、深度情報を使用して、オブジェクトを追跡するように構成される、プロセッサとを備える、ウェアラブルディスプレイシステムが、提供される。

いくつかの実施形態では、オブジェクトは、ヘッドセットの装着者の手であってもよい。

いくつかの実施形態では、第１のカメラは、プレノプティックカメラを備えてもよく、プロセッサはさらに、第１のカメラおよび第２のカメラによって入手された画像を使用して、世界モデルを作成し、第１のカメラによって入手されたライトフィールド情報を使用して、世界モデルを更新し、更新された世界モデルが品質基準を充足させないことを決定し、決定に基づいて、第２のカメラを有効にするように構成されてもよい。

いくつかの実施形態では、第１のカメラの水平視野の範囲は、９０～１７５度であってもよく、中心視野の範囲は、４０～８０度であってもよい。

いくつかの実施形態では、プロセッサはさらに、第１のカメラまたは第２のカメラのうちの少なくとも１つに、画像捕捉をピクセルのサブセットに制限するように命令を提供するように構成されてもよい。

いくつかの実施形態では、第２のカメラは、周辺視野を提供するように位置付けられてもよく、プロセッサはさらに、オブジェクトが周辺視野内にあるかどうかを決定し、追跡されるオブジェクトが周辺視野の内側にあるとき、第２のカメラを使用して、オブジェクトを追跡するように構成されてもよい。

いくつかの実施形態では、第２のカメラは、プレノプティックカメラを備えてもよく、プロセッサはさらに、追跡されるオブジェクトが、周辺視野内にあって、深度基準を充足させるとき、第２のカメラから取得されるライトフィールド情報を使用して、オブジェクトを追跡するように構成されてもよい。

いくつかの実施形態では、プロセッサはさらに、オブジェクトが周辺視野の中に移動したかどうかを決定し、決定に応答して、第２のカメラを有効にする、または第２のカメラのフレームレートを増加させるように構成されてもよい。

いくつかの実施形態では、オブジェクトが中心視野内にあるとき、深度情報を使用して、オブジェクトを追跡するステップは、中心視野内の点を選択するステップと、第１のカメラおよび第２のカメラによって入手された画像から立体視的に決定される、深度情報、または第１のカメラまたは第２のカメラのうちの１つによって入手されたライトフィールド情報から決定される深度情報のうちの少なくとも１つを使用して、選択された点に関する深度情報を決定するステップと、決定された深度情報を使用して、深度マップを生成するステップと、深度マップの部分を、形状制約および運動制約の両方を含む、手のモデルの対応する部分に合致させるステップとを含んでもよい。

いくつかの実施形態では、プロセッサはさらに、画像の部分を、形状制約および運動制約の両方を含む、手のモデルの対応する部分に合致させることによって、第２のカメラから入手された１つ以上の画像を使用して、周辺視野内の手の運動を追跡するように構成されてもよい。

いくつかの実施形態では、プロセッサは、フレームに機械的に結合されてもよい。

いくつかの実施形態では、フレームに機械的に結合される、ディスプレイデバイスは、プロセッサを備えてもよい。

いくつかの実施形態では、ローカルデータ処理モジュールが、プロセッサを備えてもよく、ローカルデータ処理モジュールは、通信リンクを通して、ディスプレイデバイスに動作可能に結合され、ディスプレイデバイスは、フレームに機械的に結合される。

いくつかの実施形態では、第１のカメラは、２０～４０度内向きに角度付けられてもよく、第２のカメラは、１～２０度内向きに角度付けられてもよい。

いくつかの実施形態では、第１のカメラは、カラーカメラであってもよく、第２のカメラは、グレースケールカメラであってもよい。

いくつかの実施形態では、２つのカメラのうちの少なくとも１つは、プレノプティックカメラであってもよい。

さらに、本開示の利点が示されるが、本開示の全ての実施形態が、全ての説明される利点を含むわけではないことを理解されたい。いくつかの実施形態は、本明細書で有利として説明される任意の特徴を実装しなくてもよい。故に、前述の説明および図面は、一例にすぎない。

本開示の前述の実施形態は、多数の方法のいずれかにおいて実装されることができる。例えば、実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせを使用して実装されてもよい。ソフトウェア内に実装されるとき、ソフトウェアコードが、単一コンピュータ内に提供される、または複数のコンピュータ間に分散されるかどうかにかかわらず、任意の好適なプロセッサまたはプロセッサの集合上で実行されることができる。そのようなプロセッサは、いくつか挙げると、ＣＰＵチップ、ＧＰＵチップ、マイクロプロセッサ、マイクロコントローラ、またはコプロセッサ等、当技術分野において公知の市販の集積回路コンポーネントを含む、集積回路コンポーネント内の１つ以上のプロセッサとともに、集積回路として実装されてもよい。いくつかの実施形態では、プロセッサは、ＡＳＩＣ等のカスタム回路内に、またはプログラマブル論理デバイスを構成することから生じる半カスタム回路内に実装されてもよい。さらなる代替として、プロセッサは、市販、半カスタム、またはカスタムかどうかにかかわらず、より大きい回路または半導体デバイスの一部であってもよい。具体的実施例として、いくつかの市販のマイクロプロセッサは、１つまたはそれらのコアのサブセットがプロセッサを構成し得るように、複数のコアを有する。但し、プロセッサは、任意の好適なフォーマットにおける回路を使用して実装されてもよい。

さらに、コンピュータは、ラックマウント式コンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、またはタブレットコンピュータ等のいくつかの形態のうちのいずれかで具現化され得ることを理解されたい。加えて、コンピュータは、携帯情報端末（ＰＤＡ）、スマートフォン、または任意の好適な携帯用または固定電子デバイスを含む、概してコンピュータと見なされないが好適な処理能力を伴う、デバイスで具現化されてもよい。

また、コンピュータは、１つ以上の入力および出力デバイスを有してもよい。これらのデバイスは、とりわけ、ユーザインターフェースを提示するために使用されることができる。ユーザインターフェースを提供するために使用され得る、出力デバイスの実施例は、出力の視覚的提示のためのプリンタまたはディスプレイ画面、または出力の可聴提示のためのスピーカまたは他の音生成デバイスを含む。ユーザインターフェースのために使用され得る、入力デバイスの実施例は、キーボード、およびマウス、タッチパッド、およびデジタル化タブレット等のポインティングデバイスを含む。別の実施例として、コンピュータは、発話認識を通して、または他の可聴フォーマットにおいて、入力情報を受信してもよい。図示される実施形態では、入力／出力デバイスは、コンピューティングデバイスと物理的に別個として図示される。しかしながら、いくつかの実施形態では、入力および／または出力デバイスは、プロセッサと同一ユニットまたはコンピューティングデバイスの他の要素の中に物理的に統合されてもよい。例えば、キーボードは、タッチスクリーン上のソフトキーボードとして実装され得る。いくつかの実施形態では、入力／出力デバイスは、コンピューティングデバイスから完全に接続解除され、無線接続を通して機能的に統合されてもよい。

そのようなコンピュータは、企業ネットワークまたはインターネット等、ローカルエリアネットワークまたは広域ネットワークとしての形態を含む、任意の好適な形態の１つ以上のネットワークによって相互接続されてもよい。そのようなネットワークは、任意の好適な技術に基づいてもよく、任意の好適なプロトコルに従って動作してもよく、無線ネットワーク、有線ネットワーク、または光ファイバネットワークを含んでもよい。

また、本明細書で概説される種々の方法およびプロセスは、種々のオペレーティングシステムまたはプラットフォームのうちのいずれか１つを採用する、１つ以上のプロセッサ上で実行可能である、ソフトウェアとしてコード化されてもよい。加えて、そのようなソフトウェアは、いくつかの好適なプログラミング言語および／またはプログラミングまたはスクリプト作成ツールのうちのいずれかを使用して、書き込まれてもよく、また、フレームワークまたは仮想マシン上で実行される実行可能機械言語コードまたは中間コードとしてコンパイルされてもよい。

本点において、本開示は、１つ以上のコンピュータまたは他のプロセッサ上で実行されるときに、上記で議論される本開示の種々の実施形態を実装する方法を行う、１つ以上のプログラムで符号化される、コンピュータ可読記憶媒体（または複数のコンピュータ可読媒体）（例えば、コンピュータメモリ、１つ以上のフロッピー（登録商標）ディスク、コンパクトディスク（ＣＤ）、光学ディスク、デジタルビデオディスク（ＤＶＤ）、磁気テープ、フラッシュメモリ、フィールドプログラマブルゲートアレイまたは他の半導体デバイス内の回路構成、または他の有形コンピュータ記憶媒体）として具現化されてもよい。前述の実施例から明白なように、コンピュータ可読記憶媒体は、非一過性形態においてコンピュータ実行可能命令を提供するために十分な時間の間、情報を留保し得る。そのようなコンピュータ可読記憶媒体または複数の媒体は、上記に記載されるように、その上に記憶される１つまたは複数のプログラムが、本開示の種々の側面を実装するように１つ以上の異なるコンピュータまたは他のプロセッサ上にロードされ得るように、トランスポータブルであることができる。本明細書で使用されるように、用語「コンピュータ可読記憶媒体」は、製造（すなわち、製造品）または機械と見なされ得るコンピュータ可読媒体のみを包含する。いくつかの実施形態では、本開示は、伝搬信号等のコンピュータ可読記憶媒体以外のコンピュータ可読媒体として具現化されてもよい。

用語「プログラム」または「ソフトウェア」は、上記に記載されるように、本開示の種々の側面を実装するようにコンピュータまたは他のプロセッサをプログラムするために採用され得る、任意のタイプのコンピュータコードまたはコンピュータ実行可能命令のセットを指すために、一般的意味において本明細書で使用される。加えて、本実施形態の一側面によると、本開示の方法を行うように実行されると、１つ以上のコンピュータプログラムは、単一のコンピュータまたはプロセッサ上に常駐する必要はないが、本開示の種々の側面を実装するように、いくつかの異なるコンピュータまたはプロセッサの間でモジュール様式において分散され得ることを理解されたい。

コンピュータ実行可能命令は、１つ以上のコンピュータまたは他のデバイスによって実行される、プログラムモジュール等の多くの形態であってもよい。概して、プログラムモジュールは、特定のタスクを行う、または特定の抽象データタイプを実装する、ルーチン、プログラム、オブジェクト、構成要素、データ構造等を含む。典型的には、プログラムモジュールの機能性は、種々の実施形態では、所望に応じて、組み合わせられる、または分散されてもよい。

また、データ構造は、任意の好適な形態でコンピュータ可読媒体に記憶されてもよい。例証を簡単にするために、データ構造は、データ構造内の場所を通して関係付けられるフィールドを有することが示されてもよい。そのような関係は、同様に、フィールド間の関係を伝えるコンピュータ可読媒体内の場所を伴うフィールドのために記憶装置を割り当てることによって、達成されてもよい。しかしながら、ポインタ、タグ、またはデータ要素間の関係を確立する他の機構の使用を通すことを含む、任意の好適な機構が、データ構造のフィールド内の情報の間の関係を確立するために使用されてもよい。

本開示の種々の側面は、単独で、組み合わせて、または前述の実施形態に具体的に議論されない種々の配列において使用されてもよく、したがって、その用途は、前述の説明に記載される、または図面に図示されるコンポーネントの詳細および配列に限定されない。例えば、一実施形態に説明される側面は、他の実施形態に説明される側面と任意の様式で組み合わせられてもよい。

また、本開示は、その実施例が提供されている、方法として具現化されてもよい。方法の一部として行われる作用は、任意の好適な方法で順序付けられてもよい。故に、例証的実施形態では、連続作用として示されるが、いくつかの作用を同時に行うことを含み得る、作用が図示されるものと異なる順序で行われる、実施形態が構築されてもよい。

請求項要素を修飾するための請求項における「第１の」、「第２の」、「第３の」等の順序の用語の使用は、単独では、別の要素と比べた１つの請求項要素のいかなる優先順位、先行、または順序、または方法の行為が行われる時間順序も含意しないが、順序の用語は、請求項要素を区別するために、（順序の用語の使用のためであるが）ある名前を有する１つの請求項要素と、同一の名前を有する別の要素を区別する標識としてのみ使用される。

また、本明細書で使用される語句および専門用語は、説明目的のためのものであって、限定と見なされるべきではない。本明細書の「～を含む」、「～を備える」、または「～を有する」、「～を含有する」、「～を伴う」、およびその変形の使用は、その後列挙されたアイテムおよびその均等物および付加的アイテムを包含することを意味する。

Claims

ウェアラブルディスプレイシステムであって、前記ウェアラブルディスプレイシステムは、
ヘッドセットであって、前記ヘッドセットは、グローバルシャッタを伴う１つの第１のカメラと、ロールシャッタを伴う１つの第２のカメラとを備え、前記第１のカメラおよび前記第２のカメラは、中心視野の重複ビューを提供するように位置付けられる、ヘッドセットと、
プロセッサであって、前記プロセッサは、前記第１のカメラおよび前記第２のカメラに動作可能に結合され、前記プロセッサは、
ロールシャッタ画像歪曲のために、補償ルーチンを実施し、前記第２のカメラを使用して入手された画像を調節することと、
部分的に、前記第１のカメラを使用して入手された画像から立体視的に決定される深度情報と、前記調節された画像とを使用して、世界モデルを作成することと
を行うように構成される、プロセッサと、
を備える、ウェアラブルディスプレイシステム。
前記第１のカメラおよび前記第２のカメラは、非対称的に内向きに角度付けられる、請求項１に記載のウェアラブルディスプレイシステム。
前記第１のカメラの視野は、前記第２のカメラの視野より大きい、請求項２に記載のウェアラブルディスプレイシステム。
前記第１のカメラは、２０～４０度内向きに角度付けられ、前記第２のカメラは、１～２０度内向きに角度付けられる、請求項２に記載のウェアラブルディスプレイシステム。
前記第１のカメラは、１～５分／ピクセルの角度ピクセル分解能を有する、請求項１に記載のウェアラブルディスプレイシステム。
前記プロセッサはさらに、サイズ低減ルーチンを実施し、前記第２のカメラを使用して入手された画像を調節するように構成される、請求項１に記載のウェアラブルディスプレイシステム。
前記サイズ低減ルーチンは、前記第２のカメラによって入手された画像内のピクセルをビニングすることによって、低減されたサイズ画像を生成することを含む、請求項６に記載のウェアラブルディスプレイシステム。
前記補償ルーチンは、
前記第１のカメラを使用して入手された第１の画像と前記第２のカメラを使用して入手された第２の画像を比較し、前記第２の画像の少なくとも一部内の歪みを検出することと、
前記第２の画像の少なくとも一部を調節し、前記検出された歪みを補償することと
を含む、請求項１に記載のウェアラブルディスプレイシステム。
前記第１のカメラを使用して入手された第１の画像と前記第２のカメラを使用して入手された第２の画像を比較することは、前記第１のカメラによって取得される第１の画像と前記第２のカメラによって取得される第２の画像との間のライン毎比較を実施することを含む、請求項８に記載のウェアラブルディスプレイシステム。
前記プロセッサはさらに、
電力節約基準または世界モデル完全性基準のうちの少なくとも１つに基づいて、前記第２のカメラを無効にする、または前記第２のカメラのフレームレートを変調させる
ように構成される、請求項１に記載のウェアラブルディスプレイシステム。
前記第１のカメラまたは前記第２のカメラのうちの少なくとも１つは、プレノプティックカメラを備え、
前記プロセッサはさらに、
部分的に、前記第１のカメラまたは前記第２のカメラのうちの少なくとも１つによって入手されたライトフィールド情報を使用して、世界モデルを作成する
ように構成される、請求項１に記載のウェアラブルディスプレイシステム。
前記第１のカメラは、プレノプティックカメラを備え、
前記プロセッサはさらに、
前記プレノプティックカメラを使用して入手された深度情報を使用して、世界モデル更新ルーチンを実施する
ように構成される、請求項１に記載のウェアラブルディスプレイシステム。
前記プロセッサは、前記ヘッドセットに機械的に結合される、請求項１に記載のウェアラブルディスプレイシステム。
前記ヘッドセットは、前記プロセッサに機械的に結合されるディスプレイデバイスを備える、請求項１に記載のウェアラブルディスプレイシステム。
ローカルデータ処理モジュールが、前記プロセッサを備え、前記ローカルデータ処理モジュールは、通信リンクを通して、ディスプレイデバイスに動作可能に結合され、前記ヘッドセットは、前記ディスプレイデバイスを備える、請求項１に記載のウェアラブルディスプレイシステム。
ウェアラブルディスプレイシステムを使用して、世界モデルを作成する方法であって、前記ウェアラブルディスプレイシステムは、
ヘッドセットであって、前記ヘッドセットは、グローバルシャッタを伴う１つの第１のカメラと、ロールシャッタを伴う１つの第２のカメラとを備え、前記第１のカメラおよび前記第２のカメラは、中心視野の重複ビューを提供するように位置付けられる、ヘッドセットと、
プロセッサであって、前記プロセッサは、前記第１のカメラおよび前記第２のカメラに動作可能に結合される、プロセッサと
を備え、
前記方法は、前記プロセッサを使用して、
ロールシャッタ画像歪曲のために、補償ルーチンを実施し、前記第２のカメラを使用して入手された画像を調節することと、
部分的に、前記第１のカメラを使用して入手された画像から立体視的に決定される深度情報と、前記調節された画像とを使用して、前記世界モデルを作成することと
を含む、方法。
ウェアラブルディスプレイシステムであって、前記ウェアラブルディスプレイシステムは、
ヘッドセットであって、前記ヘッドセットは、中心視野の重複ビューを提供するように位置付けられるグレースケールカメラおよびカラーカメラを有する、ヘッドセットと、
プロセッサであって、前記プロセッサは、前記グレースケールカメラおよび前記カラーカメラに動作可能に結合され、前記プロセッサは、
前記グレースケールカメラおよび前記カラーカメラによって入手された画像から立体視的に決定される第１の深度情報を使用して、世界モデルを作成することと、
前記グレースケールカメラおよび前記世界モデルを使用して、頭部姿勢を追跡することと
を行うように構成される、プロセッサと
を備える、ウェアラブルディスプレイシステム。
ウェアラブルディスプレイシステムを使用して、頭部姿勢を追跡する方法であって、前記ウェアラブルディスプレイシステムは、
ヘッドセットであって、前記ヘッドセットは、中心視野の重複ビューを提供するように位置付けられるグレースケールカメラおよびカラーカメラを有する、ヘッドセットと、
プロセッサであって、前記プロセッサは、前記グレースケールカメラおよび前記カラーカメラに動作可能に結合される、プロセッサと
を備え、
前記方法は、前記プロセッサを使用して、
前記グレースケールカメラおよび前記カラーカメラによって入手された画像から立体視的に決定される第１の深度情報を使用して、世界モデルを作成することと、
前記グレースケールカメラおよび前記世界モデルを使用して、頭部姿勢を追跡することと
を含む、方法。
ウェアラブルディスプレイシステムであって、前記ウェアラブルディスプレイシステムは、
フレームと、
前記フレームに機械的に結合される第１のカメラと、前記フレームに機械的に結合される第２のカメラとであって、前記第１のカメラおよび前記第２のカメラは、前記第１のカメラおよび前記第２のカメラの両方と関連付けられる中心視野を提供するように位置付けられ、前記第１のカメラおよび前記第２のカメラのうちの少なくとも１つは、プレノプティックカメラを備える、第１のカメラおよび第２のカメラと、
プロセッサであって、前記プロセッサは、前記第１のカメラおよび前記第２のカメラに動作可能に結合され、前記プロセッサは、
オブジェクトが前記中心視野内にあるかどうかを決定することと、
前記オブジェクトが前記中心視野内にあるとき、前記オブジェクトが深度基準を充足させるかどうかを決定することと、
前記追跡されるオブジェクトが、前記中心視野内にあって、前記深度基準を充足させないとき、前記第１のカメラおよび前記第２のカメラによって入手された画像から立体視的に決定される深度情報を使用して、前記オブジェクトを追跡することと、
前記追跡されるオブジェクトが、前記中心視野内にあって、前記深度基準を充足させるとき、前記第１のカメラまたは前記第２のカメラのうちの１つによって入手されたライトフィールド情報から決定される深度情報を使用して、前記オブジェクトを追跡することと
を行うように構成される、プロセッサと
を備える、ウェアラブルディスプレイシステム。
ウェアラブルディスプレイシステムを使用して、オブジェクトを追跡する方法であって、前記ウェアラブルディスプレイシステムは、
フレームと、
前記フレームに機械的に結合される第１のカメラと、前記フレームに機械的に結合される第２のカメラとであって、前記第１のカメラおよび前記第２のカメラは、前記第１のカメラおよび前記第２のカメラの両方と関連付けられる中心視野を提供するように位置付けられ、前記第１のカメラおよび前記第２のカメラのうちの少なくとも１つは、プレノプティックカメラを備える、第１のカメラおよび第２のカメラと、
プロセッサであって、前記プロセッサは、前記第１のカメラおよび前記第２のカメラに動作可能に結合される、プロセッサと
を備え、
前記方法は、前記プロセッサを使用して、
オブジェクトが前記中心視野内にあるかどうかを決定することと、
前記オブジェクトが前記中心視野内にあるとき、前記オブジェクトが深度基準を充足させるかどうかを決定することと、
前記追跡されるオブジェクトが、前記中心視野内にあって、前記深度基準を充足させないとき、前記第１のカメラおよび前記第２のカメラによって入手された画像から立体視的に決定される深度情報を使用して、前記オブジェクトを追跡することと、
前記追跡されるオブジェクトが、前記中心視野内にあって、前記深度基準を充足させるとき、前記第１のカメラまたは前記第２のカメラのうちの１つによって入手されたライトフィールド情報から決定される深度情報を使用して、前記オブジェクトを追跡することと
を含む、方法。
ウェアラブルディスプレイシステムであって、前記ウェアラブルディスプレイシステムは、
フレームと、
前記フレームに機械的に結合される２つのカメラであって、前記２つのカメラは、
第１の視野を有する、グローバルシャッタを伴う第１のカメラと、
第２の視野を有する、ロールシャッタを伴う第２のカメラと、
を備え、
前記第１のカメラおよび前記第２のカメラは、
前記第１の視野が前記第２の視野と重複する中心視野と、
前記中心視野の外側の周辺視野と
を提供するように位置付けられる、２つのカメラと、
前記第１のカメラおよび前記第２のカメラに動作可能に結合されるプロセッサと
を備える、ウェアラブルディスプレイシステム。