JP2023103441A - 拡張現実識別検証 - Google Patents

拡張現実識別検証 Download PDF

Info

Publication number
JP2023103441A
JP2023103441A JP2023083020A JP2023083020A JP2023103441A JP 2023103441 A JP2023103441 A JP 2023103441A JP 2023083020 A JP2023083020 A JP 2023083020A JP 2023083020 A JP2023083020 A JP 2023083020A JP 2023103441 A JP2023103441 A JP 2023103441A
Authority
JP
Japan
Prior art keywords
document
information
face
ard
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023083020A
Other languages
English (en)
Other versions
JP2023103441A5 (ja
Inventor
ケーラー エイドリアン
Adrian Kaehler
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Magic Leap Inc
Original Assignee
Magic Leap Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Magic Leap Inc filed Critical Magic Leap Inc
Publication of JP2023103441A publication Critical patent/JP2023103441A/ja
Publication of JP2023103441A5 publication Critical patent/JP2023103441A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Graphics (AREA)
  • Computer Security & Cryptography (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】拡張現実環境内の種々の認証技法及び拡張現実システムを提供する。【解決手段】人物と人物によって提示される識別ドキュメントとの間の整合を決定する、拡張現実(AR)システムによって実行される方法であって、環境の画像を取得することと、1つ以上のフィルタを使用して、画像内の複数の顔の中から第1の顔を検出することと、第1の顔を検出するために使用される技法に類似した技法を使用して、画像内の全ての顔の中から少なくとも第2の顔を検出することと、第1の顔の顔特徴を識別し、顔特徴を使用して、第1の顔を特性評価することと、第2の顔の顔特徴を識別し、第2の顔を特性評価することと、第1の顔に関するベクトルおよび第2の顔に関する別のベクトルを計算し、2つのベクトル間の距離を計算することと、を含む。【選択図】図13

Description

(関連出願の相互参照)
本願は、2016年6月3日に出願された米国仮出願第62/345,438号、発明の名称“AUGMENTED REALITY IDENTITY VERIFICATION”に対する35 U.S.C. § 119(e)のもとでの優先権の利益を主張するものであり、この開示は、全体的に参照により本明細書中に援用される。
本開示は、仮想現実および拡張現実イメージングおよび可視化システムに関し、より具体的には、拡張現実環境内の種々の認証技法に関する。
現代のコンピューティングおよびディスプレイ技術は、いわゆる「仮想現実」、「拡張現実」、または「複合現実」体験のためのシステムの開発を促進しており、デジタル的に再現された画像またはその一部が、現実であるように見える、またはそのように知覚され得る様式でユーザに提示される。仮想現実または「VR」シナリオは、典型的には、他の実際の実世界の視覚的入力に対する透明性を伴わずに、デジタルまたは仮想画像情報の提示を伴う。拡張現実または「AR」シナリオは、典型的には、ユーザの周囲の実際の世界の可視化に対する拡張としてのデジタルまたは仮想画像情報の提示を伴う。複合現実または「MR」は、物理的オブジェクトおよび仮想オブジェクトが、共存し、リアルタイムで相互作用する、新しい環境を生成するための実世界と仮想世界の融合に関連する。結論から述べると、ヒトの視知覚系は、非常に複雑であって、他の仮想世界画像要素または実世界画像要素における仮想画像要素の快適で、自然のような感覚で、かつ豊かな提示を促進する、VR、AR、またはMR技術の生成は、困難である。本明細書に開示されるシステムおよび方法は、VR、AR、およびMR技術に関連する種々の課題に対処する。
ユーザの環境内のオブジェクト/人々間のリンケージを検出する、またはオブジェクト/人々を認証するための拡張現実システムの種々の実施形態が、開示される。
一実施形態では、AR環境内のリンケージを検出するための拡張現実(AR)システムが、開示される。拡張現実システムは、ARシステムの環境をイメージングするように構成される、外向きに面したイメージングシステムと、3次元(3D)ビュー内の仮想コンテンツをARシステムのユーザに提示するように構成される、ARディスプレイと、ハードウェアプロセッサとを備える。ハードウェアプロセッサは、外向きに面したイメージングシステムを用いて、環境の画像を取得することと、画像内の第1の顔および第2の顔を検出することであって、第1の顔は、環境内の人物の顔であり、第2の顔は、識別ドキュメント上の顔である、ことと、第1の顔と関連付けられた第1の顔特徴に基づいて、第1の顔を認識することと、第2の顔特徴に基づいて、第2の顔を認識することと、第1の顔特徴および第2の顔特徴を分析し、人物と識別ドキュメントとの間のリンケージを検出することと、ARディスプレイに、第1の顔特徴および第2の顔特徴の分析の結果を示す仮想注釈を提示するように命令することとを行うようにプログラムされる。
別の実施形態では、拡張現実環境内のリンケージを検出するための方法が、開示される。本方法は、外向き撮像イメージングシステムおよびハードウェアプロセッサを備える拡張現実デバイスの制御下で実施されることができ、拡張現実デバイスは、仮想コンテンツを拡張現実デバイスの装着者に表示するように構成される。本方法は、環境の画像を取得することと、画像内の人物、第1のドキュメント、および第2のドキュメントを検出することと、少なくとも部分的に、第1のドキュメントの画像の分析に基づいて、第1の個人情報を抽出することと、第2のドキュメントと関連付けられた第2の個人情報にアクセスすることと、少なくとも部分的に、人物の画像の分析に基づいて、人物の第3の個人情報を抽出することであって、第1の個人情報、第2の個人情報、および第3の個人情報は、同一カテゴリ内にある、ことと、第1の個人情報、第2の個人情報、および第3の個人情報間の整合の可能性を決定することと、整合の可能性が閾値条件を超えることの決定に応答して、第1のドキュメント、第2のドキュメント、および人物間のリンケージを表示することとを含むことができる。
本明細書に説明される主題の1つ以上の実装の詳細が、付随の図面および以下の説明に記載される。他の特徴、側面、および利点は、説明、図面、および請求項から明白となるであろう。本概要または以下の発明を実施するための形態のいずれも、本発明の主題の範囲を定義または限定することを意図するものではない。
本発明は、例えば、以下を提供する。
(項目1)
AR環境内のリンケージを検出するための拡張現実(AR)システムであって、前記拡張現実は、
前記ARシステムの環境をイメージングするように構成される外向きに面したイメージングシステムと、
3次元(3D)ビュー内の仮想コンテンツを前記ARシステムのユーザに提示するように構成されるARディスプレイと、
ハードウェアプロセッサであって、前記ハードウェアプロセッサは、
前記外向きに面したイメージングシステムを用いて、前記環境の画像を取得することと、
前記画像内の第1の顔および第2の顔を検出することであって、前記第1の顔は、前記環境内の人物の顔であり、前記第2の顔は、識別ドキュメント上の顔である、ことと、
前記第1の顔と関連付けられた第1の顔特徴に基づいて、前記第1の顔を認識することと、
前記第2の顔特徴に基づいて、前記第2の顔を認識することと、
前記第1の顔特徴および前記第2の顔特徴を分析し、前記人物と前記識別ドキュメントとの間のリンケージを検出することと、
前記ARディスプレイに、前記第1の顔特徴および前記第2の顔特徴の分析の結果を示す仮想注釈を提示するように命令することと
を行うようにプログラムされる、ハードウェアプロセッサと
を備える、拡張現実システム。
(項目2)
前記第1の顔および前記第2の顔を検出するために、前記ハードウェアプロセッサは、ウェーブレットベースのブーストカスケードアルゴリズムまたは深層ニューラルネットワークアルゴリズムのうちの少なくとも1つを前記画像に適用するようにプログラムされる、項目1に記載のARシステム。
(項目3)
前記ハードウェアプロセッサはさらに、
前記第2の顔の動きを分析することによって、前記第2の顔が前記識別ドキュメント上の顔であることを検出することと、
前記動きが単一平面ホモグラフィによって記述されるかどうかを決定することと
を行うようにプログラムされる、項目1に記載のARシステム。
(項目4)
前記第1の顔または前記第2の顔を認識するために、前記ハードウェアプロセッサは、
それぞれ、顔目印検出アルゴリズム、深層ニューラルネットワークアルゴリズム、またはテンプレート整合アルゴリズムのうちの少なくとも1つを適用することによって、少なくとも部分的に、前記第1の顔特徴に基づいて、前記第1の顔と関連付けられた第1の特徴ベクトルを計算すること、または、少なくとも部分的に、前記第2の顔特徴に基づいて、前記第2の顔と関連付けられた第2の特徴ベクトルを計算すること
を行うようにプログラムされる、項目1に記載のARシステム。
(項目5)
前記人物と前記識別ドキュメントとの間のリンケージを検出するために、前記ハードウェアプロセッサは、
前記第1の特徴ベクトルと前記第2の特徴ベクトルとの間の距離を計算することと、
前記距離を閾値と比較することと、
前記距離が前記閾値に合格することの決定に応答して、前記リンケージを検出することと
を行うようにプログラムされる、項目4に記載のARシステム。
(項目6)
前記距離は、ユークリッド距離である、項目5に記載のARシステム。
(項目7)
前記識別ドキュメントは、クイックレスポンスコード、バーコード、または虹彩コードのうちの1つ以上を備えるラベルを有する、項目1に記載のARシステム。
(項目8)
前記ハードウェアプロセッサはさらに、
前記ラベルを前記環境の画像から識別することと、
前記ラベルを使用して、外部データソースにアクセスし、前記人物のバイオメトリック情報を読み出すことと
を行うようにプログラムされる、項目7に記載のARシステム。
(項目9)
ARシステムはさらに、ヒト可視スペクトル(HVS)外の光を照明するように構成される光学センサを備え、前記ハードウェアプロセッサはさらに、
前記光学センサに、前記光を前記識別ドキュメントに向かって照明し、前記識別ドキュメント内の隠蔽された情報を露見させるように命令することと、
前記識別ドキュメントの画像を分析することであって、前記画像は、前記識別ドキュメントが前記光で照明されたときに入手される、ことと、
バイオメトリック情報を前記画像から抽出することであって、前記抽出されたバイオメトリック情報は、前記人物と前記識別ドキュメントとの間のリンケージを検出するために使用される、ことと
を行うようにプログラムされる、項目1に記載のARシステム。
(項目10)
前記ハードウェアプロセッサは、前記第1の顔特徴と前記第2の顔特徴との間の整合の可能性を計算するようにプログラムされる、項目1に記載のARシステム。
(項目11)
前記注釈は、前記人物および前記識別ドキュメントをリンクさせる視覚的焦点インジケータを備える、項目1に記載のARシステム。
(項目12)
拡張現実環境内のリンケージを検出するための方法であって、
外向き撮像イメージングシステムおよびハードウェアプロセッサを備える拡張現実デバイスの制御下で、前記拡張現実デバイスは、仮想コンテンツを前記拡張現実デバイスの装着者に表示するように構成され、
前記環境の画像を取得することと、
前記画像内の人物、第1のドキュメント、および第2のドキュメントを検出することと、
少なくとも部分的に、前記第1のドキュメントの画像の分析に基づいて、第1の個人情報を抽出することと、
第2のドキュメントと関連付けられた第2の個人情報にアクセスすることと、
少なくとも部分的に、前記人物の画像の分析に基づいて、前記人物の第3の個人情報を抽出することであって、前記第1の個人情報、前記第2の個人情報、および前記第3の個人情報は、同一カテゴリ内にある、ことと、
前記第1の個人情報、前記第2の個人情報、および前記第3の個人情報の間の整合の可能性を決定することと、
前記整合の可能性が閾値条件を超えることの決定に応答して、前記第1のドキュメント、前記第2のドキュメント、および前記人物の間のリンケージを表示することと
を含む、方法。
(項目13)
前記環境の画像を取得することは、前記拡張現実デバイスの外向きに面したイメージングシステムによって入手された前記画像にアクセスすることを含む、項目12に記載の方法。
(項目14)
前記第1の個人情報および前記第3の個人情報を抽出することは、
前記画像内の第1の顔を検出することであって、前記第1の顔は、前記第1のドキュメント内に含まれる、ことと、
前記画像内の第2の顔を検出することであって、前記第2の顔は、前記環境内の人物と関連付けられる、ことと、
前記第1の顔と関連付けられた第1の顔特徴および前記第2の顔と関連付けられた第2の顔特徴を識別することと、
それぞれ、前記第1の顔特徴および前記第2の顔特徴に基づいて、前記第1の顔および前記第2の顔を認識することと
を含む、項目12に記載の方法。
(項目15)
前記第1の顔を検出することまたは前記第2の顔を検出することは、ウェーブレットベースのブーストカスケードアルゴリズムまたは深層ニューラルネットワークアルゴリズムを適用することを含む、項目14に記載の方法。
(項目16)
前記第1の顔を認識することおよび前記第2の顔を認識することは、それぞれ、顔目印検出アルゴリズム、深層ニューラルネットワークアルゴリズム、またはテンプレート整合アルゴリズムのうちの少なくとも1つを適用することによって、
少なくとも部分的に、前記第1の顔特徴に基づいて、前記第1の顔と関連付けられた第1の特徴ベクトルを計算することと、
少なくとも部分的に、前記第2の顔特徴に基づいて、前記第2の顔と関連付けられた第2の特徴ベクトルを計算することと
を含む、項目14に記載の方法。
(項目17)
前記第2の個人情報にアクセスすることは、
光が前記第2のドキュメント上に当てられたとき、前記第2のドキュメントの画像を入手することであって、前記光の少なくとも一部は、ヒト可視スペクトル外にある、ことと、
前記第2のドキュメントの前記入手された画像に基づいて、前記第2の個人情報を識別することであって、前記第2の個人情報は、通常光学条件下、ヒトに直接可視ではない、ことと
を含む、項目12に記載の方法。
(項目18)
前記第2の個人情報にアクセスすることは、
前記ラベルを前記環境の画像から識別することと、
前記ラベルを使用して、複数の人物の個人情報を記憶するデータソースにアクセスし、前記人物のバイオメトリック情報を読み出すことと
を含む、項目12に記載の方法。
(項目19)
整合の可能性を決定することは、
前記第1の個人情報および前記第2の個人情報を比較することと、
少なくとも部分的に、前記第1の個人情報と前記第2の個人情報との間の類似性または非類似性に基づいて、信頼度スコアを計算することと
を含む、項目12に記載の方法。
(項目20)
前記信頼度スコアが閾値を超えることの決定に応答して、前記第1のドキュメントまたは前記第2のドキュメントのうちの少なくとも1つを有効として示す仮想注釈を表示することをさらに含む、項目19に記載の方法。
図1は、人物によって視認されるある仮想現実オブジェクトおよびある物理的オブジェクトを伴う、複合現実シナリオの例証を描写する。 図2は、ウェアラブルシステムの実施例を図式的に図示する。 図3は、複数の深度平面を使用して3次元画像をシミュレートするためのアプローチの側面を図式的に図示する。 図4は、画像情報をユーザに出力するための導波管スタックの実施例を図式的に図示する。 図5は、導波管によって出力され得る、例示的出射ビームを示す。 図6は、導波管装置と、光を導波管装置へまたはそこから光学的に結合するための光学結合器サブシステムと、多焦点立体ディスプレイ、画像、またはライトフィールドの生成において使用される、制御サブシステムとを含む、光学システムを示す、概略図である。 図7は、ウェアラブルシステムの実施例のブロック図である。 図8は、認識されるオブジェクトに関連して仮想コンテンツをレンダリングする方法の実施例のプロセスフロー図である。 図9は、ウェアラブルシステムの別の実施例のブロック図である。 図10は、ウェアラブルシステムへのユーザ入力を決定するための方法の実施例のプロセスフロー図である。 図11は、仮想ユーザインターフェースと相互作用するための方法の実施例のプロセスフロー図である。 図12Aは、人物とドキュメントとの間のリンケージを分析することによる、識別検証の実施例を図示する。 図12Bは、2つのドキュメント間のリンケージを分析することによる、識別検証の実施例を図示する。 図13は、人物と人物によって提示される識別ドキュメントとの間の整合を決定するための例示的プロセスのフローチャートである。 図14は、2つのドキュメント間の整合を決定するための例示的プロセスのフローチャートである。 図15は、人物と複数のドキュメントとの間の整合を決定するための例示的プロセスのフローチャートである。
図面全体を通して、参照番号は、参照される要素間の対応を示すために再使用され得る。図面は、本明細書に説明される例示的実施形態を図示するために提供され、本開示の範囲を限定することを意図されない。加えて、本開示内の図は、例証目的のためのものであって、正確な縮尺ではない。
概要
拡張現実デバイス(ARD)は、ユーザの物理的環境とのユーザの視覚的または相互作用体験を向上させ得る、仮想コンテンツを提示することができる。ユーザは、ARDを通して見られる物理的コンテンツに加え、仮想コンテンツを知覚することができる。
例えば、空港のセキュリティ検問所では、旅行者は、通常、その識別ドキュメント(例えば、運転免許証またはパスポート)をARDを装着し得る検閲者に提示する。運転免許証は、旅行者の氏名、写真、年齢、身長等の識別情報を含むことができる。旅行者はまた、旅行者の氏名、目的地、旅客会社等の旅行情報を含み得る、旅券を提示し得る。検閲者は、旅行者(および旅行者の環境内の他の人物)および旅行者のドキュメントをARDを通して視認し得る。ARDは、旅行者および旅行者のドキュメントをイメージングし、旅行者のドキュメントおよび旅行者(または旅行同伴者等の環境内の他者)間のリンケージを検出することができる。
例えば、ARDは、旅行者のパスポートをイメージングし、旅行者の写真を検出し、それとARD上の外向きに面したカメラによって取得される旅行者の画像を比較し、パスポート写真が旅行者のものであるかどうかを決定することができる。ARDは、旅行者の旅券をイメージングし、旅券上の氏名を決定し、それと旅行者のパスポート上の氏名を比較してもよい。ARDは、ドキュメント間またはドキュメントと旅行者との間に見出されるリンケージについての情報を示す、視覚的焦点インジケータを提供することができる。例えば、ARDは、パスポート写真の周囲および旅行者の周囲の境界と、旅行者と写真に示される人物との間の整合(例えば、パスポート上の写真に整合する旅行者の顔特性)の可能性を示す仮想グラフィックとを表示してもよい。検閲者は、ARDによって表示される仮想情報を使用して、旅行者にセキュリティを通過させる(写真と旅行者との間のリンケージに関する高度の整合の場合)、またはさらなるアクションを行うことができる(リンケージに関する低度の整合の場合)。
ARDは、加えて、または代替として、旅券上の情報が識別ドキュメント上の情報(例えば、氏名または住所)に整合することを検証することによって、旅行者が旅券が発行された同一人物であることを決定することができる。
有利には、ARDは、識別検証がヒト検閲者(ARDによるプログラム画像比較ではなく)によって行われることになる場合の繰り返されるタスク(例えば、識別検証タスクを多数の個人に対して繰り返す)における視覚的分析および判断の低下の問題を改善し、識別検証の正確度を増加させることができる。しかしながら、識別検証のためのARDの使用もまた、ARDが、例えば、顔を識別し、顔特徴を比較することによって、ヒト特性を認識および比較するためのヒト認識力を装備していない場合があるため、デバイスに一意の課題を提示し得る。さらに、ARDは、ARDが、検証される必要がある人物またはドキュメントを識別不能である場合があるため、識別検証プロセスの間、検索対象を把握しない場合がある。これらの課題に対処するために、ARDは、そのイメージングシステムを使用して、ドキュメントおよびドキュメントを提示する人物の画像を取得してもよい。ARDは、ドキュメント上の情報(例えば、ドキュメントが発行された人物の顔の画像)を識別し、人物の関連特徴(例えば、顔または他の身体特徴)を識別することができる。ARDは、ドキュメントからの情報と人物の特徴を比較し、信頼度レベルを計算することができる。信頼度レベルが、閾値より高いとき、ARDは、ドキュメントを提示する人物が、実際に、ドキュメントによって記述される人物であることを決定し得る。ARDはまた、ドキュメントに関する他の識別情報(例えば、年齢、身長、性別)を抽出し、抽出された情報と人物から推定される対応する特性を比較してもよい。ARDは、整合(または非整合)を示す注釈をARDの装着者に提示してもよい。例えば、運転免許証上の画像は、強調され、人物の顔にリンクされ、整合または非整合を示すことができる。ARDによる識別検証に関連する付加的詳細は、図12A-15を参照してさらに説明される。
ユーザの環境内の物理的オブジェクトとの向上されたユーザ体験を提供する別の実施例として、ARDは、ユーザの環境内の物理的オブジェクトのリンケージを識別することができる。前の段落における実施例を継続すると、旅行者は、複数のドキュメントを検閲者に提示し得る。例えば、航空機の乗客は、運転免許証(またはパスポート)および航空機旅券を提示し得る。ARDは、ドキュメントの画像を取得することによって、そのような複数のドキュメントのリンケージを分析することができる。ARDは、1つのドキュメントから抽出される情報と別のドキュメントから抽出される情報を比較し、2つのドキュメント内の情報が一貫するかどうかを決定することができる。例えば、ARDは、氏名を運転免許証から抽出し、それと航空機旅券から抽出される氏名を比較し、航空機旅券および運転免許証が同一人物に発行された可能性が高いかどうかを決定することができる。上記に説明されるように、ARDは、運転免許証からの画像と人物の画像の顔整合を識別し、人物、運転免許証、および航空機旅券が、相互に関連付けられることを決定することができる。いくつかの実施形態では、ARDは、情報をドキュメント(例えば、バーコード)のうちの1つから抽出し、付加的情報を別のデータソースから読み出してもよい。ARDは、読み出された情報とドキュメントの画像から抽出された情報を比較することができる。2つのドキュメント間の情報が、一貫しない場合、ARDは、ドキュメントのいずれかまたは両方が偽造されていることを決定し得る。いくつかの実施形態では、2つのドキュメント間の情報が一貫しないと考えられるとき、ARDは、付加的分析を行う、またはARDのユーザに情報を手動で検証することを要求してもよい。他方では、ARDが、両ドキュメント内の情報が一貫することを決定する場合、ARDは、ドキュメントのいずれかが有効である、または両ドキュメントが有効であることを見出し得る。さらに、ドキュメントから抽出される識別情報と人物の画像から抽出される識別情報を整合させることによって、ARDは、人物が一方または両方のドキュメントを発行された可能性が高いかどうかを決定することができる。
実施例は、ARDを参照して説明されるが、本開示におけるシステムおよび方法は、ARDによって実装されることを要求されない。例えば、識別およびドキュメント検証のためのシステムおよび方法は、ロボットシステム、セキュリティシステム(例えば、交通結節点における)、または他のコンピューティングシステム(自動旅行チェックイン機械等)の一部であってもよい。さらに、本明細書に説明される1つ以上の特徴およびプロセスは、ARD自体によって実施されることを要求されない。例えば、情報を画像から抽出するプロセスは、別のコンピューティングデバイス(例えば、遠隔サーバ)によって実施されてもよい。
また、本明細書に説明されるデバイスおよび技法は、旅行結節点におけるセキュリティの例証的コンテキストに限定されず、情報をドキュメントから抽出し、ドキュメントまたは人物間で比較を行い、デバイスの環境内の人物を識別し、セキュリティを向上させること等が望ましい、任意のコンテキストにおいて適用されることができる。例えば、遊園地またはエンターテインメント施設における改札係が、本明細書に説明される技法およびデバイスの実施形態を使用して、客が園内または施設に入場することを許可(または入場を拒否)し得る。同様に、防犯施設(例えば、私的実験室または倉庫、オフィス建物、刑務所等)における警備員または警察官が、ARDを使用して、人物および識別ドキュメントをイメージングし得る。さらに他の用途では、いくつかのドキュメントをARDを通して視認する人物(例えば、請求書、領収証、および総勘定元帳を視認している会計士)は、ARDの能力を使用して、視認されているドキュメント上に存在し得る情報を識別または強調し(例えば、会計士のARDは、会計士が領収証と請求書をより容易に照合し得るように、特定の人物の氏名または費用を含む、ドキュメントを強調すること等ができる)、タスクを捗らせることができる。
(ウェアラブルシステムの3Dディスプレイの実施例)
ウェアラブルシステム(本明細書では、拡張現実(AR)システムとも称される)は、2Dまたは3D仮想画像をユーザに提示するために構成されることができる。画像は、組み合わせまたは同等物における、静止画像、ビデオのフレーム、またはビデオであってもよい。ウェアラブルシステムは、ユーザ相互作用のために、単独で、または組み合わせて、VR、AR、またはMR環境を提示し得る、ウェアラブルデバイスを含むことができる。ウェアラブルデバイスは、頭部搭載型デバイス(HMD)であることができ、これは、ARデバイス(ARD)と同義的に使用される。さらに、本開示の目的のために、用語「AR」は、用語「MR」と同義的に使用される。
図1は、人物によって視認される、ある仮想現実オブジェクトおよびある物理的オブジェクトを伴う、複合現実シナリオの例証を描写する。図1では、MR場面100が、描写され、MR技術のユーザには、人々、木々、背景内の建物、およびコンクリートプラットフォーム120を特徴とする、実世界公園状設定110が見える。これらのアイテムに加え、MR技術のユーザはまた、実世界プラットフォーム120上に立っているロボット像130と、マルハナバチの擬人化のように見える、飛んでいる漫画のようなアバタキャラクタ140とが「見える」と知覚するが、これらの要素は、実世界には存在しない。
3Dディスプレイが、真の深度感覚、より具体的には、表面深度のシミュレートされた感覚を生成するために、ディスプレイの視野内の各点に対し、その仮想深度に対応する遠近調節応答を生成することが望ましくあり得る。ディスプレイ点に対する遠近調節応答が、収束および立体視の両眼深度キューによって決定されるようなその点の仮想深度に対応しない場合、ヒトの眼は、遠近調節衝突を体験し、不安定なイメージング、有害な眼精疲労、頭痛、および遠近調節情報の不在下では、表面深度のほぼ完全な欠如をもたらし得る。
VR、AR、およびMR体験は、複数の深度平面に対応する画像が視認者に提供されるディスプレイを有する、ディスプレイシステムによって提供されることができる。画像は、各深度平面に対して異なってもよく(例えば、場面またはオブジェクトの若干異なる提示を提供する)、視認者の眼によって別個に集束され、それによって、異なる深度平面上に位置する場面に関する異なる画像特徴に合焦させるために要求される眼の遠近調節に基づいて、または合焦からずれている異なる深度平面上の異なる画像特徴を観察することに基づいて、ユーザに深度キューを提供することに役立ち得る。本明細書のいずれかに議論されるように、そのような深度キューは、信用できる深度の知覚を提供する。
図2は、ウェアラブルシステム200の実施例を図示する。ウェアラブルシステム200は、ディスプレイ220と、ディスプレイ220の機能をサポートするための種々の機械的および電子的モジュールおよびシステムとを含む。ディスプレイ220は、ユーザ、装着者、または視認者210によってウェアラブルである、フレーム230に結合されてもよい。ディスプレイ220は、ユーザ210の眼の正面に位置付けられることができる。ディスプレイ220は、AR/VR/MRコンテンツをユーザに提示するができる。ディスプレイ220は、ユーザの頭部上に装着される、頭部搭載型ディスプレイ(HMD)を備えることができる。いくつかの実施形態では、スピーカ240が、フレーム230に結合され、ユーザの外耳道に隣接して位置付けられる(いくつかの実施形態では、示されない別のスピーカが、ユーザの他方の外耳道に隣接して位置付けられ、ステレオ/成形可能サウンド制御を提供する)。ディスプレイ220は、音声認識を実施すべき環境からオーディオストリームを検出するために、オーディオセンサ232(例えば、マイクロホン)を含むことができる。
ウェアラブルシステム200は、ユーザの周囲の環境内の世界を観察する、外向きに面したイメージングシステム464(図4に示される)を含むことができる。ウェアラブルシステム200はまた、ユーザの眼移動を追跡することができる、内向きに面したイメージングシステム462(図4に示される)を含むことができる。内向きに面したイメージングシステムは、一方の眼の移動または両方の眼の移動のいずれかを追跡することができる。内向きに面したイメージングシステム462は、フレーム230に取り付けられてもよく、内向きに面したイメージングシステムによって取得された画像情報を処理し、例えば、ユーザ210の眼、眼の移動、または眼姿勢の瞳孔直径または配向を決定し得る、処理モジュール260または270と電気通信してもよい。
実施例として、ウェアラブルシステム200は、外向きに面したイメージングシステム464または内向きに面したイメージングシステム462を使用して、ユーザの姿勢の画像を取得することができる。画像は、静止画像、ビデオのフレームまたはビデオ、その組み合わせ、または同等物であってもよい。
ディスプレイ220は、有線導線または無線接続等によって、フレーム230に固定して取り付けられる、ユーザによって装着されるヘルメットまたは帽子に固定して取り付けられる、ヘッドホンに内蔵される、または別様にユーザ210に(例えば、バックパック式構成において、ベルト結合式構成において)可撤式に取り付けられる等、種々の構成において搭載され得る、ローカルデータ処理モジュール260に動作可能に結合されることができる(250)。
ローカル処理およびデータモジュール260は、ハードウェアプロセッサおよび不揮発性メモリ(例えば、フラッシュメモリ)等のデジタルメモリを備えてもよく、その両方とも、データの処理、キャッシング、および記憶を補助するために利用され得る。データは、a)画像捕捉デバイス(例えば、内向きに面したイメージングシステムまたは外向きに面したイメージングシステム内のカメラ)、オーディオセンサ232(例えば、マイクロホン)、慣性測定ユニット(IMU)、加速度計、コンパス、全地球測位システム(GPS)ユニット、無線デバイス、またはジャイロスコープ等の(例えば、フレーム230に動作可能に結合される、または別様にユーザ210に取り付けられ得る)センサから捕捉されるデータ、または、b)場合によっては処理または読出後にディスプレイ220への伝達のために、遠隔処理モジュール270または遠隔データリポジトリ280を使用して取得または処理されるデータを含んでもよい。ローカル処理およびデータモジュール260は、これらの遠隔モジュールがローカル処理およびデータモジュール260へのリソースとして利用可能であるように、有線通信リンクまたは無線通信リンクを介して等、通信リンク262または264によって遠隔処理モジュール270または遠隔データリポジトリ280に動作可能に結合されてもよい。加えて、遠隔処理モジュール280および遠隔データリポジトリ280は、相互に動作可能に結合されてもよい。
いくつかの実施形態では、遠隔処理モジュール270は、データまたは画像情報を分析および処理するように構成される、1つ以上のプロセッサを備えてもよい。いくつかの実施形態では、遠隔データリポジトリ280は、デジタルデータ記憶設備を備え得、これは、「クラウド」リソース構成におけるインターネットまたは他のネットワーキング構成を通して利用可能であってもよい。いくつかの実施形態では、全てのデータが、記憶され、全ての算出が、ローカル処理およびデータモジュールにおいて実施され、遠隔モジュールからの完全に自律的な使用を可能にする。
ヒト視覚系は、複雑であって、深度の現実的知覚を提供することは、困難である。理論によって限定されるわけではないが、オブジェクトの視認者は、輻輳・開散運動(vergence)および遠近調節(accommodation)の組み合わせに起因して、オブジェクトを3次元として知覚し得ると考えられる。相互に対する2つの眼の輻輳・開散運動(すなわち、眼の視線を収束させ、オブジェクト上に固定させるための相互に向かって、またはそこから離れるような瞳孔の転動運動)は、眼の水晶体の集束(または「遠近調節」)と密接に関連付けられる。通常条件下では、眼の水晶体の焦点を変更する、または眼を遠近調節し、1つのオブジェクトから異なる距離における別のオブジェクトに焦点を変更することは、「遠近調節-輻輳・開散運動反射」として知られる関係下、自動的に、輻輳・開散運動における合致する変化を同一距離に生じさせるであろう。同様に、輻輳・開散運動における変化は、通常条件下、遠近調節における合致する変化を誘起するであろう。遠近調節と輻輳・開散運動との間のより良好な合致を提供するディスプレイシステムは、3次元画像のより現実的かつ快適なシミュレーションを形成し得る。
図3は、複数の深度平面を使用して3次元画像をシミュレートするためのアプローチの側面を図示する。図3を参照すると、z-軸上の眼302および304からの種々の距離におけるオブジェクトは、それらのオブジェクトが合焦するように、眼302および304によって遠近調節される。眼302および304は、特定の遠近調節された状態をとり、オブジェクトをz-軸に沿った異なる距離に合焦させる。その結果、特定の遠近調節された状態は、特定の深度平面におけるオブジェクトまたはオブジェクトの一部が、眼がその深度平面に対して遠近調節された状態にあるとき、合焦するように、関連付けられた焦点距離を有する、深度平面306のうちの特定の1つと関連付けられると言え得る。いくつかの実施形態では、3次元画像は、眼302および304の各々に対し、画像の異なる提示を提供することによって、また、深度平面のそれぞれに対応する画像の異なる提示を提供することによって、シミュレートされてもよい。例証を明確にするために、別個であるように示されるが、眼302および304の視野は、例えば、z-軸に沿った距離が増加するにつれて、重複し得ることを理解されたい。加えて、例証を容易にするために、平坦であるように示されるが、深度平面の等高線は、深度平面内の全ての特徴が特定の遠近調節された状態における眼と合焦するように、物理的空間内で湾曲され得ることを理解されたい。理論によって限定されるわけではないが、ヒトの眼は、有限数の深度平面を解釈し、典型的には、深度知覚を提供することができると考えられる。その結果、知覚された深度の高度に真実味のあるシミュレーションが、眼にこれらの限定数の深度平面のそれぞれに対応する画像の異なる提示を提供することによって達成され得る。
(導波管スタックアセンブリ)
図4は、画像情報をユーザに出力するための導波管スタックの実施例を図示する。ウェアラブルシステム400は、複数の導波管432b、434b、436b、438b、4400bを使用して、3次元知覚を眼/脳に提供するために利用され得る、導波管のスタックまたはスタックされた導波管アセンブリ480を含む。いくつかの実施形態では、ウェアラブルシステム400は、図2のウェアラブルシステム200に対応してもよく、図4は、ウェアラブルシステム200のいくつかの部分をより詳細に概略的に示す。例えば、いくつかの実施形態では、導波管アセンブリ480は、図2のディスプレイ220の中に統合されてもよい。
図4を継続して参照すると、導波管アセンブリ480はまた、複数の特徴458、456、454、452を導波管間に含んでもよい。いくつかの実施形態では、特徴458、456、454、452は、レンズであってもよい。他の実施形態では、特徴458、456、454、452は、レンズではなくてもよい。むしろ、それらは、単に、スペーサであってもよい(例えば、空気間隙を形成するためのクラッディング層または構造)。
導波管432b、434b、436b、438b、440bまたは複数のレンズ458、456、454、452は、種々のレベルの波面曲率または光線発散を用いて、画像情報を眼に送信するように構成されてもよい。各導波管レベルは、特定の深度平面と関連付けられてもよく、その深度平面に対応する画像情報を出力するように構成されてもよい。画像投入デバイス420、422、424、426、428は、そのそれぞれが、眼410に向かって出力のために各個別の導波管を横断して入射光を分散させるように構成され得る、導波管440b、438b、436b、434b、432bの中に画像情報を投入するために利用されてもよい。光は、画像投入デバイス420、422、424、426、428の出力表面から出射し、導波管440b、438b、436b、434b、432bの対応する入力縁の中に投入される。いくつかの実施形態では、光の単一ビーム(例えば、コリメートされたビーム)が、各導波管の中に投入され、特定の導波管と関連付けられた深度平面に対応する特定の角度(および発散量)において眼410に向かって指向される、クローン化されたコリメートビームの場全体を出力してもよい。
いくつかの実施形態では、画像投入デバイス420、422、424、426、428は、それぞれ、それぞれが対応する導波管440b、438b、436b、434b、432bの中への投入のために画像情報を生成する、離散ディスプレイである。いくつかの他の実施形態では、画像投入デバイス420、422、424、426、428は、例えば、画像情報を1つ以上の光学導管(光ファイバケーブル等)を介して画像投入デバイス420、422、424、426、428のそれぞれに送り得る、単一の多重化されたディスプレイの出力端である。
コントローラ460が、スタックされた導波管アセンブリ480および画像投入デバイス420、422、424、426、428の動作を制御する。コントローラ460は、導波管440b、438b、436b、434b、432bへの画像情報のタイミングおよび提供を調整する、プログラミング(例えば、非一過性コンピュータ可読媒体内の命令)を含む。いくつかの実施形態では、コントローラ460は、単一の一体型デバイスであってもよいか、または、有線通信チャネルまたは無線通信チャネルによって接続される分散型システムであってもよい。コントローラ460は、いくつかの実施形態では、処理モジュール260または270(図2に図示される)の一部であってもよい。
導波管440b、438b、436b、434b、432bは、全内部反射(TIR)によって各個別の導波管内で光を伝搬するように構成されてもよい。導波管440b、438b、436b、434b、432bはそれぞれ、主要上部表面および主要底部表面およびそれらの主要上部表面と主要底部表面との間に延在する縁を伴う平面状であるかまたは別の形状(例えば、湾曲)を有してもよい。図示される構成では、導波管440b、438b、436b、434b、432bはそれぞれ、光を再指向させ、各個別の導波管内で伝搬させ、導波管から、画像情報を眼410に出力することによって、光を導波管から抽出するように構成される、光抽出光学要素440a、438a、436a、434a、432aを含んでもよい。抽出された光はまた、外部結合光と称され得、光抽出光学要素はまた、外部結合光学要素と称され得る。抽出された光のビームは、導波管によって、導波管内を伝搬する光が光再指向要素に衝打する場所に出力される。光抽出光学要素(440a、438a、436a、434a、432a)は、例えば、反射または回折光学特徴であってもよい。説明の容易性および図面の明確性のために、導波管440b、438b、436b、434b、432bの底部主要表面に配置されて図示されるが、いくつかの実施形態では、光抽出光学要素440a、438a、436a、434a、432aは、上部主要表面または底部主要表面に配置されてもよい、または導波管440b、438b、436b、434b、432bの容積内に直接配置されてもよい。いくつかの実施形態では、光抽出光学要素440a、438a、436a、434a、432aは、透明基板に取り付けられ、導波管440b、438b、436b、434b、432bを形成する、材料の層内に形成されてもよい。いくつかの他の実施形態では、導波管440b、438b、436b、434b、432bは、材料のモノリシック部品であってもよく、光抽出光学要素440a、438a、436a、434a、432aは、材料のその部品の表面上および/またはその内部に形成されてもよい。
図4を継続して参照すると、本明細書に議論されるように、各導波管440b、438b、436b、434b、432bは、光を出力し、特定の深度平面に対応する画像を形成するように構成される。例えば、眼の最近傍の導波管432bは、そのような導波管432bの中に投入されるにつれて、コリメートされた光を眼410に送達するように構成されてもよい。コリメートされた光は、光学無限遠焦点面を表し得る。次の導波管434bは、眼410に到達し得る前に、第1のレンズ452(例えば、負のレンズ)を通して通過する、コリメートされた光を送出するように構成されてもよい。第1のレンズ452は、眼/脳が、その次の上方の導波管434bから生じる光を光学無限遠から眼410に向かって内向きにより近い第1の焦点面から生じるように解釈するように、若干の凸面波面曲率を生成するように構成されてもよい。同様に、第3の上方の導波管436bは、眼410に到達する前に、その出力光を第1のレンズ452および第2のレンズ454の両方を通して通過させる。第1および第2のレンズ452および454の組み合わせられた屈折力は、眼/脳が、第3の導波管436bから生じる光が次の上方の導波管434bからの光であったよりも光学無限遠から人物に向かって内向きにさらにより近い第2の焦点面から生じるように解釈するように、別の漸増量の波面曲率を生成するように構成されてもよい。
他の導波管層(例えば、導波管438b、440b)およびレンズ(例えば、レンズ456、458)も同様に構成され、スタック内の最高導波管440bを用いて、人物に最も近い焦点面を表す集約焦点力のために、その出力をそれと眼との間のレンズの全てを通して送出する。スタックされた導波管アセンブリ480の他側の世界470から生じる光を視認/解釈するとき、レンズ458、456、454、452のスタックを補償するために、補償レンズ層430が、スタックの上部に配置され、下方のレンズスタック458、456、454、452の集約力を補償してもよい。そのような構成は、利用可能な導波管/レンズ対と同じ数の知覚される焦点面を提供する。導波管の光抽出光学要素およびレンズの集束側面は両方とも、静的であってもよい(例えば、動的または電気活性ではない)。いくつかの代替実施形態では、一方または両方とも、電気活性特徴を使用して動的であってもよい。
図4を継続して参照すると、光抽出光学要素440a、438a、436a、434a、432aは、光をその個別の導波管から再指向し、かつ導波管と関連付けられた特定の深度平面のための適切な発散またはコリメーションの量を用いて本光を出力するように構成されてもよい。その結果、異なる関連付けられた深度平面を有する導波管は、関連付けられた深度平面に応じて、異なる量の発散を伴う光を出力する、異なる構成の光抽出光学要素を有してもよい。いくつかの実施形態では、本明細書に議論されるように、光抽出光学要素440a、438a、436a、434a、432aは、具体的角度で光を出力するように構成され得る、立体特徴または表面特徴であってもよい。例えば、光抽出光学要素440a、438a、436a、434a、432aは、体積ホログラム、表面ホログラム、および/または回折格子であってもよい。回折格子等の光抽出光学要素は、2015年6月25日に公開された米国特許公開第2015/0178939号(参照することによってその全体として本明細書に組み込まれる)に説明される。
いくつかの実施形態では、光抽出光学要素440a、438a、436a、434a、432aは、回折パターンを形成する回折特徴、すなわち、「回折光学要素」(本明細書では、「DOE」とも称される)である。好ましくは、DOEは、ビームの光の一部のみが、DOEの各交差点で眼410に向かって偏向される一方、残りが、全内部反射を介して、導波管を通して移動し続けるように、比較的に低い回折効率を有する。画像情報を搬送する光は、したがって、複数の場所において導波管から出射する、いくつかの関連出射ビームに分割され、その結果は、導波管内でバウンスする本特定のコリメートされたビームに関して、眼304に向かう非常に均一なパターンの出射放出となることができる。
いくつかの実施形態では、1つ以上のDOEは、能動的に回折する「オン」状態と有意に回折しない「オフ」状態との間で切替可能であってもよい。例えば、切替可能なDOEは、ポリマー分散液晶の層を備えてもよく、その中で微小液滴は、ホスト媒体中に回折パターンを備え、微小液滴の屈折率は、ホスト材料の屈折率に実質的に整合するように切り替えられることができる(その場合、パターンは、入射光を著しく回折させない)、または微小液滴は、ホスト媒体のものに整合しない屈折率に切り替えられることができる(その場合、パターンは、入射光を能動的に回折させる)。
いくつかの実施形態では、深度平面または被写界深度の数および分布は、視認者の眼の瞳孔サイズまたは配向に基づいて、動的に変動されてもよい。被写界深度は、視認者の瞳孔サイズと反比例して変化してもよい。その結果、視認者の眼の瞳孔のサイズが減少するにつれて、被写界深度は、その平面の場所が眼の焦点深度を越えるため判別不能である1つの平面が、判別可能となり、瞳孔サイズの低減および被写界深度の相当する増加に伴って、より合焦して現れ得るように増加する。同様に、異なる画像を視認者に提示するために使用される、離間される深度平面の数は、減少された瞳孔サイズに伴って減少されてもよい。例えば、視認者は、一方の深度平面から他方の深度平面への眼の遠近調節を調節せずに、第1の深度平面および第2の深度平面の両方の詳細を1つの瞳孔サイズにおいて明確に知覚することが可能ではない場合がある。しかしながら、これらの2つの深度平面は、同時に、遠近調節を変化させずに、別の瞳孔サイズにおいてユーザに合焦するには十分であり得る。
いくつかの実施形態では、ディスプレイシステムは、瞳孔サイズおよび/または配向の決定に基づいて、または特定の瞳孔サイズ/または配向を示す電気信号の受信に応じて、画像情報を受信する導波管の数を変動させてもよい。例えば、ユーザの眼が、2つの導波管と関連付けられた2つの深度平面間を区別不能である場合、コントローラ460(ローカル処理およびデータモジュール260であり得る)は、これらの導波管のうちの1つへの画像情報の提供を停止するように構成またはプログラムすることができる。有利には、これは、システムへの処理負担を低減させ、それによって、システムの応答性を増加させ得る。導波管のためのDOEがオンおよびオフ状態間で切替可能である実施形態では、DOEは、導波管が画像情報を受信するとき、オフ状態に切り替えられてもよい。
いくつかの実施形態では、出射ビームに視認者の眼の直径未満の直径を有するという条件を満たさせることが望ましくあり得る。しかしながら、本条件を満たすことは、視認者の瞳孔のサイズの変動性に照らして、困難であり得る。いくつかの実施形態では、本条件は、視認者の瞳孔のサイズの決定に応答して出射ビームのサイズを変動させることによって、広範囲の瞳孔サイズにわたって満たされる。例えば、瞳孔サイズが減少するにつれて、出射ビームのサイズもまた、減少し得る。いくつかの実施形態では、出射ビームサイズは、可変開口を使用して変動されてもよい。
ウェアラブルシステム400は、世界470の一部をイメージングする、外向きに面したイメージングシステム464(例えば、デジタルカメラ)を含むことができる。世界470の本部分は、世界カメラの視野(FOV)と称され得、イメージングシステム464は、時として、FOVカメラとも称される。視認者による視認またはイメージングのために利用可能な領域全体は、動眼視野(FOR)と称され得る。FORは、装着者が、その身体、頭部、または眼を移動させ、空間内の実質的に任意の方向を知覚するため、ウェアラブルシステム400を囲繞する4πステラジアンの立体角を含んでもよい。他のコンテキストでは、装着者の移動は、より抑制されてもよく、それに応じて、装着者のFORは、より小さい立体角に接し得る。外向きに面したイメージングシステム464から得られた画像は、ユーザによって行われるジェスチャ(例えば、手または指のジェスチャ)を追跡し、ユーザの正面における世界470内のオブジェクトを検出する等のために、使用されることができる。
ウェアラブルシステム400はまた、眼移動および顔移動等のユーザの移動を観察する、内向きに面したイメージングシステム466(例えば、デジタルカメラ)を含むことができる。内向きに面したイメージングシステム466は、眼410の画像を捕捉し、眼304の瞳孔のサイズまたは配向を決定するために使用されてもよい。内向きに面したイメージングシステム466は、ユーザが見ている方向(例えば、眼姿勢)を決定する際に使用するため、またはユーザのバイオメトリック識別のため(例えば、虹彩識別を介して)、画像を得るために使用されることができる。いくつかの実施形態では、少なくとも1つのカメラが、各眼に対し、独立して、各眼の瞳孔サイズまたは眼姿勢を別個に決定し、それによって、各眼への画像情報の提示がその眼に対して動的に調整されることを可能にするために利用されてもよい。いくつかの他の実施形態では、単一眼410のみの瞳孔直径または配向(例えば、対の眼あたり単一カメラのみを使用して)が、決定され、ユーザの両眼に関して類似すると仮定される。内向きに面したイメージングシステム466によって得られる画像は、ユーザに提示されるべきオーディオまたは視覚的コンテンツを決定するためにウェアラブルシステム400によって使用され得る、ユーザの眼姿勢または気分を決定するために分析されてもよい。ウェアラブルシステム400はまた、IMU、加速度計、ジャイロスコープ等のセンサを使用して、頭部姿勢(例えば、頭部位置または頭部配向)を決定してもよい。
ウェアラブルシステム400は、ユーザが、コマンドをコントローラ460に入力し、ウェアラブルシステム400と相互作用し得る、ユーザ入力デバイス466を含むことができる。例えば、ユーザ入力デバイス466は、トラックパッド、タッチスクリーン、ジョイスティック、多自由度(DOF)コントローラ、容量感知デバイス、ゲームコントローラ、キーボード、マウス、指向性パッド(Dパッド)、ワンド、触知デバイス、トーテム(例えば、仮想ユーザ入力デバイスとして機能する)等を含むことができる。マルチDOFコントローラは、コントローラの一部または全部の可能性として考えられる平行移動(例えば、左/右、前方/後方、または上/下)または回転(例えば、ヨー、ピッチ、またはロール)におけるユーザ入力を感知することができる。平行移動をサポートする、マルチDOFコントローラは、3DOFと称され得る一方、平行移動および回転をサポートする、マルチDOFコントローラは、6DOFと称され得る。ある場合には、ユーザは、指(例えば、親指)を使用して、タッチセンサ式入力デバイスを押下またはその上でスワイプし、入力をウェアラブルシステム400に提供してもよい(例えば、ユーザ入力をウェアラブルシステム400によって提供されるユーザインターフェースに提供するために)。ユーザ入力デバイス466は、ウェアラブルシステム400の使用の間、ユーザの手によって保持されてもよい。ユーザ入力デバイス466は、ウェアラブルシステム400と有線または無線で通信することができる。
図5は、導波管によって出力された出射ビームの実施例を示す。1つの導波管が図示されるが、導波管アセンブリ480内の他の導波管も同様に機能してもよく、導波管アセンブリ480は、複数の導波管を含むことを理解されたい。光520が、導波管432bの入力縁432cにおいて導波管432bの中に投入され、TIRによって導波管432b内を伝搬する。光520がDOE432aに衝突する点では、光の一部は、出射ビーム510として導波管から出射する。出射ビーム510は、略平行として図示されるが、それらはまた、導波管432bと関連付けられた深度平面に応じて、ある角度で眼410に伝搬するように再指向されてもよい(例えば、発散出射ビームを形成する)。略平行出射ビームは、眼410から遠距離(例えば、光学無限遠)における深度平面に設定されるように現れる画像を形成するように光を外部結合する、光抽出光学要素を伴う導波管を示し得ることを理解されたい。他の導波管または他の光抽出光学要素のセットは、より発散する出射ビームパターンを出力してもよく、これは、眼410がより近い距離に遠近調節し、網膜に合焦させることを要求し、光学無限遠より眼410に近い距離からの光として脳によって解釈されるであろう。
図6は、導波管装置と、光を導波管装置へまたはそこから光学的に結合するための光学結合器サブシステムと、多焦点立体ディスプレイ、画像、またはライトフィールドの生成において使用される制御サブシステムとを含む、光学システムを示す、概略図である。光学システムは、導波管装置と、光を導波管装置にまたはそこから光学的に結合するための光学結合器サブシステムと、制御サブシステムとを含むことができる。光学システムは、多焦点立体、画像、またはライトフィールドを生成するために使用されることができる。光学システムは、1つ以上の一次平面導波管632a(1つのみのが図6に示される)と、一次導波管632aの少なくともいくつかのそれぞれと関連付けられた1つ以上のDOE632bとを含むことができる。平面導波管632bは、図4を参照して議論される導波管432b、434b、436b、438b、440bに類似することができる。光学システムは、分散導波管装置を採用し、光を第1の軸(図6の図では、垂直またはY-軸)に沿って中継し、第1の軸(例えば、Y-軸)に沿って光の有効射出瞳を拡張させてもよい。分散導波管装置は、例えば、分散平面導波管622bと、分散平面導波管622bと関連付けられた少なくとも1つのDOE622a(二重破線によって図示される)とを含んでもよい。分散平面導波管622bは、少なくともいくつかの点において、それと異なる配向を有する一次平面導波管632bと類似または同じであってもよい。同様に、少なくとも1つのDOE622aは、少なくともいくつかの点において、DOE632aと類似または同じであってもよい。例えば、分散平面導波管622bまたはDOE622aは、それぞれ、一次平面導波管632bまたはDOE632aと同一材料から成ってもよい。図6に示される光学ディスプレイシステム600の実施形態は、図2に示されるウェアラブルシステム200の中に統合されることができる。
中継され、射出瞳が拡張された光は、分散導波管装置から1つ以上の一次平面導波管632bの中に光学的に結合され得る。一次平面導波管632bは、好ましくは、第1の軸に直交する、第2の軸(例えば、図6の図では、水平またはX-軸)に沿って、光を中継することができる。着目すべきこととして、第2の軸は、第1の軸に対して非直交軸であることができる。一次平面導波管632bは、その第2の軸(例えば、X-軸)に沿って、光の有効射出瞳を拡張させる。例えば、分散平面導波管622bは、光を垂直またはY-軸に沿って中継および拡張させ、光を水平またはX-軸に沿って中継および拡張させ得る、一次平面導波管632bにその光を通過させることができる。
光学システムは、単一モード光ファイバ640の近位端の中に光学的に結合され得る、1つ以上の有色光源(例えば、赤色、緑色、および青色レーザ光)610を含んでもよい。光ファイバ640の遠位端は、圧電材料の中空管642を通して螺合または受容されてもよい。遠位端は、固定されない可撓性カンチレバー644として、管642から突出する。圧電管642は、4つの象限電極(図示せず)と関連付けられることができる。電極は、例えば、管642の外側、外側表面または外側周縁、または直径に鍍着されてもよい。コア電極(図示せず)もまた、管642のコア、中心、内側周縁、または内径に位置してもよい。
例えば、ワイヤ660を介して電気的に結合される、駆動電子機器650は、対向する対の電極を駆動し、圧電管642を独立して2つの軸において屈曲させる。光ファイバ644の突出する遠位先端は、機械的共振モードを有する。共振の周波数は、光ファイバ644の直径、長さ、および材料性質に依存し得る。圧電管642をファイバカンチレバー644の第1の機械的共振モードの近傍で振動させることによって、ファイバカンチレバー644は、振動させられ、大偏向を通して掃引し得る。
2つの軸において共振振動を刺激することによって、ファイバカンチレバー644の先端は、2次元(2-D)走査を充填する面積内において2軸方向に走査される。光源610の強度をファイバカンチレバー644の走査と同期して変調させることによって、ファイバカンチレバー644から発せられる光は、画像を形成することができる。そのような設定の説明は、米国特許公開第2014/0003762号(参照することによってその全体として本明細書に組み込まれる)に提供されている。
光学結合器サブシステムのコンポーネントは、走査ファイバカンチレバー644から発せられる光をコリメートすることができる。コリメートされた光は、鏡付き表面648によって、少なくとも1つの回折光学要素(DOE)622aを含有する、狭分散平面導波管622bの中に反射されることができる。コリメートされた光は、TIRによって分散平面導波管622bに沿って(図6の図に対して)垂直に伝搬し、そうすることによって、DOE622aと繰り返し交差することができる。DOE622aは、好ましくは、低回折効率を有する。これは、光の一部(例えば、10%)をDOE622aとの交差点の各点においてより大きい一次平面導波管632bの縁に向かって回折させ、光の一部をTIRを介して分散平面導波管622bの長さを辿ってそのオリジナル軌道上で継続させることができる。
DOE622aとの交差点の各点において、付加的光が、一次導波管632bの入口に向かって回折されることができる。入射光を複数の外部結合セットに分割することによって、光の射出瞳は、分散平面導波管622b内のDOE622aによって垂直に拡張されることができる。分散平面導波管622bから外部結合された本垂直に拡張された光は、一次平面導波管632bの縁に進入することができる。
一次導波管632bに進入する光は、TIRを介して、一次導波管632bに沿って(図6の図に対して)水平に伝搬することができる。光は、複数の点においてDOE632aと交差すると、TIRを介して、一次導波管632bの長さの少なくとも一部に沿って水平に伝搬する。DOE632aは、有利には、線形回折パターンおよび半径方向対称回折パターンの総和である、位相プロファイルを有し、光の偏向および集束の両方を生成するように設計または構成され得る。DOE632aは、有利には、ビームの光の一部のみが、DOE632aの各交差点において視認者の眼に向かって偏向される一方、光の残りが、TIRを介して、一次導波管632bを通して伝搬し続けるように、低回折効率(例えば、10%)を有し得る。
伝搬する光とDOE632aとの間の交差点の各点において、光の一部は、一次導波管632bの隣接面に向かって回折され、光がTIRから逃散し、一次導波管632bの面から発せられることを可能にする。いくつかの実施形態では、DOE632aの半径方向対称回折パターンは、加えて、ある焦点レベルを回折された光に付与し、個々のビームの光波面を成形(例えば、曲率を付与する)することと、ビームを設計される焦点レベルに合致する角度に操向することとの両方を行う。
故に、これらの異なる経路は、異なる角度におけるDOE632aの多重度、焦点レベル、または射出瞳において異なる充填パターンをもたらすことによって、光を一次平面導波管632bの外部で結合させることができる。射出瞳における異なる充填パターンは、有利には、複数の深度平面を伴うライトフィールドディスプレイを生成するために使用されることができる。導波管アセンブリ内の各層またはスタック内の層のセット(例えば、3層)が、個別の色(例えば、赤色、青色、緑色)を生成するために採用されてもよい。したがって、例えば、第1の3つの隣接する層のセットが、それぞれ、赤色光、青色光および緑色光を第1の焦点深度において生成するために採用されてもよい。第2の3つの隣接する層のセットが、それぞれ、赤色光、青色光、および緑色光を第2の焦点深度において生成するために採用されてもよい。複数のセットが、種々の焦点深度を伴うフル3Dまたは4Dカラー画像ライトフィールドを生成するために採用されてもよい。
(ウェアラブルシステムの他のコンポーネント)
多くの実装では、ウェアラブルシステムは、上記に説明されるウェアラブルシステムのコンポーネントに加えて、またはその代替として、他のコンポーネントを含んでもよい。ウェアラブルシステムは、例えば、1つ以上の触知デバイスまたはコンポーネントを含んでもよい。触知デバイスまたはコンポーネントは、触覚をユーザに提供するように動作可能であってもよい。例えば、触知デバイスまたはコンポーネントは、仮想コンテンツ(例えば、仮想オブジェクト、仮想ツール、他の仮想構造)に触れると、圧力および/またはテクスチャの感覚を提供してもよい。触覚は、仮想オブジェクトが表す物理的オブジェクトの感覚を再現してもよい、または仮想コンテンツが表す想像上のオブジェクトまたはキャラクタ(例えば、ドラゴン)の感覚を再現してもよい。いくつかの実装では、触知デバイスまたはコンポーネントは、ユーザによって装着されてもよい(例えば、ユーザウェアラブルグローブ)。いくつかの実装では、触知デバイスまたはコンポーネントは、ユーザによって保持されてもよい。
ウェアラブルシステムは、例えば、ユーザによって操作可能であって、ウェアラブルシステムへの入力またはそれとの相互作用を可能にする、1つ以上の物理的オブジェクトを含んでもよい。これらの物理的オブジェクトは、本明細書では、トーテムと称され得る。いくつかのトーテムは、例えば、金属またはプラスチック片、壁、テーブルの表面等、無生物オブジェクトの形態をとってもよい。ある実装では、トーテムは、実際には、任意の物理的入力構造(例えば、キー、トリガ、ジョイスティック、トラックボール、ロッカスイッチ)を有していなくてもよい。代わりに、トーテムは、単に、物理的表面を提供してもよく、ウェアラブルシステムは、ユーザにトーテムの1つ以上の表面上にあるように見えるように、ユーザインターフェースをレンダリングしてもよい。例えば、ウェアラブルシステムは、トーテムの1つ以上の表面上に常駐するように見えるように、コンピュータキーボードおよびトラックパッドの画像をレンダリングしてもよい。例えば、ウェアラブルシステムは、トーテムとしての役割を果たす、アルミニウムの薄い長方形プレートの表面上に見えるように、仮想コンピュータキーボードおよび仮想トラックパッドをレンダリングしてもよい。長方形プレート自体は、任意の物理的キーまたはトラックパッドまたはセンサを有していない。しかしながら、ウェアラブルシステムは、仮想キーボードまたは仮想トラックパッドを介して行われた選択または入力として、長方形プレートを用いたユーザ操作または相互作用またはタッチを検出し得る。ユーザ入力デバイス466(図4に示される)は、トラックパッド、タッチパッド、トリガ、ジョイスティック、トラックボール、ロッカまたは仮想スイッチ、マウス、キーボード、多自由度コントローラ、または別の物理的入力デバイスを含み得る、トーテムの実施形態であってもよい。ユーザは、単独で、または姿勢と組み合わせて、トーテムを使用し、ウェアラブルシステムおよび/または他のユーザと相互作用してもよい。
本開示のウェアラブルデバイス、HMD、およびディスプレイシステムと使用可能な触知デバイスおよびトーテムの実施例は、米国特許公開第2015/0016777号(参照することによってその全体として本明細書に組み込まれる)に説明されている。
(例示的ウェアラブルシステム、環境、およびインターフェース)
ウェアラブルシステムは、高被写界深度をレンダリングされたライトフィールド内で達成するために、種々のマッピング関連技法を採用してもよい。仮想世界をマッピングする際、実世界内の全ての特徴および点を把握し、仮想オブジェクトを実世界に関連して正確に描くことが有利である。この目的を達成するために、ウェアラブルシステムのユーザから捕捉されたFOV画像が、実世界の種々の点および特徴についての情報を伝達する新しい写真を含むことによって、世界モデルに追加されることができる。例えば、ウェアラブルシステムは、マップ点(2D点または3D点等)のセットを収集し、新しいマップ点を見出し、世界モデルのより正確なバージョンをレンダリングすることができる。第1のユーザの世界モデルは、第2のユーザが第1のユーザを囲繞する世界を体験し得るように、(例えば、クラウドネットワーク等のネットワークを経由して)第2のユーザに通信されることができる。
図7は、MR環境700の実施例のブロック図である。MR環境700は、入力(例えば、ユーザのウェアラブルシステムからの視覚的入力702、室内カメラ等の定常入力704、種々のセンサからの感覚入力706、ユーザ入力デバイス466からのジェスチャ、トーテム、眼追跡、ユーザ入力等)を1人以上のユーザウェアラブルシステム(例えば、ウェアラブルシステム200またはディスプレイシステム220)または定常室内システム(例えば、室内カメラ等)から受信するように構成されてもよい。ウェアラブルシステムは、種々のセンサ(例えば、加速度計、ジャイロスコープ、温度センサ、移動センサ、深度センサ、GPSセンサ、内向きに面したイメージングシステム、外向きに面したイメージングシステム等)を使用して、ユーザの環境の場所および種々の他の属性を決定することができる。本情報はさらに、異なる視点からの画像または種々のキューを提供し得る、部屋内の定常カメラからの情報で補完されてもよい。カメラ(室内カメラまたは外向きに面したイメージングシステムのカメラ等)によって取得された画像データは、マッピング点のセットに低減されてもよい。
1つ以上のオブジェクト認識装置708が、受信されたデータ(例えば、点の集合)を通してクローリングし、点を認識またはマッピングし、画像をタグ付けし、マップデータベース710を用いて、意味論情報をオブジェクトに結び付けることができる。マップデータベース710は、経時的に収集された種々の点およびその対応するオブジェクトを備えてもよい。種々のデバイスおよびマップデータベースは、ネットワーク(例えば、LAN、WAN等)を通して相互に接続され、クラウドにアクセスすることができる。
本情報およびマップデータベース内の点集合に基づいて、オブジェクト認識装置708a-708nは、環境内のオブジェクトを認識してもよい。例えば、オブジェクト認識装置は、顔、人物、窓、壁、ユーザ入力デバイス、テレビ、ドキュメント(例えば、本明細書におけるセキュリティ実施例において説明されるような旅券、運転免許証、パスポート)、ユーザの環境内の他のオブジェクト等を認識することができる。1つ以上のオブジェクト認識装置が、ある特性を伴うオブジェクトのために特殊化されてもよい。例えば、オブジェクト認識装置708aは、顔を認識するために使用されてもよい一方、別のオブジェクト認識装置は、ドキュメントを認識するために使用されてもよい。
オブジェクト認識は、種々のコンピュータビジョン技法を使用して実施されてもよい。例えば、ウェアラブルシステムは、外向きに面したイメージングシステム464(図4に示される)によって入手された画像を分析し、場面再構成、イベント検出、ビデオ追跡、オブジェクト認識(例えば、人物またはドキュメント)、オブジェクト姿勢推定、顔認識(例えば、環境内の人物またはドキュメント上の画像から)、学習、インデックス化、運動推定、または画像分析(例えば、写真、署名、識別情報、旅行情報等のドキュメント内の印を識別する)等を実施することができる。1つ以上のコンピュータビジョンアルゴリズムが、これらのタスクを実施するために使用されてもよい。コンピュータビジョンアルゴリズムの非限定的実施例は、スケール不変特徴変換(SIFT)、スピードアップロバスト特徴(SURF)、配向FASTおよび回転BRIEF(ORB)、バイナリロバスト不変スケーラブルキーポイント(BRISK)、高速網膜キーポイント(FREAK)、Viola-Jonesアルゴリズム、Eigenfacesアプローチ、Lucas-Kanadeアルゴリズム、Horn-Schunkアルゴリズム、Mean-shiftアルゴリズム、視覚的同時位置推定およびマッピング(vSLAM)技法、シーケンシャルベイズ推定器(例えば、カルマンフィルタ、拡張カルマンフィルタ等)、バンドル調節、適応閾値化(および他の閾値化技法)、反復最近傍点(ICP)、セミグローバル整合(SGM)、セミグローバルブロック整合(SGBM)、特徴点ヒストグラム、種々の機械学習アルゴリズム(例えば、サポートベクトル機械、k最近傍アルゴリズム、単純ベイズ、ニューラルネットワーク等(畳み込みまたは深層ニューラルネットワークを含む)、または他の教師あり/教師なしモデル等)等を含む。
オブジェクト認識は、加えて、または代替として、種々の機械学習アルゴリズムによって実施されることができる。いったん訓練されると、機械学習アルゴリズムは、HMDによって記憶されることができる。機械学習アルゴリズムのいくつかの実施例は、教師ありまたは教師なし機械学習アルゴリズムを含むことができ、回帰アルゴリズム(例えば、通常の最小2乗回帰等)、インスタンスベースのアルゴリズム(例えば、学習ベクトル量子化等)、決定ツリーアルゴリズム(例えば、分類および回帰ツリー等)、ベイズアルゴリズム(例えば、単純ベイズ等)、クラスタリングアルゴリズム(例えば、k-平均クラスタリング等)、関連付けルール学習アルゴリズム(例えば、アプリオリアルゴリズム等)、人工ニューラルネットワークアルゴリズム(例えば、Perceptron等)、深層学習アルゴリズム(例えば、Deep Boltzmann Machine、すなわち、深層ニューラルネットワーク等)、次元削減アルゴリズム(例えば、主成分分析等)、アンサンブルアルゴリズム(例えば、Stacked Generalization等)、および/または他の機械学習アルゴリズムを含む。いくつかの実施形態では、個々のモデルは、個々のデータセットのためにカスタマイズされることができる。例えば、ウェアラブルデバイスは、ベースモデルを生成または記憶することができる。ベースモデルは、開始点として使用され、データタイプ(例えば、テレプレゼンスセッション内の特定のユーザ)、データセット(例えば、テレプレゼンスセッション内のユーザの取得される付加的画像のセット)、条件付き状況、または他の変形例に特有の付加的モデルを生成してもよい。いくつかの実施形態では、ウェアラブルHMDは、複数の技法を利用して、集約されたデータの分析のためのモデルを生成するように構成されることができる。他の技法は、事前に定義された閾値またはデータ値を使用することを含んでもよい。
マップデータベース内の本情報および点の集合に基づいて、オブジェクト認識装置708a-708nは、オブジェクトを認識し、オブジェクトを意味論情報で補完し、命をオブジェクトに与えてもよい。例えば、オブジェクト認識装置が、点のセットがドアであることを認識する場合、システムは、いくつかの意味論情報を結び付けてもよい(例えば、ドアは、ヒンジを有し、ヒンジを中心として90度移動を有する)。オブジェクト認識装置が、点のセットが鏡であることを認識する場合、システムは、鏡が、部屋内のオブジェクトの画像を反射させ得る、反射表面を有するという意味論情報を結び付けてもよい。経時的に、マップデータベースは、システム(ローカルに常駐し得る、または無線ネットワークを通してアクセス可能であり得る)がより多くのデータを世界から蓄積するにつれて成長する。いったんオブジェクトが認識されると、情報は、1つ以上のウェアラブルシステムに伝送されてもよい。例えば、MR環境700は、Californiaで起こっている場面についての情報を含んでもよい。環境700は、New Yorkにおける1人以上のユーザに伝送されてもよい。FOVカメラおよび他の入力から受信されたデータに基づいて、オブジェクト認識装置および他のソフトウェアコンポーネントは、場面が世界の異なる部分に存在し得る第2のユーザに正確に「パス」され得るように、種々の画像から収集された点をマッピングし、オブジェクトを認識すること等ができる。環境700はまた、場所特定目的のために、トポロジマップを使用してもよい。
図8は、認識されたオブジェクトに関連して仮想コンテンツをレンダリングする方法800の実施例のプロセスフロー図である。方法800は、仮想場面がウェアラブルシステムのユーザに提示され得る方法を説明する。ユーザは、その場面から地理的に遠隔に存在してもよい。例えば、ユーザは、New Yorkに存在し得るが、Californiaで現在起こっている場面を視認することを所望し得る、またはCaliforniaに存在する友人と散歩に行くことを所望し得る。
ブロック810では、ウェアラブルシステムは、ユーザの環境に関する入力をユーザおよび他のユーザから受信してもよい。これは、種々の入力デバイスおよびマップデータベース内にすでに保有されている知識を通して達成されてもよい。ユーザのFOVカメラ、センサ、GPS、眼追跡等が、ブロック810において、情報をシステムに伝達する。システムは、ブロック820において、本情報に基づいて、大まかな点を決定してもよい。大まかな点は、ユーザの周囲における種々のオブジェクトの配向および位置を表示および理解する際に使用され得る、姿勢データ(例えば、頭部姿勢、眼姿勢、身体姿勢、または手のジェスチャ)を決定する際に使用されてもよい。オブジェクト認識装置708a~708nは、ブロック830において、これらの収集された点を通してクローリングし、マップデータベースを使用して、1つ以上のオブジェクトを認識してもよい。本情報は、次いで、ブロック840において、ユーザの個々のウェアラブルシステムに伝達されてもよく、所望の仮想場面が、ブロック850において、適宜、ユーザに表示されてもよい。例えば、所望の仮想場面(例えば、CAにおけるユーザ)が、New Yorkにおけるユーザの種々のオブジェクトおよび他の周囲に関連して、適切な配向、位置等において表示されてもよい。
図9は、ウェアラブルシステムの別の実施例のブロック図である。本実施例では、ウェアラブルシステム900は、世界に関するマップデータを含み得る、マップを備える。マップは、部分的に、ウェアラブルシステム上にローカルに常駐してもよく、部分的に、有線ネットワークまたは無線ネットワークによってアクセス可能なネットワーク化された記憶場所(例えば、クラウドシステム内)に常駐してもよい。姿勢プロセス910が、ウェアラブルコンピューティングアーキテクチャ(例えば、処理モジュール260またはコントローラ460)上で実行され、ウェアラブルコンピューティングハードウェアまたはユーザの位置および配向を決定するために、マップからのデータを利用してもよい。姿勢データは、ユーザが、システムを体験し、その世界内で動作するとき、オンザフライで収集されたデータから算出されてもよい。データは、実環境または仮想環境内のオブジェクトに関する画像、センサ(概して、加速度計およびジャイロスコープコンポーネントを備える、慣性測定ユニット等)からのデータ、および表面情報を備えてもよい。
大まかな点表現は、同時場所特定およびマッピング(例えば、入力が画像/視覚のみである構成を指す、SLAMまたはvSLAM)プロセスの出力であってもよい。システムは、世界内の種々のコンポーネントの場所だけではなく、世界が成っているものを見出すように構成されることができる。姿勢は、マップを埋めることおよびマップからのデータを使用することを含め、多くの目標を達成する、構築ブロックであってもよい。
一実施形態では、大まかな点位置は、それ自体では完全に適正であり得ず、さらなる情報が、多焦点AR、VR、またはMR体験を生成するために必要とされ得る。概して、深度マップ情報を指す、稠密表現が、少なくとも部分的に、本間隙を充填するために利用されてもよい。そのような情報は、立体視940と称されるプロセスから算出されてもよく、深度情報は、三角測量または飛行時間感知等の技法を使用して決定される。画像情報およびアクティブパターン(アクティブプロジェクタを使用して生成される赤外線パターン等)が、立体視プロセス940への入力としての役割を果たし得る。有意な量の深度マップ情報が、ともに融合されてもよく、このうちのいくつかは、表面表現を用いて要約されてもよい。例えば、数学的に定義可能な表面は、ゲームエンジンのような他の処理デバイスへの効率的(例えば、大規模点クラウドと比較して)かつ摘要可能な入力であってもよい。したがって、立体視プロセス(例えば、深度マップ)940の出力は、融合プロセス930において組み合わせられてもよい。姿勢950は、同様に、本融合プロセス930への入力であってもよく、融合930の出力は、マッププロセス920を埋めるための入力となる。サブ表面が、トポグラフィマッピング等において相互に接続し、より大きい表面を形成してもよく、マップは、点および表面の大規模ハイブリッドとなる。
複合現実プロセス960における種々の側面を解決するために、種々の入力が、利用されてもよい。例えば、図9に描写される実施形態では、ゲームパラメータは、システムのユーザが1匹以上のモンスタと種々の場所においてモンスタバトルゲームをプレーしていること、モンスタが死んでいる、種々の条件下で逃げていること(ユーザがモンスタを撃つ場合等)、種々の場所における壁または他のオブジェクト、および同等物を決定するための入力であってもよい。世界マップは、複合現実に対する別の有用な入力となる、そのようなオブジェクトが相互に対して存在する場所に関する情報を含んでもよい。世界に対する姿勢は、同様に、入力となり、ほぼあらゆる双方向システムに対して重要な役割を果たす。
ユーザからの制御または入力は、ウェアラブルシステム900への別の入力である。本明細書に説明されるように、ユーザ入力は、視覚的入力、ジェスチャ、トーテム、オーディオ入力、感覚入力等を含むことができる。動き回るまたはゲームをプレーするために、例えば、ユーザは、ウェアラブルシステム900に、何をしたいかに関して命令する必要があり得る。空間内で自ら移動するだけではなく、利用され得る種々の形態のユーザ制御が、存在する。一実施形態では、トーテム(例えば、ユーザ入力デバイス)、または玩具銃等のオブジェクトが、ユーザによって保持され、システムによって追跡されてもよい。システムは、好ましくは、ユーザがアイテムを保持していることを把握し、ユーザがアイテムと行っている相互作用の種類を理解するように構成されるであろう(例えば、トーテムまたはオブジェクトが、銃である場合、システムは、場所および配向だけではなく、ユーザが、そのようなアクティビティがカメラのいずれかの視野内にないときでも、何が起こっているかの決定を補助し得る、IMU等のセンサを装備し得る、トリガまたは他の感知ボタンまたは要素をクリックしているかどうかも理解するように構成されてもよい。)
手のジェスチャ追跡または認識もまた、入力情報を提供してもよい。ウェアラブルシステム900は、ボタン押下のため、左または右、停止、握持、保持等をジェスチャするために、手のジェスチャを追跡および解釈するように構成されてもよい。例えば、1つの構成では、ユーザは、非ゲーム環境において電子メールまたはカレンダを通してフリップする、または別の人物または演奏者と「フィストバンプ」を行うことを所望し得る。ウェアラブルシステム900は、動的であり得る、またはそうではない場合がある、最小量の手のジェスチャを活用するように構成されてもよい。例えば、ジェスチャは、停止を示すために手を広げる、OKを示すために親指を上げる、OKではないことを示すために親指を下げる、または指向性コマンドを示すために左右または上下に手をフリップする等、単純な静的ジェスチャであってもよい。
眼追跡は、別の入力である(例えば、ユーザが見ている場所を追跡し、ディスプレイ技術を制御し、具体的深度または範囲においてレンダリングする)。一実施形態では、眼の輻輳・開散運動が、三角測量を使用して決定されてもよく、次いで、その特定の人物のために開発された輻輳・開散運動/遠近調節モデルを使用して、遠近調節が、決定されてもよい。眼追跡は、眼カメラによって実施され、眼視線(例えば、片眼または両眼の方向または配向)を決定することができる。他の技法も、例えば、眼の近傍に設置された電極による電位の測定(例えば、電気眼球図記録)等、眼追跡のために使用されることができる。
音声認識は、単独で、または他の入力(例えば、トーテム追跡、眼追跡、ジェスチャ追跡等)と組み合わせて使用され得る、別の入力であり得る。システム900は、オーディオストリームを環境から受信する、オーディオセンサ232(例えば、マイクロホン)を含むことができる。受信されたオーディオストリームは、処理され(例えば、処理モジュール260、270または中央サーバ1650によって)、ユーザの音声(他の音声または背景オーディオから)を認識し、コマンド、パラメータ等をオーディオストリームから抽出することができる。例えば、システム900は、オーディオストリームから、語句「あなたのIDを見せてください」が発せられたことを識別し、本語句がシステム900の装着者(例えば、検閲者の環境内の別の人物ではなく、セキュリティ検閲者)によって発せられたことを識別し、語句および状況のコンテキスト(例えば、セキュリティ検問所)から、実施されるべき実行可能コマンド(例えば、装着者のFOV内のもののコンピュータビジョン分析)およびコマンドが実施されるべきオブジェクト(「あなたのID」)が存在することを抽出し得る。システム900は、発話している人物(例えば、発話がARDの装着者または別の人物または音声(例えば、環境内のラウドスピーカによって伝送される記録された音声)からのものであるかどうか)を決定するための話者認識技術と、発せられている内容を決定するための発話認識技術とを組み込むことができる。音声認識技法は、周波数推定、隠れマルコフモデル、ガウス混合モデル、パターン整合アルゴリズム、ニューラルネットワーク、マトリクス表現、ベクトル量子化、話者ダイアライゼーション、決定ツリー、および動的時間伸縮(DTW)技法を含むことができる。音声認識技法はまた、コホートモデルおよび世界モデル等のアンチ話者技法を含むことができる。スペクトル特徴は、話者特性を表す際に使用されてもよい。
カメラシステムに関して、図9に示される例示的ウェアラブルシステム900は、3つの対のカメラ、すなわち、ユーザの顔の両側に配列される相対的広FOVまたは受動SLAM対のカメラと、ユーザの正面に配向され、立体視イメージングプロセス940をハンドリングし、また、ユーザの顔の正面の手のジェスチャおよびトーテム/オブジェクトの軌道を捕捉するための異なる対のカメラとを含むことができる。ステレオプロセス940に対するFOVカメラおよび対のカメラは、外向きに面したイメージングシステム464(図4に示される)の一部であってもよい。ウェアラブルシステム900は、眼ベクトルおよび他の情報を三角測量するために、ユーザの眼に向かって配向される眼追跡カメラ(図4に示される内向きに面したイメージングシステム462の一部であってもよい)を含むことができる。ウェアラブルシステム900はまた、1つ以上のテクスチャ化光プロジェクタ(赤外線(IR)プロジェクタ等)を備え、テクスチャを場面の中に投入してもよい。
図10は、ウェアラブルシステムへのユーザ入力を決定するための方法1000の実施例のプロセスフロー図である。本実施例では、ユーザは、トーテムと相互作用してもよい。ユーザは、複数のトーテムを有してもよい。例えば、ユーザは、ソーシャルメディアアプリケーションのための指定される1つのトーテム、ゲームをプレーするための別のトーテム等を有してもよい。ブロック1010では、ウェアラブルシステムは、トーテムの運動を検出してもよい。トーテムの移動は、外向きに面したイメージングシステムを通して認識されてもよい、またはセンサ(例えば、触知グローブ、画像センサ、手追跡デバイス、眼追跡カメラ、頭部姿勢センサ等)を通して検出されてもよい。
少なくとも部分的に、検出されたジェスチャ、眼姿勢、頭部姿勢、またはトーテムを通した入力に基づいて、ウェアラブルシステムは、ブロック1020において、基準フレームに対するトーテム(またはユーザの眼または頭部またはジェスチャ)の位置、配向、または移動を検出する。基準フレームは、それに基づいてウェアラブルシステムがトーテム(またはユーザ)の移動をアクションまたはコマンドに変換する、マップ点のセットであってもよい。ブロック1030では、トーテムとのユーザの相互作用が、マッピングされる。基準フレーム1020に対するユーザ相互作用のマッピングに基づいて、システムは、ブロック1040において、ユーザ入力を決定する。
例えば、ユーザは、トーテムまたは物理的オブジェクトを前後に移動させ、仮想ページを捲り、次のページに移動すること、または、1つのユーザインターフェース(UI)ディスプレイ画面から別のUI画面に移動することを示してもよい。別の実施例として、ユーザは、ユーザのFOR内の異なる実オブジェクトまたは仮想オブジェクトを見るために、その頭部または眼を移動させてもよい。特定の実オブジェクトまたは仮想オブジェクトにおけるユーザの注視が、閾値時間より長い場合、その実オブジェクトまたは仮想オブジェクトは、ユーザ入力として選択されてもよい。いくつかの実装では、ユーザの眼の輻輳・開散運動が、追跡されることができ、遠近調節/輻輳・開散運動モデルが、ユーザが合焦している深度平面に関する情報を提供する、ユーザの眼の遠近調節状態を決定するために使用されることができる。いくつかの実装では、ウェアラブルシステムは、レイキャスティング技法を使用して、ユーザの頭部姿勢または眼姿勢の方向に沿っている実オブジェクトまたは仮想オブジェクトを決定することができる。種々の実装では、レイキャスティング技法は、実質的に殆ど横幅を伴わない細い光線束を投じる、または実質的横幅を伴う光線(例えば、円錐または円錐台)を投じることを含むことができる。
ユーザインターフェースは、本明細書に説明されるようなディスプレイシステム(図2におけるディスプレイ220等)によって投影されてもよい。また、1つ以上のプロジェクタ等の種々の他の技法を使用して表示されてもよい。プロジェクタは、画像をキャンバスまたは球体等の物理的オブジェクト上に投影してもよい。ユーザインターフェースとの相互作用は、システムの外部またはシステムの一部の1つ以上のカメラを使用して(例えば、内向きに面したイメージングシステム462または外向きに面したイメージングシステム464を使用して)追跡されてもよい。
図11は、仮想ユーザインターフェースと相互作用するための方法1100の実施例のプロセスフロー図である。方法1100は、本明細書に説明されるウェアラブルシステムによって行われてもよい。方法1100の実施形態は、ウェアラブルシステムのFOV内の人物またはドキュメントを検出するためにウェアラブルシステムによって使用されることができる。
ブロック1110では、ウェアラブルシステムは、特定のUIを識別してもよい。UIのタイプは、ユーザによって与えられてもよい。ウェアラブルシステムは、特定のUIがユーザ入力(例えば、ジェスチャ、視覚的データ、オーディオデータ、感覚データ、直接コマンド等)に基づいて取り込まれる必要があることを識別してもよい。UIは、セキュリティシナリオに特有であることができ、システムの装着者は、ドキュメントを装着者に提示するユーザを観察する(例えば、旅客検問所において)。ブロック1120では、ウェアラブルシステムは、仮想UIのためのデータを生成してもよい。例えば、UIの境界、一般的構造、形状等と関連付けられたデータが、生成されてもよい。加えて、ウェアラブルシステムは、ウェアラブルシステムがユーザの物理的場所に関連してUIを表示し得るように、ユーザの物理的場所のマップ座標を決定してもよい。例えば、UIが、身体中心である場合、ウェアラブルシステムは、リングUIがユーザの周囲に表示され得るか、または、平面UIが壁上またはユーザの正面に表示され得るように、ユーザの物理的立ち位置、頭部姿勢、または眼姿勢の座標を決定してもよい。本明細書に説明されるセキュリティコンテキストでは、UIは、装着者が、旅行者および旅行者のドキュメントを見ている間、UIを容易に視認し得るように、UIがドキュメントをシステムの装着者に提示する旅行者を囲繞しているかのように表示され得る。UIが、手中心の場合、ユーザの手のマップ座標が、決定されてもよい。これらのマップ点は、FOVカメラ、感覚入力を通して受信されたデータ、または任意の他のタイプの収集されたデータを通して導出されてもよい。
ブロック1130では、ウェアラブルシステムは、データをクラウドからディスプレイに送信してもよい、またはデータは、ローカルデータベースからディスプレイコンポーネントに送信されてもよい。ブロック1140では、UIは、送信されたデータに基づいて、ユーザに表示される。例えば、ライトフィールドディスプレイは、仮想UIをユーザの眼の一方または両方の中に投影することができる。いったん仮想UIが生成されると、ウェアラブルシステムは、ブロック1150において、単に、ユーザからのコマンドを待機し、より多くの仮想コンテンツを仮想UI上に生成してもよい。例えば、UIは、ユーザの身体またはユーザの環境内の人物(例えば、旅行者)の身体の周囲の身体中心リングであってもよい。ウェアラブルシステムは、次いで、コマンド(ジェスチャ、頭部または眼移動、音声コマンド、ユーザ入力デバイスからの入力等)を待機してもよく、認識される場合(ブロック1160)、コマンドと関連付けられた仮想コンテンツが、ユーザに表示されてもよい(ブロック1170)。
ウェアラブルシステム、UI、およびユーザ体験(UX)の付加的実施例は、米国特許公開第2015/0016777号(参照することによってその全体として本明細書に組み込まれる)に説明されている。
(人物の画像に基づく識別検証)
図4を参照して説明されるように、ARDは、外向きに面したイメージングシステム464を使用して、装着者の周囲の環境をイメージングすることができる。画像は、静止画像、ビデオからの個々のフレーム、またはビデオを含むことができる。ARDは、画像を分析し、オブジェクト(例えば、ドキュメント)、人物、オブジェクト内の要素(例えば、パスポート上の写真、旅行者の身体の画像内の顔等)間のリンケージを識別することができる。
図12Aは、人物の特性およびドキュメント内の情報を分析することによる、識別検証の実施例を図示する。図12Aでは、人物5030は、運転免許証5150aを保持している。人物5030は、例えば、検問所におけるセキュリティ検閲者によって装着され得る、ARDの正面に立っていてもよい。ARDは、人物5030の身体の一部と、運転免許証5150aとを含む、画像1200aを捕捉することができる。ARDは、人物のバイオメトリック情報を画像1200aから抽出し、抽出されたバイオメトリック情報を使用して、人物の識別を決定することができる。
実施例として、ARDは、顔認識技法を使用して、人物5030の識別を決定してもよい。ARDは、画像1200aを分析し、画像内に現れる顔を特定することができる。図12Aに示されるように、ARDは、ウェーブレットベースのカスケードアルゴリズム(例えば、Haarウェーブレットベースのブーストカスケードアルゴリズム)、深層ニューラルネットワーク(DNN)(例えば、顔を識別するように訓練されたトリプレット組み込みネットワーク)等の種々の顔検出技法を使用して、人物5030の顔5020と、運転免許証5150a上の顔5120aとを検出することができる。
いったん顔が、検出されると、ARDは、顔に関する特徴ベクトルを計算することによって、顔を特性評価することができる。特徴ベクトルは、顔の数値表現であることができる。例えば、ARDは、検出された顔の顔特徴(例えば、眼の角、眉毛、口、鼻先等)に基づいて、特徴ベクトルを計算してもよい。例えば、顔目印検出、テンプレート整合、DNNトリプルネットワーク、他の組み込みネットワーク、それらの組み合わせ、または同等物等の種々のアルゴリズムが、顔を特性評価するために使用されてもよい。
画像1200a内の2つの顔の特徴ベクトルは、2つの顔間の類似性および非類似性を比較するために使用されてもよい。例えば、ARDは、対応する特徴ベクトル空間内の2つの特徴ベクトル間の距離(ユークリッド距離等)を計算することができる。距離が閾値を超えると、ARDは、2つの顔が十分に異なると決定し得る。他方では、距離が閾値を下回ると、ARDは、2つの顔が類似すると決定し得る。
いくつかの実施形態では、異なる加重が、異なる顔特徴と関連付けられてもよい。例えば、ARDは、顔特徴の場所に基づいて、加重を特徴ベクトルの成分に割り当てることができる。その結果、個別の顔特徴と関連付けられた加重が、2つの顔の類似性および非類似性を決定する際に組み込まれ得る。
いくつかの状況では、環境の画像は、複数の顔を含んでもよい。例えば、空港のセキュリティ検問所では、ARDによって入手された画像は、ARDの正面に立っている人物および周囲における他の人々を含んでもよい。ARDは、フィルタを使用して、1つ以上の関連顔を識別してもよい。実施例として、ARDは、ARDの場所に対する顔の距離またはサイズに基づいて、関連顔を決定してもよい。ARDは、ARDに最も近い人物が検証されている人物である可能性が高いため、画像内の最近傍または最大顔が関連顔であることを決定し得る。
別の実施例として、ARDは、本明細書に説明される技法を使用して、ドキュメント上の顔(環境内の複数の顔の中から)を識別し、ドキュメント上の顔と環境内のヒトを整合させてもよい。ARDは、顔(物理的顔およびドキュメント上の顔)と関連付けられた重要点を追跡することによって、ドキュメント上の顔と人物の物理的顔を区別することができる。ARDは、任意の重要点アルゴリズム(Shi-Tomasiコーナー検出アルゴリズム等)を使用して、本プロセスを実施してもよい。ある実装では、顔検出、顔認識、および重要点追跡は、図7に説明されるように、1つ以上のオブジェクト認識装置708によって実施されてもよい。
ARDは、抽出された重要点の動きを追跡し、顔が物理的顔またはドキュメント上の顔の画像であるかどうかを決定することができる。例えば、ARDは、外向きに面したイメージングシステム464によって入手された画像のシーケンシャルフレームを使用して、抽出された重要点の動きを追跡することができる。ARDは、特徴のより多くの動きを検出するとき、顔を物理的顔としてタグ付けし得る。これは、物理的顔の特徴が、通常、ドキュメント上の顔の特徴より多くの動きを有するためである。例えば、人物は、数秒毎にその眼を瞬目させる一方、ドキュメント上に示されるような眼は、瞬目しない。加えて、または代替として、ARDは、顔の移動が単一平面ホモグラフィ(例えば、同一平面表面の2つ以上の画像間のコンピュータビジョン関係)によって記述され得るとき、顔をドキュメント上の画像としてタグ付けし得る。これは、ドキュメント上の顔画像が、通常、ドキュメントとともに移動する一方、人物の顔が、典型的には、環境(または環境内のオブジェクト/他の人々)とともに移動しないためである。
顔認識に加えて、またはその代替として、ARDは、他のバイオメトリック(身長、髪色、眼色、虹彩コード、声紋等)を使用して、人物を識別してもよい。例えば、ARDは、外向きに面したイメージングシステム464によって入手された画像1200aに基づいて、人物5030の髪色を決定することができる。ARDはまた、外向きに面したイメージングシステム464によって入手された画像に基づいて、年齢、性別、身長等の人物5030の個人情報を推定することができる。例えば、ARDは、人物の画像および人物5030の場所とARDの場所との間の距離に基づいて、人物5030の身長を計算可能であってもよい。ARDはまた、その顔特徴(例えば、皺等)に基づいて、人物の年齢を推定してもよい。ARDは、DNNまたは他の類似アルゴリズムを使用して、本目的を達成してもよい。さらに別の実施例として、ARDは、単独で、または顔認識(または他のバイオメトリック)と組み合わせて、個人の声紋を使用して、人物の識別を決定することができる。ARDは、人物が発話するとき、人物の音声データを入手し、図9に説明される音声認識アルゴリズムを適用し、人物の音声における特徴(例えば、ピッチ、方言、アクセント等)を識別することができる。ARDはさらに、識別された特徴をデータベース内でルックアップし、識別された特徴に整合する1人以上の人物が存在するかどうかを決定することができる。
ARDは、画像1200aから入手された情報を使用して、画像1200a内で利用不可能な付加的情報を取得することができる。例えば、ARDは、人物5030の眼の画像を使用して、人物5030の虹彩コードを計算することができる。ARDは、人物5030の虹彩コードをデータベース内でルックアップし、人物5030の氏名を取得することができる。加えて、または代替として、ARDは、データベースを参照することによって、人物の身長、髪色、眼色、顔特徴を使用して、付加的個人情報(氏名、住所、職業等)を取得することができる。例えば、ARDは、人物の身長、髪色、および眼色を使用して、データベースクエリを実施し、クエリされた身長、髪色、および眼色の整合特性を有する人物のリストを受信することができる。
(ドキュメントの画像に基づくドキュメント認証)
図12Aに示されるように、運転免許証5150aは、種々の個人情報を含んでもよい。情報は、明示的であってもよい(情報を有するドキュメントがヒト可視スペクトルまたはHVS内の光で照明されたときに、人物によって直接知覚可能である)。HVSは、概して、約400nm~約750nm波長範囲を有する。運転免許証5150a上の明示的情報は、運転免許証番号、有効期限5140a、氏名5110a、性別、髪色、身長、および顔5120aの画像を含むことができる。例えば、ARDは、有効期限5140aを運転免許証5150aの画像から抽出し、有効期限5140aと今日の日付を比較することができる。有効期限5140aが、今日の日付前である場合、ARDは、ドキュメントがもはや有効ではないことを決定し得る。
ドキュメントはまた、隠蔽された情報を含んでもよい(ドキュメントがヒト可視スペクトル内の光で照明されたときに、人物によって直接知覚可能ではない)。隠蔽された情報は、ラベル内にエンコードされてもよい、または別のデータソースへの参照(データベースにクエリし、ドキュメントと関連付けられた付加的情報を読み出すために使用され得る、識別子等)を含有してもよい。例えば、図12Bに示されるように、ドキュメント(例えば、航空機旅券5470)は、クイックレスポンス(QR)コード5470またはバーコード等の光学ラベルを含んでもよい。QRコード(登録商標)5470は、ヒト眼によって直接知覚可能であるが、QRコード(登録商標)内にエンコードされた情報は、ヒトによって直接解読されることができない。ARDは、そのような隠蔽された情報をドキュメントから抽出し得る、光学センサを含むことができる。例えば、ARDは、QRコード(登録商標)を走査し、別のデータソース(航空機の予約システム等)と通信し、QRコード(登録商標)内にエンコードされた情報を取得することができる。ラベルはまた、虹彩コード、指紋等のバイオメトリックラベルを含んでもよい。例えば、パスポートは、人物の虹彩コードを含んでもよい。ARDは、虹彩コードを含む、パスポートの画像を取得してもよい。ARDは、虹彩コードを使用するデータベースをルックアップし、人物の他のバイオメトリック情報(例えば、生年月日、氏名等)を取得することができる。
いくつかの状況では、隠蔽された情報は、例えば、紫外線(UV)光または赤外線(IR)光等のHVS外のある光学条件下のみで知覚可能であってもよい。ARDは、ヒト可視スペクトル(例えば、UV光またはIR光)外の光を放出し得る、光学センサを含んでもよい。例えば、人物のプライバシを保護するために、パスポート内の虹彩コードは、UV光下でのみ見えてもよい。ARDは、UV光を放出し、UV条件下でドキュメントの画像を取得することによって、虹彩コードを取得してもよい。ARDは、次いで、UV条件下で取得された画像を使用して、虹彩コードを抽出することができる。他の場合では、セキュリティ理由から、識別ドキュメントは、人物の写真の2つのコピーを含んでもよく、第1のコピーは、可視光(HVS内)で視認可能であってもよく、第2のコピーは、HVS外の光(例えば、UVまたはIR照明下)で照明されたときのみ視認可能であってもよい。そのような二重コピーは、人物が、視覚的に視認可能であるコピーを修正可能であり得るが、同一変更をUVまたはIR照明下のみで視認可能なコピーに行う能力を有し得ないため、セキュリティを増加させることができる。故に、ARDは、ドキュメントを非HVS光で照明し、非HVS視認可能コピーの画像を取得し、HVS視認可能コピーの画像を取得し、実際の人物の画像を取得し、全3つの画像を使用して、比較を行い得る(例えば、顔認識技法を使用して)。
光学ラベルまたはバイオメトリックラベルに加えて、またはその代替として、ドキュメントはまた、RFIDタグ等の電磁ラベルを有してもよい。電磁ラベルは、ARDによって検出され得る、信号を放出することができる。例えば、ARDは、ある周波数を伴う信号を検出可能であるように構成されてもよい。いくつかの実装では、ARDは、信号をオブジェクトに送信し、信号のフィードバックを受信することができる。例えば、ARDは、信号を送信し、航空機旅券5470上のラベルにピングしてもよい(図13に示される)。
ARDは、ドキュメント内の情報(明示的または隠蔽された)に基づいて、ドキュメントの真正性を決定することができる。ARDは、別のデータソースと通信し、そのデータソース内のドキュメントの画像から入手された情報をルックアップすることによって、そのような検証を実施してもよい。例えば、ドキュメントが、個人の番地を示す場合、ARDは、番地をデータベース内でルックアップし、番地が存在するかどうかを決定してもよい。ARDが、番地が存在しないことを決定する場合、ARDは、ドキュメントが偽造されているかもしれないことを装着者にフラグしてもよい。他方では、番地が存在する場合、ARDは、番地が人物の真の住所であるより高い可能性を有し得ることを決定し得る。別の実施例では、ドキュメントは、人物の指紋の画像を含んでもよい。ARDは、外向きに面したイメージングシステム464を使用して、指紋の画像を含む、ドキュメントの画像を取得し、データベースから、本指紋と関連付けられた個人情報(人物の氏名、住所、生年月日等)を読み出すことができる。ARDは、データベースから読み出される個人情報とドキュメント上に現れる情報を比較することができる。ARDは、これらの2つの情報が整合しない(例えば、読み出された情報がドキュメント上に現れるものと異なる氏名を有する)場合、ドキュメントが偽造されているとフラグしてもよい。他方では、ARDは、これらの2つの情報が整合する場合、ドキュメントを真正としてフラグしてもよい。
ARDはまた、ドキュメント内の情報のみを使用して、ドキュメントを検証することができる。例えば、ARDは、信号をドキュメントと関連付けられたラベルから受信してもよい。信号が、特定の周波数帯域内にある場合、ARDは、ドキュメントが真正であることを決定し得る。別の実施例では、ARDは、クエリ信号をARDを囲繞するオブジェクトに能動的に送信してもよい。ARDが、ドキュメントと関連付けられたラベルに正常にピングすることができる場合、ARDは、ドキュメントが真正であることを決定してもよい。他方では、ドキュメントの画像とARDによって受信された信号との間の不整合が存在する場合、ARDは、ドキュメントが偽造されていることを決定し得る。例えば、ドキュメントの画像は、RFIDの画像を含み得るが、ARDは、任意の情報をRFIDから受信しない場合がある。その結果、ARDは、ドキュメントが偽造されていることを決定し得る。
本明細書に説明される実施例は、ドキュメントの認証を参照するが、これらの実施例は限定ではない。本明細書に説明される技法はまた、任意のオブジェクトを認証するために使用されることができる。例えば、ARDは、パッケージの住所の画像を取得し、送信者または受信者の住所を分析することによって、パッケージが危険であり得るかどうかを決定してもよい。
(人物とドキュメントとの間のリンケージ)
図12Aに示されるように、ARDは、装着者の正面に立っている人物が運転免許証上に示される同一人物であるかどうかを検証することができる。ARDは、種々のファクターを使用して、人物5030と運転免許証5150aとの間の整合を識別することによって、そのような検証を実施してもよい。ファクターは、画像1200aから抽出される情報に基づいてもよい。例えば、1つのファクターは、人物5030の顔5020と運転免許証5150a上に示される顔5120aとの間の類似性の程度であってもよい。ARDは、本明細書に説明される顔認識技法を使用して、顔を識別し、顔特徴間の距離を計算することができる。距離は、2つの顔の類似性または非類似性を表すために使用されてもよい。例えば、2つの顔が、2つの眼間の類似距離および鼻から口までの類似距離を有するとき、ARDは、2つの顔が同一である可能性が高いことを決定し得る。しかしながら、ある顔特徴間の距離が、2つの顔間で変動するとき、ARDは、2つの顔が同一である可能性が低いことを決定し得る。顔を比較する他の技法もまた、使用されてもよい。例えば、ARDは、これらの2つの顔が同一テンプレート内にあるかどうかを決定することができる。
いくつかの実施形態では、ARDは、紙上に現れる少なくとも1つの顔を含むように顔認識を制限してもよい。これは、2人の人物の顔特徴を比較することを回避する一方、ARDの装着者がある人物の識別をドキュメントに対して検証することにのみに着目するためである。ドキュメント上の顔をヒト上の顔から区別するための本明細書に説明される任意の技法も、本目的のために使用されてもよい。
別の実施例として、人物とドキュメントとの間のリンケージを検証するためのファクターは、髪色の整合を含んでもよい。ARDは、人物5030の髪色を画像1200aから取得することができる。ARDは、本情報と運転免許証5150上に記述される髪色を比較することができる。運転免許証5150aのセクション5130aでは、John Doeの髪色は、茶色である。ARDが、人物5030の髪色もまた茶色であることを決定する場合、ARDは、髪色に関して整合が存在することを決定し得る。
ファクターはまた、ARDによって入手された画像(例えば、画像1200aおよび画像1200b)以外のデータソースから取得される情報に基づいてもよい。ARDは、画像1200aから抽出される情報を使用して、人物またはドキュメントと関連付けられたより多くの情報を別のデータソースから取得することができる。例えば、ARDは、人物5030に関する虹彩コードを生成し、虹彩コードをデータベース内でルックアップし、人物5030の氏名を取得してもよい。ARDは、データベースに見出される氏名と運転免許証5150a上に現れる氏名5110aを比較することができる。ARDが、これらの2つの氏名が整合することを決定する場合、ARDは、人物5030が実際にJohn Doeであることを決定し得る。
ARDは、比較を行うとき、人物の顔画像または運転免許証上の顔画像を処理してもよい。例えば、人物5030は、眼鏡を装着している一方、運転免許証上の写真5254aは、眼鏡を有していない場合がある。ARDは、(人物5030が装着している眼鏡のような)一対の眼鏡を写真5254aに追加する、または人物5030が装着している対の眼鏡を「除去」し、処理された画像を使用して、整合を検出することができる。ARDはまた、整合を検索しながら、人物5030が装着している衣類を変化させる等、入手された画像(例えば、画像5200aまたは画像5200b)の他の部分を処理してもよい。
ある実施形態では、ARDは、信頼度スコアを計算し、人物がドキュメントによって記述されるのと同一人物かどうかを決定してもよい。信頼度スコアは、人物とドキュメントとの間の1つ以上のファクターの整合(または不整合)を使用して、計算されてもよい。例えば、ARDは、髪色、顔の写真、および性別の整合に基づいて、信頼度スコアを計算してもよい。ARDが、全3つの特性整合を決定する場合、ARDは、99%信頼度を伴って、人物がドキュメントによって示される人物であることを決定し得る。
ARDは、異なる加重を異なるファクターに割り当ててもよい。例えば、ARDは、人物の虹彩コードを偽造することが困難であるため、重い加重を虹彩コードの整合に割り当てる一方、軽い加重を髪色整合に割り当ててもよい。したがって、ARDが、人物の虹彩コードがドキュメント内のものに整合することを検出すると、ARDは、人物の髪色が同一ドキュメント内の記述に整合し得ない場合でも、人物がドキュメントに記述される人物であるとフラグしてもよい。
信頼度スコアの別の実施例は、図12Bに示される。図12Bでは、ARDは、人物の顔5020と運転免許証5150b上の人物の画像5120との間の類似性の程度を計算することができる。しかしながら、顔5020は、画像5120b内の顔と異なる特徴を有する。例えば、画像5120bは、異なる眉毛を有する。画像5120b内の眼もまた、顔5020のものより小さく、より離間されている。顔認識アルゴリズムおよび信頼度スコアを計算する方法を使用して、ARDは、人物5030の顔5020が運転免許証上の顔5120bに整合する可能性が48%しかないと決定し得る。
信頼度スコアを使用して、人物の識別を検証することに加え、信頼度スコアが、ドキュメントの有効性を検証する、または複数のドキュメントを横断してリンケージを検証するために使用されてもよい。例えば、ARDは、ドキュメント上の情報とデータベース内に記憶される情報を比較してもよい。ARDは、見出される整合の数に基づいて、信頼度スコアを計算することができる。信頼度スコアが、ある閾値を下回る場合、ARDは、ドキュメントが無効であることを決定し得る。他方では、信頼度スコアが、閾値以上である場合、ARDは、ドキュメントが有効であることを決定し得る。
(複数のドキュメント間のリンケージ)
図12Bは、ARDによって入手された画像1200bを図示する。画像1200b内では、個人5030が、運転免許証5150bと、航空機旅券5450とを保持している。ARDは、これらの2つのドキュメント内の情報を比較し、運転免許証または航空機旅券の有効性を決定することができる。例えば、ARDが、運転免許証上の情報が、航空機旅券上の情報に整合しないことを決定する場合、ARDは、運転免許証または航空機旅券のいずれかまたは両方が無効であることを決定し得る。
ARDは、画像1200b内の明示的情報を使用して、2つのドキュメントの有効性を検証することができる。例えば、ARDは、運転免許証5150b上に示される氏名5110bと航空機旅券5450上に示される氏名5410を比較してもよい。これらの2つの氏名は両方とも、John Doeであるため、ARDは、整合が存在することをフラグすることができる。
ARDは、別のデータソースを参照することによって、2つのドキュメントの有効性を検証することができる。図12Bでは、ARDは、QRコード(登録商標)5470を走査することによって、乗客の氏名、生年月日、および性別を読み出し可能であってもよい。ARDは、そのような情報と運転免許証上に示される情報を比較し、航空機旅券および運転免許証が同一人物に属するかどうかを決定することができる。
本明細書に説明される実施例は、2つのドキュメントの比較を参照するが、本技法はまた、複数のドキュメントの比較または複数の人物の識別の検証に適用されることができることに留意されたい。例えば、ARDは、本明細書に説明される顔認識技法を使用して、人々のグループの類似度を比較してもよい。
(注釈の実施例)
ARDは、個人(John Doe等)またはドキュメント(運転免許証5150a等)を検証するとき、注釈をARDによって入手された画像(例えば、画像1200aおよび1200b)に提供することができる。注釈は、人物、ドキュメント、人物の特徴、またはドキュメント内のある情報(有効期限等)の近傍にあってもよい。
注釈は、視覚的焦点インジケータを備えてもよい。視覚的焦点インジケータは、後光、色、ハイライト、動画、または他の可聴、触知、視覚的効果、それらの組み合わせ、または同等物であってもよく、これは、ARDの装着者が、人物またはドキュメントのある特徴により容易に気付くことに役立ち得る。例えば、ARDは、ボックス5252(図12Aおよび12Bに示される)をJohn Doeの顔5020の周囲に提供してもよい。ARDはまた、ボックス(例えば、図12Aではボックス5254aおよび図12Bではボックス5254b)を運転免許証上の顔画像の周囲に提供してもよい。ボックスは、顔認識技法を使用して識別された顔の領域を示してもよい。加えて、ARDは、図12Aに示されるように、運転免許証5150aの有効期限5140aを点線で強調してもよい。同様に、ARDは、図12Bでは、運転免許証5150bの有効期限5140bを強調してもよい。
視覚的焦点インジケータに加えて、またはその代替として、ARDは、注釈のためのテキストを使用することができる。例えば、図12Aに示されるように、ARDは、いったんARDが人物の氏名がJohn Doeであることを決定すると、「John Doe」5010をその頭部の上部に表示することができる。他の実装では、ARDは、氏名「John Doe」を人物の顔の右等のいずれかの場所に表示してもよい。氏名に加え、ARDはまた、他の情報を人物の近傍に示すことができる。例えば、ARDは、John
Doeの職業をその頭部の上部に表示してもよい。別の実施例では、図12Bでは、運転免許証を認証後、ARDは、単語「有効」5330aを運転免許証5150bの上部に表示してもよい。また、図12Bでは、ARDは、フライトの出発5460時間がすでに過ぎていることを決定し得る。その結果、ARDは、単語「警告」を出発時間5460に繋げ、本情報をARDの装着者に強調してもよい。
ARDは、注釈を使用して、整合を示すことができる。例えば、図12Aでは、ARDが、John Doeの顔5020がその運転免許証5150a上に示される写真に整合することを決定する場合、ARDは、単語「整合」5256をARDの装着者に表示してもよい。ARDはまた、ボックス5252をJohn Doeの顔5020にわたって、別のボックス5254aを運転免許証5150a上のその写真にわたって表示してもよく、ボックス5252およびボックス5254aは、同一色を有してもよい。ARDはまた、線を2つの整合特徴(例えば、John Doeの顔5020と運転免許証5150a上のその顔5120aの画像)間に引き、整合が検出されたことを示してもよい。
いくつかの実施形態では、図12Bに示されるように、ARDは、単語「整合」5310を整合に関する信頼度スコア5320とともに表示してもよい。いくつかの実装では、信頼度スコア5320が、閾値を下回ると、ARDは、「整合」の代わりに、単語「不整合」を表示してもよい。
整合を自動的に検出することに加え、ARDはまた、装着者がARDの判断を上書きすることを可能にしてもよい。例えば、ARDが、整合の低い可能性を示す、または不整合を示すとき、ARDは、装着者が、手動点検に切り替えることを可能にしてもよく、これは、ARDによって提供される結果を上書きしてもよい。
(人物とドキュメントの整合の例示的プロセス)
図13は、人物と人物によって提示される識別ドキュメントとの間の整合を決定するための例示的プロセスのフローチャートである。プロセス1300は、本明細書に説明されるARシステム(例えば、ウェアラブルシステム200)によって実施されてもよいが、プロセス1300はまた、ロボット、旅行チェックインキオスク、またはセキュリティシステム等の他のコンピューティングシステムによって実施されてもよい。
ブロック1310では、ARシステムは、環境の画像を取得することができる。本明細書に説明されるように、画像は、静止画像、ビデオからの個々のフレーム、またはビデオであってもよい。ARシステムは、画像を外向きに面したイメージングシステム464(図4に示される)、部屋カメラ、または別のコンピューティングデバイスのカメラ(パーソナルコンピュータと関連付けられたウェブカメラ等)から取得することができる。
複数の顔が、環境の画像内に存在し得る。システムは、ウェーブレットベースのカスケードアルゴリズムまたはDNN等の顔認識技法を使用して、これらの顔を特定することができる。環境の画像内の顔の全てうち、顔のうちのいくつかは、ドキュメント上の顔画像であり得る一方、他の顔は、環境内の異なる人々の物理的顔であり得る。
ブロック1320では、ARシステムは、1つ以上のフィルタを使用して、画像内の複数の顔の中から第1の顔を検出することができる。例えば、図12Aを参照して説明されるように、フィルタのうちの1つは、顔と画像を入手するARシステムとの間の距離であってもよい。システムは、第1の顔がデバイスに最も近い距離を有する顔であり得ることを決定してもよい。別の実施例では、ARシステムは、ある距離内の顔のみを検出するように構成されてもよい。第1の顔は、人物の物理的顔であってもよく、その識別は、システムによって検証される。
ブロック1330では、ARシステムは、第1の顔を検出するために使用されるもの等に類似した技法を使用して、画像内の全ての顔の中から少なくとも第2の顔を検出することができる。例えば、システムは、第2の顔が、ARシステム、第1の顔等からある距離内にある顔であり得ることを決定してもよい。
いくつかの実装では、第2の顔は、運転免許証等のドキュメント上の顔であってもよい。ARシステムは、ドキュメント内を検索することによって、第2の顔を検出することができる。ARシステムは、重要点の動きを追跡することによって、ドキュメント内の顔を物理的顔から区別することができる。例えば、ARシステムは、識別された顔の重要点を抽出することができる。ARシステムは、ビデオのシーケンシャルフレーム間の重要点の動きを追跡することができる。顔の動きが、単一平面ホモグラフィによって記述され得る場合、ARシステムは、顔が識別ドキュメント上の顔画像であることを決定し得る。
ブロック1340では、ARシステムは、第1の顔の顔特徴を識別し、顔特徴を使用して、第1の顔を特性評価することができる。ARシステムは、目印検出、テンプレート整合、DNNトリプレットネットワーク、または他の類似技法を使用して、顔を特性評価することができる。ARシステムは、ブロック1350において、同一技法を使用して、第2の顔の顔特徴を識別し、第2の顔を特性評価することができる。
ブロック1360では、ARシステムは、第1の顔および第2の顔の顔特徴を比較することができる。ARシステムは、第1の顔に関するベクトルおよび第2の顔に関する別のベクトルを計算し、2つのベクトル間の距離を計算することができる。2つのベクトル間の距離が、閾値より低い場合、ARシステムは、2つの顔が相互に整合することを決定し得る。他方では、距離が、閾値以上である場合、ARシステムは、2つの顔が異なることを決定し得る。
顔特徴整合に加え、ARシステムはまた、他のファクターを使用して、人物が識別ドキュメントによって記述されるのと同一人物であるかどうかを決定してもよい。例えば、ARシステムは、人物の髪色および眼色を画像から決定してもよい。ARシステムはまた、髪色および眼色情報を識別ドキュメントから抽出することができる。画像から決定された情報が識別ドキュメントから抽出される情報に整合する場合、ARシステムは、人物が識別ドキュメントによって記述される人物に整合する可能性が高いことをフラグしてもよい。他方では、画像から決定された情報が、識別ドキュメントから抽出される情報に完全には整合しない場合、ARシステムは、整合のより低い可能性を示し得る。
(複数のドキュメントの整合の例示的プロセス)
図14は、2つのドキュメント間の整合を決定するための例示的プロセスのフローチャートである。プロセス1400は、本明細書に説明されるARシステムによって実施されてもよいが、プロセス1400はまた、ロボット、旅行チェックインキオスク、またはセキュリティシステム等の他のコンピューティングシステムによって実施されてもよい。
ブロック1410では、ARシステムは、環境の画像を取得することができる。ARシステムは、ブロック1310を参照して説明される類似技法を使用して、画像を取得することができる。
複数のドキュメントが、環境の画像内に存在し得る。例えば、セキュリティ検問所では、ARシステムによって捕捉された画像は、異なる顧客および環境内のフライヤー(flyer)または他のドキュメントによって保持される航空機旅券および識別ドキュメントを含み得る。ARシステムは、ドキュメントの4つの角を見出すこと等によって、重要点認識技法を使用して、これらのドキュメントのうちの1つ以上を検出してもよい。
ブロック1420では、ARシステムは、第1のドキュメントおよび第2のドキュメントを画像内の複数のドキュメントの中から検出することができる。ARシステムは、1つ以上のフィルタを使用して、第1および第2のドキュメントを識別してもよい。例えば、ARシステムは、ある距離内に現れるドキュメントを検出するように構成されてもよい。別の実施例として、ARシステムは、識別ドキュメントまたは航空機旅券等のあるタイプのドキュメントのみを識別し、フライヤーまたは情報通知等の他のドキュメントを除外するように構成されてもよい。
ARシステムはまた、2つのドキュメント内のコンテンツに基づいて、第1および第2のドキュメントを識別することができる。例えば、ARシステムは、ドキュメント上に現れる氏名等の共有情報に基づいて、第1および第2のドキュメントを識別してもよい。いくつかの実施形態では、ARシステムは、別のドキュメント内の情報に基づいて、環境内のドキュメントをルックアップすることができる。例えば、ARシステムは、運転免許証上の氏名を識別し、氏名を使用して、同一氏名を有する航空機旅券を検索することができる。
ブロック1430では、ARシステムは、ドキュメント内の第1の情報をドキュメントの画像から抽出することができる。例えば、ARシステムは、テキスト認識を使用して、識別ドキュメントの有効期限を識別ドキュメントの画像から抽出してもよい。
ブロック1440では、ARシステムは、ドキュメントと関連付けられた第2の情報を取得することができる。例えば、ARシステムは、ドキュメント上の光学ラベルを識別し、ARシステムのセンサを使用して、光学ラベルを走査することができる。ARシステムは、光学ラベルに基づいて、別のデータソースを参照することができ、ドキュメント内で直接知覚可能ではない付加的情報を取得することができる。いくつかの実装では、第1の情報および第2の情報は、同一カテゴリ内にあってもよい。例えば、第1の情報が、ドキュメントの有効期限である場合、ARシステムは、光学ラベルを走査し、ドキュメントの有効期限を別のデータソースから読み出してもよい。有効期限に加え、情報のカテゴリはまた、例えば、生年月日、有効期限、出発時間、髪色、眼色、虹彩コード等を含んでもよい。
ブロック1450では、ARシステムは、第1の情報が第2の情報と一貫するかどうかを決定することができる。例えば、図12Bに示されるように、ARシステムは、運転免許証上の氏名が航空機旅券上の氏名に整合するかどうかを決定することができる。本明細書に説明されるように、整合は、100%整合を要求しない。例えば、ARシステムは、運転免許証が、乗客の完全なミドルネームを有する一方、航空機旅券が、乗客のミドルネームのイニシャルのみを有する場合でも、整合を検出してもよい。
第1の情報が、第2の情報に整合する場合、ブロック1460では、ARシステムは、第1のドキュメントまたは第2のドキュメントのいずれか(または両方)が有効であることを決定し得る。ARシステムは、視覚的焦点インジケータ(ドキュメントの周囲の後光等)を提供することによって、第1のドキュメントおよび/または第2のドキュメントをフラグすることができる。ARシステムはまた、図12Aに示されるように、単語「整合」等の仮想注釈を提供することができる。
他方では、第1の情報が、第2の情報と一貫しない場合、ブロック1470では、ARシステムは、第1の情報および第2の情報が整合しないことのインジケーションを提供してもよい。例えば、ARシステムは、ハイライト等の視覚的焦点インジケータを提供し、第1の情報と第2の情報との間の非一貫性を示してもよい。いくつかの実施形態では、ARシステムは、第1の情報と第2の情報との間の不整合に基づいて、ドキュメントのうちの少なくとも1つが無効であることを決定してもよい。
いくつかの実装では、ARシステムは、ドキュメント内の複数の情報を比較し、比較に基づいて、信頼度スコアを計算してもよい。ARシステムは、信頼度スコアと閾値スコアを比較することによって、ドキュメントを有効(または無効)としてフラグしてもよい。(複数のドキュメントを使用して人物を認証する例示的プロセス)
図15は、人物と複数のドキュメントとの間の整合を決定するための例示的プロセスのフローチャートである。プロセス1500は、本明細書に説明されるARシステム(例えば、ウェアラブルシステム200)によって実施されてもよいが、プロセス1500はまた、ロボット、旅行チェックインキオスク、またはセキュリティシステム等の他のコンピューティングシステムによって実施されてもよい。
ブロック1510では、ARシステムは、環境の画像を取得することができる。ARシステムは、外向きに面したイメージングシステム464(図4に示される)を使用して、画像を取得することができる。ARシステムは、画像内の第1のドキュメント、第2のドキュメント、および人物を検出してもよい。例えば、ARシステムによって捕捉された画像は、第1のドキュメントおよび第2のドキュメントを保持する人物を含んでもよい。
ブロック1520では、ARシステムは、環境の画像を分析し、情報を第1のドキュメントから抽出することができる。抽出された情報は、人物のバイオメトリック情報を含んでもよい。
ブロック1532では、ARシステムは、情報を第2のドキュメントから抽出することができる。抽出された情報は、バイオメトリック情報を含んでもよい。ARシステムは、第2のドキュメントの画像を分析することによって、そのような情報を抽出してもよい。ARシステムはまた、情報を第2のドキュメントから直接抽出してもよい。例えば、ARシステムは、ヒト可視スペクトル外の光(UV光等)を第2のドキュメント上に放出し、ヒト可視スペクトル内の光で照明されたときに知覚可能ではない情報を識別してもよい。別の実施例として、ARシステムは、第2のドキュメントの光学ラベルを走査し、光学ラベル内の情報を使用し、付加的情報を別のデータソースから取得してもよい。
いくつかの実装では、第1のドキュメントから抽出される情報は、第2のドキュメントから抽出される情報と同一カテゴリ内にあってもよい。例えば、ARシステムは、第1のドキュメント内の人物の氏名を識別し、第2のドキュメント内の別の氏名を識別してもよい。ブロック1542では、ARシステムは、第1のドキュメント上の氏名が第2のドキュメント上の氏名に整合するかどうか等、情報および第2の情報が相互に整合するかどうかを決定することができる。
ブロック1552では、ARシステムは、第1および第2のドキュメント内の情報の一貫性に基づいて、第1のドキュメントと第2のドキュメントとの間のリンケージを決定することができる。例えば、第1のドキュメントおよび第2のドキュメントが、同一氏名を示す場合、第1および第2のドキュメント間にリンケージが存在する可能性がより高い。ARシステムは、第1および第2のドキュメント内の情報の複数のカテゴリを使用して、リンケージを決定してもよい。例えば、氏名の比較に加え、ARシステムはまた、2つのドキュメントの居住住所を比較することができる。ARシステムが、2つのドキュメントが、同一氏名を有するが、異なる住所であることを決定する場合、ARシステムは、2つのドキュメント間のリンケージの存在の可能性が低いことを決定し得る。いくつかの実施形態では、ARシステムは、別のデータソースを参照し、リンケージをさらに決定してもよい。例えば、ARシステムは、住所を人口統計データベース内でルックアップしてもよい。両住所が、人物の氏名にリンクされる場合、ARシステムは、2つのドキュメント間のリンケージの存在の可能性を増加させてもよい。
本明細書に説明されるように、いくつかの実施形態では、ARシステムが、第1のドキュメントおよび第2のドキュメント内の情報が一貫しないことを決定する場合、ARシステムは、非一貫性をフラグしてもよい。例えば、ARシステムが、運転免許証上の氏名が人物によって提示される航空機旅券上の氏名に整合しないことを決定すると、ARシステムは、単語「不整合」を表示する、または第1および/または第2のドキュメントの氏名を強調してもよい。
ブロック1532、1542、および1552に加え、またはその代替として、ARシステムは、ブロック1534、1544、および1554を実施し、リンケージを検出してもよい。ブロック1534では、ARシステムは、人物のバイオメトリック情報を環境の画像から抽出することができる。例えば、ARシステムは、人物の顔を識別し、人物の顔特徴を分析してもよい。
ブロック1544では、ARシステムは、人物のバイオメトリック情報がドキュメントからのバイオメトリック情報に整合するかどうかを決定することができる。図12Aおよび12Bを参照して説明されるように、ARシステムは、人物の顔特徴が識別ドキュメント上の画像の顔特徴に整合するかどうかを決定することができる。
ブロック1554では、ARシステムは、1つ以上の情報の整合に基づいて、ドキュメントと人物との間のリンケージを検出することができる。図12Aおよび12Bを参照して説明されるように、ARシステムは、人物の顔とドキュメント内の顔との間の顔特徴の類似性および非類似性を決定してもよい。ARシステムはまた、ドキュメント内の髪色の記述が人物の髪色に整合するかどうか、ドキュメント上の虹彩コードが人物を走査することによって生成された虹彩コードに整合するかどうか等の他のファクターを使用して、人物がドキュメントによって記述されるのと同一人物である可能性がより高いかどうかを決定してもよい。ARシステムは、1つまたはファクターに基づいて、信頼度スコアを計算することができる。ARシステムは、信頼度スコアが閾値に合格するかどうかに基づいて、リンケージが存在するかどうかを決定することができる。
随意に、ブロック1560では、ARシステムは、第1のドキュメント、第2のドキュメント、および人物内の情報を分析し、それらの間にリンケージが存在するかどうかを決定することができる。例えば、図12Bを参照して説明されるように、ARシステムは、人物の顔特徴を分析し、顔特徴を使用して、人物の氏名を別のデータソース内でルックアップすることができる。ARシステムは、本氏名と第1および第2のドキュメント内の氏名を比較し、全3つの氏名が一貫するかどうかを決定することができる。氏名が一貫する場合、ARシステムは、第1のドキュメント、第2のドキュメント、および人物間にリンケージを作成することができる。そうでなければ、ARシステムは、それらの間のリンケージの可能性を示す、またはリンケージが存在しないことを示してもよい。
別の実施例では、識別ドキュメントと人物との間のリンケージが存在し得るが、他のドキュメントとのリンケージが存在しない場合がある。これは、例えば、ある人物が、自身の運転免許証を保持するが、別の人物のフライト旅券を使用するときに起こり得る。本状況では、ARシステムは、人物と運転免許証との間のリンケージが存在する場合でも、2つのドキュメント間にリンケージを作成しないように構成されてもよい。ある実施形態では、ブロック1552および1554は、随意であってもよい。例えば、ARシステムは、ブロック1552および1554を実施せずに、ブロック1560を直接実施することができる。
いくつかの実装では、ARシステムは、周囲を検索し、リンケージを有し得るドキュメントを識別することができる。例えば、ARシステムが、1人の人物が運転免許証および航空機旅券を保持する一方、別の人物が異なる運転免許証を保持する、画像を取得すると、ARシステムは、それらが異なる人々に属するため、2つの運転免許証間にリンケージが存在しないことを決定し得る。ARシステムは、別のドキュメント(航空機旅券等)を検索し、例えば、同一人物の氏名が両ドキュメント上に現れるため、他のドキュメントおよび運転免許証がリンケージを有することを決定し得る。
本明細書に説明される実施例は、人物とドキュメントとの間のリンケージ(例えば、整合/不整合)を検出することができるが、ある実装では、ARシステムはまた、2人の人物間のリンケージを検出することができる。例えば、ARシステムは、環境内の2人の異なる個人と対応する2つの顔を検出し、2つの顔の顔特徴を比較し、個人が類似しているようである(例えば、彼らが双子または兄弟であるため)ことまたは異なっているようである(例えば、彼らが非関連の見知らぬ人であるため)ことを決定することができる。
(付加的実施形態)
第1の側面では、人物と人物によって提示されるドキュメントを整合させるための方法であって、コンピュータハードウェアを備える拡張現実(AR)システムの制御下で、ARシステムは、環境をイメージングするように構成される外向きに面したカメラを備え、外向きに面したカメラを用いて、環境の画像を取得することと、画像内の第1の顔を検出することであって、第1の顔は、環境内の人物と関連付けられる、ことと、画像内の第2の顔を検出することであって、第2の顔は、人物と関連付けられた識別ドキュメント内に含まれる、ことと、第1の顔と関連付けられた第1の顔特徴を識別することと、第2の顔と関連付けられた第2の顔特徴を識別することと、少なくとも部分的に、第1の顔特徴および第2の顔特徴の比較に基づいて、人物と識別ドキュメントとの間の整合を決定することとを含む、方法。
第2の側面では、第1の顔を検出することまたは第2の顔を検出することは、ウェーブレットベースのブーストカスケードアルゴリズムまたは深層ニューラルネットワークアルゴリズムのうちの少なくとも1つを使用して、画像内の第1の顔または第2の顔を特定することを含む、側面1に記載の方法。
第3の側面では、画像は、複数の顔を備え、第1の顔を検出することまたは第2の顔を検出することは、フィルタを適用し、関連顔を識別することを含む、側面1-2のいずれか1項に記載の方法。
第4の側面では、第2の顔を検出することは、第2の顔の動きを分析することと、第2の顔の動きが単一平面ホモグラフィによって記述されることの決定に応答して、第2の顔を検出することとを含む、側面1-3のいずれか1項に記載の方法。
第5の側面では、第1の顔特徴を識別することまたは第2の顔特徴を識別することは、それぞれ、少なくとも部分的に、第1の顔特徴に基づいて、第1の顔と関連付けられた第1の特徴ベクトルを計算すること、または少なくとも部分的に、第2の顔特徴に基づいて、第2の顔と関連付けられた第2の特徴ベクトルを計算することを含む、側面1-4のいずれか1項に記載の方法。
第6の側面では、少なくとも部分的に、個別の第1の顔特徴の場所に基づいて、第1の加重を第1の顔特徴に割り当てること、または少なくとも部分的に、個別の第2の顔特徴の場所に基づいて、第2の加重を第2の顔特徴に割り当てることをさらに含む、側面5に記載の方法。
第7の側面では、第1の特徴ベクトルを計算することまたは第2の特徴ベクトルを計算することは、顔目印検出アルゴリズム、深層ニューラルネットワークアルゴリズム、またはテンプレート整合アルゴリズムのうちの1つ以上を使用して実施される、側面5-6のいずれか1項に記載の方法。
第8の側面では、整合を決定することは、第1の特徴ベクトルと第2の特徴ベクトルとの間の距離を計算することと、距離を閾値と比較することと、距離が閾値に合格したとき、整合を確認することとを含む、側面5-7のいずれか1項に記載の方法。
第9の側面では、距離は、ユークリッド距離である、側面8に記載の方法。
第10の側面では、識別ドキュメントは、識別ドキュメントがヒト可視スペクトル(HVS)内の光で照明されたときに直接知覚可能ではない、隠蔽された情報を含む、側面1-9のいずれか1項に記載の方法。
第11の側面では、隠蔽された情報は、クイックレスポンスコード、バーコード、または虹彩コードのうちの1つ以上を備える、ラベル内にエンコードされる、側面1-10のいずれか1項に記載の方法。
第12の側面では、ラベルは、別のデータソースへの参照を備える、側面11に記載の方法。
第13の側面では、少なくとも部分的に、環境の画像の分析に基づいて、人物の第1のバイオメトリック情報を取得することと、第2のバイオメトリック情報を識別ドキュメントから取得することとをさらに含む、側面1-12のいずれか1項に記載の方法。
第14の側面では、第2のバイオメトリック情報を取得することは、識別ドキュメント上のラベルを走査し、ラベル内にエンコードされた隠蔽された情報を読み出すこと、識別ドキュメントによって提供される参照を使用して、バイオメトリック情報を他のデータソースから読み出すこと、または識別ドキュメントを紫外線光で照明し、識別ドキュメント内の隠蔽された情報を露見させることであって、隠蔽された情報は、HVS内の光で照明されたときに可視ではない、ことのうちの1つ以上を含む、側面13に記載の方法。
第15の側面では、整合を決定することはさらに、第1のバイオメトリック情報と第2のバイオメトリック情報を比較し、第1のバイオメトリック情報が第2のバイオメトリック情報と一貫するかどうかを決定することを含む、側面13-14のいずれか1項に記載の方法。
第16の側面では、第1のバイオメトリック情報または第2のバイオメトリック情報は、指紋、虹彩コード、身長、性別、髪色、眼色、または体重のうちの1つ以上を含む、側面13-15のいずれか1項に記載の方法。
第17の側面では、識別ドキュメントは、運転免許証、パスポート、またはステートIDカード(state identification card)のうちの少なくとも1つを含む、側面1-16のいずれか1項に記載の方法。
第18の側面では、拡張現実(AR)システムを使用して、人物の識別を検証するための方法であって、コンピュータハードウェアを備えるARシステムの制御下で、ARシステムは、環境をイメージングするように構成される外向きに面したカメラと、ヒト可視スペクトル(HVS)外の光を放出するように構成される光学センサとを備え、外向きに面したカメラを用いて、環境の画像を取得することと、少なくとも部分的に、環境の画像の分析に基づいて、人物と関連付けられた第1のバイオメトリック情報を識別することと、人物によって提示されるドキュメント内の第2のバイオメトリック情報を識別することと、第1のバイオメトリック情報と第2のバイオメトリック情報との間の整合を決定することとを含む、方法。
第19の側面では、光学センサによって放出される光は、紫外線光を含む、側面18に記載の方法。
第20の側面では、第1のバイオメトリック情報または第2のバイオメトリック情報は、顔、指紋、虹彩コード、身長、性別、髪色、眼色、または体重のうちの1つ以上を含む、側面18-19のいずれか1項に記載の方法。
第21の側面では、第1のバイオメトリック情報を識別することおよび第2のバイオメトリック情報を識別することは、画像内の第1の顔を検出することであって、第1の顔は、第1の顔特徴を含み、人物と関連付けられる、ことと、画像内の第2の顔を検出することであって、第2の顔は、第2の顔特徴を含み、人物によって提示されるドキュメント内に含まれる、こととを含む、側面18-20のいずれか1項に記載の方法。
第22の側面では、第1の顔を検出することまたは第2の顔を検出することは、ウェーブレットベースのブーストカスケードアルゴリズムまたは深層ニューラルネットワークアルゴリズムのうちの少なくとも1つを使用して、画像内の第1の顔または第2の顔を特定することを含む、側面21に記載の方法。
第23の側面では、整合を決定することは、それぞれ、または少なくとも部分的に、第2の顔特徴に基づいて、第2の顔に関する第2の特徴ベクトルを計算することと、第1の特徴ベクトルと第2の特徴ベクトルとの間の距離を計算すること、距離を閾値と比較し、距離が閾値に合格したとき、整合を確認することとを含む、側面21-22のいずれか1項に記載の方法。
第24の側面では、少なくとも部分的に、個別の第1の顔特徴の場所に基づいて、第1の加重を第1の顔特徴に割り当てること、または少なくとも部分的に、個別の第2の顔特徴の場所に基づいて、第2の加重を第2の顔特徴に割り当てることをさらに含む、側面21-23のいずれか1項に記載の方法。
第25の側面では、距離は、ユークリッド距離である、側面23-24のいずれか1項に記載の方法。
第26の側面では、第1の特徴ベクトルを計算することまたは第2の特徴ベクトルを計算することは、顔目印検出アルゴリズム、深層ニューラルネットワークアルゴリズム、またはテンプレート整合アルゴリズムのうちの1つ以上を使用して実施される、側面23-25のいずれか1項に記載の方法。
第27の側面では、第2の情報を識別することは、光学センサによって、光をドキュメント上に放出することであって、光は、HVS外である、ことと、光学センサによって放出される光下で情報を識別することであって、第2の情報は、HVS内の光で照明されたときに直接可視ではない、こととを含む、側面18-19のいずれか1項に記載の方法。
第28の側面では、第2の情報を識別することは、ドキュメント内のラベルを識別することであって、ラベルは、エンコードされたバイオメトリック情報を含有する、ことと、少なくとも部分的に、ラベルの分析に基づいて、デコードされたバイオメトリック情報を読み出すこととを含む、側面18-19のいずれか1項に記載の方法。
第29の側面では、デコードされたバイオメトリック情報を読み出すことは、バイオメトリック情報を環境の画像以外のデータソースから読み出すことを含む、側面28に記載の方法。
第30の側面では、ドキュメントは、識別ドキュメントを含む、側面29に記載の方法。
第31の側面では、外向きに面したカメラと、コンピュータハードウェアとを備える、拡張現実(AR)システムであって、ARシステムは、側面1-17に記載の方法のうちの任意の1つを実施するように構成される、ARシステム。
第32の側面では、環境をイメージングするように構成される、外向きに面したカメラと、ヒト可視スペクトル外の光を放出するように構成される、光学センサと、コンピュータハードウェアとを備える、拡張現実(AR)システムであって、ARシステムは、側面18-30に記載の方法のうちの任意の1つを実施するように構成される、ARシステム。
第33の側面では、拡張現実(AR)システムを使用して、2つのドキュメント間のリンケージを決定するための方法であって、コンピュータハードウェアを備えるARシステムの制御下で、ARシステムは、環境をイメージングするように構成される外向きに面したカメラと、ヒト可視スペクトル(HVS)外の光を放出するように構成される光学センサとを備え、環境の画像を取得することと、画像内の第1のドキュメントおよび第2のドキュメントを検出することと、少なくとも部分的に、画像の分析に基づいて、第1の情報を第1のドキュメントから抽出することと、第2の情報を第2のドキュメントから抽出することであって、第1の情報および第2の情報は、同一カテゴリ内にある、ことと、第1の情報と第2の情報との間の整合を決定することと、第1の情報と第2の情報との間の整合が存在することの決定に応答して、第1のドキュメントと第2のドキュメントとの間のリンケージを決定することとを含む、方法。
第34の側面では、光学センサによって放出される光は、紫外線光を含む、側面33に記載の方法。
第35の側面では、第1の情報および第2の情報は、氏名、住所、有効期限、人物の写真、指紋、虹彩コード、身長、性別、髪色、眼色、または体重を含む、側面33-34のいずれか1項に記載の方法。
第36の側面では、第2の情報は、HVS内の光で照明されたときに不可視である、側面33-35のいずれか1項に記載の方法。
第37の側面では、第2の情報を抽出することは、光学センサによって、第2のドキュメント上に光を放出することであって、光の少なくとも一部は、HVS外である、ことと、光学センサによって放出される光下で第2の情報を識別することであって、第2の情報は、通常光学条件下でヒトに直接可視ではない、こととを含む、側面36に記載の方法。
第38の側面では、第2の情報を抽出することは、第2のドキュメント内のラベルを識別することであって、ラベルは、別のデータソースへの参照を含有する、ことと、他のデータソースと通信し、第2の情報を読み出すこととを含む、側面33-36のいずれか1項に記載の方法。
第39の側面では、ラベルは、クイックレスポンスコードまたはバーコードのうちの1つ以上を備える、側面38に記載の方法。
第40の側面では、整合を決定することは、第1の情報および第2の情報を比較することと、少なくとも部分的に、第1の情報と第2の情報との間の類似性または非類似性に基づいて、信頼度スコアを計算することと、信頼度スコアが閾値に合格したとき、整合を検出することとを含む、側面33-39のいずれか1項に記載の方法。
第41の側面では、少なくとも部分的に、決定された整合に基づいて、第1のドキュメントまたは第2のドキュメントのうちの少なくとも1つを有効としてフラグすることをさらに含む、側面33-40のいずれか1項に記載の方法。
第42の側面では、第1の情報と第2の情報との間の整合が存在しないことの決定に応答して、第1の情報および第2の情報が整合しないことのインジケーションを提供することをさらに含み、インジケーションは、焦点インジケータを備える、側面33-41のいずれか1項に記載の方法。
第43の側面では、第1のドキュメントおよび第2のドキュメントを検出することは、少なくとも部分的に、フィルタに基づいて、第1のドキュメントおよび第2のドキュメントを識別することを含む、側面33-42のいずれか1項に記載の方法。
第44の側面では、拡張現実(AR)システムを使用して、人物と複数のドキュメントとの間のリンケージを決定するための方法であって、コンピュータハードウェアを備えるARシステムの制御下で、ARシステムは、環境をイメージングするように構成される外向きに面したカメラと、ヒトの可視スペクトル外の光を放出するように構成される光学センサとを備え、環境の画像を取得することと、画像内の人物、第1のドキュメント、および第2のドキュメントを検出することと、少なくとも部分的に、第1のドキュメントの画像の分析に基づいて、第1の個人情報を抽出することと、第2の個人情報を第2のドキュメントから抽出することと、少なくとも部分的に、人物の画像の分析に基づいて、人物の第3の個人情報を抽出することであって、第1の個人情報、第2の個人情報、および第3の個人情報は、同一カテゴリ内にある、ことと、第1の個人情報、第2の個人情報、および第3の個人情報間の整合を決定することと、第1の個人情報、第2の情報、および第3の個人情報間に整合が存在することの決定に応答して、第1のドキュメント、第2のドキュメント、および人物間のリンケージを決定することとを含む、方法。
第45の側面では、光学センサによって放出される光は、紫外線光を含む、側面44に記載の方法。
第46の側面では、第1の個人情報、第2の人物情報、または第3の個人情報は、氏名、住所、有効期限、人物の写真、指紋、虹彩コード、身長、性別、髪色、眼色、または体重を含む、側面44-45のいずれか1項に記載の方法。
第47の側面では、第1の個人情報を抽出することおよび第3の個人情報を抽出することは、画像内の第1の顔を検出することであって、第1の顔は、第1のドキュメント内に含まれる、ことと、画像内の第2の顔を検出することであって、第2の顔は、環境内の人物と関連付けられる、ことと、第1の顔と関連付けられた第1の顔特徴を識別することと、第2の顔と関連付けられた第2の顔特徴を識別することとを含む、側面44に記載の方法。
第48の側面では、第1の顔を検出することまたは第2の顔を検出することは、ウェーブレットベースのブーストカスケードアルゴリズムまたは深層ニューラルネットワークアルゴリズムのうちの少なくとも1つを使用して、画像内の第1の顔または第2の顔を特定することを含む、側面47に記載の方法。
第49の側面では、第1の顔を検出することは、第1の顔の動きを分析することと、第2の顔の動きが単一平面ホモグラフィによって記述されることの決定に応答して、第1の顔を検出することとを含む、側面47-48のいずれか1項に記載の方法。
第50の側面では、第1の顔特徴を識別することまたは識別する第2の顔特徴を識別することは、それぞれ、少なくとも部分的に、第1の顔特徴に基づいて、第1の顔と関連付けられた第1の特徴ベクトルを計算すること、または少なくとも部分的に、第2の顔特徴に基づいて、第2の顔と関連付けられた第2の特徴ベクトルを計算することを含む、側面47-49のいずれか1項に記載の方法。
第51の側面では、少なくとも部分的に、個別の第1の顔特徴の場所に基づいて、第1の加重を第1の顔特徴に割り当てること、または少なくとも部分的に、個別の第2の顔特徴の場所に基づいて、第2の加重を第2の顔特徴に割り当てることをさらに含む、側面50に記載の方法。
第52の側面では、第1の特徴ベクトルを計算することまたは第2の特徴ベクトルを計算することは、顔目印検出アルゴリズム、深層ニューラルネットワークアルゴリズム、またはテンプレート整合アルゴリズムのうちの1つ以上を使用して実施される、側面50-51のいずれか1項に記載の方法。
第53の側面では、整合を決定することは、第1の特徴ベクトルと第2の特徴ベクトルとの間の距離を計算することと、距離を閾値と比較することと、距離が閾値に合格したとき、整合を確認することとを含む、側面47-52のいずれか1項に記載の方法。
第54の側面では、距離は、ユークリッド距離である、側面53に記載の方法。
第55の側面では、第2の個人情報は、HVS内の光で照明されたときに不可視である、側面44-54に記載の方法。
第56の側面では、第2の個人情報を抽出することは、光学センサによって、第2のドキュメント上に光を放出することであって、光の少なくとも一部は、HVS外である、ことと、光学センサによって放出される光下で第2の個人情報を識別することであって、第2の個人情報は、通常光学条件下でヒトに直接可視ではない、こととを含む、側面55に記載の方法。
第57の側面では、第2の個人情報を抽出することは、第2のドキュメント内のラベルを識別することであって、ラベルは、別のデータソースへの参照を含有する、ことと、他のデータソースと通信し、第2の個人情報を読み出すこととを含む、側面44-55のいずれか1項に記載の方法。
第58の側面では、ラベルは、クイックレスポンスコードまたはバーコードのうちの1つ以上を備える、側面57に記載の方法。
第59の側面では、整合を決定することは、第1の個人情報および第2の個人情報を比較することと、少なくとも部分的に、第1の個人情報と第2の個人情報との間の類似性または非類似性に基づいて、信頼度スコアを計算することと、信頼度スコアが閾値に合格したとき、整合を検出することとを含む、側面44-58のいずれか1項に記載の方法。
第60の側面では、少なくとも部分的に、検出された整合に基づいて、第1のドキュメントまたは第2のドキュメントのうちの少なくとも1つを有効としてフラグすることをさらに含む、側面44-59のいずれか1項に記載の方法。
第61の側面では、第1の個人情報、第2の個人情報、および第3の個人情報のうちの少なくとも2つ間に整合が存在しないことの決定に応答して、整合が存在しないことを示すインジケーションを提供することをさらに含む、側面44-60のいずれか1項に記載の方法。
第62の側面では、環境内において、第1の個人情報、第2の個人情報、または第3の個人情報のうちの少なくとも1つに整合する情報を含む、第4のドキュメントを検索することをさらに含む、側面61に記載の方法。
第63の側面では、第1のドキュメントまたは第2のドキュメントは、識別ドキュメントまたは航空機旅券を含む、側面44-62のいずれか1項に記載の方法。
第64の側面では、画像内の人物、第1のドキュメント、および第2のドキュメントを検出することは、少なくとも部分的に、フィルタに基づいて、人物、第1のドキュメント、または第2のドキュメントを識別することを含む、側面44-63のいずれか1項に記載の方法。
第65の側面では、コンピュータハードウェアを備える、拡張現実(AR)システムであって、ARシステムは、環境をイメージングするように構成される、外向きに面したカメラと、ヒト可視スペクトル外の光を放出するように構成される、光学センサとを備え、ARシステムは、側面33-64に記載の方法のうちの任意の1つを実施するように構成される、ARシステム。
第66の側面では、AR環境内のリンケージを検出するための拡張現実(AR)システムであって、拡張現実システムは、ARシステムの環境をイメージングするように構成される、外向きに面したイメージングシステムと、3次元(3D)ビュー内の仮想コンテンツをARシステムのユーザに提示するように構成される、ARディスプレイと、ハードウェアプロセッサであって、外向きに面したイメージングシステムを用いて、環境の画像を取得することと、画像内の第1の顔および第2の顔を検出することであって、第1の顔は、環境内の人物の顔であり、第2の顔は、識別ドキュメント上の顔である、ことと、第1の顔と関連付けられた第1の顔特徴に基づいて、第1の顔を認識することと、第2の顔特徴に基づいて、第2の顔を認識することと、第1の顔特徴および第2の顔特徴を分析し、人物と識別ドキュメントとの間のリンケージを検出することと、ARディスプレイに、第1の顔特徴および第2の顔特徴の分析の結果を示す仮想注釈を提示するように命令することとを行うようにプログラムされる、ハードウェアプロセッサとを備える、拡張現実システム。
第67の側面では、第1の顔および第2の顔を検出するために、ハードウェアプロセッサは、ウェーブレットベースのブーストカスケードアルゴリズムまたは深層ニューラルネットワークアルゴリズムのうちの少なくとも1つを画像に適用するようにプログラムされる、側面66に記載のARシステム。
第68の側面では、ハードウェアプロセッサはさらに、第2の顔の動きを分析することによって、第2の顔が識別ドキュメント上の顔であることを検出することと、動きが単一平面ホモグラフィによって記述されるかどうかを決定することとを行うようにプログラムされる、側面66-67のいずれか1項に記載のARシステム。
第69の側面では、第1の顔または第2の顔を認識するために、ハードウェアプロセッサは、それぞれ、顔目印検出アルゴリズム、深層ニューラルネットワークアルゴリズム、またはテンプレート整合アルゴリズムのうちの少なくとも1つを適用することによって、少なくとも部分的に、第1の顔特徴に基づいて、第1の顔と関連付けられた第1の特徴ベクトルを計算すること、または、少なくとも部分的に、第2の顔特徴に基づいて、第2の顔と関連付けられた第2の特徴ベクトルを計算することを行うようにプログラムされる、側面66-68のいずれか1項に記載のARシステム。
第70の側面では、人物と識別ドキュメントとの間のリンケージを検出するために、ハードウェアプロセッサは、第1の特徴ベクトルと第2の特徴ベクトルとの間の距離を計算することと、距離を閾値と比較することと、距離が閾値に合格することの決定に応答して、リンケージを検出することとを行うようにプログラムされる、側面69に記載のARシステム。
第71の側面では、距離は、ユークリッド距離である、側面70に記載のARシステム。
第72の側面では、識別ドキュメントは、クイックレスポンスコード、バーコード、または虹彩コードのうちの1つ以上を備える、ラベルを有する、側面66-71のいずれか1項に記載のARシステム。
第73の側面では、ハードウェアプロセッサはさらに、ラベルを環境の画像から識別することと、ラベルを使用して、外部データソースにアクセスし、人物のバイオメトリック情報を読み出すこととを行うようにプログラムされる、側面72に記載のARシステム。
第74の側面では、ARシステムはさらに、ヒト可視スペクトル(HVS)外の光を照明するように構成される、光学センサを備え、ハードウェアプロセッサはさらに、光学センサに、光を識別ドキュメントに向かって照明し、識別ドキュメント内の隠蔽された情報を露見させるように命令することと、識別ドキュメントの画像を分析することであって、画像は、識別ドキュメントが光で照明されたときに入手される、ことと、バイオメトリック情報を画像から抽出することであって、抽出されたバイオメトリック情報は、人物と識別ドキュメントとの間のリンケージを検出するために使用される、こととを行うようにプログラムされる、側面66-73のいずれか1項に記載のARシステム。
第75の側面では、ハードウェアプロセッサは、第1の顔特徴と第2の顔特徴との間の整合の可能性を計算するようにプログラムされる、側面66-74のいずれか1項に記載のARシステム。
第76の側面では、注釈は、人物および識別ドキュメントをリンクさせる視覚的焦点インジケータを備える、側面66-75のいずれか1項に記載のARシステム。
第77の側面では、拡張現実環境内のリンケージを検出するための方法であって、外向き撮像イメージングシステムおよびハードウェアプロセッサを備える拡張現実デバイスの制御下で、拡張現実デバイスは、仮想コンテンツを拡張現実デバイスの装着者に表示するように構成され、環境の画像を取得することと、画像内の人物、第1のドキュメント、および第2のドキュメントを検出することと、少なくとも部分的に、第1のドキュメントの画像の分析に基づいて、第1の個人情報を抽出することと、第2のドキュメントと関連付けられた第2の個人情報にアクセスすることと、少なくとも部分的に、人物の画像の分析に基づいて、人物の第3の個人情報を抽出することであって、第1の個人情報、第2の個人情報、および第3の個人情報は、同一カテゴリ内にある、ことと、第1の個人情報、第2の個人情報、および第3の個人情報間の整合の可能性を決定することと、整合の可能性が閾値条件を超えることの決定に応答して、第1のドキュメント、第2のドキュメント、および人物間のリンケージを表示することとを含む、方法。
第78の側面では、環境の画像を取得することは、拡張現実デバイスの外向きに面したイメージングシステムによって入手された画像にアクセスすることを含む、側面77に記載の方法。
第79の側面では、第1の個人情報および第3の個人情報を抽出することは、画像内の第1の顔を検出することであって、第1の顔は、第1のドキュメント内に含まれる、ことと、画像内の第2の顔を検出することであって、第2の顔は、環境内の人物と関連付けられる、ことと、第1の顔と関連付けられた第1の顔特徴および第2の顔と関連付けられた第2の顔特徴を識別することと、それぞれ、第1の顔特徴および第2の顔特徴に基づいて、第1の顔および第2の顔を認識することとを含む、側面77-78のいずれか1項に記載の方法。
第80の側面では、第1の顔を検出することまたは第2の顔を検出することは、ウェーブレットベースのブーストカスケードアルゴリズムまたは深層ニューラルネットワークアルゴリズムを適用することを含む、側面79に記載の方法。
第81の側面では、第1の顔を認識することおよび第2の顔を認識することは、それぞれ、顔目印検出アルゴリズム、深層ニューラルネットワークアルゴリズム、またはテンプレート整合アルゴリズムのうちの少なくとも1つを適用することによって、少なくとも部分的に、第1の顔特徴に基づいて、第1の顔と関連付けられた第1の特徴ベクトルを計算することと、少なくとも部分的に、第2の顔特徴に基づいて、第2の顔と関連付けられた第2の特徴ベクトルを計算することとを含む、側面79-80のいずれか1項に記載の方法。
第82の側面では、第2の個人情報にアクセスすることは、光が第2のドキュメント上に当てられたとき、第2のドキュメントの画像を入手することであって、光の少なくとも一部は、ヒト可視スペクトル外にある、ことと、第2のドキュメントの入手された画像に基づいて、第2の個人情報を識別することであって、第2の個人情報は、通常光学条件下、ヒトに直接可視ではない、こととを含む、側面77-81のいずれか1項に記載の方法。
第83の側面では、第2の個人情報にアクセスすることは、ラベルを環境の画像から識別することと、ラベルを使用して、複数の人物の個人情報を記憶するデータソースにアクセスし、人物のバイオメトリック情報を読み出すこととを含む、側面77-82のいずれか1項に記載の方法。
第84の側面では、整合の可能性を決定することは、第1の個人情報および第2の個人情報を比較することと、少なくとも部分的に、第1の個人情報と第2の個人情報との間の類似性または非類似性に基づいて、信頼度スコアを計算することとを含む、側面77-83のいずれか1項に記載の方法。
第85の側面では、信頼度スコアが閾値を超えることの決定に応答して、第1のドキュメントまたは第2のドキュメントのうちの少なくとも1つを有効として示す仮想注釈を表示することをさらに含む、側面84に記載の方法。
(他の考慮点)
本明細書に説明される、および/または添付される図に描写されるプロセス、方法、およびアルゴリズムはそれぞれ、具体的かつ特定のコンピュータ命令を実行するように構成される、1つ以上の物理的コンピューティングシステム、ハードウェアコンピュータプロセッサ、特定用途向け回路、および/または電子ハードウェアによって実行される、コードモジュールにおいて具現化され、それによって完全または部分的に自動化され得る。例えば、コンピューティングシステムは、具体的コンピュータ命令とともにプログラムされた汎用コンピュータ(例えば、サーバ)または専用コンピュータ、専用回路等を含むことができる。コードモジュールは、実行可能プログラムにコンパイルおよびリンクされ得る、動的リンクライブラリ内にインストールされ得る、または解釈されるプログラミング言語において書き込まれ得る。いくつかの実装では、特定の動作および方法が、所与の機能に特有の回路によって実施され得る。
さらに、本開示の機能性のある実装は、十分に数学的、コンピュータ的、または技術的に複雑であるため、(適切な特殊化された実行可能命令を利用する)特定用途向けハードウェアまたは1つ以上の物理的コンピューティングデバイスは、例えば、関与する計算の量または複雑性に起因して、または結果を実質的にリアルタイムで提供するために、機能性を実施する必要があり得る。例えば、ビデオは、多くのフレームを含み、各フレームは、数百万のピクセルを有し得、具体的にプログラムされたコンピュータハードウェアは、商業的に妥当な時間量において所望の画像処理タスクまたは用途を提供するようにビデオデータを処理する必要がある。
コードモジュールまたは任意のタイプのデータは、ハードドライブ、ソリッドステートメモリ、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、光学ディスク、揮発性または不揮発性記憶装置、同一物の組み合わせ、および/または同等物を含む、物理的コンピュータ記憶装置等の任意のタイプの非一過性コンピュータ可読媒体上に記憶され得る。本方法およびモジュール(またはデータ)はまた、無線ベースおよび有線/ケーブルベースの媒体を含む、種々のコンピュータ可読伝送媒体上で生成されたデータ信号として(例えば、搬送波または他のアナログまたはデジタル伝搬信号の一部として)伝送され得、種々の形態(例えば、単一または多重化アナログ信号の一部として、または複数の離散デジタルパケットまたはフレームとして)をとり得る。開示されるプロセスまたはプロセスステップの結果は、任意のタイプの非一過性有形コンピュータ記憶装置内に持続的または別様に記憶され得る、またはコンピュータ可読伝送媒体を介して通信され得る。
本明細書に説明される、および/または添付される図に描写されるフロー図における任意のプロセス、ブロック、状態、ステップ、または機能性は、プロセスにおいて具体的機能(例えば、論理または算術)またはステップを実施するための1つ以上の実行可能命令を含む、コードモジュール、セグメント、またはコードの一部を潜在的に表すものとして理解されたい。種々のプロセス、ブロック、状態、ステップ、または機能性は、組み合わせられる、再配列される、追加される、削除される、修正される、または別様に本明細書に提供される例証的実施例から変更されることができる。いくつかの実施形態では、付加的または異なるコンピューティングシステムまたはコードモジュールが、本明細書に説明される機能性のいくつかまたは全てを実施し得る。本明細書に説明される方法およびプロセスはまた、任意の特定のシーケンスに限定されず、それに関連するブロック、ステップ、または状態は、適切な他のシーケンスで、例えば、連続して、並行に、またはある他の様式で実施されることができる。タスクまたはイベントが、開示される例示的実施形態に追加される、またはそれから除去され得る。さらに、本明細書に説明される実装における種々のシステムコンポーネントの分離は、例証を目的とし、全ての実装においてそのような分離を要求するものとして理解されるべきではない。説明されるプログラムコンポーネント、方法、およびシステムは、概して、単一のコンピュータ製品においてともに統合される、または複数のコンピュータ製品にパッケージ化され得ることを理解されたい。多くの実装変形例が、可能である。
本プロセス、方法、およびシステムは、ネットワーク(または分散)コンピューティング環境において実装され得る。ネットワーク環境は、企業全体コンピュータネットワーク、イントラネット、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、パーソナルエリアネットワーク(PAN)、クラウドコンピューティングネットワーク、クラウドソースコンピューティングネットワーク、インターネット、およびワールドワイドウェブを含む。ネットワークは、有線ネットワークまたは無線ネットワークまたは任意の他のタイプの通信ネットワークであり得る。
本開示のシステムおよび方法は、それぞれ、いくつかの革新的側面を有し、そのうちのいかなるものも、本明細書に開示される望ましい属性に単独で関与しない、またはそのために要求されない。上記に説明される種々の特徴およびプロセスは、相互に独立して使用され得る、または種々の方法で組み合わせられ得る。全ての可能な組み合わせおよび副次的組み合わせが、本開示の範囲内に該当することが意図される。本開示に説明される実装の種々の修正が、当業者に容易に明白であり得、本明細書に定義される一般原理は、本開示の精神または範囲から逸脱することなく、他の実装に適用され得る。したがって、請求項は、本明細書に示される実装に限定されることを意図されず、本明細書に開示される本開示、原理、および新規の特徴と一貫する最も広い範囲を与えられるべきである。
別個の実装の文脈において本明細書に説明されるある特徴はまた、単一の実装において組み合わせで実装されることができる。逆に、単一の実装の文脈において説明される種々の特徴もまた、複数の実装において別個に、または任意の好適な副次的組み合わせにおいて実装されることができる。さらに、特徴がある組み合わせにおいて作用するものとして上記に説明され、さらに、そのようなものとして最初に請求され得るが、請求される組み合わせからの1つ以上の特徴は、いくつかの場合では、組み合わせから削除されることができ、請求される組み合わせは、副次的組み合わせまたは副次的組み合わせの変形例を対象とし得る。いかなる単一の特徴または特徴のグループも、あらゆる実施形態に必要または必須ではない。
とりわけ、「~できる(can)」、「~し得る(could)」、「~し得る(might)」、「~し得る(may)」、「例えば(e.g.,)」、および同等物等、本明細書で使用される条件文は、別様に具体的に記載されない限り、または使用されるような文脈内で別様に理解されない限り、概して、ある実施形態がある特徴、要素、および/またはステップを含む一方、他の実施形態がそれらを含まないことを伝えることが意図される。したがって、そのような条件文は、概して、特徴、要素、および/またはステップが、1つ以上の実施形態に対していかようにも要求されることを示唆することは意図されていない、または、1つ以上の実施形態が、著者の入力または促しの有無を問わず、これらの特徴、要素、および/またはステップが任意の特定の実施形態において含まれる、または実施されるべきかどうかを決定するための論理を必ず含むことを示唆することを意図されない。用語「~を備える」、「~を含む」、「~を有する」、および同等物は、同義語であり、非限定的方式で包括的に使用され、付加的な要素、特徴、行為、動作等を除外しない。また、用語「または」は、その包括的意味において使用され(およびその排他的意味において使用されず)、したがって、例えば、要素のリストを接続するために使用されたとき、用語「または」は、リスト内の要素のうちの1つ、いくつか、または全てを意味する。加えて、本願および添付される請求項で使用されるような冠詞「a」、「an」、および「the」は、別様に規定されない限り、「1つ以上の」または「少なくとも1つ」を意味するように解釈されるべきである。
本明細書で使用されるように、項目のリスト「のうちの少なくとも1つ」を指す語句は、単一の要素を含む、それらの項目の任意の組み合わせを指す。ある実施例として、「A、B、またはCのうちの少なくとも1つ」は、A、B、C、AおよびB、AおよびC、BおよびC、およびA、B、およびCを網羅することが意図される。語句「X、Y、およびZのうちの少なくとも1つ」等の接続文は、別様に具体的に記載されない限り、概して、項目、用語等がX、Y、またはZのうちの少なくとも1つであり得ることを伝えるために使用されるような文脈で別様に理解される。したがって、そのような接続文は、概して、ある実施形態が、Xのうちの少なくとも1つ、Yのうちの少なくとも1つ、およびZのうちの少なくとも1つがそれぞれ存在するように要求することを示唆することを意図されない。
同様に、動作は、特定の順序で図面に描写され得るが、これは、望ましい結果を達成するために、そのような動作が示される特定の順序で、または連続的順序で実施されること、または、全ての図示される動作が実施されることの必要はないと認識されるべきである。さらに、図面は、フローチャートの形態で1つ以上の例示的プロセスを図式的に描写し得る。しかしながら、描写されない他の動作も、図式的に図示される例示的方法およびプロセス内に組み込まれることができる。例えば、1つ以上の付加的動作が、図示される動作のいずれかの前に、その後に、それと同時に、またはその間に実施されることができる。加えて、動作は、他の実装において再配列される、または再順序付けられ得る。ある状況では、マルチタスクおよび並列処理が、有利であり得る。さらに、上記に説明される実装における種々のシステムコンポーネントの分離は、全ての実装におけるそのような分離を要求するものとして理解されるべきではなく、説明されるプログラムコンポーネントおよびシステムは、概して、単一のソフトウェア製品においてともに統合される、または複数のソフトウェア製品にパッケージ化され得ることを理解されたい。加えて、他の実装も、以下の請求項の範囲内である。いくつかの場合では、請求項に列挙されるアクションは、異なる順序で実施され、依然として、望ましい結果を達成することができる。

Claims (1)

  1. 本明細書に記載の発明。
JP2023083020A 2016-06-03 2023-05-19 拡張現実識別検証 Pending JP2023103441A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662345438P 2016-06-03 2016-06-03
US62/345,438 2016-06-03
JP2022037025A JP2022066540A (ja) 2016-06-03 2022-03-10 拡張現実識別検証

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2022037025A Division JP2022066540A (ja) 2016-06-03 2022-03-10 拡張現実識別検証

Publications (2)

Publication Number Publication Date
JP2023103441A true JP2023103441A (ja) 2023-07-26
JP2023103441A5 JP2023103441A5 (ja) 2024-01-10

Family

ID=60478990

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2018562246A Active JP6850817B2 (ja) 2016-06-03 2017-06-01 拡張現実識別検証
JP2020094351A Active JP7041194B2 (ja) 2016-06-03 2020-05-29 拡張現実識別検証
JP2022037025A Pending JP2022066540A (ja) 2016-06-03 2022-03-10 拡張現実識別検証
JP2023083020A Pending JP2023103441A (ja) 2016-06-03 2023-05-19 拡張現実識別検証

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2018562246A Active JP6850817B2 (ja) 2016-06-03 2017-06-01 拡張現実識別検証
JP2020094351A Active JP7041194B2 (ja) 2016-06-03 2020-05-29 拡張現実識別検証
JP2022037025A Pending JP2022066540A (ja) 2016-06-03 2022-03-10 拡張現実識別検証

Country Status (9)

Country Link
US (3) US10534954B2 (ja)
EP (2) EP4350647A3 (ja)
JP (4) JP6850817B2 (ja)
KR (4) KR20240036149A (ja)
CN (2) CN116778367A (ja)
AU (2) AU2017273737B2 (ja)
CA (1) CA3025936A1 (ja)
IL (3) IL297603A (ja)
WO (1) WO2017210419A1 (ja)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017015390A1 (en) * 2015-07-20 2017-01-26 University Of Maryland, College Park Deep multi-task learning framework for face detection, landmark localization, pose estimation, and gender recognition
US11329980B2 (en) 2015-08-21 2022-05-10 Veridium Ip Limited System and method for biometric protocol standards
US10255040B2 (en) * 2017-05-11 2019-04-09 Veridium Ip Limited System and method for biometric identification
US10142288B1 (en) * 2015-09-04 2018-11-27 Madrona Venture Fund Vi, L.P Machine application interface to influence virtual environment
US10424072B2 (en) 2016-03-01 2019-09-24 Samsung Electronics Co., Ltd. Leveraging multi cues for fine-grained object classification
KR102506459B1 (ko) * 2016-05-20 2023-03-03 매직 립, 인코포레이티드 콘볼루셔널 이미지 변환 추정을 수행하기 위한 방법 및 시스템
WO2017210419A1 (en) 2016-06-03 2017-12-07 Magic Leaf, Inc. Augmented reality identity verification
US10579860B2 (en) * 2016-06-06 2020-03-03 Samsung Electronics Co., Ltd. Learning model for salient facial region detection
US10728236B1 (en) * 2016-09-07 2020-07-28 Amazon Technologies, Inc. Augmented reality data exchange
US10621773B2 (en) * 2016-12-30 2020-04-14 Google Llc Rendering content in a 3D environment
US10768425B2 (en) * 2017-02-14 2020-09-08 Securiport Llc Augmented reality monitoring of border control systems
CN106980983A (zh) 2017-02-23 2017-07-25 阿里巴巴集团控股有限公司 基于虚拟现实场景的业务认证方法及装置
US11024064B2 (en) * 2017-02-24 2021-06-01 Masimo Corporation Augmented reality system for displaying patient data
EP3585254B1 (en) 2017-02-24 2024-03-20 Masimo Corporation Medical device cable and method of sharing data between connected medical devices
CN117389420A (zh) * 2017-04-14 2024-01-12 奇跃公司 多模式眼睛跟踪
EP3616210A1 (en) * 2017-04-23 2020-03-04 Orcam Technologies Ltd. Wearable apparatus and methods for analyzing images
CN110809804B (zh) 2017-05-08 2023-10-27 梅西莫股份有限公司 使用适配器将医疗系统与网络控制器配对的系统
US20190031145A1 (en) 2017-07-28 2019-01-31 Alclear, Llc Biometric identification system connected vehicle
US10579785B2 (en) * 2017-09-29 2020-03-03 General Electric Company Automatic authentification for MES system using facial recognition
US11531960B2 (en) 2017-09-29 2022-12-20 Nec Corporation Information processing apparatus, information processing system, control method, and program
US20210201269A1 (en) * 2017-11-03 2021-07-01 Sensormatic Electronics, LLC Methods and System for Employee Monitoring and Business Rule and Quorum Compliance Monitoring
CN109918975B (zh) * 2017-12-13 2022-10-21 腾讯科技(深圳)有限公司 一种增强现实的处理方法、对象识别的方法及终端
JP6607266B2 (ja) 2018-01-12 2019-11-20 日本電気株式会社 顔認証装置
CN108346195B (zh) * 2018-03-08 2020-10-09 青岛理工大学 一种基于增强现实的列车智能巡检方法
CN108491081B (zh) * 2018-03-23 2020-09-25 联想(北京)有限公司 一种基于神经网络的数据处理方法及装置
RU2715515C2 (ru) * 2018-03-30 2020-02-28 Акционерное общество "Лаборатория Касперского" Система и способ выявления изображения, содержащего идентификационный документ
CN108805005A (zh) 2018-04-16 2018-11-13 深圳市商汤科技有限公司 身份验证方法和装置、电子设备、计算机程序和存储介质
US10810457B2 (en) * 2018-05-09 2020-10-20 Fuji Xerox Co., Ltd. System for searching documents and people based on detecting documents and people around a table
EP3572972A1 (en) * 2018-05-23 2019-11-27 IDEMIA Identity & Security Germany AG Extendend convolutional neural network for document analysis
US10984600B2 (en) 2018-05-25 2021-04-20 Tiff's Treats Holdings, Inc. Apparatus, method, and system for presentation of multimedia content including augmented reality content
US10818093B2 (en) 2018-05-25 2020-10-27 Tiff's Treats Holdings, Inc. Apparatus, method, and system for presentation of multimedia content including augmented reality content
EP3588364A1 (en) * 2018-06-21 2020-01-01 Onfido Ltd Within document face verification
FR3083895B1 (fr) * 2018-07-13 2021-11-26 Idemia Identity & Security France Procede de reconnaissance biometrique
GB2575509A (en) 2018-07-13 2020-01-15 Nokia Technologies Oy Spatial audio capture, transmission and reproduction
FR3083894B1 (fr) * 2018-07-13 2020-06-26 Idemia Identity & Security France Procede de reconnaissance biometrique
GB2575511A (en) * 2018-07-13 2020-01-15 Nokia Technologies Oy Spatial audio Augmentation
WO2020022034A1 (ja) * 2018-07-25 2020-01-30 日本電気株式会社 情報処理装置、情報処理方法および情報処理プログラム
JP6611214B1 (ja) * 2018-08-02 2019-11-27 株式会社 ディー・エヌ・エー 本人確認のためのシステム、方法、及びプログラム
US10452897B1 (en) 2018-08-06 2019-10-22 Capital One Services, Llc System for verifying the identity of a user
DE102018123719A1 (de) * 2018-09-26 2020-03-26 Bundesdruckerei Gmbh Vorrichtung zum Erkennen einer Bildmanipulation in einem digitalen Referenzgesichtsbild einer Person
US20200125322A1 (en) * 2018-10-22 2020-04-23 Navitaire Llc Systems and methods for customization of augmented reality user interface
US11450069B2 (en) * 2018-11-09 2022-09-20 Citrix Systems, Inc. Systems and methods for a SaaS lens to view obfuscated content
KR20200057480A (ko) * 2018-11-16 2020-05-26 삼성전자주식회사 증강 현실 제어 장치, 이를 이용한 증강 현실 구현 방법, 및 이를 포함하는 증강 현실 구현 시스템
CN109829418B (zh) * 2019-01-28 2021-01-05 北京影谱科技股份有限公司 一种基于背影特征的打卡方法、装置和系统
CN113966508A (zh) 2019-02-21 2022-01-21 可重构可视代码技术公司 被重构的分段代码及其使用方法
JP7211266B2 (ja) * 2019-05-27 2023-01-24 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
CN112115747A (zh) * 2019-06-21 2020-12-22 阿里巴巴集团控股有限公司 活体检测和数据处理方法、设备、系统及存储介质
US11295134B2 (en) * 2019-07-02 2022-04-05 Truist Bank User scanning and one-way augmented reality viewing system
CA3152060A1 (en) * 2019-08-23 2021-03-04 Berbix Inc. Identity authentication and processing
KR102252159B1 (ko) * 2019-08-27 2021-05-14 (주)네오위즈랩 증강현실 포토카드를 제공하는 시스템, 서버, 방법 및 그 기록매체
CN110638524B (zh) * 2019-09-16 2021-11-02 山东省肿瘤防治研究院(山东省肿瘤医院) 一种基于vr眼镜的肿瘤穿刺实时模拟系统
CN110728318A (zh) * 2019-10-09 2020-01-24 安徽萤瞳科技有限公司 一种基于深度学习的头发丝颜色识别方法
US11200411B2 (en) * 2019-10-16 2021-12-14 The Toronto-Dominion Bank Training a card type classifier with simulated card images
US11544415B2 (en) 2019-12-17 2023-01-03 Citrix Systems, Inc. Context-aware obfuscation and unobfuscation of sensitive content
US12079266B2 (en) * 2019-12-17 2024-09-03 Motorola Solutions, Inc. Image-assisted field verification of query response
US11539709B2 (en) 2019-12-23 2022-12-27 Citrix Systems, Inc. Restricted access to sensitive content
US11687778B2 (en) 2020-01-06 2023-06-27 The Research Foundation For The State University Of New York Fakecatcher: detection of synthetic portrait videos using biological signals
US11582266B2 (en) 2020-02-03 2023-02-14 Citrix Systems, Inc. Method and system for protecting privacy of users in session recordings
CN115087952A (zh) * 2020-02-10 2022-09-20 日本电气株式会社 用于便携式终端的程序、处理方法及便携式终端
US11676161B2 (en) * 2020-02-25 2023-06-13 Nec Corporation Combined light and heavy models for image filtering
US11599717B2 (en) 2020-03-20 2023-03-07 Capital One Services, Llc Separately collecting and storing form contents
US11361113B2 (en) 2020-03-26 2022-06-14 Citrix Systems, Inc. System for prevention of image capture of sensitive information and related techniques
CN111460418A (zh) * 2020-03-27 2020-07-28 深圳光启超材料技术有限公司 基于智能头盔的生物特征识别方法及智能头盔
IL299752A (en) * 2020-06-22 2023-03-01 ID Metrics Group Incorporated Data processing and transaction decision system
US11216960B1 (en) * 2020-07-01 2022-01-04 Alipay Labs (singapore) Pte. Ltd. Image processing method and system
WO2022041163A1 (en) 2020-08-29 2022-03-03 Citrix Systems, Inc. Identity leak prevention
WO2022041162A1 (en) 2020-08-29 2022-03-03 Citrix Systems, Inc. Mask including moveable window for viewing content
CN112099637A (zh) * 2020-09-27 2020-12-18 成都佳发教育科技有限公司 一种基于ar交互的穿戴式信息采集系统
WO2022074836A1 (ja) * 2020-10-09 2022-04-14 匡次 岩崎 生体認証システム、生体認証プログラムおよび生体認証用物品
FR3117247A1 (fr) 2020-12-04 2022-06-10 Imprimerie Nationale Procede et systeme d’extraction et de lecture de donnees d’un document physique
US11893551B2 (en) 2021-04-15 2024-02-06 Bank Of America Corporation Information security system and method for augmented reality check generation
US11989973B2 (en) * 2021-08-31 2024-05-21 Black Sesame Technologies Inc. Age and gender estimation using a convolutional neural network
US20230316790A1 (en) * 2022-03-30 2023-10-05 Jumio Corporation Authentication of Age, Gender, and Other Biometric Data from Live Images of Users
CN114724151B (zh) * 2022-04-22 2024-09-17 厦门大学 一种基于卷积神经网络的古筝简谱识别方法及系统
US20230368502A1 (en) * 2022-05-11 2023-11-16 Verizon Patent And Licensing Inc. System and method for facial recognition
US20230385831A1 (en) * 2022-05-24 2023-11-30 Ncr Corporation Customer identification verification
US11886767B2 (en) 2022-06-17 2024-01-30 T-Mobile Usa, Inc. Enable interaction between a user and an agent of a 5G wireless telecommunication network using augmented reality glasses
US20240007464A1 (en) * 2022-06-30 2024-01-04 Bank Of America Corporation Integration of real-world and virtual-world systems
WO2024044185A1 (en) * 2022-08-23 2024-02-29 SparkCognition, Inc. Face image matching based on feature comparison
IT202200018807A1 (it) * 2022-09-14 2024-03-14 Labconsulenze S R L Sistema di identificazione di veicoli e persone.
US12041059B1 (en) * 2023-07-11 2024-07-16 HYPR Corp. Device enrollment identity verification
KR102629509B1 (ko) * 2023-08-10 2024-01-29 보이스아이 주식회사 이차원코드를 이용한 신분증명 방법

Family Cites Families (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5291560A (en) 1991-07-15 1994-03-01 Iri Scan Incorporated Biometric personal identification system based on iris analysis
US6222525B1 (en) 1992-03-05 2001-04-24 Brad A. Armstrong Image controllers with sheet connected sensors
US5699449A (en) * 1994-11-14 1997-12-16 The University Of Connecticut Method and apparatus for implementation of neural networks for face recognition
US5670988A (en) 1995-09-05 1997-09-23 Interlink Electronics, Inc. Trigger operated electronic device
US6119096A (en) 1997-07-31 2000-09-12 Eyeticket Corporation System and method for aircraft passenger check-in and boarding using iris recognition
US6505193B1 (en) 1999-12-01 2003-01-07 Iridian Technologies, Inc. System and method of fast biometric database searching using digital certificates
JP4336807B2 (ja) * 2000-01-26 2009-09-30 独立行政法人 国立印刷局 網点印刷物及びその印刷方法
CN1650622B (zh) 2002-03-13 2012-09-05 图象公司 用于数字重新灌录或修改电影或其他图像序列数据的系统和方法
US20040003295A1 (en) * 2002-06-20 2004-01-01 David Elderfield Biometric document authentication system
JP3988554B2 (ja) * 2002-07-12 2007-10-10 コニカミノルタホールディングス株式会社 画像照会用情報構築方法および画像照会方法
WO2004010365A2 (en) * 2002-07-19 2004-01-29 Dicut Inc. Face recognition system and method therefor
KR20040082879A (ko) * 2003-03-20 2004-09-30 아프로파이낸셜그룹 주식회사 모바일폰과 에이알에스를 이용한 온라인대출시스템 및이의 운용방법
US7817013B2 (en) * 2003-09-05 2010-10-19 Honeywell International Inc. Distributed stand-off ID verification compatible with multiple face recognition systems (FRS)
US7680330B2 (en) * 2003-11-14 2010-03-16 Fujifilm Corporation Methods and apparatus for object recognition using textons
JP2005284565A (ja) * 2004-03-29 2005-10-13 Glory Ltd 自動取引装置
JP2006099614A (ja) * 2004-09-30 2006-04-13 Toshiba Corp 生体判別装置および生体判別方法
JP4267584B2 (ja) * 2005-02-28 2009-05-27 株式会社東芝 機器制御装置及びその方法
JP2007052638A (ja) * 2005-08-18 2007-03-01 Konica Minolta Photo Imaging Inc 個人認証用媒体及び個人認証用システム
US11428937B2 (en) 2005-10-07 2022-08-30 Percept Technologies Enhanced optical and perceptual digital eyewear
US8696113B2 (en) 2005-10-07 2014-04-15 Percept Technologies Inc. Enhanced optical and perceptual digital eyewear
US20070081123A1 (en) 2005-10-07 2007-04-12 Lewis Scott W Digital eyewear
US8315463B2 (en) * 2006-11-14 2012-11-20 Eastman Kodak Company User interface for face recognition
JP2008158678A (ja) * 2006-12-21 2008-07-10 Toshiba Corp 人物認証装置および人物認証方法および入退場管理システム
JP2008179014A (ja) * 2007-01-23 2008-08-07 Oki Electric Ind Co Ltd 査証発行装置、本人確認装置、査証偽変造対策システム、査証発行方法および本人確認方法
CN101145238A (zh) * 2007-02-08 2008-03-19 罗中根 超现实三维全息智能虚拟人系统及方法
US20090322866A1 (en) * 2007-04-19 2009-12-31 General Electric Company Security checkpoint systems and methods
KR100886557B1 (ko) * 2007-05-03 2009-03-02 삼성전자주식회사 적응형 학습에 기반한 얼굴 인식 시스템 및 방법
JP5180630B2 (ja) * 2008-03-13 2013-04-10 セコム株式会社 監視装置
WO2009155370A1 (en) * 2008-06-18 2009-12-23 University Of Southern California Multi-level domino, bundled data, and mixed templates
JP2010079393A (ja) * 2008-09-24 2010-04-08 Japan Tobacco Inc データ処理装置、そのコンピュータプログラムおよびデータ処理方法
CN101515324A (zh) * 2009-01-21 2009-08-26 上海银晨智能识别科技有限公司 适用于多种姿态的人脸识别布控系统及方法
JP5451302B2 (ja) * 2009-10-19 2014-03-26 キヤノン株式会社 画像処理装置及び方法、プログラム及び記憶媒体
US20110153341A1 (en) * 2009-12-17 2011-06-23 General Electric Company Methods and systems for use of augmented reality to improve patient registration in medical practices
US8345984B2 (en) 2010-01-28 2013-01-01 Nec Laboratories America, Inc. 3D convolutional neural networks for automatic human action recognition
EP2385484A1 (en) * 2010-05-06 2011-11-09 STMicroelectronics (Grenoble 2) SAS Object detection in an image
US8675926B2 (en) * 2010-06-08 2014-03-18 Microsoft Corporation Distinguishing live faces from flat surfaces
US8311337B2 (en) * 2010-06-15 2012-11-13 Cyberlink Corp. Systems and methods for organizing and accessing feature vectors in digital images
KR20150006093A (ko) * 2010-11-17 2015-01-16 주식회사 케이티 얼굴 아이디 기반 증강 콘텐츠 스토어 서비스 방법 및 시스템
US9304319B2 (en) 2010-11-18 2016-04-05 Microsoft Technology Licensing, Llc Automatic focus improvement for augmented reality displays
US10156722B2 (en) 2010-12-24 2018-12-18 Magic Leap, Inc. Methods and systems for displaying stereoscopy with a freeform optical system with addressable focus for virtual and augmented reality
EP2656135B1 (en) 2010-12-24 2022-05-04 Magic Leap, Inc. Freeform waveguide prism
JP5606382B2 (ja) * 2011-04-20 2014-10-15 株式会社トーショー 個人認証システム
JP5719223B2 (ja) * 2011-04-25 2015-05-13 オリンパスイメージング株式会社 画像記録装置、記録方法およびプログラム
CA2835120C (en) 2011-05-06 2019-05-28 Magic Leap, Inc. Massive simultaneous remote digital presence world
KR101381439B1 (ko) * 2011-09-15 2014-04-04 가부시끼가이샤 도시바 얼굴 인식 장치 및 얼굴 인식 방법
EP2760363A4 (en) 2011-09-29 2015-06-24 Magic Leap Inc TACTILE GLOVE FOR HUMAN COMPUTER INTERACTION
CA3207408A1 (en) 2011-10-28 2013-06-13 Magic Leap, Inc. System and method for augmented and virtual reality
CN202472696U (zh) * 2011-11-18 2012-10-03 山东神思电子技术股份有限公司 一种基于二代身份证和人脸特征识别的身份验证系统
JP6250547B2 (ja) 2011-11-23 2017-12-20 マジック リープ, インコーポレイテッドMagic Leap,Inc. 3次元仮想現実および拡張現実表示システム
JP2013172432A (ja) 2012-02-23 2013-09-02 Panasonic Corp 機器制御装置、機器制御方法、機器制御プログラム、及び集積回路
ES2687748T3 (es) * 2012-02-24 2018-10-29 Nant Holdings Ip Llc Activación de contenido por medio de autenticación basada en interacciones, sistemas y método
NZ700887A (en) 2012-04-05 2016-11-25 Magic Leap Inc Wide-field of view (fov) imaging devices with active foveation capability
CN115494654A (zh) 2012-06-11 2022-12-20 奇跃公司 使用波导反射器阵列投射器的多深度平面三维显示器
US9671566B2 (en) 2012-06-11 2017-06-06 Magic Leap, Inc. Planar waveguide apparatus with diffraction element(s) and system employing same
CN102800131A (zh) * 2012-07-24 2012-11-28 中国铁道科学研究院电子计算技术研究所 火车票实名制验票系统
JP2015534108A (ja) 2012-09-11 2015-11-26 マジック リープ, インコーポレイテッド 人間工学的な頭部搭載型ディスプレイデバイスおよび光学システム
JP6025522B2 (ja) 2012-11-27 2016-11-16 キヤノン株式会社 画像処理装置、画像処理方法、画像処理システム及びプログラム
NL2010045C2 (en) * 2012-12-21 2014-06-24 Morpho B V Identity document comprising a ghost image based on a two- dimensional image.
KR102507206B1 (ko) 2013-01-15 2023-03-06 매직 립, 인코포레이티드 초고해상도 스캐닝 섬유 디스플레이
US9203835B2 (en) * 2013-03-01 2015-12-01 Paypal, Inc. Systems and methods for authenticating a user based on a biometric model associated with the user
EP2965291A4 (en) * 2013-03-06 2016-10-05 Intel Corp METHODS AND APPARATUS FOR UTILIZING OPTICAL RECOGNITION OF CHARACTERS TO PROVIDE INCREASED REALITY
KR20230173231A (ko) 2013-03-11 2023-12-26 매직 립, 인코포레이티드 증강 및 가상 현실을 위한 시스템 및 방법
US9154773B2 (en) * 2013-03-15 2015-10-06 Seiko Epson Corporation 2D/3D localization and pose estimation of harness cables using a configurable structure representation for robot operations
KR102560629B1 (ko) 2013-03-15 2023-07-26 매직 립, 인코포레이티드 디스플레이 시스템 및 방법
CA2914629C (en) 2013-06-05 2022-10-04 Morphotrust Usa Inc. System and method for credential authentication
US10262462B2 (en) 2014-04-18 2019-04-16 Magic Leap, Inc. Systems and methods for augmented and virtual reality
US9874749B2 (en) 2013-11-27 2018-01-23 Magic Leap, Inc. Virtual and augmented reality systems and methods
US20140380249A1 (en) 2013-06-25 2014-12-25 Apple Inc. Visual recognition of gestures
US9471824B2 (en) * 2013-07-12 2016-10-18 Qualcomm Incorporated Embedded barcodes for displaying context relevant information
US9495586B1 (en) * 2013-09-18 2016-11-15 IDChecker, Inc. Identity verification using biometric data
AU2014337171B2 (en) 2013-10-16 2018-11-15 Magic Leap, Inc. Virtual or augmented reality headsets having adjustable interpupillary distance
US9857591B2 (en) 2014-05-30 2018-01-02 Magic Leap, Inc. Methods and system for creating focal planes in virtual and augmented reality
CN107329259B (zh) 2013-11-27 2019-10-11 奇跃公司 虚拟和增强现实系统与方法
TWI510953B (zh) * 2013-12-20 2015-12-01 Wistron Corp 身份驗證防僞方法與應用此方法的身份驗證裝置
EP3712680B1 (en) 2014-01-31 2022-07-13 Magic Leap, Inc. Multi-focal display system and method
CN111552079B (zh) 2014-01-31 2022-04-15 奇跃公司 多焦点显示系统和方法
US10320807B2 (en) * 2014-02-25 2019-06-11 Sal Khan Systems and methods relating to the authenticity and verification of photographic identity documents
US10203762B2 (en) 2014-03-11 2019-02-12 Magic Leap, Inc. Methods and systems for creating virtual and augmented reality
GB201406594D0 (en) * 2014-04-11 2014-05-28 Idscan Biometric Ltd Method, system and computer program for validating a facial image-bearing identity document
US9773156B2 (en) * 2014-04-29 2017-09-26 Microsoft Technology Licensing, Llc Grouping and ranking images based on facial recognition data
US9436892B2 (en) * 2014-05-02 2016-09-06 Hong Kong Applied Science And Technology Research Institute Co., Ltd. Method and apparatus for facial detection using regional similarity distribution analysis
US10620700B2 (en) 2014-05-09 2020-04-14 Google Llc Systems and methods for biomechanically-based eye signals for interacting with real and virtual objects
CN106662754B (zh) 2014-05-30 2021-05-25 奇跃公司 用于采用虚拟或增强现实装置生成虚拟内容显示的方法和系统
DE102014108578A1 (de) * 2014-06-18 2015-12-24 Ovd Kinegram Ag Verfahren zur Prüfung eines Sicherheitsdokuments
US9444990B2 (en) * 2014-07-16 2016-09-13 Sony Mobile Communications Inc. System and method for setting focus of digital image based on social relationship
US9679194B2 (en) 2014-07-17 2017-06-13 At&T Intellectual Property I, L.P. Automated obscurity for pervasive imaging
US9544308B2 (en) * 2014-11-01 2017-01-10 RONALD Henry Minter Compliant authentication based on dynamically-updated credentials
CN104680131B (zh) * 2015-01-29 2019-01-11 深圳云天励飞技术有限公司 基于身份证件信息和人脸多重特征识别的身份验证方法
USD758367S1 (en) 2015-05-14 2016-06-07 Magic Leap, Inc. Virtual reality headset
JP6754619B2 (ja) * 2015-06-24 2020-09-16 三星電子株式会社Samsung Electronics Co.,Ltd. 顔認識方法及び装置
US9779316B2 (en) * 2015-09-30 2017-10-03 Tyco Fire & Security Gmbh Scalable and distributed biometric processing
WO2017210419A1 (en) 2016-06-03 2017-12-07 Magic Leaf, Inc. Augmented reality identity verification
US10083347B2 (en) * 2016-07-29 2018-09-25 NTech lab LLC Face identification using artificial neural network

Also Published As

Publication number Publication date
CN109564620A (zh) 2019-04-02
JP7041194B2 (ja) 2022-03-23
IL263219A (en) 2018-12-31
EP4350647A2 (en) 2024-04-10
CA3025936A1 (en) 2017-12-07
EP3465597A1 (en) 2019-04-10
US20200184201A1 (en) 2020-06-11
EP3465597B1 (en) 2024-02-28
CN116778367A (zh) 2023-09-19
IL297603A (en) 2022-12-01
EP3465597A4 (en) 2020-01-01
WO2017210419A8 (en) 2018-03-08
US20170351909A1 (en) 2017-12-07
US10534954B2 (en) 2020-01-14
IL263219B2 (en) 2023-06-01
KR102648194B1 (ko) 2024-03-14
EP4350647A3 (en) 2024-04-24
AU2017273737B2 (en) 2022-05-05
JP2020144944A (ja) 2020-09-10
WO2017210419A1 (en) 2017-12-07
KR20230047216A (ko) 2023-04-06
JP6850817B2 (ja) 2021-03-31
US20220180658A1 (en) 2022-06-09
JP2022066540A (ja) 2022-04-28
KR20210062747A (ko) 2021-05-31
IL299710A (en) 2023-03-01
CN109564620B (zh) 2023-06-27
KR102516112B1 (ko) 2023-03-29
KR102258047B1 (ko) 2021-05-27
US11263438B2 (en) 2022-03-01
KR20240036149A (ko) 2024-03-19
AU2017273737A1 (en) 2018-12-20
KR20190015349A (ko) 2019-02-13
AU2022209261A1 (en) 2022-08-25
JP2019523929A (ja) 2019-08-29

Similar Documents

Publication Publication Date Title
JP7041194B2 (ja) 拡張現実識別検証
KR102217797B1 (ko) 전체 얼굴 이미지의 안구주위 및 오디오 합성
US11954243B2 (en) Mapping and localization of a passable world
CN113330390A (zh) 用于化身运动的多模态手的位置和取向
US20240312158A1 (en) Object interactivity in virtual space
NZ786190A (en) Augmented reality identity verification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240917

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20241002