WO2022004483A1

WO2022004483A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2022004483A1
Application number: PCT/JP2021/023550
Authority: WO
Inventors: 巧浜崎
Original assignee: ソニーグループ株式会社
Priority date: 2020-06-29
Filing date: 2021-06-22
Publication date: 2022-01-06
Also published as: CN115552475A; DE112021003448T5

Abstract

【課題】仮想オブジェクトにおけるＡＲ表示の遅延を防止するための技術を提供すること。【解決手段】本技術に係る情報処理装置は、制御部を具備する。制御部は、端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する。

Description

情報処理装置、情報処理方法及びプログラム

　本技術は、仮想オブジェクトをＡＲ（Augmented Reality）表示するための技術に関する。

　近年においては、現実世界に存在する対象物に対して仮想オブジェクトを重畳して表示させることで、仮想オブジェクトがあたかも現実世界に存在する物体であるかのようにユーザに知覚させることが可能なＡＲ技術が広く知られるようになってきている（例えば、下記特許文献１参照）。

　ＡＲ技術は、例えば、ＨＭＤ（Head Mounted Display）やスマートフォン等の各種の端末に搭載されている。

　仮想オブジェクトを対象物に対してＡＲ表示させるためには、端末に対する対象物の位置姿勢を認識する必要がある。この認識技術における研究開発は、現在に至るまで行われており、主な方法としては、端末に設けられた撮像部による画像情報から対象物の位置姿勢を認識する方法が挙げられる。

特開２０１７－１２０５５０号公報

　例えば、ＨＭＤを装着したユーザが首を振った場合等のように端末が姿勢変化したときにＡＲ表示画角内に対象物が入る場合がある。このような場合、対象物の位置姿勢が認識されるまでは仮想オブジェクトはＡＲ表示されず、ＡＲ表示の遅延が生じてしまう。
　以上のような事情に鑑み、本技術の目的は、仮想オブジェクトにおけるＡＲ表示の遅延を防止するための技術を提供することにある。

　本技術に係る情報処理装置は、制御部を具備する。
　制御部は、端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する。

　これにより、仮想オブジェクトにおけるＡＲ表示の遅延を防止することができる。

　本技術に係る情報処理方法は、端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、
　前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示することを含む。

　本技術に係るプログラムは、端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、
　前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　処理をコンピュータに実行させる。

本技術の第１実施形態に係るＨＭＤの一例を示す図である。本実施形態に係るＨＭＤの内部構成を示すブロック図である。対象物に対して仮想オブジェクトが重畳してＡＲ表示されたときの様子を示す図である。制御部の自己位置推定処理を示すフローチャートである。正面画像における対象物の検知処理を示すフローチャートである。正面画像における対象物の追跡処理を示すフローチャートである。側面画像における対象物の検知処理を示すフローチャートである。側面画像における対象物の追跡処理を示すフローチャートである。仮想オブジェクトのＡＲ表示処理を示すフローチャートである。本実施形態に係るＨＭＤにおける処理の流れと、比較例に係るＨＭＤにおける処理の流れとが比較された図である。比較例に係るＨＭＤにおいて、ユーザにより首が振られたときに仮想オブジェクトがどのタイミングでＡＲ表示されるかを示す図である。本実施形態に係るＨＭＤにおいて、ユーザにより首が振られたときに仮想オブジェクトがどのタイミングでＡＲ表示されるかを示す図である。複数の正面カメラ６が用いられた場合の様子を示す図である。

　以下、本技術に係る実施形態を、図面を参照しながら説明する。

≪第１実施形態≫
＜全体構成及び各部の構成＞
　図１は、本技術の第１実施形態に係るＨＭＤ１０の一例を示す図である。図２は、本実施形態に係るＨＭＤ１０の内部構成を示すブロック図である。

　図１及び図２に示すように、ＨＭＤ１０（端末の一例）は、ＨＭＤ本体１１と、制御部１と、記憶部２と、表示部３と、慣性センサ４と、撮像部５と、通信部８とを備えている。

　ＨＭＤ本体１１は、ユーザの頭部に装着されて使用される。ＨＭＤ本体１１は、フロント部１２と、フロント部１２の右側に設けられた右テンプル部１３と、フロント部１２の左側に設けられた左テンプル部１４と、フロント部１２の下側に取り付けられたグラス部１５とを有する。

　表示部３は、制御部１の制御に応じて、正面側におけるＡＲ表示画角内において仮想オブジェクト９をＡＲ表示することが可能とされている。ＡＲ表示とは、ユーザから見て、仮想オブジェクト９が、あたかも実空間に存在する現実物体であるかのように知覚させるように表示を行うことを意味する。

　図３は、対象物に対して仮想オブジェクト９が重畳してＡＲ表示されたときの様子を示す図である。図３の左側には、対象物である木馬の鞍の上の位置にキャラクタの仮想オブジェクト９がＡＲ表示されたときの様子が示されている。図３の右側には、対象物である人物（子供）の顔の上の位置にキャラクタの仮想オブジェクト９がＡＲ表示されたときの様子が示されている。

　表示部３の少なくとも一部は、グラス部１５に設けられている。表示部３は、光透過性を有するディスプレイ（光学シースルーディスプレイ）であり、例えば、光源としてのＯＬＥＤ（Organic Light Emitting Diode）及び導光板を含む。表示部３は、ハーフミラーを用いた構成、網膜操作ディスプレイ等、種々の形態を採用し得る。表示部３の光源は、フロント部１２、右テンプル部１３、あるいは、左テンプル部１４等に設けられていてもよい。

　なお、表示部３は、ビデオシースルーディスプレイであってもよい。この場合、正面側に設けられた正面カメラ６により撮像された画像に仮想オブジェクト９が重畳された画像が表示部３上に表示される。

　撮像部５は、正面カメラ６（第２の撮像部）と、側面カメラ７（第１の撮像部）とを含む。正面カメラ６及び側面カメラ７は、それぞれ、ＣＣＤ（Charge Coupled Device）センサ、ＣＭＯＳ（Complemented Metal Oxide Semiconductor）センサ等の撮像素子と、結像レンズ等の光学系とを含む。

　図１に示す例では、正面カメラ６（第２の撮像部）は、フロント部１２の外面において外向きに設けられている。正面カメラ６は、ＨＭＤ１０の正面における正面画像（第２の画像情報）を取得して、制御部１へと出力する。

　この正面カメラ６は、第２の撮像部の一例である。第２の撮像部は、表示部３のＡＲ表示画角に対応する領域を撮像可能に構成されている。第２の撮像部は、ＡＲ表示画角に対応する領域に存在する物体を撮像し、撮像により得られた画像情報（第２の画像情報）を制御部１へと出力する。

　図１に示す例では、側面カメラ７は、右テンプル部１３の外面において外向きに設けられている。側面カメラ７は、ＨＭＤ１０の右側面における側面画像（第１の画像情報）を取得して、制御部１へと出力する。

　側面カメラ７は、第１の撮像部の一例である。この第１の撮像部は、表示部３のＡＲ表示画角よりも外側の領域を撮像可能に構成されている。第１の撮像部は、ＡＲ表示画角よりも外側に存在する物体を撮像し、撮像により得られた画像情報（第１の画像情報）を制御部１へと出力する

　なお、第１の撮像部が設けられる位置としては、例えば、ＨＭＤ１０の側面、側面及び正面の中間、背面、背面及び側面の中間、頭上等が挙げられる。典型的には、第１の撮像部は、第２の撮像部が画角的に撮像しにくい方向を撮像可能な位置に配置されていればよい。

　また、図１に示す例では、第１の撮像部の数が１つである場合の一例が示されているが、この数は、２以上であってもよい。但し、第１の撮像部の数が多すぎるとＨＭＤ１０の消費電力が大きくなってしまうので、第１の撮像部の数は、この点を考慮して設定される。

　慣性センサ４は、３軸方向の加速度を検出する加速度センサと、３軸回りの角速度を検出する角速度センサとを含む。慣性センサ４は、検出により得られた３軸方向の加速度、３軸回りの角速度を慣性情報として、制御部１に出力する。

　本実施形態では、慣性センサ４の検出軸が３軸とされているが、この検出軸は、１軸、あるいは、２軸であってもよい。また、本実施形態では、慣性センサ４として、２種類のセンサが用いられているが、慣性センサ４として１種類、あるいは、３種類以上のセンサが用いられてもよい。

　通信部８は、有線又は無線により、外部機器（例えば、ネットワーク上のサーバ装置等）との間で通信可能に構成されている。

　制御部１は、記憶部２に記憶された各種のプログラムに基づき種々の演算を実行し、ＨＭＤ１０の各部を統括的に制御する。なお、制御部１の処理については、動作説明の欄において後に詳述する。

　制御部１は、ハードウェア、又は、ハードウェア及びソフトウェアの組合せにより実現される。ハードウェアは、制御部１の一部又は全部として構成され、このハードウェアとしては、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＶＰＵ（Vision Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＦＰＧＡ（Field Programmable Gate Array）、ＡＳＩＣ（Application Specific Integrated Circuit）、あるいは、これらのうち２以上の組合せなどが挙げられる。

　記憶部２は、制御部１の処理に必要な各種のプログラムや、各種のデータが記憶される不揮発性のメモリと、制御部１の作業領域として用いられる揮発性のメモリとを含む。なお、上記各種のプログラムは、光ディスク、半導体メモリなどの可搬性の記録媒体から読み取られてもよいし、ネットワーク上のサーバ装置からダウンロードされてもよい。

　＜動作説明＞
　次に、ＨＭＤ１０の制御部１の処理について説明する。

　［自己位置推定処理］
　まず、制御部１の自己位置推定処理について説明する。図４は、制御部１の自己位置推定処理を示すフローチャートである。まず、制御部１は、正面カメラ６から正面画像を取得し、側面カメラ７から側面画像を取得する（ステップ１０１）。

　次に、制御部１は、正面画像及び側面画像に基づいて、端末における世界座標系での自己位置姿勢を推定する（ステップ１０２）。そして、制御部１は、推定された自己位置姿勢を、時刻情報に関連付けて記憶部２に記憶させ（ステップ１０３）、その後、ステップ１０１へ戻る。

　ここでの説明では、自己位置推定において、正面画像及び側面画像の両方が用いられる場合について説明したが、これらのうちいずれか一方のみが自己位置推定に用いられてもよい。

　自己位置推定においては、例えば、画像情報（正面画像及び／又は側画画像）から抽出された特徴点群と、マップ情報に含まれる特徴点群とが比較されて、ＨＭＤ１０の自己位置推定が実行される。

　自己位置推定に用いられるマップ情報は、事前に作成される方法と、事前に作成せずに自己位置推定と同時に作成する方法とが存在するが、どちらの方法が用いられてもよい。なお、マップ情報を自己位置推定と同時に作成する方法は、一般的にＳＬＡＭ（Simultaneous Localization and Mapping）と呼ばれる。

　自己位置推定は、リローカライゼイション及びモーショントラッキングを含む。リローカライゼイションは、画像情報の特徴点群及びマップ情報の特徴点群に基づいて、世界座標系において自己位置推定を行う技術である。

　このリローカライゼイションは、ＨＭＤ１０に電源が投入された直後や、モーショントラッキングに基づく自己位置推定が失敗したとき等に実行される。また、画像情報からの特徴点群と、マップ情報に含まれる特徴点群とを比較する処理が常時実行され、これらの特徴点群のマッチングが成功したときにリローカライゼイションが実行されてもよい。

　モーショントラッキングは、画像情報（又は慣性情報）に基づき、微小時間毎に、自己位置及び姿勢の変化量（動き）を算出し、この変化量を順次加算することで、世界座標系において現在の自己位置推定を実行する技術である。

　モーショントラッキングでは、まず、画像情報が画像処理されて画像情報から特徴点群が抽出される。そして、前回における画像情報の特徴点群と、今回における画像情報の特徴点群との比較により、前回の自己位置及び姿勢と今回の自己位置及び姿勢の変化量が算出される。この変化量が前回における自己位置及び姿勢に加算されることで、世界座標系において現在における自己位置推定が実行される。

　ここでの説明では、モーショントラッキングについて撮像部５からの画像情報が用いられる場合について説明したが、画像情報の代わりに、慣性センサ４からの慣性情報が用いられてもよい。あるいは、画像情報及び慣性情報の両方が用いられてもよい。

　また、自己位置推定において、画像情報に基づいて推定された自己位置姿勢が慣性情報に基づいて補正されてもよい。

　なお、現在において自己位置推定技術として各種の方法が提案されているが、典型的には、端末装置２０は、どのような方法により自己位置推定処理を実行してもよい。

　ここで、図４に示す自己位置推定の処理のループは、高頻度のループ（例えば、１００～２００回／秒）とされている。

　［ＨＭＤ１０に対する対象物の位置姿勢の認識処理］
　次に、ＨＭＤ１０に対する対象物の相対的な位置姿勢の認識（推定）処理について説明する。本実施形態では、制御部１は、正面画像に基づいて、ＡＲ表示画角内の対象物のＨＭＤ１０に対する位置姿勢を推定して認識する認識処理（以下、正面画像に基づく対象物の位置姿勢認識処理）を実行する。

　また、制御部１は、ＡＲ表示画角外に存在する対象物が、ＡＲ表示画角内に入ったときのために、側面画像に基づいて、ＡＲ表示画角外の対象物のＨＭＤ１０に対する位置姿勢を事前に推定して認識する事前認識処理（以下、側面画像に基づく対象物の事前位置姿勢認識処理）を実行する。

　また、本実施形態では、正面画像に基づく対象物の位置姿勢認識処理、並びに、側面画像に基づく対象物の事前位置姿勢認識処理について、それぞれ、検知処理（Ｄｉｔｅｃｔｉｏｎ）及び追跡処理（Ｔｒａｃｋｉｎｇ）が存在する。

　つまり、本実施形態では、ＨＭＤ１０に対する対象物の相対的な位置姿勢の認識処理について、以下の（１）～（４）の４つの処理が実行される。
　１．正面画像に基づく対象物の位置姿勢認識処理
　（１）正面画像における対象物の検知処理（第２の検知処理）
　（２）正面画像における対象物の追跡処理（第２の追跡処理）
　２．側面画像に基づく対象物の事前位置姿勢認識処理
　（３）側面画像における対象物の検知処理（第１の検知処理）
　（４）側面画像における対象物の追跡処理（第１の追跡処理）

　ここで、検知処理は、一枚の画像から、対象物に関する前情報なしで、ＨＭＤ１０に対する対象物の位置姿勢を推定して認識する技術である。この検知処理では、画像内に対象物が写っているかどうか（対象物が検知されたかどうか）が判断され、また、画像内に対象物が写っている場合には、ＨＭＤ１０に対する対象物の相対位置姿勢が推定される。

　一方、追跡処理は、ＨＭＤ１０に対する対象物の以前の位置姿勢が、前情報として予め与えられている状態で、ＨＭＤ１０に対する対象物の位置姿勢を推定して認識する技術である。この追跡処理では、検知処理により対象物が検知された後に、前情報を元に対象物の動きが追跡されて、ＨＭＤ１０に対する対象物の位置姿勢が推定される。

　「正面画像内検知処理」
　まず、正面画像における対象物の検知処理（第２の検知処理）について説明する。図５は、正面画像における対象物の検知処理を示すフローチャートである。

　まず、制御部１は、正面画像を正面カメラ６から取得する（ステップ２０１）。次に、制御部１は、正面画像内に、仮想オブジェクト９のＡＲ表示の対象となる対象物が写っているかどうか（対象物が検知されたかどうか）を判定する（ステップ２０２）。

　対象物は、例えば、現実世界に予め用意されたＡＲマーカなどであってもよいし（マーカ型ＡＲ）、図３に示すような木馬や人等の現実世界に存在する物体であってもよい（マーカレス型ＡＲ）。

　正面画像内に対象物が写っているかどうかの判定については、まず、制御部１は、正面画像から特徴点群を抽出する。次に、制御部１は、正面画像から抽出された特徴点群と、対象物の認識モデルの特徴点群（予め記憶部２に記憶されている）とを比較することで、正面画像内に対象物が写っているかどうかを判定する。

　正面画像内に対象物が写っていない場合（対象物が検知されなかった場合）（ステップ２０２のＮＯ）、制御部１は、ステップ２０１へ戻り、再び正面カメラ６から正面画像を取得する。一方、正面画像内に対象物が写っている場合（ステップ２０２のＹＥＳ）、制御部１は、正面画像における対象物に対応する特徴点群に基づいて、ＨＭＤ１０に対する対象物の相対的な位置姿勢を推定して認識する（ステップ２０３）。

　次に、制御部１は、ＨＭＤ１０に対する対象物の相対的な位置姿勢を、時刻情報に関連付けて記憶部２に記憶し（ステップ２０４）、ステップ２０１へ戻る。

　なお、図５に示す正面画像における検知処理は、典型的には、１つの対象物が検知された後も、繰り返して実行される。これは、正面画像内に対象物が複数存在する場合があるためである。一方、仮想オブジェクト９を１つしかＡＲ表示しない場合、１つの対象物が検知されたとき、その対象物の追跡ができている間（図６のステップ３０４参照）は、図５に示す検知処理を停止することも可能である。

　「正面画像内追跡処理」
　次に、正面画像における対象物の追跡処理（第２の追跡処理）について説明する。図６は、正面画像における対象物の追跡処理を示すフローチャートである。

　まず、制御部１は、正面画像における対象物の検知処理により、対象物が検知されたかどうかを判定する（ステップ３０１）（図５のステップ２０２参照）。対象物が検知されなかった場合（ステップ３０１のＮＯ）、制御部１は、ステップ３０１へ戻る。

　一方、対象物が検知された場合（ステップ３０１のＹＥＳ）、制御部１は、正面カメラ６から正面画像を取得する（ステップ３０２）。次に、制御部１は、ＨＭＤ１０に対する対象物の前回の位置姿勢（前情報）を用いて、正面画像における対象物に対応する特徴点群に基づいて、ＨＭＤ１０に対する対象物の相対的な位置姿勢を推定して認識する（ステップ３０３）。

　次に、制御部１は、対象物の位置姿勢が認識可能であったかどうか（対象物が追跡可能であったかどうか）を判定する（ステップ３０４）。対象物の位置姿勢が認識不能（対象物が追跡不能）であった場合（ステップ３０４のＮＯ）、制御部１は、ステップ３０１へ戻る。

　なお、対象物の位置姿勢が認識不能となるケースとしては、例えば、以下の（１）、（２）のケースが挙げられる。（１）正面カメラ６の画角から対象物が外れてしまい、正面画像に対象物が写らなくなった。（２）正面画像に対象物は写っているものの、例えば、ユーザが首を振った等が理由でＨＭＤ１０の姿勢変化の速度が速く、正面画像内の対象物がぼやけてしまい対象物の位置姿勢を推定して認識することができない。

　ステップ３０４において、対象物の位置姿勢が認識可能（対象物が追跡可能）であった場合（ステップ３０４のＹＥＳ）、制御部１は、次のステップ３０４へ進む。ステップ３０４では、制御部１は、ＨＭＤ１０に対する対象物の相対的な位置姿勢を、時刻情報に関連付けて記憶部２に記憶する。そして、制御部１は、ステップ３０２へ戻る。

　なお、図６に示す正面画像における対象物の追跡処理は、正面画像内で対象物が検知されると、対象物毎に実行される。例えば、２つの対象物が正面画像に写っており、正面画像内で２つの対象物が検知された場合、図６に示す正面画像における追跡処理が、２つ並列して実行されることになる。なお、仮想オブジェクト９を１つしかＡＲ表示しない場合には、追跡処理を対象物毎に並列して実行する必要はない。

　「側面画像内検知処理」
　次に、側面画像における対象物の検知処理（第２の検知処理）について説明する。図７は、側面画像における対象物の検知処理を示すフローチャートである。

　まず、制御部１は、側面画像を側面カメラ７から取得する（ステップ４０１）。次に、制御部１は、側面画像内に、仮想オブジェクト９のＡＲ表示の対象となる対象物が写っているかどうか（対象物が検知されたかどうか）を判定する（ステップ４０２）。

　側面画像内に対象物が写っているかどうかの判定については、まず、制御部１は、側面画像から特徴点群を抽出する。次に、制御部１は、側面画像から抽出された特徴点群と、対象物の認識モデルの特徴点群（予め記憶部２に記憶されている）とを比較することで、側面画像内に対象物が写っているかどうかを判定する。

　側面画像内に対象物が写っていない場合（対象物が検知されなかった場合）（ステップ４０２のＮＯ）、制御部１は、ステップ４０１へ戻り、再び側面カメラ７から側面画像を取得する。一方、側面画像内に対象物が写っている場合（ステップ４０２のＹＥＳ）、制御部１は、側面画像における対象物に対応する特徴点群に基づいて、ＨＭＤ１０に対する対象物の相対的な位置姿勢を事前に推定して認識する（ステップ４０３）。

　次に、制御部１は、ＨＭＤ１０に対する対象物の相対的な位置姿勢を、時刻情報に関連付けて記憶部２に記憶し（ステップ４０４）、ステップ４０１へ戻る。

　なお、図７に示す側面画像における検知処理は、典型的には、１つの対象物が検知された後も、繰り返して実行される。これは、側面画像内に対象物が複数存在する場合があるためである。なお、仮想オブジェクト９を１つしかＡＲ表示しない場合、１つの対象物が検知されたとき、その対象物の追跡ができている間（図８のステップ５０４参照）は、図７に示す検知処理を停止することも可能である。

　「側面画像内追跡処理」
　次に、側面画像における対象物の追跡処理（第２の追跡処理）について説明する。図８は、側面画像における対象物の追跡処理を示すフローチャートである。

　まず、制御部１は、側面画像における対象物の検知処理により、対象物が検知されたかどうかを判定する（ステップ５０１）（図７のステップ４０２参照）。対象物が検知されなかった場合（ステップ５０１のＮＯ）、制御部１は、ステップ５０１へ戻る。

　一方、対象物が検知された場合（ステップ５０１のＹＥＳ）、制御部１は、側面カメラ７から側面画像を取得する（ステップ５０２）。次に、制御部１は、ＨＭＤ１０に対する対象物の前回の位置姿勢（前情報）を用いて、側面画像における対象物に対応する特徴点群に基づいて、ＨＭＤ１０に対する対象物の相対的な位置姿勢を事前に推定して認識する（ステップ５０３）。

　次に、制御部１は、対象物の位置姿勢が認識可能であったかどうか（対象物が追跡可能であったかどうか）を判定する（ステップ５０４）。対象物の位置姿勢が認識不能（対象物が追跡不能）であった場合（ステップ５０４のＮＯ）、制御部１は、ステップ５０１へ戻る。

　なお、対象物の位置姿勢が認識不能となるケースとしては、例えば、以下の（１）、（２）のケースが挙げられる。（１）側面カメラ７の画角から対象物が外れてしまい、側面画像に対象物が写らなくなった。（２）側面画像に対象物は写っているものの、例えば、ユーザが首を振った等が理由でＨＭＤ１０の姿勢変化の速度が速く、側面画像内の対象物がぼやけてしまい対象物の位置姿勢を推定して認識することができない。

　ステップ５０４において、対象物の位置姿勢が推定可能（対象物が追跡可能）であった場合（ステップ５０４のＹＥＳ）、制御部１は、次のステップ５０４へ進む。ステップ５０４では、制御部１は、ＨＭＤ１０に対する対象物の相対的な位置姿勢を、時刻情報に関連付けて記憶部２に記憶する。そして、制御部１は、ステップ５０２へ戻る。

　なお、図８に示す側面画像における対象物の追跡処理は、側面画像内で対象物が検知されると、対象物毎に実行される。例えば、２つの対象物が側面画像に写っており、側面画像内で２つの対象物が検知された場合、図８に示す側面画像における追跡処理が、２つ並列して実行されることになる。なお、仮想オブジェクト９を１つしかＡＲ表示しない場合には、追跡処理を対象物毎に並列して実行する必要はない。

　［処理のループの頻度］
　次に、（１）正面画像における対象物の検知処理、（２）正面画像における対象物の追跡処理、（３）側面画像における対象物の検知処理、（４）側面画像における対象物の追跡処理における４つの処理のループの頻度について説明する。

　一般的に、前情報なしに対象物の位置姿勢を推定する検知処理は、前情報が与えられた状態で対象物の位置姿勢を推定する追跡処理よりも計算量が多い。従って、検知処理における処理のループの頻度は、追跡処理における処理のループの頻度よりも低い。

　従って、（１）正面画像における対象物の検知処理のループの頻度は、（２）正面画像における対象物の追跡処理のループの頻度よりも低く、また、（３）側面画像における対象物の検知処理のループの頻度は、（４）側面画像における対象物の追跡処理のループの頻度よりも低い。

　また、本実施形態では、省電力化及び計算量削減のために、（１）正面画像における対象物の検知処理のループの頻度と、（３）側面画像における対象物の検知処理のループの頻度と異ならせることとしている。また、（２）正面画像における対象物の追跡処理のループの頻度と、（４）側面画像における対象物の追跡処理のループの頻度とを異ならせることとしている。

　正面画像に対象物が写るっている場合には仮想オブジェクト９をＡＲ表示する必要があるので、正面画像に基づく対象物の位置姿勢推定処理は、重要度が高い。従って、（２）正面画像における対象物の追跡処理は、高頻度（例えば、１００～２００回／秒）（第２の頻度）で繰り返し実行される。また、正面画像の撮像の頻度は、追跡処理のループの頻度に合わせて、高頻度（例えば、１００～２００回／秒）で繰り返し実行される。

　また、検知処理は、追跡処理よりも計算量が多い処理であるので、（１）正面画像における対象物の検知処理は、中頻度（例えば、３０～６０回／秒）（第４の頻度）で繰り返し実行される。

　一方、側面画像に基づく対象物の事前位置姿勢推定の結果は、その時点ではＡＲ表示に用いられることはなく、その後に、ユーザが側方に位置する対象物の方向を向いたとき等に初めて用いられる情報である。従って、（４）側面画像における対象物の追跡処理は、中頻度（例えば、２０～４０回／秒）（第１の頻度）で繰り返し実行される。また、側面画像の撮像の頻度は、追跡処理のループの頻度に合わせて、中頻度（例えば、２０～４０回／秒）で繰り返し実行される。

　また、検知処理は、追跡処理よりも計算量が多い処理であるので、（３）側面画像における対象物の検知処理は、低頻度（例えば、５～１０回／秒）（第３の頻度）で繰り返し実行される。なお、この頻度は、側面での対象物の検知が遅延しない程度の頻度とされる。

　つまり、本実施形態では、（４）側面画像における対象物の追跡処理のループの頻度は、（２）正面画像における対象物の追跡処理のループの頻度よりも低く設定される。また、本実施形態では、（３）側面画像における対象物の検知処理のループの頻度は、（１）正面における対象物の検知処理のループの頻度よりも低く設定される。

　これにより、側面画像に基づく対象物の事前位置姿勢推定処理の処理負荷が低減され、省電力化が実現される。特に、ＨＭＤ１０をスタンドアローンで動作させる場合、このように省電力化を図ることが有効である。

　ここで、（３）側面画像における対象物の検知処理、（４）側面画像における対象物の追跡処理における２つのループの頻度は、正面に対する側面カメラの位置（角度）が遠くなるほどその頻度が低くなるように設定されていてもよい。

　［仮想オブジェクト９のＡＲ表示処理］
　つぎに、仮想オブジェクト９のＡＲ表示処理について説明する。図９は、仮想オブジェクト９のＡＲ表示処理を示すフローチャートである。

　まず、制御部１は、正面画像に基づいて、ＨＭＤ１０に対する対象物の位置姿勢が認識されたかどうかを判定する（図５及び図６参照）。正面画像に基づいて、ＨＭＤ１０に対する対象物の位置姿勢が認識された場合（ステップ６０１のＹＥＳ）、制御部１は、次のステップ６０２に進む。一方、正面画像に基づいて、ＨＭＤ１０に対する対象物の位置姿勢が認識されなかった場合（ステップ６０１のＮＯ）、制御部１は、ステップ６０２～６０６をとばして、ステップ６０７に進む。

　ステップ６０２では、制御部１は、現在において、事前認識に係る対象物のＨＭＤ１０に対する位置姿勢の予測を実行中であるかどうかを判定する。なお、この予測については、後述のステップ６１０において詳述する。

　予測を実行中である場合（ステップ６０２のＹＥＳ）、制御部１は、事前認識に係る対象物のＨＭＤ１０に対する位置姿勢の予測を終了し（ステップ６０３）、次のステップ６０４へ進む。一方、予測を実行中ではない場合（ステップ６０３のＮＯ）、制御部１は、ステップ６０３をとばしてステップ６０４へ進む。

　ステップ６０４では、制御部１は、予測結果に基づく仮想オブジェクト９のＡＲ表示を実行中であるかどうかを判定する。なお、予測結果に基づく仮想オブジェクト９のＡＲ表示については、後述のステップ６１２において詳述する。

　予測結果に基づく仮想オブジェクト９のＡＲ表示を実行中である場合（ステップ６０４のＹＥＳ）、制御部１は、予測結果に基づく仮想オブジェクト９のＡＲ表示を終了し（ステップ６０５）、次のステップ６０６へ進む。一方、予測結果に基づく仮想オブジェクト９のＡＲ表示を実行中ではない場合（ステップ６０４のＮＯ）、制御部１は、ステップ６０５をとばしてステップ６０６へ進む。

　ステップ６０６では、制御部１は、正面画像に基づいて認識された、ＨＭＤ１０に対する対象物の位置姿勢に基づいて、対象物に対して仮想オブジェクト９をＡＲ表示する。

　次に、制御部１は、ＨＭＤ１０を装着したユーザにより首振りが開始されたかどうか（首振りの速度が閾値以上となったかどうか）を判定する（ステップ６０７）。この場合、制御部１は、典型的には、ＨＭＤ１０の姿勢変化の速度が所定の閾値を超えたかどうかを判断することでユーザによる首振りの開始を判定する。

　ＨＭＤ１０による姿勢変化の速度は、慣性センサ４からの慣性情報に基づいて判定されてもよいし、自己位置推定による値に基づいて判定されてもよい。

　なお、ステップ６０７において、制御部１は、ＨＭＤ１０の姿勢変化の速度と、事前認識された対象物の位置姿勢とに基づいて、端末に対する事前認識された対象物の速度（例えば、垂直軸回り）を予測し、予測された速度が閾値を超えたかどうかを判定してもよい。これは、対象物が人等である場合には、対象物が動く場合があるためであり、このような処理により、対象物が動く場合に適切に対応することができる。

　首振りが開始されていない場合（ステップ６０７のＮＯ）、制御部１は、ステップ１０１へ戻る。一方、首振りが開始された場合（ステップ６０７のＹＥＳ）、正面カメラ６及び側面カメラ７による撮像を停止させ、正面画像に基づく対象物の位置姿勢認識処理及び側面画像に基づく対象物の事前位置姿勢認識処理を停止させる（ステップ６０８）。

　これは、首振りが開始されると、画像にブラーが乗って被写体がぼやけてしまい、正面画像に基づく対象物の位置姿勢認識処理及び側面画像に基づく対象物の事前位置姿勢認識処理が適切に行えなくなってしまうためである。従って、これらの処理の意味がなくなってしまうので、本実施形態では、省電力化のために撮像やこれらの処理を停止させることとしている。なお、撮像やこれらの処理を継続することも可能である。

　撮像を停止させた後、制御部１は、首振り開始時（あるいはそれよりも多少前の時点）において、側面画像に基づいて対象物が事前認識されていたかどうかを判定する（ステップ６０９）（図７及び図８参照）。

　対象物が事前認識されていなかった場合（ステップ６０９のＮＯ）、制御部１は、首振りが終了したかどうかを判定し（ステップ６１５）、首振りが終了した場合には、正面カメラ６及び側面カメラ７での撮像を開始する（ステップ６１４）。

　一方、対象物が事前認識されていた場合（ステップ６０９のＹＥＳ）、制御部１は、事前認識された対象物のＨＭＤ１０に対する位置姿勢の予測を開始する（ステップ６１０）。この予測では、制御部１は、事前認識された対象物のＨＭＤ１０に対する位置姿勢と、ＨＭＤ１０の現在の自己位置姿勢とに基づいて、現在のＨＭＤ１０の位置姿勢に対する現在の対象物の相対的な位置姿勢を予測する。なお、この予測は、事前認識された対象物が動いていた場合には、動きによる予測も含む。

　次に、制御部１は、予測結果（現在のＨＭＤ１０の位置姿勢に対する現在の対象物の相対的な位置姿勢）に基づいて、事前認識された対象物が表示部３のＡＲ表示画角内に入ったどうかを判定する（ステップ６１１）。

　事前認識された対象物が表示部３のＡＲ表示画角内に入った場合（ステップ６１１のＹＥＳ）、制御部１は、予測の結果に基づいて、仮想オブジェクト９のＡＲ画像を生成（描画）して仮想オブジェクト９をＡＲ表示する処理を開始する（ステップ６１２）。なお、ＡＲ画像が生成されている間に、ＨＭＤ１０の自己位置姿勢は多少変化することがあるので、仮想オブジェクト９のＡＲ表示位置は、ＨＭＤ１０における最新の自己位置姿勢に基づいて補正されてもよい。

　予測の結果に基づく、仮想オブジェクト９のＡＲ表示を開始すると、次に、制御部１は、ステップ６１３へ進む。また、ステップ６１１において、事前認識された対象物が表示部３のＡＲ表示画角内に入っていない場合（ステップ６１１のＮＯ）、ステップ６１２をとばして、ステップ６１３へ進む。

　ステップ６１３では、制御部１は、ＨＭＤ１０を装着したユーザにより首振りが終了されたかどうか（首振りの速度が閾値以下となったかどうか）を判定する。この場合、制御部１は、典型的には、ＨＭＤ１０の姿勢変化の速度が所定の閾値以下となったかどうかを判断することでユーザによる首振りの終了を判定する。

　なお、ステップ６１３において、制御部１は、ＨＭＤ１０の姿勢変化の速度と、事前認識された対象物の位置姿勢とに基づいて、端末に対する事前認識された対象物の速度（例えば、垂直軸回り）を予測し、予測された速度が閾値以下となったかどうかを判定してもよい。これは、対象物が人等ある場合には、対象物が動く場合があるためであり、このような処理により、対象物が動く場合に適切に対応することができる。

　なお、ステップ６１３における処理と、ステップ６１５における処理とは典型的には同じである。

　ステップ６１３において、首振りが終了していない場合（ステップ６１３のＮＯ）、制御部１は、ステップ６１１へ戻る。一方、ステップ６１３において、首振りが終了した場合、制御部１は、正面カメラ６及び側面カメラ７における撮像を開始する（ステップ６１４）。そして、制御部１は、ステップ６０１へ戻る。

　なお、本実施形態では、予測の期間は、ＨＭＤ１０の首振りが検知されてから（ＨＭＤ１０の姿勢変化の速度が所定の閾値以上となってから）、正面画像に基づく対象物の認識処理において、事前認識された対象物の認識が完了するまでの間の期間とされている。また、本実施形態では、予測に基づく仮想オブジェクト９のＡＲ表示期間は、事前認識された対象物がＡＲ表示画角内に入ってから、正面画像に基づく対象物の位置姿勢認識処理において対象物の認識が完了するまでの間の期間とされている。

　＜作用等＞
　次に、本実施形態に係るＨＭＤ１０における処理の流れと、比較例に係るＨＭＤ２０における処理の流れとを比較しつつ、本実施形態における作用等について説明する。図１０は、本実施形態に係るＨＭＤ１０における処理の流れと、比較例に係るＨＭＤ２０における処理の流れとが比較された図である。

　図１１は、比較例に係るＨＭＤ２０において、ユーザにより首が振られたときに仮想オブジェクト９がどのタイミングでＡＲ表示されるかを示す図である。図１２は、本実施形態に係るＨＭＤ１０において、ユーザにより首が振られたときに仮想オブジェクト９がどのタイミングでＡＲ表示されるかを示す図である。

　まず、図１０における上側の図と、図１１を参照して、比較例に係るＨＭＤ２０の処理の流れについて説明する。

　比較例に係るＨＭＤ２０においては、側面カメラ７が設けられておらず、従って、首振り前において、対象物を事前認識することができない。ユーザの首振りによりＡＲ表示画角内に対象物が入ったとき、首振りによって、正面画像にブラーが乗ってしまい対象物がぼやけてしまう。このため、対象物がＡＲ表示画角に入った時点では、正面画像に基づいて、ＨＭＤ１０に対する対象物の位置姿勢を認識することができず、この認識に基づくＡＲ表示も行うことができない。

　首振りの速度が遅くなり、正面画像に基づいて、ＨＭＤ１０に対する対象物の位置姿勢の認識が可能となると、対象物の認識が開始される。そして、ＨＭＤ１０に対する対象物の位置姿勢の認識が完了すると、仮想オブジェクト９のＡＲ画像が生成（描画）されて、仮想オブジェクト９がＡＲ表示される。

　つまり、ユーザからすると、ＡＲ表示されていない仮想オブジェクト９が対象物に対して突然ＡＲ表示されることになる。このような場合、ユーザは、違和感や、不快感等を覚えやすい。

　次に、図１０の下側及び図１２を参照して、本実施形態に係るＨＭＤ１０における処理の流れについて説明する。

　本実施形態に係るＨＭＤ１０においては、側面カメラ７が設けられているため、首振り前において、対象物を事前認識することが可能である（図７及び図８参照）。ユーザの首振りの開始が検知されると（図９：ステップ６０７のＹＥＳ参照）、事前認識された対象物のＨＭＤ１０に対する位置姿勢の予測が開始される（ステップ６１０参照）。

　ＡＲ表示画角内に対象物が入ったとき（ステップ６１１参照）、予測の結果に基づく、仮想オブジェクト９のＡＲ表示が開始される（ステップ６１２参照）。

　首振りの速度が遅くなり（ステップ６１３のＹＥＳ参照）、正面画像に基づいて、ＨＭＤ１０に対する対象物の位置姿勢の認識が可能となると、正面画像に基づく対象物の認識が開始される。そして、正面画像に基づくＨＭＤ１０に対する対象物の位置姿勢の初回の認識（つまり、正面画像に基づく対象物の検知処理）が完了すると（ステップ６０１のＹＥＳ参照）、予測ではなく、正面画像による対象物の位置姿勢の認識に基づいて、仮想オブジェクト９がＡＲ表示される（ステップ６０６参照）。

　以上説明したように、本実施形態では、ＡＲ表示画角よりも外側の領域を撮像可能な側面カメラ７からの側面画像に基づいてＡＲ表示画角外の対象物のＨＭＤ１０に対する位置姿勢を事前に認識する事前認識処理が実行され、対象物がＡＲ表示画角内に入ったとき、事前認識された対象物の位置姿勢に基づいて、対象物に対して仮想オブジェクト９がＡＲ表示される。

　これにより、対象物がＡＲ表示画角に入ったときに遅延なく仮想オブジェクト９をＡＲ表示することができる。従って、ＡＲ表示されていない仮想オブジェクト９が対象物に対して突然ＡＲ表示されるようなことがなくなり、ユーザに対して、違和感や、不快感等を覚えさせてしまうことを防止することができる。

　また、本実施形態では、事前認識された対象物の位置姿勢と、推定されたＨＭＤ１０の自己位置姿勢とに基づいて対象物の位置姿勢が予測され、対象物がＡＲ表示画角内に入ったとき、予測の結果に基づいて、対象物に対して仮想オブジェクト９がＡＲ表示される。

　このような予測に基づいて、対象物がＡＲ表示されることで、対象物がＡＲ表示画角に入ったときに、適切に遅延なく仮想オブジェクト９をＡＲ表示することができる。

　また、本実施形態では、（４）側面画像における対象物の追跡処理のループの頻度は、（２）正面画像における対象物の追跡処理のループの頻度よりも低く設定される。また、本実施形態では、（３）側面画像における対象物の検知処理のループの頻度は、（１）正面における対象物の検知処理のループの頻度よりも低く設定される。

　≪各種変形例≫
　＜正面カメラ６における露光タイミング＞
　次に、正面カメラ６による露光タイミングについて説明する。図９を参照して、制御部１は、首振りの速度がある程度遅くなると、停止されていた正面カメラ６の撮像を開始する（ステップ６１４参照）。このときの正面カメラ６の露光タイミングを調整することで、正面画像に基づくＨＭＤ１０に対する対象物の位置姿勢の初回の認識の完了（ステップ６０１参照）を早めてもよい。

　ここで、首振りの速度が遅くなって、正面カメラ６の露光が開始されるとき、露光の開始タイミングが少し早いと仮定する。この場合、正面画像の後半部分は、対象物を認識可能な部分であるのにも関わらず、正面画像の前半部分にブラーが乗ってしまい、その画像全体としては、対象物を認識できなくなってしまう可能性がある。この場合、正面画像の露光が始まるタイミングによっては、最大１フレーム分遅れて認識が完了してしまう可能性がある。これは、比較的に正確である正面画像に基づく対象物の検知処理が遅れてしまう原因になる。

　正面カメラ６による理想的な露光の開始タイミングは、首振りの速度（ＨＭＤ１０の姿勢変化の速度）が、正面画像に基づく対象物の検知処理が可能な速度となった直後である。これについては、露光時間と、慣性情報（または、自己位置推定による姿勢変化）とから閾値が決められることで実現可能である。

　つまり、制御部１は、ＨＭＤ１０の姿勢変化の速度に基づいて、露光の開始タイミングを決定（調整）してもよい。

　なお、対象物が人等である場合には、対象物が動く場合がある。この場合、首振りの速度（ＨＭＤ１０の姿勢変化の速度）だけでなく、対象物の動きも考慮して、ＨＭＤ１０に対する対象物の相対的な速度の予測が必要である。従って、この場合、制御部１は、ＨＭＤ１０の姿勢変化の速度と、事前認識された対象物の位置姿勢とに基づいて、端末に対する対象物の速度を予測し、予測された速度に基づいて、正面画像の露光のタイミングを決定（調整）してもよい。

　＜正面カメラ６における露光時間＞
　次に、正面カメラ６による露光時間について説明する。図９を参照して、制御部１は、首振りの速度がある程度遅くなると、停止されていた正面カメラ６の撮像を開始する（ステップ６１４参照）。このときの正面カメラ６の露光時間を調整することで、正面画像に基づくＨＭＤ１０に対する対象物の位置姿勢の初回の認識の完了（ステップ６０１参照）を早めてもよい。

　ここで、首振りの速度が遅くなって、正面カメラ６による撮像が行われるとき、露光時間を一時的に短くすることで、正面画像に基づく対象物の検知処理（つまり、初回の認識）が早くなる可能性がある。一方、露光時間を短くすると、画像が暗くなってしまったり、また、感度向上のためにノイズが乗ってしまったりしてしまう可能性があり、これにより認識の精度が低下してしまうことが考えらえる。従って、首振りの速度がさらに遅くなって、通常の露光時間でも対象物を認識できることが感知されたときに、露光時間が通常の露光時間に戻されてもよい。

　つまり、制御部１は、ＨＭＤ１０の姿勢変化の速度に基づいて、露光時間を決定（調整）してもよい。

　なお、対象物が人等である場合には、対象物が動く場合がある。この場合、首振りの速度（ＨＭＤ１０の姿勢変化の速度）だけでなく、対象物の動きも考慮して、ＨＭＤ１０に対する対象物の相対的な速度の予測が必要である。従って、この場合、制御部１は、ＨＭＤ１０の姿勢変化の速度と、事前認識された対象物の位置姿勢とに基づいて、端末に対する対象物の速度を予測し、予測された速度に基づいて、正面画像の露光時間を決定（調整）してもよい。

　＜表示部３のＡＲ表示画角と、カメラ画角の関係＞
　ここで、表示部３のＡＲ表示画角を１つのカメラの撮像画角で覆えている場合、そのカメラが正面カメラ６とされればよい。一方で、ＡＲ表示画角を１つのカメラの撮像画角で覆えていない場合、複数のカメラが正面カメラ６とされる。この場合、複数の正面カメラ６は、互いに撮像画角が部分的に重なるようにして配置される。

　この場合、複数の正面カメラ６の画像のうち、対象物が写っていない画像については、追跡処理を行う必要はなく、検知処理だけ行われればよい。この場合、複数の正面カメラ６間での対象物の移動につては、上述の正面カメラ６及び側面カメラ７間での対象物の移動のように、移動先のカメラで検知処理による認識が完了するまでは、上記予測や上記予測結果に基づくＡＲ表示が実行されればよい。なお、正面カメラ６の画角同士が重なっている領域が広いほど予測に頼る時間が短くなる。

　図１３は、複数の正面カメラ６が用いられた場合の様子を示す図である。

　これらの正面カメラ６は、それぞれ、表示部３のＡＲ表示画角に対応する領域を撮像可能に構成されており、かつ、表示部３のＡＲ表示画角よりも外側の領域を撮像可能に構成されている。つまり、ここでの例での正面カメラ６は、第２の撮像部でもあり、第１の撮像部でもある。なお、図１３の説明では、右側の正面カメラ６を第１の正面カメラ６と呼び、左側の正面カメラ６を第２の正面カメラ６と呼ぶ。

　図１３の例では、正面カメラ６がＡＲ表示画角内及びＡＲ表示画角外の両方を撮像可能である場合に、省電力化のために、対象物がＡＲ表示画角内に存在するか、ＡＲ表示画角外に存在するかに応じて、追跡処理の頻度を異ならせている。

　以下、対象物が（Ａ）～（Ｃ）に存在するとして、場合分けして説明する。なお、検知処理については、新たな対象物がＡＲ表示画角内に新たに現れることを考慮して、対象物が（Ａ）～（Ｃ）のどの位置に存在していても、制御部１は、第１の正面カメラ６及び第２の正面カメラ６からの画像に基づいて、それぞれ、中頻度で検知処理を実行する。

　（Ａ）の場合、つまり、第１の正面カメラ６及び第２の正面カメラ６の両方の撮影画角内に対象物が入っているときを考える。この場合、第１の正面カメラ６及び第２の正面カメラ６の両方の撮影画角内に入っているため、制御部１は、一方の正面カメラ６からの画像に基づいて、追跡処理を高頻度で行えば十分である。

　（Ｂ）の場合、つまり対象物が第１の正面カメラ６の撮影画角内、かつ、第２の正面カメラ６の撮影画角外、かつ、ＡＲ表示画角内に存在しているときを考える。この場合は、制御部１は、第１の正面カメラ６からの画像情報のみに基づいて、高頻度で追跡処理を行う。

　（Ｃ）の場合、つまり、対象物が、第１の正面カメラ６の撮影画角内、かつ、第２の正面カメラ６の撮影画角外、かつ、ＡＲ表示画角外に存在しているときを考える。この場合はＡＲ表示画角内に対象物がないので、制御部１は、首振りに備えてあらかじめ対象物の位置姿勢を認識する。そのため、制御部１は、中頻度で追跡処理を行えばよい。

　つまり、ここでの例では、第１の正面カメラ６は、ＡＲ表示画角よりも外側の領域（Ｃ）と、ＡＲ表示画角に対応する領域（Ａ）及び（Ｂ）との両方の領域を撮像可能である。

　そして、制御部１は、第１の正面カメラ６からの画像のうち、ＡＲ表示画角よりも外側の領域（Ｃ）の画像情報に基づいて、ＨＭＤ１０に対する対象物の事前位置姿勢認識処理を実行する。また、制御部１は、第１の正面カメラ６からの画像のうち、ＡＲ表示画角に対応する領域（Ａ）及び（Ｂ）の画像情報に基づいて、ＨＭＤ１０に対する対象物の位置姿勢認識処理を実行する。

　また、制御部１は、事前位置姿勢認識処理において、ＡＲ表示画角よりも外側の領域の画像情報に基づいて前記対象物の動きを追跡する追跡処理（第３の追跡処理）を中頻度（第５の頻度）で繰り返し実行する。

　また、制御部１は、位置姿勢認識処理において、ＡＲ表示画角に対応する領域の画像情報に基づいて対象物の動きを追跡する追跡処理（第４の追跡処理）を、中頻度よりも高い高頻度（第６の頻度）で繰り返し実行する。

　このような処理により適切に省電力化を図ることができる。

　＜専用カメラ＞
　本技術のために、専用のカメラがＨＭＤ１０に搭載されるかどうかについて説明する。本技術のために、専用のカメラを搭載することも可能であるが、既存のＨＭＤ１０に既に搭載されているカメラが用いられてもよい。ＨＭＤ１０は、一般的に自己位置姿勢の推定（ＳＬＡＭ）のためにカメラを前方だけでなく側面にも有している場合が多い。そのため自己位置姿勢の推定に用いられているカメラが本技術において用いられてもよい。自己位置推定では撮像した画像の処理を中頻度で実行することで自己位置を推定し、この自己位置を慣性情報に基づいて補正することで自己位置推定自体のレートを向上させているタイプが主流である。従って、本技術とも相性が良い。正面カメラ６に関しては従来の自己位置推定で使用されている正面のカメラの撮影頻度を上げることが想定される（ＳＬＡＭでは、中頻度、本技術では高頻度のため）。

　＜リプロジェクション＞
　本技術とリプロジェクション技術の関連について説明する。どちらも慣性情報を用いた自己位置推定を利用する点に類似はあるが、本技術とリプロジェクションは次の点で異なっている。リプロジェクションは一度レンダリングした画像をより新しい自己位置推定の認識結果を用いて変形させる画像変形の技術である。

　一方、本技術は、正面以外にある対象物を側面カメラ７であらかじめ認識したうえで、自己位置推定を用いて対象物の座標を追跡処理することで首を振ったときでもＡＲ表示が遅れないようにする物体認識の技術である。

　それらの技術は独立なため本技術はリプロジェクションと併用してもよい。リプロジェクションは物体を認識してレンダリングした後に遅延を抑えて重畳ずれを軽減しつつフレームレートを向上できる。しかしまだ認識してない物体に関しては認識及びＡＲ表示ができないので、対象物が目の前にあってもＡＲ表示できない期間が発生する。そこで本技術とリプロジェクションを併用するとこの問題を解決できる。

　＜その他＞
　以上の説明では、端末の一例としてＨＭＤ１０を例に挙げて説明した。一方、端末は、ＨＭＤ１０に限られない。端末は、例えば、ユーザの身体に装着可能なウェアラブルデバイスであってもよいし、ユーザが携帯可能なモバイルデバイスであってもよい。

　ウェアラブルデバイスとしては、例えば、ＨＭＤ１０の他には、リストバンド型、腕時計型、指輪型、ペンダント型等のウェアラブルデバイスが挙げられる。モバイルデバイスとしては、例えば、携帯電話機（スマートフォンを含む）、タブレットＰＣ（Personal Computer）、携帯ゲーム機、携帯音楽プレイヤー等が挙げられる。

　典型的には、端末装置２０は、ＡＲ表示可能であること、実空間における自己位置及び姿勢を推定可能であること、ユーザの移動に伴って移動可能であることの３つの条件を満たすことができる装置であればどのような装置であっても構わない。

　また、以上の説明では、情報処理装置の一例として、ＨＭＤ１０を例に挙げて説明した。つまり、情報処理装置が端末自体である場合について説明した。一方、情報処理装置は、端末自体でなくともよい。典型的には、上記した各種の処理を実行する制御部１を含む装置が情報処理装置と見做される。従って、情報処理装置は、ネットワーク上のサーバ装置などであってもよい。

　本技術は以下の構成をとることもできる。
（１）　端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する制御部
　を具備する情報処理装置。
（２）　（１）に記載の情報処理装置であって、
　前記制御部は、事前認識された前記対象物の位置姿勢と、推定された前記端末の自己位置姿勢とに基づいて前記対象物の位置姿勢を予測し、前記対象物がＡＲ表示画角内に入ったとき、前記予測の結果に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　を具備する情報処理装置。
（３）　（２）に記載の情報処理装置であって、
　前記制御部は、前記ＡＲ表示画角に対応する領域を撮像可能な前記端末の第２の撮像部からの第２の画像情報に基づいて、前記ＡＲ表示画角内の対象物の位置姿勢を認識する認識処理を実行し、認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　情報処理装置。
（４）　（３）に記載の情報処理装置であって、
　前記制御部は、前記対象物がＡＲ表示画角内に入ってから、前記認識処理において前記対象物の認識が完了するまでの間の期間において、前記予測の結果に基づく前記仮想オブジェクトのＡＲ表示を実行する
　情報処理装置。
（５）　（３）又は（４）に記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度が所定の閾値以上となってから、前記認識処理において対象物の認識が完了するまでの間の期間において、前記予測を実行する
　情報処理装置。
（６）　（３）～（５）のうちいずれか１つに記載の情報処理装置であって、
　前記制御部は、前記事前認識処理において、前記第１の画像情報に基づいて前記対象物を検知する第１の検知処理を第１の頻度で繰り返し実行する
　情報処理装置。
（７）　（６）に記載の情報処理装置であって、
　前記制御部は、前記認識処理において、前記第２の画像情報に基づいて前記対象物を検知する第２の検知処理を、前記第１の頻度とは異なる第２の頻度で繰り返し実行する
　情報処理装置。
（８）　（７）に記載の情報処理装置であって、
　前記第１の頻度は、前記第２の頻度よりも低い
　情報処理装置。
（９）　（３）～（８）のうちいずれか１つに記載の情報処理装置であって、
　前記制御部は、前記事前認識処理において、前記第１の画像情報に基づいて前記対象物の動きを追跡する第１の追跡処理を第３の頻度で繰り返し実行する
　情報装置。
（１０）　（９）に記載の情報処理装置であって、
　前記制御部は、前記認識処理において、前記第２の画像情報に基づいて前記対象物の動きを追跡する第２の追跡処理を、前記第の３頻度とは異なる第４の頻度で繰り返し実行する
　情報処理装置。
（１１）　（１０）に記載の情報処理装置であって、
　前記第３の頻度は、前記第４の頻度よりも低い
　情報処理装置。
（１２）　（３）～（１１）のうちいずれか１つに記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度に基づいて、前記第２の撮像部の露光のタイミングを調整する
　情報処理装置。
（１３）　（１２）に記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度と、事前認識された前記対象物の位置姿勢とに基づいて、前記端末に対する対象物の速度を予測し、予測された速度に基づいて、前記第２の撮像部の露光のタイミングを調整する
　情報処理装置。
（１４）　（３）～（１３）のうちいずれか１つに記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度に基づいて、前記第２の撮像部の露光時間を調整する
　情報処理装置。
（１５）　（１４）に記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度と、事前認識された前記対象物の位置姿勢とに基づいて、前記端末に対する対象物の速度を予測し、予測された速度に基づいて、前記第２の撮像部の露光のタイミングを調整する
　情報処理装置。
（１６）　（２）に記載の情報処理装置であって、
　前記第１の撮像部は、ＡＲ表示画角よりも外側の領域と、ＡＲ表示画角に対応する領域との両方の領域を撮像可能であり、
　前記制御部は、前記第１の画像情報のうち、前記ＡＲ表示画角よりも外側の領域の画像情報に基づいて、前記事前認識処理を実行し、前記第１の画像情報のうち、前記ＡＲ表示画角に対応する領域の画像情報に基づいて、前記ＡＲ表示画角内の対象物の位置姿勢を認識する認識処理を実行する
　情報処理装置。
（１７）　（１６）に記載の情報処理装置であって、
　前記制御部は、前記事前認識処理において、前記ＡＲ表示画角よりも外側の領域の画像情報に基づいて前記対象物の動きを追跡する第３の追跡処理を第５の頻度で繰り返し実行する
　情報処理装置。
１８）　（１７）に記載の情報処理装置であって、
　前記制御部は、前記認識処理において、前記ＡＲ表示画角に対応する領域の画像情報に基づいて前記対象物の動きを追跡する第４の追跡処理を、前記第５の頻度とは異なる第６の頻度で繰り返し実行する
　情報処理装置。
（１９）　端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、
　前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　情報処理方法。
（２０）　端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、
　前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　処理をコンピュータに実行させるプログラム。

　１…制御部
　２…記憶部
　３…表示部
　４…慣性センサ
　５…撮像部
　６…正面カメラ
　７…側面カメラ
　１０…ＨＭＤ

Claims

　端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する制御部
　を具備する情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記制御部は、事前認識された前記対象物の位置姿勢と、推定された前記端末の自己位置姿勢とに基づいて前記対象物の位置姿勢を予測し、前記対象物がＡＲ表示画角内に入ったとき、前記予測の結果に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　を具備する情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記制御部は、前記ＡＲ表示画角に対応する領域を撮像可能な前記端末の第２の撮像部からの第２の画像情報に基づいて、前記ＡＲ表示画角内の対象物の位置姿勢を認識する認識処理を実行し、認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記制御部は、前記対象物がＡＲ表示画角内に入ってから、前記認識処理において前記対象物の認識が完了するまでの間の期間において、前記予測の結果に基づく前記仮想オブジェクトのＡＲ表示を実行する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度が所定の閾値以上となってから、前記認識処理において対象物の認識が完了するまでの間の期間において、前記予測を実行する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記制御部は、前記事前認識処理において、前記第１の画像情報に基づいて前記対象物を検知する第１の検知処理を第１の頻度で繰り返し実行する
　情報処理装置。
　請求項６に記載の情報処理装置であって、
　前記制御部は、前記認識処理において、前記第２の画像情報に基づいて前記対象物を検知する第２の検知処理を、前記第１の頻度とは異なる第２の頻度で繰り返し実行する
　情報処理装置。
　請求項７に記載の情報処理装置であって、
　前記第１の頻度は、前記第２の頻度よりも低い
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記制御部は、前記事前認識処理において、前記第１の画像情報に基づいて前記対象物の動きを追跡する第１の追跡処理を第３の頻度で繰り返し実行する
　情報装置。
　請求項９に記載の情報処理装置であって、
　前記制御部は、前記認識処理において、前記第２の画像情報に基づいて前記対象物の動きを追跡する第２の追跡処理を、前記第の３頻度とは異なる第４の頻度で繰り返し実行する
　情報処理装置。
　請求項１０に記載の情報処理装置であって、
　前記第３の頻度は、前記第４の頻度よりも低い
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度に基づいて、前記第２の撮像部の露光のタイミングを調整する
　情報処理装置。
　請求項１２に記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度と、事前認識された前記対象物の位置姿勢とに基づいて、前記端末に対する対象物の速度を予測し、予測された速度に基づいて、前記第２の撮像部の露光のタイミングを調整する
　情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度に基づいて、前記第２の撮像部の露光時間を調整する
　情報処理装置。
　請求項１４に記載の情報処理装置であって、
　前記制御部は、前記端末の姿勢変化の速度と、事前認識された前記対象物の位置姿勢とに基づいて、前記端末に対する対象物の速度を予測し、予測された速度に基づいて、前記第２の撮像部の露光のタイミングを調整する
　情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記第１の撮像部は、ＡＲ表示画角よりも外側の領域と、ＡＲ表示画角に対応する領域との両方の領域を撮像可能であり、
　前記制御部は、前記第１の画像情報のうち、前記ＡＲ表示画角よりも外側の領域の画像情報に基づいて、前記事前認識処理を実行し、前記第１の画像情報のうち、前記ＡＲ表示画角に対応する領域の画像情報に基づいて、前記ＡＲ表示画角内の対象物の位置姿勢を認識する認識処理を実行する
　情報処理装置。
　請求項１６に記載の情報処理装置であって、
　前記制御部は、前記事前認識処理において、前記ＡＲ表示画角よりも外側の領域の画像情報に基づいて前記対象物の動きを追跡する第３の追跡処理を第５の頻度で繰り返し実行する
　情報処理装置。
　請求項１７に記載の情報処理装置であって、
　前記制御部は、前記認識処理において、前記ＡＲ表示画角に対応する領域の画像情報に基づいて前記対象物の動きを追跡する第４の追跡処理を、前記第５の頻度とは異なる第６の頻度で繰り返し実行する
　情報処理装置。
　端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、
　前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　情報処理方法。
　端末の表示部のＡＲ表示画角よりも外側の領域を撮像可能な前記端末の第１の撮像部からの第１の画像情報に基づいてＡＲ表示画角外の対象物の前記端末に対する位置姿勢を事前に認識する事前認識処理を実行し、
　前記対象物がＡＲ表示画角内に入ったとき、事前認識された前記対象物の位置姿勢に基づいて、前記対象物に対して仮想オブジェクトをＡＲ表示する
　処理をコンピュータに実行させるプログラム。