WO2023176420A1

WO2023176420A1 - 情報処理装置及び情報処理方法

Info

Publication number: WO2023176420A1
Application number: PCT/JP2023/007211
Authority: WO
Inventors: 洋史湯浅; 毅石川; 京二郎永野; 真城間
Original assignee: ソニーグループ株式会社
Priority date: 2022-03-18
Filing date: 2023-02-28
Publication date: 2023-09-21

Abstract

本技術は、仮想オブジェクトを摘むジェスチャを迅速かつ正確に検出することができるようにする情報処理装置及び情報処理方法に関する。情報処理装置は、ユーザの手の指を含まない部分である手基部の動き及び前記手の第１の指の動きを個別に検出し、前記手基部の動き及び前記第１の指の動きに基づいて、前記ユーザが仮想オブジェクトを摘むジェスチャを検出するジェスチャ検出部を備える。本技術は、例えば、ヘッドマウントディスプレイに適用できる。

Description

情報処理装置及び情報処理方法

　本技術は、情報処理装置及び情報処理方法に関し、特に、仮想オブジェクトを摘む（つまむ）ジェスチャを検出する場合に用いて好適な情報処理装置及び情報処理方法に関する。

　ＡＲ（Augmented Reality、拡張現実）やＭＲ（Mixed Reality、複合現実）等の現実世界と仮想世界を融合する技術において、例えば、ユーザが仮想オブジェクトを摘むジェスチャを行う場合がある。

　ここで、仮想オブジェクトとは、ユーザの視界内において、現実世界に重畳して表示される視覚情報である。

　これに対して、従来、２本の指の間に仮想オブジェクトが位置する状態が所定の時間以上維持された場合、仮想オブジェクトが摘まれたと判定する技術が提案されている（例えば、特許文献１参照）。

特開２０１６－１８９１９４号公報

　しかしながら、特許文献１に記載の発明では、ユーザが仮想オブジェクトを摘もうとしてから仮想オブジェクトが摘まれたと判定されるまでの間に、所定の時間以上のタイムラグが生じる。

　本技術は、このような状況に鑑みてなされたものであり、仮想オブジェクトを摘むジェスチャを迅速かつ正確に検出できるようにするものである。

　本技術の一側面の情報処理装置は、ユーザの手の指を含まない部分である手基部の動き及び前記手の第１の指の動きを個別に検出し、前記手基部の動き及び前記第１の指の動きに基づいて、前記ユーザが仮想オブジェクトを摘むジェスチャを検出するジェスチャ検出部を備える。

　本技術の一側面の情報処理方法は、ユーザの手の指を含まない部分である手基部の動き及び前記手の所定の指の動きを個別に検出し、前記手基部の動き及び前記指の動きに基づいて、前記ユーザが仮想オブジェクトを摘むジェスチャを検出する。

　本技術の一側面においては、ユーザの手の指を含まない部分である手基部の動き及び前記手の第１の指の動きを個別に検出し、前記手基部の動き及び前記第１の指の動きに基づいて、前記ユーザが仮想オブジェクトを摘むジェスチャが検出される。

仮想オブジェクトに対する摘みジェスチャを説明するための図である。仮想オブジェクトを摘むジェスチャを検出する場合の課題を説明するための図である。仮想オブジェクトを摘むジェスチャを検出する場合の課題を説明するための図である。仮想オブジェクトを放すジェスチャを検出する場合の課題を説明するための図である。本技術を適用した情報処理システムの一実施の形態を示す図である。指先センサの構成例を示す図である。ヘッドマウントディスプレイの構成例を示すブロック図である。情報処理システムによる摘みジェスチャ検出処理を説明するためのフローチャートである。仮想オブジェクトを摘むジェスチャの検出方法を説明するための図である。仮想オブジェクトをそっと放すジェスチャの検出方法を説明するための図である。仮想オブジェクトを勢いよく放すジェスチャの検出方法を説明するための図である。コンピュータの構成例を示すブロック図である。

　以下、本技術を実施するための形態について説明する。説明は以下の順序で行う。
　１．本技術の背景
　２．実施の形態
　３．変形例
　４．その他

　＜＜１．本技術の背景＞＞
　まず、図１乃至図４を参照して、本技術の背景について説明する。

　ＡＲ又はＭＲでは、図１に示されるように仮想オブジェクト２を摘むジェスチャが行われる場合がある。具体的には、例えば、図１のＡに示されるように、ユーザは、手１の親指の指先（腹）と人差し指の指先（腹）を接触させることにより仮想オブジェクト２を摘む。次に、図１のＢに示されるように、ユーザは、親指の指先と人差し指の指先を接触させたまま手１を移動させることにより、仮想オブジェクト２を目的地まで移動させる。そして、図１のＣに示されるように、ユーザは、目的地で親指の指先と人差し指の指先を離すことにより、仮想オブジェクト２を放す。

　なお、以下、親指の指先と人差し指の指先を接触させることを、単に、親指と人差し指を接触させると記載する。また、親指の指先と人差し指の指先を離すことを、単に、親指と人差し指を離すと記載する。

　ここで、例えば、図２のＡに示されるように、ユーザは、近接している仮想オブジェクト２と仮想オブジェクト３の中から仮想オブジェクト２を選択して摘む場合、手１の親指と人差し指を離した状態で、親指と人差し指の指先を仮想オブジェクト２に接近させる。そして、図２のＢに示されるように、ユーザは、ユーザから見て仮想オブジェクト２と重なるように、手１の親指と人差し指を接触させる。これにより、ユーザは、仮想オブジェクト２及び仮想オブジェクト３の中から仮想オブジェクト２を選択して摘むことができる。

　ここで、仮想オブジェクトを選択するために手１を移動させている場合と、仮想オブジェクトを摘むために親指と人差し指とを接触させる場合の両方で、手１の指先の位置が動く。この指先の動きが、ユーザが仮想オブジェクトを選択しようとしているのか、仮想オブジェクトを摘もうとしているのかを判別することが難しい。

　また、例えば、カメラ等の光学的なセンサを用いた場合、手１の位置や姿勢によっては、親指と人差し指の接触の検出が困難なときがある。

　例えば、図３のＡでは、実際には手１の親指と人差し指が離れているが、このように角度によっては、親指と人差し指が接触しているように見える。そのため、仮想オブジェクト３が摘まれたと誤検出されるおそれがある。

　これに対して、例えば、図３のＢに示されるように、親指の指先と人差し指の指先が視認しやすくなるように手１の位置及び姿勢を調整してから、親指と人差し指を接触させるようにすることが考えられる。しかし、この場合、手１の位置及び姿勢を調整するのに時間を要する上に、手１の動きが不自然になり、操作性が低下する。

　さらに、例えば、上述した特許文献１に記載の発明のように、親指と人差し指を接触させた状態が所定の時間継続した場合に仮想オブジェクトが摘まれたと判定する場合、仮想オブジェクトが摘まれたと判定されるまでの間に、所定の時間以上のタイムラグが生じる。

　また、仮想オブジェクトを摘んだまま手を動かし、所望の位置で仮想オブジェクトを放す場合にユーザの手の指先の位置が動く。この指先の動きが、ユーザが仮想オブジェクトを移動させているのか、仮想オブジェクトを放そうとしているのかを判別することが難しい。

　さらに、例えば、ユーザが仮想オブジェクトを摘んだまま素早く移動させたり、振り回したりする等、手を大きく動かしたり、素早く動かしたりする場合、途中で親指と人差し指が意図せずに離れてしまうことが想定される。この場合、例えば、図４に示されるように、手１で仮想オブジェクト２を摘んで所望の位置まで移動させる途中で、仮想オブジェクト２が意図せずに放されてしまうおそれがある。

　これに対して、本技術は、仮想オブジェクトを摘むジェスチャ及び放すジェスチャを正確かつ迅速に検出できるようにするものである。

　なお、以下、ユーザが仮想オブジェクトと摘んでから放すまでの一連のジェスチャを摘みジェスチャと称する。

　＜＜２．実施の形態＞＞
　次に、図５乃至図１１を参照して、本技術の実施の形態について説明する。

　　＜情報処理システム１０１の構成例＞
　図５は、本技術を適用した情報処理システム１０１の一実施の形態を示している。

　情報処理システム１０１は、指先センサ１１１、ＩＭＵ１１２、ＩＭＵ１１３、及び、ヘッドマウントディスプレイ（ＨＭＤ）１１４を備える。

　指先センサ１１１、ＩＭＵ１１２、及び、ＩＭＵ１１３は、ユーザが仮想オブジェクトを摘む場合に用いる側の手１０２に装着される。

　具体的には、指先センサ１１１は、図６のＡに示されるように、人差し指１０２Ａの指先に装着される。

　図６のＢに示されるように、指先センサ１１１は、圧力センサ１３１、指サック１３２、及び、静電容量センサ１３３を備える。

　圧力センサ１３１は、人差し指１０２Ａの腹に接するように配置される。圧力センサ１３１は、人差し指１０２Ａの指先（腹）に加わる圧力を検出する。

　指サック１３２は、指先センサ１１１を人差し指１０２Ａの指先に装着するために用いられる。

　静電容量センサ１３３は、指サック１３２の外側に設けられている。静電容量センサ１３３は、指サック１３２を挟んで、圧力センサ１３１と略同じ位置に配置されている。静電容量センサ１３３は、人差し指１０２Ａの指先（腹）の静電容量を検出することにより、人差し指１０２Ａの指先への物体の接触状態を検出する。

　指先センサ１１１は、人差し指１０２Ａの指先の圧力及び静電容量の検出結果を示すセンサデータをＨＭＤ１１４に送信する。

　ＩＭＵ１１２は、例えば、人差し指１０２Ａの第２関節と第３関節との間の基節骨に対応する基節部に装着され、人差し指１０２Ａの加速度及び角速度を検出する。ＩＭＵ１１２は、人差し指１０２Ａの加速度及び角速度の検出結果を示すセンサデータをＨＭＤ１１４に送信する。

　ＩＭＵ１１３は、手の甲１０２Ｃに装着される。ＩＭＵ１１３は、手１０２の指を除く部分（以下、手基部と称する）の加速度及び角速度を検出する。手基部は、手の甲１０２Ｃ及び掌を含む。ＩＭＵ１１３は、手１０２の手基部の加速度及び角速度の検出結果を示すセンサデータをＨＭＤ１１４に送信する。

　なお、ＩＭＵ１１３は、手１０２の手基部の加速度及び角速度を検出することが可能な位置であれば、手の甲１０２Ｃ以外の位置（例えば、手１０２の掌等）に装着されてもよい。

　なお、親指１０２Ｂには、特にセンサは装着されない。

　ＨＭＤ１１４は、ユーザの頭部１０３に装着され、ＡＲ又はＭＲを実現する。例えば、ＨＭＤ１１４は、ユーザの視界内において、仮想オブジェクトを現実世界に重畳して表示する。

　なお、仮想オブジェクトの種類は、特に限定されない。例えば、仮想オブジェクトは、現実世界の物体を模したオブジェクト、各種の情報を視覚的に伝達するオブジェクト、ＨＭＤ１１４の操作用のオブジェクト等を含む。

　また、ＨＭＤ１１４は、指先センサ１１１、ＩＭＵ１１２、及び、ＩＭＵ１１３からのセンサデータに基づいて、ユーザによる摘みジェスチャを検出する。

　　＜ＨＭＤ１１４の構成例＞
　図７は、ＨＭＤ１１４の構成例を示している。

　ＨＭＤ１１４は、入力部１５１、センシング部１５２、通信部１５３、制御部１５４、及び、出力部１５５を備える。

　入力部１５１は、各種の入力デバイス及び操作デバイスを備え、各デバイスを用いて入力される入力データを制御部１５４に供給する。入力データは、例えば、操作デバイスによる操作データ、マイクロフォンによる音声データ等を含む。

　センシング部１５２は、撮影部１６１及びＩＭＵ１６２を備える。

　撮影部１６１は、例えば、ユーザの顔の前方（顔が向いている方向）を撮影するカメラ（以下、前方カメラと称する）、及び、ユーザの目を含む範囲を撮影するカメラ（以、ユーザカメラと称する）を備える。前方カメラは、撮影することにより得られた画像（以下、前方画像と称する）を制御部１５４に供給する。ユーザカメラは、撮影することにより得られた画像（以下、ユーザ画像と称する）を制御部１５４に供給する。

　なお、前方カメラには、例えば、ユーザの手指のボーン情報を検出できるように、ＴｏＦ（Time Of Flight）カメラ等のデプス（距離）を検出可能なカメラが用いられることが望ましい。

　ＩＭＵ１６２は、ＨＭＤ１１４が装着されているユーザの頭部の加速度及び角速度を検出する。ＩＭＵ１６２は、ユーザの頭部の加速度及び角速度の検出結果を示すセンサデータを制御部１５４に供給する。

　通信部１５３は、指先センサ１１１、ＩＭＵ１１２、及び、ＩＭＵ１１３と通信を行い、それぞれからセンサデータを受信する。通信部１５３は、受信したセンサデータを制御部１５４に供給する。

　なお、通信部１５３の通信方式は、特に制限されず、有線通信及び無線通信のいずれでもよい。

　制御部１５４は、ＨＭＤ１１４の各部の制御、及び、各種の処理を実行する。制御部１５４は、ジェスチャ検出部１７１、視線検出部１７２、情報処理部１７３、及び、出力制御部１７４を備える。

　ジェスチャ検出部１７１は、指先センサ１１１、ＩＭＵ１１２、及び、ＩＭＵ１１３からのセンサデータ、並びに、前方カメラからの前方画像に基づいて、ユーザによる各種のジェスチャを検出する。検出対象となるジェスチャには、上述した摘みジェスチャが含まれる。

　視線検出部１７２は、ユーザカメラからのユーザ画像、及び、ＩＭＵ１６２からのセンサデータに基づいて、ユーザの視線方向を検出する。

　情報処理部１７３は、指先センサ１１１、ＩＭＵ１１２、及び、ＩＭＵ１１３からのセンサデータ、入力部１５１からの入力データ、撮影部１６１からの前方画像及びユーザ画像、ＩＭＵ１６２からのセンサデータ、ジェスチャ検出部１７１により検出されたユーザのジェスチャ、並びに、視線検出部１７２により検出されたユーザの視線等に基づいて、各種の情報処理を行う。各種の情報処理には、例えば、仮想オブジェクトを表示するための画像データの生成処理が含まれる。

　出力制御部１７４は、情報処理部１７３の処理の結果等に基づいて、出力部１５５による各種の情報の出力を制御する。例えば、出力制御部１７４は、表示部１８１による視覚情報の出力を制御する。この視覚情報には、仮想オブジェクトが含まれる。出力制御部１７４は、音声出力部１８２による聴覚情報の出力を制御する。出力制御部１７４は、ハプティクスデバイス１８３による触覚情報の出力を制御する。

　出力部１５５は、表示部１８１、音声出力部１８２、及び、ハプティクスデバイス１８３を備える。

　表示部１８１は、１以上のディスプレイを備え、出力制御部１７４の制御の下に、視覚情報を表示する。例えば、表示部１８１は、ユーザの視界内において、視覚情報の一種である仮想オブジェクトを現実世界に重畳させて表示する。

　音声出力部１８２は、１以上の音声出力デバイスを備え、出力制御部１７４の制御の下に、聴覚情報を出力する。音声出力デバイスとしては、例えば、スピーカ、ヘッドホン、イヤホン等が想定される。

　ハプティクスデバイス１８３は、出力制御部１７４の制御の下に、触覚情報を出力する。例えば、ハプティクスデバイス１８３は、ＨＭＤ１１４の筐体を振動させる。例えば、ハプティクスデバイス１８３は、ユーザの体の所定の部位（例えば、手）に装着され、装着された部位に振動等の触覚情報を伝達する。

　　＜摘みジェスチャ検出処理＞
　次に、図８のフローチャートを参照して、情報処理システム１０１により実行される摘みジェスチャ検出処理について説明する。

　この処理は、例えば、ＨＭＤ１１４の電源がオンされたとき開始され、オフされたとき終了する。

　ステップＳ１において、情報処理システム１０１は、センシングを開始する。具体的には、指先センサ１１１は、ユーザの人差し指の指先の静電容量及び圧力を検出し、検出結果を示すセンサデータをＨＭＤ１１４に送信する処理を開始する。ＩＭＵ１１２は、ユーザの人差し指の加速度及び角速度を検出し、検出結果を示すセンサデータをＨＭＤ１１４に送信する処理を開始する。ＩＭＵ１１３は、ユーザの手基部の加速度及び角速度を検出し、検出結果を示すセンサデータをＨＭＤ１１４に送信する処理を開始する。

　これに対して、ＨＭＤ１１４の通信部１５３は、指先センサ１１１、ＩＭＵ１１２、及び、ＩＭＵ１１３からセンサデータを受信し、制御部１５４に供給する処理を開始する。

　撮影部１６１は、ユーザの顔の前方を撮影し、得られた前方画像を制御部１５４に供給する処理を開始する。また、撮影部１６１は、ユーザの目を含む範囲を撮影し、得られたユーザ画像を制御部１５４に供給する処理を開始する。

　ＩＭＵ１６２は、ユーザの頭部の加速度及び角速度を検出し、検出結果を示すセンサデータを制御部１５４に供給する処理を開始する。

　ステップＳ２において、ジェスチャ検出部１７１は、手基部の位置及び姿勢の変化が所定の範囲内であるか否かを判定する。

　具体的には、ジェスチャ検出部１７１は、手基部の加速度及び角速度に基づいて、手基部の位置及び姿勢の変化を検出する。例えば、ジェスチャ検出部１７１は、手基部の位置の変化が所定の閾値（以下、位置閾値と称する）未満、かつ、手基部の各軸（ｘ軸、ｙ軸、ｚ軸）の姿勢の変化が所定の閾値（以下、姿勢閾値と称する）未満である場合、手基部の位置及び姿勢の変化が所定の範囲内であると判定する。一方、ジェスチャ検出部１７１は、手基部の位置の変化が位置閾値以上、又は、手基部の少なくとも一軸の姿勢の変化が姿勢閾値以上である場合、手基部の位置及び姿勢のうち少なくとも一方の変化が所定の範囲より大きいと判定する。

　なお、例えば、位置閾値は、１０ｍｍ／ｓｅｃに設定される。例えば、姿勢閾値は、各軸とも１度／ｓｅｃに設定される。

　ステップＳ２の判定処理は、手基部の位置及び姿勢の変化が所定の範囲内であると判定されるまで、繰り返し実行される。一方、手基部の位置及び姿勢の変化が所定の範囲内であると判定された場合、処理はステップＳ３に進む。

　ステップＳ３において、ジェスチャ検出部１７１は、人差し指が親指に接触したか否かを判定する。例えば、ジェスチャ検出部１７１は、人差し指の指先の静電容量が所定の閾値未満、又は、圧力が所定の閾値未満である場合、人差し指の指先が親指に接触していないと判定し、処理はステップＳ２に戻る。

　その後、ステップＳ３において、人差し指が親指に接触したと判定されるまで、ステップＳ２及びステップＳ３の処理が繰り返し実行される。

　一方、ステップＳ３において、ジェスチャ検出部１７１は、人差し指の指先の静電容量が所定の閾値以上、かつ、圧力が所定の閾値以上である場合、人差し指が親指に接触したと判定し、処理はステップＳ４に進む。

　なお、例えば、ステップＳ３において、人差し指の指先の圧力のみに基づいて、親指と人差し指の接触を検出するようにすることも可能である。

　ただし、人差し指の指先の静電容量も用いた方が、検出精度が向上する。例えば、人差し指をゆっくり動かして親指と接触させた場合の検出精度が向上する。

　一方、人差し指の指先の静電容量のみに基づいて、親指と人差し指の接触を検出する方法は、偶然親指と人差し指とが接触した場合等に誤検出が生じるおそれがあるため、あまり望ましくない。

　ステップＳ４において、ジェスチャ検出部１７１は、人差し指の指先の位置が仮想オブジェクトの範囲内であるか否かを判定する。例えば、ジェスチャ検出部１７１は、前方画像に基づいて、所定の座標系（例えば、ワールド座標系）における人差し指の指先の位置を検出する。そして、ジェスチャ検出部１７１は、仮想オブジェクトが現実世界に存在する場合に上記座標系において存在すると仮定される領域（以下、仮想オブジェクト領域と称する）と、人差し指の指先の位置とを比較する。

　そして、ジェスチャ検出部１７１は、仮想オブジェクト領域内に人差し指の指先が含まれる場合、人差し指の指先の位置が仮想オブジェクトの範囲内であると判定する。一方、ジェスチャ検出部１７１は、仮想オブジェクト領域内に人差し指の指先が含まれない場合、人差し指の指先の位置が仮想オブジェクトの範囲内でないと判定する。

　なお、仮想オブジェクト領域は、必ずしも仮想オブジェクトが現実世界に存在すると仮定される領域と正確に一致する必要はない。例えば、仮想オブジェクトが現実世界に存在すると仮定される領域の周りにマージンを設けた領域が、仮想オブジェクト領域に設定されてもよい。また、例えば、仮想オブジェクトが現実世界に存在すると仮定される領域の中央付近の領域が、仮想オブジェクト領域に設定されてもよい。

　そして、人差し指の指先の位置が仮想オブジェクトの範囲内でないと判定された場合、処理はステップＳ２に戻る。

　その後、ステップＳ４において、人差し指の指先の位置が仮想オブジェクトの範囲内であると判定されるまで、ステップＳ２乃至ステップＳ４の処理が繰り返し実行される。

　一方、ステップＳ４において、人差し指の指先の位置が仮想オブジェクトの範囲内であると判定された場合、処理はステップＳ５進む。

　ステップＳ５において、ジェスチャ検出部１７１は、仮想オブジェクトが摘まれたと判定する。換言すれば、ジェスチャ検出部１７１は、摘みジェスチャが開始されたと判定する。

　例えば、図９に示されるように、ユーザが手１０２で仮想オブジェクト２０１を摘む場合、まず摘む対象となる仮想オブジェクト２０１を選択するために、手１０２全体が仮想オブジェクト２０１の近くまで動くことが想定される。そして、ユーザが手１０２で摘む段階において、手の甲１０２Ｃを含む手基部がほぼ静止した状態で、指（特に、人差し指１０２Ａ）のみが動くと想定される。

　従って、手基部の位置及び姿勢の変化が所定の範囲内であり、かつ、人差し指の指先が親指と接触したときに仮想オブジェクトの範囲内である場合（すなわち、仮想オブジェクトを含む範囲内で親指と人差し指が接触した場合）、仮想オブジェクトが摘まれたと判定される。

　ステップＳ６において、ステップＳ２の処理と同様に、手基部の位置及び姿勢の変化が所定の範囲内であるか否かが判定される。手基部の位置及び姿勢の変化が所定の範囲内であると判定された場合、処理はステップＳ７に進む。

　なお、ステップＳ６の処理で用いられる位置閾値及び姿勢閾値は、ステップＳ２の処理と同じ値に設定されてもよいし、異なる値に設定されてもよい。

　ステップＳ７において、ジェスチャ検出部１７１は、人差し指が親指から離れたか否かを判定する。例えば、ジェスチャ検出部１７１は、人差し指の指先の静電容量が所定の閾値以上である場合、人差し指が親指から離れていないと判定し、処理はステップＳ６に戻る。

　なお、ステップＳ７の判定処理においては、人差し指の指先の圧力は用いられずに、人差し指の指先の静電容量のみが用いられる。

　一方、ステップＳ６において、手基部の位置及び姿勢のうち少なくとも一方の変化が所定の範囲より大きいと判定された場合、処理はステップＳ８に進む。

　ステップＳ８において、ジェスチャ検出部１７１は、人差し指の位置及び姿勢のうち少なくとも一方の変化が所定の範囲より大きく、かつ、人差し指が親指から離れた状態が継続したか否かを判定する。

　例えば、ジェスチャ検出部１７１は、人差し指の加速度及び角速度に基づいて、人差し指の位置及び姿勢の変化を検出する。例えば、ジェスチャ検出部１７１は、人差し指の位置の変化が所定の閾値未満、かつ、人差し指の少なくとも各軸の姿勢の変化が所定の閾値未満である場合、人差し指の位置及び姿勢の変化が所定の範囲内であると判定する。一方、ジェスチャ検出部１７１は、人差し指の位置の変化が所定の閾値以上、又は、人差し指の少なくとも一軸の姿勢の変化が所定の閾値以上である場合、人差し指の位置及び姿勢のうち少なくとも一方の変化が所定の範囲より大きいと判定する。

　例えば、ジェスチャ検出部１７１は、人差し指の指先の静電容量が所定の閾値未満である状態が所定の時間（例えば、０．２秒）以上継続した場合、人差し指が親指から離れた状態が継続したと判定する。一方、ジェスチャ検出部１７１は、人差し指の指先の静電容量が所定の閾値未満である状態が所定の時間（例えば、０．２秒）以上継続していない場合、人差し指が親指から離れた状態が継続していないと判定する。

　そして、人差し指の位置及び姿勢の変化が所定の範囲内、又は、人差し指が親指から離れた状態が継続していないと判定された場合、処理はステップＳ６に戻る。

　その後、ステップＳ７において、人差し指が親指から離れたと判定されるか、ステップＳ８において、人差し指の位置及び姿勢のうち少なくとも一方の変化が所定の範囲より大きく、かつ、人差し指が親指から離れた状態が継続したと判定されるまで、ステップＳ６乃至ステップＳ８の処理が繰り返し実行される。

　一方、ステップＳ７において、例えば、ジェスチャ検出部１７１は、人差し指の指先の静電容量が所定の閾値未満である場合、人差し指が親指から離れたと判定し、処理はステップＳ９に進む。

　また、ステップＳ８において、人差し指の位置及び姿勢のうち少なくとも一方の変化が所定の範囲より大きく、かつ、人差し指が親指から離れた状態が継続したと判定された場合、処理はステップＳ９に進む。

　ステップＳ９において、ジェスチャ検出部１７１は、仮想オブジェクトが放されと判定する。

　例えば、ユーザが仮想オブジェクトを放す場合、そっと放す場合と、勢いよく放す場合が想定される。

　例えば、図１０は、ユーザが仮想オブジェクトをそっと放す場合の例を示している。この例では、ユーザが、仮想空間においてドミノ倒しをするためにドミノを並べており、仮想オブジェクトであるドミノ２０２を手１０２から放す例が示されている。この場合、ユーザは、手の甲１０２Ｃを含む手基部をほぼ静止させたまま、人差し指１０２Ａ及び親指１０２Ｂのみを動かすと想定される。

　これに対して、ステップＳ７及びステップＳ８の判定処理により、手基部の位置及び姿勢の変化が所定の範囲内、かつ、人差し指が親指から離れる動きが検出されることにより、仮想オブジェクトをそっと放すジェスチャが検出される。

　例えば、図１１は、ユーザが仮想オブジェクトを勢いよく放す場合の例を示している。この場合、ユーザは、仮想オブジェクト２０３を摘んだ手１０２を動かしながら、所望の位置で仮想オブジェクト２０３を手１０２から放すことが想定される。

　これに対して、ステップＳ７及びステップＳ９の判定処理により、手基部の位置及び姿勢のうち少なくとも一方の変化が所定の範囲より大きく、かつ、人差し指の位置及び姿勢のうち少なくとも一方の変化が所定の範囲より大きく、かつ、人差し指が親指から離れた状態が継続する動きが検出されることにより、仮想オブジェクトを勢いよく放すジェスチャが検出される。

　なお、例えば、ユーザが手で仮想オブジェクトを摘んで動かしている場合に、意図せずに親指と人差し指が離れることが想定される。特に、仮想オブジェクトを勢いよく動かしたり、振り回したりしている場合に、意図せずに親指と人差し指が離れることが想定される。

　これに対して、上述したように、人差し指が親指から離れた状態が所定の時間以上継続しないと、仮想オブジェクトが放されたと判定されない。これにより、ユーザが意図せずに親指と人差し指が離れた場合に、仮想オブジェクトが放されたと誤検出されることが防止される。

　その後、処理はステップＳ１に戻り、ステップＳ１以降の処理が実行される。

　以上のようにして、ユーザが仮想オブジェクトを摘んだり、放したりするジェスチャを迅速かつ正確に検出することが可能になる。

　例えば、ユーザの手の手基部の動きと指の動きを個別にセンシングすることにより、ユーザの摘むという動作をより自然に検出することが可能になる。これにより、例えば、ユーザが仮想オブジェクトを選択するジェスチャと摘むジェスチャを正確に区別することができる。また、例えば、ユーザが仮想オブジェクトを摘み続けるジェスチャと放すジェスチャを正確に区別することができる。

　＜＜３．変形例＞＞
　次に、上述した実施の形態の変形例について説明する。

　　＜誤検出時の対応＞
　例えば、情報処理システム１０１は、摘みオブジェクトの検出結果がユーザの意図と反する場合の対応を行うようにしてもよい。

　例えば、ユーザが意図していないのに仮想オブジェクトが摘まれたり、ユーザが意図する仮想オブジェクトと異なる仮想オブジェクトが摘まれたりした場合、ユーザが所定のジェスチャを行うことにより、直前に検出された仮想オブジェクトを摘むジェスチャが取り消されるようにしてもよい。

　例えば、ユーザが仮想オブジェクトを摘んだつもりでも、手基部の位置又は姿勢の変化が所定の範囲より大きいため、仮想オブジェクトが摘まれたと判定されない場合が想定される。この場合、ユーザは再度同じ仮想オブジェクトを摘もうとすることが想定される。

　これに対して、例えば、ジェスチャ検出部１７１は、同じ仮想オブジェクトに対して連続して親指と人差し指を接触させるジェスチャを検出した場合、上述した位置閾値及び姿勢閾値を下げるようにしてもよい。これにより、ユーザが再度同じ仮想オブジェクトを摘もうとした場合に、当該仮想オブジェクトを摘むジェスチャが検出されやすくなる。

　　＜ジェスチャに関する変形例＞
　例えば、仮想オブジェクトが大きい場合、ユーザは親指の指先と人差し指の指先を接触させずに近接させることにより、仮想オブジェクトを摘もうとすることが想定される。これに対して、例えば、ジェスチャ検出部１７１は、親指の指先と人差し指の指先が接触しなくても、仮想オブジェクトを摘むジェスチャを検出するようにしてもよい。

　この場合、例えば、ジェスチャ検出部１７１は、前方画像に基づいて、親指の指先と人差し指の指先の近接を検出することにより、仮想オブジェクトを摘むジェスチャを検出するようにしてもよい。

　例えば、ジェスチャ検出部１７１は、親指と人差し指の加速度及び角速度に基づいて、親指と人差し指の位置及び姿勢を検出し、親指の指先と人差し指の指先の近接を検出することにより、仮想オブジェクトを摘むジェスチャを検出するようにしてもよい。

　例えば、ジェスチャ検出部１７１は、人差し指の指先（腹）に設けられた近接センサのセンサデータに基づいて、親指の指先と人差し指の指先の近接を検出することにより、仮想オブジェクトを摘むジェスチャを検出するようにしてもよい。

　なお、上述した方法のうち２つ以上を組み合わせて、親指の指先と人差し指の指先の近接を検出することにより、仮想オブジェクトを摘むジェスチャを検出するようにしてもよい。

　本技術は、摘みジェスチャ以外にも、例えば、仮想オブジェクトを握るジェスチャ、指先をフック状にして仮想オブジェクトを引っ掛けるジェスチャ、指で仮想オブジェクトを払い飛ばすジェスチャ等の他のジェスチャに対しても適用することが可能である。

　　＜摘みジェスチャの検出方法に関する変形例＞
　例えば、ジェスチャ検出部１７１は、手の甲以外の部分（例えば、手首、掌、拳、腕等）の加速度及び角速度を用いて、手基部の位置及び姿勢を検出するようにしてもよい。

　例えば、ユーザは、仮想オブジェクトの大きさや形状によっては、仮想オブジェクトを摘む手と反対側の手を仮想オブジェクトの下に添えて、仮想オブジェクトを摘むことが想定される。これに対して、例えば、ジェスチャ検出部１７１は、仮想オブジェクトを摘む手と反対側の手や腕の動きをさらに用いて、仮想オブジェクトを摘むジェスチャを検出するようにしてもよい。

　例えば、ユーザは、ある程度以上の大きさの仮想オブジェクトを摘む場合、摘む前に指を一度広げてから摘むことが想定される。これに対して、例えば、ジェスチャ検出部１７１は、親指と人差し指の間の距離が広がったり、手の指が一度広がった状態になったりすることを、仮想オブジェクトを摘むジェスチャの検出条件に加えるようにしてもよい。

　例えば、ジェスチャ検出部１７１は、視線検出部１７２により検出されるユーザの視線に基づいて、摘む対象となる仮想オブジェクトを検出するようにしてもよい。

　　＜閾値に関する変形例＞
　例えば、ジェスチャ検出部１７１は、上述した図８のステップＳ２及びステップＳ６において用いられる手基部に対する位置閾値及び姿勢閾値を、ユーザの状態及び属性、仮想オブジェクトの状態及び属性、周囲の環境等に基づいて変化させるようにしてもよい。

　例えば、ユーザの利き腕に近い位置では手の動きが速くなると想定されるため、仮想オブジェクトがユーザの利き腕に近い位置にある場合、ジェスチャ検出部１７１は、ユーザの利き腕の情報を取得し、位置閾値及び姿勢閾値のうち少なくとも一方を大きくするようにしてもよい。

　例えば、ジェスチャ検出部１７１は、情報処理システム１０１が狭い空間で使用されている場合、ユーザの手の動きが小さくなると想定されるため、位置閾値及び姿勢閾値のうち少なくとも一方を小さくするようにしてもよい。

　例えば、ジェスチャ検出部１７１は、仮想オブジェクトと手の間の距離、複数の仮想オブジェクト間の距離、仮想オブジェクトの大きさ、仮想オブジェクトの移動速度等に基づいて、位置閾値及び姿勢閾値のうち少なくとも一方を変化させるようにしてもよい。

　例えば、ジェスチャ検出部１７１は、ユーザの姿勢（例えば、立っているか座っているか等）、ユーザの歩行状態、ユーザの情報処理システム１０１の使用履歴、ユーザの操作が得意な領域、ユーザの装着物等に基づいて、位置閾値及び姿勢閾値のうち少なくとも一方を変化させるようにしてもよい。装着物としては、例えば、グローブ等の手を動きにくくするものが想定される。

　例えば、機械学習により、位置閾値及び姿勢閾値を含む各種の閾値が設定及び変更されるようにしてもよい。この場合、例えば、情報処理システム１０１がユーザの手元に届くまでに閾値が設定されるようにしてもよいし、情報処理システム１０１がユーザの手元に届いた後に閾値が変更されるようにしてもよい。

　　＜ユーザインタフェースに関する変形例＞
　例えば、上述した図８のステップＳ５において、ジェスチャ検出部１７１が、ユーザにより仮想オブジェクトが摘まれたと判定した場合、出力部１５５が、摘みジェスチャを検出したことをユーザに通知するようにしてもよい。例えば、表示部１８１は、出力制御部１７４の制御の下に、摘まれた仮想オブジェクトの表示態様（例えば、色、形状、透明度、明度等）を変化させるようにしてもよい。

　なお、仮想オブジェクトの表示態様を変化させるだけでなく、音声情報や触覚情報により、摘みジェスチャを検出したことをユーザに通知するようにしてもよい。

　これにより、ユーザは、摘みジェスチャが検出されたこと、及び、摘みジェスチャの対象となった仮想オブジェクトを認識することができ、安心して操作することができるようになる。

　例えば、ジェスチャ検出部１７１が、過去のセンサデータ等を用いて学習することにより、ユーザの手基部及び人差し指等の動きに基づいて、ユーザにより摘まれる仮想オブジェクトを予測するようしてもよい。そして、ジェスチャ検出部１７１は、当該仮想オブジェクトを摘みジェスチャの検出対象に前倒しして設定するようにしてもよい。また、表示部１８１は、出力制御部１７４の制御の下に、当該仮想オブジェクトの表示態様を変化させるようにしてもよい。これにより、ユーザは、所望の仮想オブジェクトをより迅速に摘むことが可能になる。

　なお、以上の仮想オブジェクトの表示態様の変化の有無等が、ユーザや周囲の環境に基づいて変更されるようにしてもよい。例えば、情報処理システム１０１の使用歴が浅いユーザに対しては、上述したように仮想オブジェクトの表示態様を変化させ、使用歴が長いユーザに対しては、仮想オブジェクトの表示態様を変化させないようにしてもよい。例えば、ユーザの視界内に多くの情報が表示されている場合、ユーザに提示される情報量が過剰にならないように、仮想オブジェクトの表示態様が変化しないようにしてもよい。

　例えば、表示部１８１は、出力制御部１７４の制御の下に、仮想オブジェクトを放した後の動きを示す情報を、ユーザの視界内において表示するようにしてもよい。例えば、現在の状態において仮想オブジェクトが放された場合の仮想オブジェクトの軌跡、回転の状態、着地する位置及び姿勢等の情報が、ユーザの視界内において表示されるようにしてもよい。

　例えば、ハプティクスデバイス１８３が、仮想オブジェクトを摘んだり放したりする感覚を触覚情報によりユーザに伝達するようにしてもよい。この場合、必ずしも仮想オブジェクトが表示されなくてもよい。例えば、表示装置を用いない触覚によるＡＲや、ユーザの視界の外に存在する仮想オブジェクトを摘む場合において、ユーザが触覚情報により仮想オブジェクトを摘んだり放したりする感覚を実感することが可能になる。

　　＜その他の変形例＞
　例えば、ユーザが複数の仮想オブジェクトを一度に摘めるようにしてもよい。この場合、例えば、ジェスチャ検出部１７１は、手基部の位置及び姿勢の変化量に基づいて、摘みジェスチャの対象となる仮想オブジェクトの数を変化させるようにしてもよい。

　本技術は、例えば、ユーザの手の動きに連動して遠隔地のロボットアームが動く場合に、ロボットアームが現実のオブジェクト（実物体）又は仮想オブジェクトを摘む場合にも適用することが可能である。この場合、ジェスチャ検出部１７１は、ロボットアームの性能に応じて、位置閾値及び姿勢閾値等の各種の閾値を変化させるようにしてもよい。

　例えば、本技術は、ＨＭＤ以外の方法、例えば、プロジェクタやスマートフォン等の表示端末を用いて実現されるＡＲやＭＲにも適用することが可能である。

　＜＜４．その他＞＞
　　＜コンピュータの構成例＞
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図１２は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータ１０００において、CPU（Central Processing Unit）１００１，ROM（Read Only Memory）１００２，RAM（Random Access Memory）１００３は、バス１００４により相互に接続されている。

　バス１００４には、さらに、入出力インタフェース１００５が接続されている。入出力インタフェース１００５には、入力部１００６、出力部１００７、記憶部１００８、通信部１００９、及びドライブ１０１０が接続されている。

　入力部１００６は、入力スイッチ、ボタン、マイクロフォン、撮像素子などよりなる。出力部１００７は、ディスプレイ、スピーカなどよりなる。記憶部１００８は、ハードディスクや不揮発性のメモリなどよりなる。通信部１００９は、ネットワークインタフェースなどよりなる。ドライブ１０１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア１０１１を駆動する。

　以上のように構成されるコンピュータ１０００では、CPU１００１が、例えば、記憶部１００８に記録されているプログラムを、入出力インタフェース１００５及びバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ１０００（CPU１００１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータ１０００では、プログラムは、リムーバブルメディア１０１１をドライブ１０１０に装着することにより、入出力インタフェース１００５を介して、記憶部１００８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１００９で受信し、記憶部１００８にインストールすることができる。その他、プログラムは、ROM１００２や記憶部１００８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　さらに、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　　＜構成の組み合わせ例＞
　本技術は、以下のような構成をとることもできる。

（１）
　ユーザの手の指を含まない部分である手基部の動き及び前記手の第１の指の動きを個別に検出し、前記手基部の動き及び前記第１の指の動きに基づいて、前記ユーザが仮想オブジェクトを摘むジェスチャを検出するジェスチャ検出部を
　備える情報処理装置。
（２）
　前記ジェスチャ検出部は、前記手基部の位置及び姿勢の変化が第１の範囲内である場合に、前記仮想オブジェクトを含む第２の範囲内で前記第１の指の指先が前記手の第２の指の指先と接触したとき、前記仮想オブジェクトが摘まれたと判定する
　前記（１）に記載の情報処理装置。
（３）
　前記ジェスチャ検出部は、前記手基部の位置の変化が第１の閾値未満、かつ、前記手基部の姿勢の変化が第２の閾値未満である場合、前記手基部の位置及び姿勢の変化が前記第１の範囲内であると判定する
　前記（２）に記載の情報処理装置。
（４）
　前記ジェスチャ検出部は、前記ユーザの状態及び属性のうち少なくとも１つに基づいて、前記第１の閾値及び前記第２の閾値のうち少なくとも１つを変化させる
　前記（３）に記載の情報処理装置。
（５）
　前記ジェスチャ検出部は、周囲の環境に基づいて、前記第１の閾値及び前記第２の閾値のうち少なくとも１つを変化させる
　前記（３）又は（４）に記載の情報処理装置。
（６）
　前記ジェスチャ検出部は、前記仮想オブジェクトの状態及び属性のうち少なくとも１つに基づいて、前記第１の閾値及び前記第２の閾値のうち少なくとも１つを変化させる
　前記（３）又は（４）に記載の情報処理装置。
（７）
　前記ジェスチャ検出部は、前記手の甲の加速度及び角速度に基づいて、前記手基部の位置及び姿勢の変化を検出し、前記第１の指の指先の圧力に基づいて、前記第１の指の指先と前記第２の指の指先との接触状態を検出する
　前記（２）又は（３）に記載の情報処理装置。
（８）
　前記ジェスチャ検出部は、さらに前記第１の指の指先の静電容量に基づいて、前記第１の指の指先と前記第２の指の指先との接触状態を検出する
　前記（７）に記載の情報処理装置。
（９）
　前記第１の指は、人差し指であり、
　前記第２の指は、親指である
　前記（２）又は（３）に記載の情報処理装置。
（１０）
　前記ジェスチャ検出部は、前記手基部の動き及び前記第１の指の動きに基づいて、さらに前記仮想オブジェクトを放すジェスチャを検出する
　前記（１）乃至（３）のいずれかに記載の情報処理装置。
（１１）
　前記ジェスチャ検出部は、前記手基部の位置及び姿勢の変化が第３の範囲内である場合に、前記第１の指の指先が第２の指の指先から離れたとき、又は、前記手基部の位置及び姿勢のうち少なくとも一方の変化が前記第３の範囲より大きい場合、前記第１の指の位置及び姿勢のうち少なくとも一方の変化が第４の範囲より大きく、かつ、前記第１の指の指先が前記第２の指の指先から離れた状態が所定の時間以上継続したとき、前記仮想オブジェクトが放されたと判定する
　前記（１０）に記載の情報処理装置。
（１２）
　前記ジェスチャ検出部は、前記手の甲の加速度及び角速度に基づいて、前記手基部の位置及び姿勢の変化を検出し、前記第１の指の加速度及び角速度に基づいて、前記第１の指の位置及び姿勢の変化を検出し、前記第１の指の指先の静電容量に基づいて、前記第１の指の指先と前記第２の指の指先との接触状態を検出する
　前記（１１）に記載の情報処理装置。
（１３）
　前記仮想オブジェクトを前記ユーザの視界内において現実世界に重畳させて表示する制御を実行する出力制御部を
　さらに備える前記（１）乃至（３）のいずれかに記載の情報処理装置。
（１４）
　前記出力制御部は、前記仮想オブジェクトが摘まれたと判定された場合、前記仮想オブジェクトの表示態様を変化させる
　前記（１３）に記載の情報処理装置。
（１５）
　前記ジェスチャ検出部は、前記手基部の動き及び前記第１の指の動きに基づいて、前記ユーザにより摘まれる前記仮想オブジェクトを予測し、
　前記出力制御部は、前記ユーザにより摘まれると予測された前記仮想オブジェクトの表示態様を変化させる
　前記（１３）又は（１４）に記載の情報処理装置。
（１６）
　前記出力制御部は、前記仮想オブジェクトを放した後の動きを示す情報を表示させる
　前記（１３）又は（１４）に記載の情報処理装置。
（１７）
　ユーザの手の指を含まない部分である手基部の動き及び前記手の所定の指の動きを個別に検出し、前記手基部の動き及び前記指の動きに基づいて、前記ユーザが仮想オブジェクトを摘むジェスチャを検出する
　情報処理方法。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　１０１　情報処理システム，　１１１　指先センサ，　１１２，１１３　ＩＭＵ，　１１４　ヘッドマウントディスプレイ，　１５２　センシング部，　１５４　制御部，　１５５　出力部，　１６１　撮影部，　１６２　ＩＭＵ，　１７１　ジェスチャ検出部，　１７２　視線検出部，　１７３　情報処理部，　１７４　出力制御部，　１８１　表示部，　１８２　音声出力部，　１８３　ハプティクスデバイス

Claims

　ユーザの手の指を含まない部分である手基部の動き及び前記手の第１の指の動きを個別に検出し、前記手基部の動き及び前記第１の指の動きに基づいて、前記ユーザが仮想オブジェクトを摘むジェスチャを検出するジェスチャ検出部を
　備える情報処理装置。
　前記ジェスチャ検出部は、前記手基部の位置及び姿勢の変化が第１の範囲内である場合に、前記仮想オブジェクトを含む第２の範囲内で前記第１の指の指先が前記手の第２の指の指先と接触したとき、前記仮想オブジェクトが摘まれたと判定する
　請求項１に記載の情報処理装置。
　前記ジェスチャ検出部は、前記手基部の位置の変化が第１の閾値未満、かつ、前記手基部の姿勢の変化が第２の閾値未満である場合、前記手基部の位置及び姿勢の変化が前記第１の範囲内であると判定する
　請求項２に記載の情報処理装置。
　前記ジェスチャ検出部は、前記ユーザの状態及び属性のうち少なくとも１つに基づいて、前記第１の閾値及び前記第２の閾値のうち少なくとも１つを変化させる
　請求項３に記載の情報処理装置。
　前記ジェスチャ検出部は、周囲の環境に基づいて、前記第１の閾値及び前記第２の閾値のうち少なくとも１つを変化させる
　請求項３に記載の情報処理装置。
　前記ジェスチャ検出部は、前記仮想オブジェクトの状態及び属性のうち少なくとも１つに基づいて、前記第１の閾値及び前記第２の閾値のうち少なくとも１つを変化させる
　請求項３に記載の情報処理装置。
　前記ジェスチャ検出部は、前記手の甲の加速度及び角速度に基づいて、前記手基部の位置及び姿勢の変化を検出し、前記第１の指の指先の圧力に基づいて、前記第１の指の指先と前記第２の指の指先との接触状態を検出する
　請求項２に記載の情報処理装置。
　前記ジェスチャ検出部は、さらに前記第１の指の指先の静電容量に基づいて、前記第１の指の指先と前記第２の指の指先との接触状態を検出する
　請求項７に記載の情報処理装置。
　前記第１の指は、人差し指であり、
　前記第２の指は、親指である
　請求項２に記載の情報処理装置。
　前記ジェスチャ検出部は、前記手基部の動き及び前記第１の指の動きに基づいて、さらに前記仮想オブジェクトを放すジェスチャを検出する
　請求項１に記載の情報処理装置。
　前記ジェスチャ検出部は、前記手基部の位置及び姿勢の変化が第３の範囲内である場合に、前記第１の指の指先が第２の指の指先から離れたとき、又は、前記手基部の位置及び姿勢のうち少なくとも一方の変化が前記第３の範囲より大きい場合、前記第１の指の位置及び姿勢のうち少なくとも一方の変化が第４の範囲より大きく、かつ、前記第１の指の指先が前記第２の指の指先から離れた状態が所定の時間以上継続したとき、前記仮想オブジェクトが放されたと判定する
　請求項１０に記載の情報処理装置。
　前記ジェスチャ検出部は、前記手の甲の加速度及び角速度に基づいて、前記手基部の位置及び姿勢の変化を検出し、前記第１の指の加速度及び角速度に基づいて、前記第１の指の位置及び姿勢の変化を検出し、前記第１の指の指先の静電容量に基づいて、前記第１の指の指先と前記第２の指の指先との接触状態を検出する
　請求項１１に記載の情報処理装置。
　前記仮想オブジェクトを前記ユーザの視界内において現実世界に重畳させて表示する制御を実行する出力制御部を
　さらに備える請求項１に記載の情報処理装置。
　前記出力制御部は、前記仮想オブジェクトが摘まれたと判定された場合、前記仮想オブジェクトの表示態様を変化させる
　請求項１３に記載の情報処理装置。
　前記ジェスチャ検出部は、前記手基部の動き及び前記第１の指の動きに基づいて、前記ユーザにより摘まれる前記仮想オブジェクトを予測し、
　前記出力制御部は、前記ユーザにより摘まれると予測された前記仮想オブジェクトの表示態様を変化させる
　請求項１３に記載の情報処理装置。
　前記出力制御部は、前記仮想オブジェクトを放した後の動きを示す情報を表示させる
　請求項１３に記載の情報処理装置。
　ユーザの手の指を含まない部分である手基部の動き及び前記手の所定の指の動きを個別に検出し、前記手基部の動き及び前記指の動きに基づいて、前記ユーザが仮想オブジェクトを摘むジェスチャを検出する
　情報処理方法。