JP2015109111A - Gesture operation input processing device, three-dimensional display device and gesture operation input processing method - Google Patents

Gesture operation input processing device, three-dimensional display device and gesture operation input processing method Download PDF

Info

Publication number
JP2015109111A
JP2015109111A JP2015045530A JP2015045530A JP2015109111A JP 2015109111 A JP2015109111 A JP 2015109111A JP 2015045530 A JP2015045530 A JP 2015045530A JP 2015045530 A JP2015045530 A JP 2015045530A JP 2015109111 A JP2015109111 A JP 2015109111A
Authority
JP
Japan
Prior art keywords
gesture
distance
user
depth direction
operation input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015045530A
Other languages
Japanese (ja)
Other versions
JP6053845B2 (en
Inventor
平田 真一
Shinichi Hirata
真一 平田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Computer Entertainment Inc filed Critical Sony Computer Entertainment Inc
Priority to JP2015045530A priority Critical patent/JP6053845B2/en
Publication of JP2015109111A publication Critical patent/JP2015109111A/en
Application granted granted Critical
Publication of JP6053845B2 publication Critical patent/JP6053845B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a technique of gesture interface for supporting operation input by user gesture.SOLUTION: A distance calculation unit 20 obtains, from a gesture image obtained by capturing an image of user gesture performed while watching a three-dimensional display, a distance of the user gesture in depth direction. A gesture recognition parameter adjustment unit 50 adjusts, on the basis of the resolution of distance measurements in depth direction, a parameter when recognizing operation input by user gesture. A gesture recognition processing unit 60 refers to, under an adjusted parameter, a distance in depth direction calculated by the distance calculation unit 20, to recognize operation input by user gesture.

Description

この発明は、ジェスチャによる操作入力を処理する装置および方法に関する。   The present invention relates to an apparatus and method for processing an operation input by a gesture.

立体映像が視聴できる3次元テレビが一般家庭でも利用できるようになった。また、3次元映像を記録したブルーレイディスクをプレイヤで再生して、3次元ディスプレイに表示して高画質の3次元映像を視聴することも可能になった。ゲーム機においても3次元ディスプレイに接続して3次元映像を用いたゲームアプリケーションをプレイできる。さらに、距離センサを備えたカメラを用いて、ユーザの3次元映像を撮影し、ゲームアプリケーションに取り込むこともある。   3D TVs that can view 3D images can now be used at home. In addition, a Blu-ray disc on which 3D video is recorded can be played back by a player and displayed on a 3D display for viewing high-quality 3D video. In a game machine, a game application using a 3D image can be played by connecting to a 3D display. Furthermore, a user's 3D image | video may be image | photographed using a camera provided with the distance sensor, and it may take in in a game application.

ゲームアプリケーションの中には、ユーザが身体を用いて操作をしたり、ゲームに参加するタイプのものが増えている。今後、ゲームアプリケーションが3次元化すると、ジェスチャによる入力操作がより多く利用されることが予想される。   Among game applications, there are an increasing number of types in which a user performs operations using the body or participates in a game. In the future, when the game application becomes three-dimensional, it is expected that more input operations using gestures will be used.

特許文献1には、ユーザが画面から離れた位置から指示を与えることができるインタフェースを備えた携帯型ゲーム装置が開示されている。   Patent Document 1 discloses a portable game device having an interface through which a user can give an instruction from a position away from the screen.

国際公開第10/038822号パンフレットInternational Publication No. 10/038822 Pamphlet

ユーザのジェスチャによる操作入力を支援するためのジェスチャインタフェースの技術が求められている。システムは、ディスプレイを前にしてユーザがストレスを感じることなくジェスチャを介して操作を入力できるように、ジェスチャを認識する際の検出感度をシステムの性能に合わせて適切なレベルに制御する必要がある。   There is a demand for a gesture interface technique for supporting operation input by a user's gesture. The system needs to control the detection sensitivity when recognizing the gesture to an appropriate level according to the performance of the system so that the user can input an operation through the gesture without feeling stressed in front of the display. .

本発明はこうした課題に鑑みてなされたものであり、その目的は、ジェスチャによる操作入力を容易にする技術を提供することにある。   The present invention has been made in view of these problems, and an object of the present invention is to provide a technique that facilitates operation input by a gesture.

上記課題を解決するために、本発明のある態様のジェスチャ操作入力処理装置は、ディスプレイを見ながら行われるユーザのジェスチャを撮影した画像からユーザの指示ポイントを抽出する指示ポイント抽出部と、前記指示ポイントまでの奥行き方向の距離を求める距離計算部と、奥行き方向の距離計測の分解能および前記ディスプレイの3次元表示性能の少なくとも一方にもとづいて、ユーザのジェスチャによる操作入力を認識する際の奥行き方向の検出感度に関するパラメータを調整するパラメータ調整部と、調整されたパラメータのもとで、前記距離計算部により計算された前記指示ポイントまでの奥行き方向の距離を参照して、ユーザのジェスチャによる操作入力を認識するジェスチャ認識処理部とを含む。   In order to solve the above-described problem, a gesture operation input processing device according to an aspect of the present invention includes an instruction point extraction unit that extracts a user instruction point from an image obtained by photographing a user gesture performed while watching a display, and the instruction Based on at least one of the distance calculation unit for obtaining the distance in the depth direction to the point, the resolution of the distance measurement in the depth direction, and the three-dimensional display performance of the display, the depth direction when recognizing the operation input by the user's gesture A parameter adjustment unit that adjusts a parameter relating to detection sensitivity, and a distance in the depth direction to the indicated point calculated by the distance calculation unit based on the adjusted parameter, and an operation input by a user's gesture And a gesture recognition processing unit for recognizing.

本発明の別の態様は、ジェスチャ操作入力処理方法である。この方法は、ユーザのジェスチャによる操作入力を支援するインタフェースを備えた3次元ジェスチャ入力システムにおけるジェスチャ操作入力処理方法であって、ディスプレイを見ながら行われるユーザのジェスチャを撮影した画像からユーザの指示ポイントを抽出するステップと、前記指示ポイントまでの奥行き方向の距離を求めるステップと、奥行き方向の距離計測の分解能および前記ディスプレイの3次元表示性能の少なくとも一方にもとづいて、ユーザのジェスチャによる操作入力を認識する際の奥行き方向の検出感度に関するパラメータを調整するステップと、調整されたパラメータのもとで、前記距離計算部により計算された前記指示ポイントまでの奥行き方向の距離を参照して、ユーザのジェスチャによる操作入力を認識するステップとを含む。   Another aspect of the present invention is a gesture operation input processing method. This method is a gesture operation input processing method in a three-dimensional gesture input system having an interface that supports an operation input by a user's gesture, and points to the user from an image obtained by photographing the user's gesture while looking at a display. Recognizing an operation input by a user's gesture based on at least one of a depth direction distance measurement resolution and a 3D display performance of the display. Adjusting a parameter related to detection sensitivity in the depth direction when performing the gesture, and referring to the distance in the depth direction to the indicated point calculated by the distance calculation unit based on the adjusted parameter, Recognize operation input by And a step.

なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。   It should be noted that any combination of the above-described constituent elements and the expression of the present invention converted between a method, an apparatus, a system, a computer program, a data structure, a recording medium, etc. are also effective as an aspect of the present invention.

本発明によれば、ジェスチャによる操作入力が容易に行えるようになる。   According to the present invention, operation input by a gesture can be easily performed.

3次元ジェスチャ入力システムの構成図である。It is a block diagram of a three-dimensional gesture input system. ジェスチャ操作入力処理装置の構成図である。It is a block diagram of a gesture operation input processing apparatus. 図3(a)、(b)は、三角測量型のカメラの距離計測原理と距離分解能を説明する図である。FIGS. 3A and 3B are diagrams for explaining the distance measurement principle and distance resolution of a triangulation type camera. 図4(a)、(b)は、TOF型のカメラの距離計測原理と距離分解能を説明する図である。4A and 4B are diagrams for explaining the distance measurement principle and distance resolution of a TOF type camera. ディスプレイ装置の前面に設定される仮想的なスクリーンを説明する図である。It is a figure explaining the virtual screen set in the front surface of a display apparatus. 図6(a)〜(e)は、ジェスチャによる操作入力の例を説明する図である。6A to 6E are diagrams illustrating an example of an operation input by a gesture. ジェスチャの奥行き方向の動き検出の感度を調整するパラメータを説明する図である。It is a figure explaining the parameter which adjusts the sensitivity of the motion detection of the depth direction of a gesture. 図2のジェスチャ操作入力処理装置によるZ方向の動き検出の感度に関するパラメータの調整方法を説明するフローチャートである。3 is a flowchart for explaining a method for adjusting a parameter related to sensitivity of motion detection in the Z direction by the gesture operation input processing device of FIG. 2.

図1は、3次元ジェスチャ入力システム300の構成図である。3次元ジェスチャ入力システム300は、ゲーム機200、ディスプレイ装置210、およびカメラ220を含む。   FIG. 1 is a configuration diagram of a three-dimensional gesture input system 300. The three-dimensional gesture input system 300 includes a game machine 200, a display device 210, and a camera 220.

ゲーム機200は、ゲームアプリケーションなどのコンテンツを実行し、ディスプレイ装置210に映像や操作メニューなどを表示する。ゲーム機200の代わりに、記録媒体に格納されたコンテンツを再生するプレイヤを用いてもよい。   The game machine 200 executes content such as a game application and displays a video, an operation menu, and the like on the display device 210. Instead of the game machine 200, a player that reproduces content stored in a recording medium may be used.

ディスプレイ装置210は、2次元表示および/または3次元表示が可能なディスプレイである。ディスプレイ装置210が2次元表示のみが可能である場合、コンテンツを2次元画像として表示するが、3次元表示も可能である場合、ユーザからの指示またはアプリケーションからの指示に応じて、コンテンツを2次元画像または3次元画像として表示する。   The display device 210 is a display capable of two-dimensional display and / or three-dimensional display. When the display device 210 can only display two-dimensionally, the content is displayed as a two-dimensional image. When three-dimensional display is also possible, the content is displayed in two dimensions according to an instruction from the user or an instruction from the application. Display as an image or a three-dimensional image.

カメラ220は、ユーザ250のジェスチャを撮影する。カメラ220は、ディスプレイ装置210の上部などに設けられる。カメラ220の設置位置を原点とし、ディスプレイ表面をXY平面とし、ディスプレイ表面に垂直な方向をZ軸とする座標系を考える。カメラ220は、被写体までのZ方向の距離を測定する測距機能を有する。たとえば、カメラ220は、音波や光を被写体に投射し、反射して戻ってくるまでの時間を計ることにより被写体までの距離を測定する距離センサを有してもよく、あるいは、異なる二つの視点から撮影した視差画像から奥行き値を計算する画像処理ユニットを有してもよい。   The camera 220 captures a gesture of the user 250. The camera 220 is provided on the display device 210 or the like. Consider a coordinate system in which the installation position of the camera 220 is the origin, the display surface is the XY plane, and the direction perpendicular to the display surface is the Z axis. The camera 220 has a distance measuring function for measuring the distance in the Z direction to the subject. For example, the camera 220 may have a distance sensor that measures the distance to the subject by projecting sound waves or light onto the subject and measuring the time from reflection to return, or two different viewpoints. You may have an image processing unit which calculates a depth value from the parallax image photoed from.

ユーザ250は、ディスプレイ装置210に表示された画像を見ながら、ジェスチャによりゲーム機200に対する操作コマンドを入力する。ディスプレイ装置210がステレオディスプレイのように立体視のために専用メガネ230を有する場合は、ユーザ250は専用メガネ230を装着してディスプレイ装置210の画面を見る。   The user 250 inputs an operation command for the game machine 200 using a gesture while viewing an image displayed on the display device 210. When the display device 210 has the dedicated glasses 230 for stereoscopic viewing like a stereo display, the user 250 wears the dedicated glasses 230 and views the screen of the display device 210.

ユーザ250は、手の指などを指示ポイント240a〜cとして3次元空間内で動かすことによって、操作コマンドをゲーム機200に与える。ディスプレイ装置210の画面には、ユーザのジェスチャ入力を支援するために、ゲーム機200が検出した指示ポイント240a〜cの移動軌跡が表示される。   The user 250 gives an operation command to the game machine 200 by moving a finger of a hand or the like in the three-dimensional space as instruction points 240a to 240c. On the screen of the display device 210, the movement trajectories of the instruction points 240a to 240c detected by the game machine 200 are displayed in order to support the user's gesture input.

ゲーム機200は、カメラ220により撮影されたユーザ250のジェスチャ画像からユーザ250の手の指などの指示ポイント240a〜cを検出し、カメラ220から指示ポイント240a〜cまでの距離を求める。   The game machine 200 detects instruction points 240a to 240c such as fingers of the user 250's hand from the gesture image of the user 250 photographed by the camera 220, and obtains distances from the camera 220 to the instruction points 240a to 240c.

ゲーム機200が指示ポイント240a〜cを検出しやすいように、ユーザは人差し指だけを差し出すようにしてもよい。あるいは、指示ポイント240を画像認識しやすいように、ユーザ250はマーカーが付けられた指キャップを指に付けたり、マーカーが付けられた指示棒を使用してジェスチャを行ってもよい。あるいは、ユーザ250は、3次元座標を検出できる位置センサを搭載したコントローラを手にもってジェスチャを行い、コントローラから無線通信などにより、位置センサが検出した3次元座標をゲーム機200に送信してもよい。   In order for the game machine 200 to easily detect the instruction points 240a to 240c, the user may present only the index finger. Alternatively, the user 250 may attach a finger cap with a marker to a finger or make a gesture using an indicator bar with a marker so that the instruction point 240 can be easily recognized. Alternatively, the user 250 performs a gesture by holding a controller equipped with a position sensor capable of detecting three-dimensional coordinates, and transmits the three-dimensional coordinates detected by the position sensor to the game machine 200 by wireless communication or the like. Good.

ゲーム機200は、ユーザ250の指示ポイント240の3次元空間内での動きに応じて、ユーザが意図した操作コマンドを認識し、操作コマンドを実行する。特に、ゲーム機200は、ユーザ250のジェスチャの奥行き方向の動きを検出することにより、ユーザ250のジェスチャに自由度をもたせて、ジェスチャ入力インタフェースに柔軟性を与えることができる。   The game machine 200 recognizes the operation command intended by the user in accordance with the movement of the instruction point 240 of the user 250 in the three-dimensional space, and executes the operation command. In particular, the game machine 200 can provide flexibility to the gesture input interface by detecting the movement in the depth direction of the gesture of the user 250 to give the user 250 a degree of freedom.

図2は、ジェスチャ操作入力処理装置100の構成図である。図2に示すジェスチャ操作入力処理装置100の機能構成の一部または全部は、ゲーム機200にハードウェア、ソフトウェアまたはその組み合わせによって実装することができる。ゲーム機200以外に、パーソナルコンピュータ、携帯機器、携帯端末などに実装してもよい。   FIG. 2 is a configuration diagram of the gesture operation input processing device 100. A part or all of the functional configuration of the gesture operation input processing device 100 illustrated in FIG. 2 can be implemented in the game machine 200 by hardware, software, or a combination thereof. In addition to the game machine 200, it may be mounted on a personal computer, a portable device, a portable terminal, or the like.

ジェスチャ操作入力処理装置100は、指示ポイント抽出部10、距離計算部20、距離センサ性能取得部30、距離センサデータベース32、ディスプレイ性能取得部40、ディスプレイデータベース42、ジェスチャ認識パラメータ調整部50、仮想スクリーン記憶部52、ジェスチャ認識処理部60、表示制御部70、およびアプリケーション実行部80を有する。   The gesture operation input processing device 100 includes an instruction point extraction unit 10, a distance calculation unit 20, a distance sensor performance acquisition unit 30, a distance sensor database 32, a display performance acquisition unit 40, a display database 42, a gesture recognition parameter adjustment unit 50, a virtual screen. A storage unit 52, a gesture recognition processing unit 60, a display control unit 70, and an application execution unit 80 are included.

指示ポイント抽出部10は、カメラ220が撮影したユーザ250のジェスチャ画像を取得し、ジェスチャ画像からユーザの指示ポイント240を抽出する。指示ポイント240は、ユーザの指の先端部やマーカーが付された箇所であるから、エッジ抽出や画像解析など一般的な画像処理機能を用いて指示ポイント240を画像から抽出することができる。   The instruction point extraction unit 10 acquires a gesture image of the user 250 taken by the camera 220 and extracts a user instruction point 240 from the gesture image. Since the instruction point 240 is a point to which the tip of the user's finger or a marker is attached, the instruction point 240 can be extracted from the image using a general image processing function such as edge extraction or image analysis.

距離計算部20は、指示ポイント240までの奥行き方向の距離を求める。カメラ220が三角測量型の測距機能を有する場合、異なる二つの視点から撮像された視差画像から指示ポイント240までの奥行き方向の距離を求める。カメラ220がアクティブ型レーザ距離計やレーダーなどTOF(time of flight)の距離センサを有する場合、距離計算部20は、指示ポイント240に光を投影してから、その光が指示ポイント240に反射して戻ってくるまでの往復時間をカメラ220から取得して、往復時間に光の速度を乗算することにより、指示ポイント240までの距離を求める。   The distance calculation unit 20 calculates a distance in the depth direction to the indication point 240. When the camera 220 has a triangulation type distance measuring function, the distance in the depth direction from the parallax images captured from two different viewpoints to the instruction point 240 is obtained. In the case where the camera 220 has a time-of-flight (TOF) distance sensor such as an active laser distance meter or a radar, the distance calculation unit 20 projects light onto the instruction point 240 and then the light is reflected on the instruction point 240. The round trip time until the camera returns is acquired from the camera 220, and the distance to the indication point 240 is obtained by multiplying the round trip time by the speed of light.

距離センサ性能取得部30は、距離センサデータベース32を参照して、カメラ220の距離センサの分解能に関する情報を取得し、ジェスチャ認識パラメータ調整部50に与える。距離センサの分解能情報には、測定可能な距離の範囲や、距離センサの測距方式が三角測量型であるか、TOF型であるかを示す識別情報などが含まれる。   The distance sensor performance acquisition unit 30 refers to the distance sensor database 32, acquires information regarding the resolution of the distance sensor of the camera 220, and provides the information to the gesture recognition parameter adjustment unit 50. The resolution information of the distance sensor includes a range of measurable distance, identification information indicating whether the distance sensor distance measurement method is a triangulation type, or a TOF type.

ディスプレイ性能取得部40は、ディスプレイデータベース42を参照して、ディスプレイ装置210の表示性能に関する情報を取得し、ディスプレイ装置210の表示性能情報をジェスチャ認識パラメータ調整部50に与える。表示性能情報には、3次元表示性能に関する情報が含まれる。たとえば、ディスプレイ装置210が、通常の液晶テレビのディスプレイのようにZ方向の表示能力をもたない2Dディスプレイであるか、ステレオ視(両眼立体視)可能なステレオディスプレイであるか、3次元空間を表示可能な3Dディスプレイであるかを示す識別情報が含まれる。   The display performance acquisition unit 40 refers to the display database 42, acquires information related to the display performance of the display device 210, and provides the display performance information of the display device 210 to the gesture recognition parameter adjustment unit 50. The display performance information includes information regarding the three-dimensional display performance. For example, the display device 210 is a 2D display that does not have a display capability in the Z direction as in a normal liquid crystal television display, or a stereo display that can be viewed in stereo (binocular stereoscopic view). Identification information indicating whether the 3D display is capable of displaying is included.

ジェスチャ認識パラメータ調整部50は、距離センサ性能取得部30から与えられる距離センサの分解能と、ディスプレイ性能取得部40から与えられるディスプレイの3次元表示性能と、距離計算部20から与えられる指示ポイント240までの測定距離とにもとづいて、ジェスチャ認識する際のパラメータを調整する。ジェスチャ認識の際のパラメータは、特に指示ポイント240の奥行き方向の動きを検出する感度を調整するためのものである。   The gesture recognition parameter adjustment unit 50 includes the resolution of the distance sensor provided from the distance sensor performance acquisition unit 30, the three-dimensional display performance of the display provided from the display performance acquisition unit 40, and the indication point 240 provided from the distance calculation unit 20. Based on the measured distance, the parameters for gesture recognition are adjusted. The parameters for the gesture recognition are particularly for adjusting the sensitivity of detecting the movement of the indication point 240 in the depth direction.

ジェスチャ認識パラメータ調整部50は、奥行き方向の距離計測の分解能が高ければ、指示ポイント240の奥行き方向の動きを検出する粒度を細かくして感度を上げ、逆に、奥行き方向の距離計測の分解能が低ければ、指示ポイント240の奥行き方向の動きを検出する粒度を粗くして感度を下げる。同様に、ディスプレイの3次元表示性能が高ければ、指示ポイント240の奥行き方向の動きを検出する粒度を細かくして感度を上げ、逆に、ディスプレイの3次元表示性能が低ければ、指示ポイント240の奥行き方向の動きを検出する粒度を粗くして感度を下げる。   If the resolution of the distance measurement in the depth direction is high, the gesture recognition parameter adjustment unit 50 increases the sensitivity by reducing the granularity for detecting the movement of the indication point 240 in the depth direction, and conversely, the resolution of the distance measurement in the depth direction is high. If it is low, the granularity for detecting the movement of the indication point 240 in the depth direction is coarsened to lower the sensitivity. Similarly, if the three-dimensional display performance of the display is high, the granularity for detecting the movement in the depth direction of the indication point 240 is made finer to increase the sensitivity. Conversely, if the three-dimensional display performance of the display is low, the indication point 240 Decrease the sensitivity by coarsening the granularity to detect the movement in the depth direction.

本実施の形態では、ディスプレイ装置210の前面に、仮想的なスクリーンを設定し、指示ポイント240が仮想的なスクリーンを通過することを契機に、指示ポイント240をアクティブ化する。指示ポイント240が仮想的なスクリーンよりユーザから見て手前にある場合は、指示ポイント240は非アクティブとすることで、ユーザが指などで操作入力を与えるときと、与えないときを容易に区別できるようにする。仮想的なスクリーンをディスプレイ装置210の前面に複数設置してユーザが段階的に指を差し入れることで、段階的に操作入力を与えることができるようにしてもよい。仮想スクリーン記憶部52は、そのような仮想的なスクリーンの設置位置や設置間隔などの情報を保持する。   In the present embodiment, a virtual screen is set on the front surface of the display device 210, and the instruction point 240 is activated when the instruction point 240 passes through the virtual screen. When the instruction point 240 is in front of the virtual screen as viewed from the user, the instruction point 240 is inactive, so that it is easy to distinguish when the user gives an operation input with a finger or the like and when not giving it. Like that. A plurality of virtual screens may be installed on the front surface of the display device 210 so that the user can input operation in stages by inserting a finger in stages. The virtual screen storage unit 52 holds information such as installation positions and installation intervals of such virtual screens.

ジェスチャ認識パラメータ調整部50は、仮想スクリーン記憶部52に保持された仮想的なスクリーンの設置位置や設置間隔などのパラメータを調整することにより、指示ポイント240の奥行き方向の動きを検出する感度を調整することができる。   The gesture recognition parameter adjustment unit 50 adjusts the sensitivity for detecting the movement of the indication point 240 in the depth direction by adjusting parameters such as the installation position and installation interval of the virtual screen held in the virtual screen storage unit 52. can do.

ジェスチャ認識処理部60は、調整されたパラメータのもとで、距離計算部20により計算された指示ポイント240までの奥行き方向の距離を参照して、3次元空間内のユーザのジェスチャを認識し、操作コマンドを特定する。ジェスチャ認識処理部60は、指示ポイント240までの奥行き方向の距離にもとづいて、指示ポイント240がディスプレイ装置210の前面に設定された仮想的なスクリーンを通過したかどうかを判定し、通過した場合に指示ポイント240をアクティブ化し、ユーザのジェスチャによる操作入力を特定する。表示制御部70は、ジェスチャ認識処理部60がユーザのどのようなジェスチャを認識しているかを示すために、ディスプレイ装置210に指示ポイント240の移動軌跡を表示する。   The gesture recognition processing unit 60 recognizes the user's gesture in the three-dimensional space with reference to the distance in the depth direction to the indication point 240 calculated by the distance calculation unit 20 under the adjusted parameters. Specify the operation command. The gesture recognition processing unit 60 determines whether or not the instruction point 240 has passed the virtual screen set on the front surface of the display device 210 based on the distance in the depth direction to the instruction point 240. The instruction point 240 is activated, and the operation input by the user's gesture is specified. The display control unit 70 displays the movement locus of the instruction point 240 on the display device 210 in order to indicate what kind of gesture the user has recognized by the gesture recognition processing unit 60.

アプリケーション実行部80は、ジェスチャ認識処理部60により特定された操作コマンドを実行し、アプリケーションに反映させる。   The application execution unit 80 executes the operation command specified by the gesture recognition processing unit 60 and reflects it in the application.

図3(a)、(b)は、三角測量型のカメラ220の距離計測原理と距離分解能を説明する図である。図3(a)に示すように、三角測量の場合、2台のカメラ220a、220bを用いて異なる視点から視差画像を撮像するか、1台のカメラ220を移動させて視点位置を異ならせて視差画像を撮像することにより、指示ポイント240までの距離dを測定する。三角測量の原理を用いた測距カメラの一例として、ステレオカメラがある。   FIGS. 3A and 3B are diagrams for explaining the distance measurement principle and distance resolution of the triangulation type camera 220. FIG. As shown in FIG. 3A, in the case of triangulation, two cameras 220a and 220b are used to capture parallax images from different viewpoints, or one camera 220 is moved to change the viewpoint position. By capturing the parallax image, the distance d to the instruction point 240 is measured. A stereo camera is an example of a ranging camera that uses the principle of triangulation.

図3(b)のグラフは、三角測量型のカメラ220における、絶対距離dに対する距離分解能Rを示す。グラフの横軸は視点から被写体までの絶対距離dであり、縦軸は三角測量による距離分解能Rである。図3(b)に示すように、三角測量の場合、被写体までの距離が遠く離れるほど、距離分解能Rが低くなり、測定精度は落ちる。逆に被写体までの距離が近いほど、距離分解能Rが高くなり、測定精度は上がる。   The graph of FIG. 3B shows the distance resolution R with respect to the absolute distance d in the triangulation type camera 220. The horizontal axis of the graph is the absolute distance d from the viewpoint to the subject, and the vertical axis is the distance resolution R by triangulation. As shown in FIG. 3B, in the case of triangulation, the distance resolution R decreases as the distance to the subject increases, and the measurement accuracy decreases. Conversely, the closer the distance to the subject, the higher the distance resolution R and the higher the measurement accuracy.

図4(a)、(b)は、TOF型のカメラ220の距離計測原理と距離分解能を説明する図である。TOF型のカメラ220の場合、被写体に赤外光や超音波を投射し、その反射波を測定することにより、被写体までの距離を測定する。図4(a)に示すように、TOF法では、カメラ220のセンサから出た光が指示ポイント240に当たって反射し、センサに届くまでの往復時間tを測定し、光の速度cを乗算して2で割ることにより、次式のように距離dを求めることができる。
d=t×c/2
4A and 4B are diagrams illustrating the distance measurement principle and distance resolution of the TOF type camera 220. FIG. In the case of the TOF type camera 220, the distance to the subject is measured by projecting infrared light or ultrasonic waves onto the subject and measuring the reflected wave. As shown in FIG. 4A, in the TOF method, the light emitted from the sensor of the camera 220 is reflected by the indication point 240 and reflected, and the round-trip time t until it reaches the sensor is measured and multiplied by the speed of light c. By dividing by 2, the distance d can be obtained as follows.
d = t × c / 2

図4(b)のグラフは、TOF型のカメラ220における、絶対距離dに対する距離分解能Rを示す。図4(b)に示すように、TOF法の場合、被写体までの距離に関係なく、距離分解能Rは一定であり、被写体までの距離が遠く離れても、測定精度は落ちない。   The graph of FIG. 4B shows the distance resolution R with respect to the absolute distance d in the TOF type camera 220. As shown in FIG. 4B, in the case of the TOF method, the distance resolution R is constant regardless of the distance to the subject, and the measurement accuracy does not decrease even if the distance to the subject is far away.

三角測量型のカメラ220は被写体までの距離が遠くなると測定精度が落ちるが、二つの視点の間隔をより広げれば、測定精度を上げることができる。一般家庭でディスプレイ装置210にカメラ220を設置することを考えると、視点間隔を広げることには限界があるため、絶対距離に関係なく測定精度が一定であるTOF型のカメラ220を用いた方が有利である。   The measurement accuracy of the triangulation type camera 220 decreases as the distance to the subject increases, but the measurement accuracy can be increased by further widening the interval between the two viewpoints. Considering the installation of the camera 220 on the display device 210 in a general home, there is a limit to widening the viewpoint interval, so it is better to use the TOF type camera 220 whose measurement accuracy is constant regardless of the absolute distance. It is advantageous.

ディスプレイ装置210についてもジェスチャによる操作入力に影響を与える表示能力の違いがある。2次元ディスプレイ、たとえば普通の液晶テレビのディスプレイは、Z方向の表現能力は持たない。このような2次元ディスプレイの場合、ユーザがディスプレイに写し出された自分の姿または指示ポイント240の移動軌跡を見ながら、空中で円を描くと、奥行き方向の距離が一定でない円になることが多い。   The display device 210 also has a display capability difference that affects the operation input by the gesture. A two-dimensional display, such as an ordinary liquid crystal television display, does not have the ability to express in the Z direction. In the case of such a two-dimensional display, when a user draws a circle in the air while looking at his / her figure projected on the display or the movement locus of the instruction point 240, the distance in the depth direction is often a circle that is not constant. .

ステレオ視(両眼立体視)が可能なステレオディスプレイは、Z方向の表現能力を持ち、ユーザは、裸眼または偏光メガネを用いて一組の左右画像を見ることで立体視することができる。たとえば、左右画像を時分割切り替え表示し、液晶シャッターメガネにより、左右の目に交互に左画像/右画像を入力する方式や、パララックスバリアやレンチキュラレンズを用いて、裸眼状態で左右の目にそれぞれ左画像/右画像が見えるようにする方式で立体視が可能である。このようなステレオディスプレイの場合、ユーザがディスプレイを見ながら、空中で円を描くと、ディスプレイ面に平行な円を描くことができる。しかし、ステレオディスプレイは、立体視するためのユーザの視点位置が固定されており、ある視点から一方向に見た立体視しかできず、ユーザの視点位置の変化には追随できないものが多い。   A stereo display capable of stereo viewing (binocular stereoscopic viewing) has a Z-direction expression capability, and a user can view stereoscopically by viewing a set of left and right images using naked eyes or polarized glasses. For example, the left and right images are displayed in a time-division switching manner, and the left and right eyes are alternately input using the liquid crystal shutter glasses, or a parallax barrier or lenticular lens is used. Stereoscopic viewing is possible by making the left image / right image visible. In the case of such a stereo display, when a user draws a circle in the air while looking at the display, a circle parallel to the display surface can be drawn. However, the stereo display has a fixed viewpoint of the user for stereoscopic viewing, and can only perform stereoscopic viewing from one viewpoint in one direction, and often cannot follow changes in the user's viewpoint.

インテグラルイメージング方式やホログラム方式などの多視点対応の3次元ディスプレイは、視点位置に応じて異なる左右画像を複数組映し出すことで、異なる視点位置から見ても立体視することができる。このような3次元ディスプレイの場合、ユーザは、どの視点位置から見ても立体視ができることから、あたかも3次元空間に実物があるかのように見え、表示された立体画像を見ながら、奥行き方向の操作をより正確に行うことができる。3次元ディスプレイは、ユーザの視点位置の変化に追随することができ、より自然な立体視が可能である。さらにホログラム方式を使えば、左右画像を実質的に無限組見せることができるので、ほぼ完全な立体視が可能となる。   A multi-view three-dimensional display such as an integral imaging method or a hologram method can produce a stereoscopic view from different viewpoint positions by projecting a plurality of different left and right images according to the viewpoint position. In the case of such a three-dimensional display, since the user can perform stereoscopic viewing from any viewpoint position, it looks as if there is a real thing in the three-dimensional space, and while viewing the displayed stereoscopic image, the depth direction Can be performed more accurately. The three-dimensional display can follow a change in the viewpoint position of the user, and enables more natural stereoscopic viewing. Further, if the hologram method is used, a substantially infinite set of left and right images can be shown, so that almost perfect stereoscopic viewing is possible.

ディスプレイ装置210が、2次元ディスプレイから、ステレオディスプレイ、そして3次元ディスプレイになるにつれて、ユーザがジェスチャにより操作入力する際のZ軸方向の操作精度が上がり、Z方向にリッチなジェスチャをして操作入力することが可能になる。   As the display device 210 changes from a two-dimensional display to a stereo display and a three-dimensional display, the operation accuracy in the Z-axis direction when the user performs an operation input with a gesture increases, and the operation input with a rich gesture in the Z direction occurs. It becomes possible to do.

本実施の形態の3次元ジェスチャ入システム300では、カメラ220の距離計測分解能と、ディスプレイ装置210の3次元表示性能に応じて、ジェスチャ認識のパラメータを調整することで、ユーザの操作感を最適化する。   In the 3D gesture insertion system 300 according to the present embodiment, the user's operational feeling is optimized by adjusting the gesture recognition parameters according to the distance measurement resolution of the camera 220 and the 3D display performance of the display device 210. To do.

図5は、ディスプレイ装置210の前面に設定される仮想的なスクリーンを説明する図である。ディスプレイ装置210に設置されたカメラ220を原点とし、ディスプレイ装置210面をXY平面とし、ディスプレイ装置210面に垂直な奥行き方向をZ軸とする座標系において、カメラ220からの距離dがZ1、Z2(Z1<Z2)の位置にそれぞれ仮想的な第1、第2仮想スクリーン270a、270bが設けられている。   FIG. 5 is a diagram for explaining a virtual screen set on the front surface of the display apparatus 210. In a coordinate system in which the camera 220 installed in the display device 210 is the origin, the display device 210 surface is the XY plane, and the depth direction perpendicular to the display device 210 surface is the Z axis, the distance d from the camera 220 is Z1, Z2. Virtual first and second virtual screens 270a and 270b are provided at positions (Z1 <Z2), respectively.

ユーザが指などをディスプレイ装置210に向かって差し出し、指示ポイント240がこれらの仮想スクリーンを突き破った場合、指示ポイント240をアクティブにする。仮想スクリーンは、指示ポイント240までの奥行き距離に応じて指示ポイント240をアクティブにする距離スイッチ機能を有する。   When the user pushes his finger or the like toward the display device 210 and the indication point 240 breaks through these virtual screens, the indication point 240 is activated. The virtual screen has a distance switch function that activates the instruction point 240 according to the depth distance to the instruction point 240.

ユーザが手の指をディスプレイ装置210に向かって差し出し、指示ポイント240の位置のZ座標の値がZ2よりも小さくなったとき、指示ポイント240は第2仮想スクリーン270bを突き破ったと判定され、さらに、指示ポイント240の位置のZ座標の値がZ1よりも小さくなったとき、指示ポイント240は第1仮想スクリーン270aを突き破ったと判定される。   When the user pushes the finger of the hand toward the display device 210 and the value of the Z coordinate at the position of the indication point 240 becomes smaller than Z2, it is determined that the indication point 240 has broken through the second virtual screen 270b, When the value of the Z coordinate at the position of the instruction point 240 becomes smaller than Z1, it is determined that the instruction point 240 has penetrated the first virtual screen 270a.

たとえば、指示ポイント240が距離Z2の位置にある第2仮想スクリーン270bを突き破った場合、ジェスチャ認識処理部60は、その動作をディスプレイ上のボタンなどを選択する操作であると認識し、指示ポイント240がさらに距離Z1の位置にある第1仮想スクリーン270aを突き破ると、ジェスチャ認識処理部60は、その動作をワープ操作であると認識してもよい。   For example, when the instruction point 240 breaks through the second virtual screen 270b at the position of the distance Z2, the gesture recognition processing unit 60 recognizes the operation as an operation for selecting a button or the like on the display, and the instruction point 240 Further pierce the first virtual screen 270a located at the distance Z1, the gesture recognition processing unit 60 may recognize the operation as a warp operation.

このように奥行き方向の距離に応じて2段階の仮想スクリーンを設けることにより、ジェスチャ認識処理部60は、ユーザのジェスチャの奥行き方向の変化に応じて、異なる操作コマンドを特定することができる。仮想スクリーンの段数をさらに増やせば、突き破る仮想スクリーンの段数に応じてさらに多くの異なる操作コマンドを特定することができる。また、仮想スクリーンの段数を増やせば、奥行き方向の動きの加速度変化を検出して、操作コマンドにさらにバリエーションをもたせることもできる。   Thus, by providing a two-stage virtual screen according to the distance in the depth direction, the gesture recognition processing unit 60 can specify different operation commands according to the change in the depth direction of the user's gesture. If the number of virtual screens is further increased, more different operation commands can be specified according to the number of virtual screens to be penetrated. In addition, if the number of virtual screens is increased, it is possible to detect a change in the acceleration in the depth direction and further vary the operation command.

図6(a)〜(e)は、ジェスチャによる操作入力の例を説明する図である。図6(a)は、指を仮想スクリーンに突っ込んでそこを原点として上下左右に動かしたり、円を描くことにより、相対的なコントロールを入力する例である。たとえば、指が仮想スクリーンを突き破ると、指示ポイント240がアクティブになり、ディスプレイ装置210に表示されたオブジェクトやアイコンが選択され、指示ポイント240を上下左右に動かすことで、画面に表示されたオブジェクトやアイコンを上下左右に動かすことができる。また、ディスプレイ装置210の画面に画像やドキュメントが表示されている場合は、指を上下左右に動かすことで上下左右にスクロールしたり、右回りの円を描くことで拡大、左回りの円を描くことで縮小表示できるようにしてもよい。   6A to 6E are diagrams illustrating an example of an operation input by a gesture. FIG. 6A is an example in which relative control is input by pushing a finger into a virtual screen and moving it up, down, left, or right from the origin, or drawing a circle. For example, when the finger breaks through the virtual screen, the instruction point 240 is activated, the object or icon displayed on the display device 210 is selected, and the object displayed on the screen is moved by moving the instruction point 240 up, down, left, or right. The icon can be moved up, down, left and right. When an image or document is displayed on the screen of the display device 210, the finger is moved up, down, left and right by moving the finger up, down, left and right, or a clockwise circle is drawn, and a counterclockwise circle is drawn. It may be possible to reduce the display.

図6(b)は、指を仮想スクリーンに突っ込み、カメラ220a、220bの視界を横切るように、大きく左右に動かした場合、ジェスチャ認識処理部60は、ユーザのジェスチャをフリック入力と判定し、アプリケーション実行部80は、判定された操作入力にしたがって、たとえば、次の画面に移動したり、連続スクロールを実行したりする。   In FIG. 6B, when the finger is pushed into the virtual screen and moved to the left or right so as to cross the field of view of the cameras 220a and 220b, the gesture recognition processing unit 60 determines the user's gesture as a flick input, For example, the execution unit 80 moves to the next screen or executes continuous scrolling according to the determined operation input.

図6(c)、(d)は、ユーザがジェスチャによりピンチ操作を入力する様子を示す。ピンチとは二本の指でつまむような動作をして、指と指の間を広げたり(ピンチアウト)、狭めたりする(ピンチイン)ことである。   FIGS. 6C and 6D show a state in which the user inputs a pinch operation using a gesture. Pinch is an operation of pinching with two fingers to widen (pinch out) or narrow (pinch in) between the fingers.

図6(c)は、左右の2本の指を仮想スクリーンに突っ込み、2本の指の間隔を狭めるジェスチャを行った場合、ジェスチャ認識処理部60は、このジェスチャをピンチイン操作であると判定し、表示制御部70は、表示されている画面を縮小する処理を実行する。   In FIG. 6C, when a gesture is performed in which the left and right fingers are pushed into the virtual screen and the interval between the two fingers is narrowed, the gesture recognition processing unit 60 determines that the gesture is a pinch-in operation. The display control unit 70 executes processing for reducing the displayed screen.

図6(d)は、左右の2本の指を仮想スクリーンに突っ込み、2本の指の間隔を広げるジェスチャを行った場合、ジェスチャ認識処理部60は、このジェスチャをピンチアウト操作であると判定し、表示制御部70は、表示されている画面を拡大する処理を実行する。   In FIG. 6D, when a gesture is performed in which two fingers on the left and right are pushed into the virtual screen and the distance between the two fingers is increased, the gesture recognition processing unit 60 determines that the gesture is a pinch-out operation. Then, the display control unit 70 executes a process for enlarging the displayed screen.

図6(e)は、指示ポイント240がアクティブのときに、さらに指を突き出すと、ジェスチャ認識処理部60は、ワープ操作であると判定する。また、たとえば、指を1本だけを突き出すと、ジェスチャ認識処理部60は、選択/実行ボタンの押し下げと判定するが、2本突き出すと、キャンセルボタンの押し下げであると判定してもよい。   In FIG. 6E, when the pointing point 240 is active and the finger is further protruded, the gesture recognition processing unit 60 determines that the operation is a warp operation. Further, for example, when only one finger is pushed out, the gesture recognition processing unit 60 determines that the selection / execution button is pressed, but when two fingers are pushed out, the gesture recognition processing unit 60 may determine that the cancel button is pressed.

図7は、ジェスチャの奥行き方向の動き検出の感度を調整するパラメータを説明する図である。ディスプレイ面をXY平面、ディスプレイ面に垂直な方向をZ軸として、Z=Z1、Z2、Z3(Z1<Z2<Z3)の位置にそれぞれ仮想スクリーン270a、270b、270cが設けられたとする。設定する仮想スクリーンの段数をN、隣り合う仮想スクリーンの間隔をD、各仮想スクリーンのデッドバンド(不感帯)の幅をdとする。   FIG. 7 is a diagram illustrating parameters for adjusting the sensitivity of motion detection in the depth direction of a gesture. Assume that virtual screens 270a, 270b, and 270c are provided at positions Z = Z1, Z2, and Z3 (Z1 <Z2 <Z3), respectively, where the display surface is the XY plane and the direction perpendicular to the display surface is the Z axis. The number of virtual screens to be set is N, the interval between adjacent virtual screens is D, and the width of the dead band (dead zone) of each virtual screen is d.

段数N、間隔D、およびデッドバンド幅dは、ジェスチャの奥行き方向の動き検出の感度に関するパラメータであり、これらのパラメータを、距離計測分解能と3次元表示性能にもとづいて調整する。また、これらの調整パラメータを奥行き方向の距離Zに依存して変化させてもよい。   The stage number N, the interval D, and the dead band width d are parameters related to the sensitivity of motion detection in the depth direction of the gesture, and these parameters are adjusted based on the distance measurement resolution and the three-dimensional display performance. Further, these adjustment parameters may be changed depending on the distance Z in the depth direction.

ディスプレイ装置210が、2次元ディスプレイからステレオディスプレイ、そして、3Dディスプレイへと3次元表示性能が上がるにつれて、ジェスチャ認識パラメータ調整部50は、段数Nを増やし、間隔Dとデッドバンド幅dは減らす。3次元表示性能が高いほど、ユーザはZ方向にリッチな動作をすることができるようになり、Z方向の検出感度を高めても問題がないからである。   As the display device 210 increases in 3D display performance from a 2D display to a stereo display and then to a 3D display, the gesture recognition parameter adjustment unit 50 increases the number of stages N and decreases the interval D and the dead bandwidth d. This is because the higher the three-dimensional display performance, the more the user can perform a rich operation in the Z direction, and there is no problem even if the detection sensitivity in the Z direction is increased.

カメラ220が三角測量型である場合、奥行き方向の距離に応じて段数N、間隔D、およびデッドバンド幅dを変化させる。三角測量法の場合、被写体がカメラ220から遠くなるほど測定精度が落ちるため、カメラ220からの距離が所定の閾値より小さいところでは、段数Nを増やし、間隔Dとデッドバンド幅dは減らしてZ方向の検出感度を上げ、カメラ220からの距離が所定の閾値より大きいところでは、段数Nを減らし、間隔Dとデッドバンド幅dは減らしてZ方向の検出感度を下げる。   When the camera 220 is a triangulation type, the number of steps N, the interval D, and the dead band width d are changed according to the distance in the depth direction. In the triangulation method, the measurement accuracy decreases as the subject is farther from the camera 220. Therefore, when the distance from the camera 220 is smaller than a predetermined threshold, the number of steps N is increased, the interval D and the dead band width d are decreased, and the Z direction is reached. When the distance from the camera 220 is larger than a predetermined threshold, the number of steps N is reduced, the interval D and the dead band width d are reduced, and the detection sensitivity in the Z direction is lowered.

カメラ220がTOF型である場合、奥行き方向の距離が変わっても測定精度は変わらないため、間隔D、デッドバンド幅dは一定値にするが、TOF型は測定精度が高いため、段数Nを三角測量型の場合よりは増やすことができる。   When the camera 220 is of the TOF type, the measurement accuracy does not change even if the distance in the depth direction changes. Therefore, the interval D and the dead band width d are constant, but the TOF type has a high measurement accuracy. It can be increased compared to the triangulation type.

図8は、ジェスチャ操作入力処理装置100によるZ方向の動き検出の感度に関するパラメータの調整方法を説明するフローチャートである。図8に示すフローチャートにおいては、各部の処理手順を、ステップを意味するS(Stepの頭文字)と数字との組み合わせによって表示する。また、Sと数字との組み合わせによって表示した処理で何らかの判断処理が実行され、その判断結果が肯定的であった場合は、Y(Yesの頭文字)を付加して、例えば、(S14のY)と表示し、逆にその判断結果が否定的であった場合は、N(Noの頭文字)を付加して、(S14のN)と表示する。   FIG. 8 is a flowchart for explaining a method for adjusting a parameter related to the sensitivity of motion detection in the Z direction by the gesture operation input processing device 100. In the flowchart shown in FIG. 8, the processing procedure of each part is displayed by a combination of S (acronym for Step) meaning a step and a number. In addition, when a determination process is executed in the process displayed by the combination of S and a number, and the determination result is affirmative, Y (acronym for Yes) is added, for example (Y in S14) If the result of the determination is negative, N (the acronym for No) is added and (N in S14) is displayed.

ディスプレイ性能取得部40は、ディスプレイデータベース42からディスプレイ性能、特に3次元表示性能に関するデータを取得する(S10)。ゲーム機200にディスプレイ装置210が接続された時点で、ゲーム機200にはディスプレイ装置210のドライバがインストールされている。ディスプレイ性能取得部40は、ディスプレイ装置210のドライバの情報をもとにディスプレイデータベース42に問い合わせをして、3次元表示性能に関するデータを取得する。あるいは、ディスプレイ装置210のドライバに3次元表示性能に関するデータが含まれていれば、ディスプレイ性能取得部40はドライバから3次元表示性能に関するデータを取り出してもよい。   The display performance acquisition unit 40 acquires data relating to display performance, particularly 3D display performance, from the display database 42 (S10). When the display device 210 is connected to the game machine 200, the driver of the display device 210 is installed in the game machine 200. The display performance acquisition unit 40 makes an inquiry to the display database 42 based on information about the driver of the display device 210 and acquires data related to the three-dimensional display performance. Alternatively, if the driver of the display device 210 includes data related to 3D display performance, the display performance acquisition unit 40 may extract data related to 3D display performance from the driver.

ジェスチャ認識パラメータ調整部50は、調整パラメータである段数N、間隔D、およびデッドバンド幅dの初期値を設定する(S12)。この初期値は、ディスプレイが高度な3次元表示性能をもつことを前提としたデフォールト値である。   The gesture recognition parameter adjustment unit 50 sets initial values of the stage number N, the interval D, and the dead bandwidth d, which are adjustment parameters (S12). This initial value is a default value based on the premise that the display has high three-dimensional display performance.

ディスプレイ性能取得部40は、3次元表示性能に関するデータにもとづいて、ディスプレイ装置210が3次元ディスプレイであるかどうかを判定する(S14)。3次元ディスプレイであれば(S14のY)、段数N、間隔D、およびデッドバンド幅dの初期値を変えることなく、ステップS22に進む。   The display performance acquisition unit 40 determines whether or not the display device 210 is a three-dimensional display based on the data regarding the three-dimensional display performance (S14). If it is a three-dimensional display (Y of S14), it will progress to step S22, without changing the initial value of the stage number N, the space | interval D, and the dead band width d.

3次元ディスプレイでなければ(S14のN)、ジェスチャ認識パラメータ調整部50は、段数Nを減少させ、間隔Dおよびデッドバンド幅dを増加させる(S16)。次に、ディスプレイ性能取得部40は、ディスプレイ装置210がステレオディスプレイであるかどうかを判定する(S18)。ステレオディスプレイであれば(S18のY)、これ以上、段数N、間隔D、およびデッドバンド幅dの値を変えることなく、ステップS22に進む。   If the display is not a three-dimensional display (N in S14), the gesture recognition parameter adjustment unit 50 decreases the number of stages N and increases the interval D and the dead bandwidth d (S16). Next, the display performance acquisition unit 40 determines whether or not the display device 210 is a stereo display (S18). If the display is a stereo display (Y in S18), the process proceeds to step S22 without changing the values of the stage number N, the interval D, and the dead band width d.

ディスプレイ装置210がステレオディスプレイでない、すなわち、2次元ディスプレイである場合(S18のN)、ジェスチャ認識パラメータ調整部50は、さらに段数Nを減少させ、間隔Dおよびデッドバンド幅dを増加させる(S20)。   When the display device 210 is not a stereo display, that is, a two-dimensional display (N in S18), the gesture recognition parameter adjustment unit 50 further decreases the number of stages N and increases the interval D and the dead bandwidth d (S20). .

次に、距離センサ性能取得部30は、距離センサデータベース32からカメラ220の距離分解能に関するデータを取得する(S21)。ゲーム機200にカメラ220が接続された時点で、ゲーム機200にはカメラ220のドライバがインストールされている。距離センサ性能取得部30は、カメラ220のドライバの情報をもとに距離センサデータベース32に問い合わせをして、距離分解能に関するデータを取得する。あるいは、カメラ220のドライバに距離分解能に関するデータが含まれていれば、距離センサ性能取得部30はドライバから距離分解能に関するデータを取り出してもよい。   Next, the distance sensor performance acquisition unit 30 acquires data relating to the distance resolution of the camera 220 from the distance sensor database 32 (S21). When the camera 220 is connected to the game machine 200, a driver for the camera 220 is installed in the game machine 200. The distance sensor performance acquisition unit 30 makes an inquiry to the distance sensor database 32 based on the information of the driver of the camera 220 and acquires data related to the distance resolution. Alternatively, if the driver of the camera 220 includes data regarding distance resolution, the distance sensor performance acquisition unit 30 may extract data regarding distance resolution from the driver.

距離センサ性能取得部30は、距離分解能に関するデータにもとづいて、カメラ220が三角測量型であるかどうかを判定する(S22)。三角測量型であれば(S22のY)、奥行き方向の距離に応じて段数N、間隔D、およびデッドバンド幅dを異ならせる(S24)。具体的には、カメラ220に近い位置ほど仮想スクリーンの段数Nを増やし、カメラ220から遠くなるほど仮想スクリーンの段数Nを減らす。また、カメラ220に近い位置の仮想スクリーンについては、測定精度が高いため、隣り合うスクリーンの間隔Dを狭くし、デッドバンド幅dも狭くする。カメラ220から遠い位置の仮想スクリーンについては、測定精度が落ちるため、隣り合うスクリーンの間隔Dを広くし、デッドバンド幅dも広くする。   The distance sensor performance acquisition unit 30 determines whether the camera 220 is a triangulation type based on the data related to the distance resolution (S22). If it is a triangulation type (Y in S22), the number of steps N, the interval D, and the dead band width d are varied according to the distance in the depth direction (S24). Specifically, the virtual screen level N is increased as the position is closer to the camera 220, and the virtual screen level N is decreased as the position is farther from the camera 220. Further, since the measurement accuracy of the virtual screen near the camera 220 is high, the interval D between adjacent screens is narrowed and the dead band width d is also narrowed. For the virtual screen far from the camera 220, the measurement accuracy decreases, so the interval D between adjacent screens is widened and the dead band width d is also widened.

カメラ220が三角測量型でない場合(S22のN)、距離センサ性能取得部30は、距離分解能に関するデータにもとづいて、カメラ220がTOF型であるかどうかを判定する(S26)。TOF型であれば(S26のY)、奥行き方向の距離に関係なく、仮想スクリーンの段数N、間隔D、およびデッドバンド幅dは一定にし、仮想スクリーンの総段数Nは増やす(S28)。TOF型でない場合(S26のN)、段数N、間隔D、およびデッドバンド幅dをこれ以上調整せず、ステップS30に進む。   When the camera 220 is not the triangulation type (N in S22), the distance sensor performance acquisition unit 30 determines whether the camera 220 is the TOF type based on the data regarding the distance resolution (S26). In the case of the TOF type (Y in S26), the number N of virtual screen stages, the interval D, and the dead band width d are made constant regardless of the distance in the depth direction, and the total number N of virtual screen stages is increased (S28). If it is not the TOF type (N in S26), the stage number N, the interval D, and the dead band width d are not adjusted any more, and the process proceeds to step S30.

ジェスチャ認識パラメータ調整部50は、調整された段数N、間隔D、およびデッドバンド幅dをジェスチャ認識処理部60に供給する(S30)。   The gesture recognition parameter adjustment unit 50 supplies the adjusted stage number N, interval D, and dead bandwidth d to the gesture recognition processing unit 60 (S30).

以上述べたように、本実施の形態の3次元ジェスチャ入力システム300によれば、距離センサの測定分解能とディスプレイの3次元表示性能にもとづいて、ユーザのジェスチャの特に奥行き方向の検出感度を適切に調整することにより、ユーザはストレスを感じることなく、また、システムの性能に応じてジェスチャによる入力を行うことができる。距離センサやディスプレイの組み合わせが変わっても、システム側で自動的に検出感度を調整するため、シームレスで柔軟性に富むジェスチャ入力インタフェースを提供することができる。   As described above, according to the 3D gesture input system 300 of this embodiment, the detection sensitivity of the user's gesture, particularly in the depth direction, is appropriately set based on the measurement resolution of the distance sensor and the 3D display performance of the display. By adjusting, the user can input by gesture according to the performance of the system without feeling stress. Even if the combination of the distance sensor and the display changes, the detection sensitivity is automatically adjusted on the system side, so that a seamless and flexible gesture input interface can be provided.

以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。   The present invention has been described based on the embodiments. The embodiments are exemplifications, and it will be understood by those skilled in the art that various modifications can be made to combinations of the respective constituent elements and processing processes, and such modifications are within the scope of the present invention. .

10 指示ポイント抽出部、 20 距離計算部、 30 距離センサ性能取得部、 32 距離センサデータベース、 40 ディスプレイ性能取得部、 42 ディスプレイデータベース、 50 ジェスチャ認識パラメータ調整部、 52 仮想スクリーン記憶部、 60 ジェスチャ認識処理部、 70 表示制御部、 80 アプリケーション実行部、 100 ジェスチャ操作入力処理装置、 200 ゲーム機、 210 ディスプレイ装置、 220 カメラ、 230 専用メガネ、 240 指示ポイント、 250 ユーザ、 270 仮想スクリーン、 300 3次元ジェスチャ入力システム。   DESCRIPTION OF SYMBOLS 10 Instruction point extraction part, 20 Distance calculation part, 30 Distance sensor performance acquisition part, 32 Distance sensor database, 40 Display performance acquisition part, 42 Display database, 50 Gesture recognition parameter adjustment part, 52 Virtual screen memory | storage part, 60 Gesture recognition process Unit, 70 display control unit, 80 application execution unit, 100 gesture operation input processing device, 200 game machine, 210 display device, 220 camera, 230 dedicated glasses, 240 instruction point, 250 user, 270 virtual screen, 300 3D gesture input system.

Claims (7)

立体視することができる3次元空間を表示可能な3次元ディスプレイを見ながら行われるユーザのジェスチャを撮影したジェスチャ画像からユーザのジェスチャの奥行き方向の距離を求める距離計算部と、
奥行き方向の距離計測の分解能にもとづいて、ユーザのジェスチャによる操作入力を認識する際のパラメータを調整するパラメータ調整部と、
調整されたパラメータのもとで、前記距離計算部により計算された奥行き方向の距離を参照して、ユーザのジェスチャによる操作入力を認識するジェスチャ認識処理部とを含むことを特徴とするジェスチャ操作入力処理装置。
A distance calculation unit for obtaining a distance in the depth direction of the user's gesture from a gesture image obtained by photographing the user's gesture performed while viewing a three-dimensional display capable of displaying a three-dimensional space that can be stereoscopically viewed;
A parameter adjustment unit that adjusts parameters when recognizing an operation input by a user's gesture based on resolution of distance measurement in the depth direction;
A gesture operation input comprising: a gesture recognition processing unit that recognizes an operation input by a user's gesture with reference to the distance in the depth direction calculated by the distance calculation unit under the adjusted parameter. Processing equipment.
前記奥行き方向の距離計測の分解能は、前記ジェスチャ画像がステレオカメラにより撮影されたものであるか否かを示す情報であることを特徴とする請求項1に記載のジェスチャ操作入力処理装置。   The gesture operation input processing apparatus according to claim 1, wherein the resolution of the distance measurement in the depth direction is information indicating whether or not the gesture image is taken by a stereo camera. 立体視することができる3次元空間を表示する表示制御部と、
ユーザのジェスチャを撮影するカメラ部と、
ユーザのジェスチャによる操作入力を認識する際のパラメータを調整するために必要な前記カメラ部の奥行き方向の距離計測の分解能に関する情報を出力する出力部とを含むことを特徴とする3次元ディスプレイ装置。
A display control unit for displaying a three-dimensional space that can be stereoscopically viewed;
A camera unit for photographing a user's gesture;
A three-dimensional display device, comprising: an output unit that outputs information on resolution of distance measurement in the depth direction of the camera unit necessary for adjusting a parameter when recognizing an operation input by a user's gesture.
前記奥行き方向の距離計測の分解能に関する情報は、当該3次元ディスプレイ装置にユーザのジェスチャの奥行き方向の情報を取得するためのステレオカメラが備えられているか否かを示す情報であることを特徴とする請求項3に記載の3次元ディスプレイ装置。   The information on the resolution of the distance measurement in the depth direction is information indicating whether or not the three-dimensional display device is provided with a stereo camera for acquiring information on the depth direction of the user's gesture. The three-dimensional display device according to claim 3. 立体視することができる3次元空間を表示可能な3次元ディスプレイを見ながら行われるユーザのジェスチャを撮影したジェスチャ画像からユーザのジェスチャの奥行き方向の距離を求める距離計算ステップと、
奥行き方向の距離計測の分解能にもとづいて、ユーザのジェスチャによる操作入力を認識する際のパラメータを調整するパラメータ調整ステップと、
調整されたパラメータのもとで、前記距離計算ステップにより計算された奥行き方向の距離を参照して、ユーザのジェスチャによる操作入力を認識するジェスチャ認識処理ステップとを含むことを特徴とするジェスチャ操作入力処理方法。
A distance calculation step for obtaining a distance in the depth direction of the user's gesture from a gesture image obtained by photographing the user's gesture performed while viewing a three-dimensional display capable of displaying a stereoscopically viewable three-dimensional space;
A parameter adjustment step for adjusting a parameter for recognizing an operation input by a user's gesture based on the resolution of distance measurement in the depth direction;
And a gesture recognition processing step of recognizing an operation input by a user's gesture with reference to the distance in the depth direction calculated by the distance calculation step under the adjusted parameter. Processing method.
立体視することができる3次元空間を表示可能な3次元ディスプレイを見ながら行われるユーザのジェスチャを撮影したジェスチャ画像からユーザのジェスチャの奥行き方向の距離を求める距離計算機能と、
奥行き方向の距離計測の分解能にもとづいて、ユーザのジェスチャによる操作入力を認識する際のパラメータを調整するパラメータ調整機能と、
調整されたパラメータのもとで、前記距離計算機能により計算された奥行き方向の距離を参照して、ユーザのジェスチャによる操作入力を認識するジェスチャ認識処理機能とをコンピュータに実現させることを特徴とするプログラム。
A distance calculation function for obtaining a distance in the depth direction of the user's gesture from a gesture image obtained by photographing the user's gesture performed while viewing a three-dimensional display capable of displaying a stereoscopically viewable three-dimensional space;
A parameter adjustment function for adjusting parameters when recognizing an operation input by a user's gesture based on the resolution of distance measurement in the depth direction;
A gesture recognition processing function for recognizing an operation input by a user's gesture by referring to the distance in the depth direction calculated by the distance calculation function under the adjusted parameter is realized by the computer. program.
請求項6のプログラムを格納したことを特徴とする記録媒体。   A recording medium storing the program according to claim 6.
JP2015045530A 2015-03-09 2015-03-09 Gesture operation input processing device, three-dimensional display device, and gesture operation input processing method Active JP6053845B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015045530A JP6053845B2 (en) 2015-03-09 2015-03-09 Gesture operation input processing device, three-dimensional display device, and gesture operation input processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015045530A JP6053845B2 (en) 2015-03-09 2015-03-09 Gesture operation input processing device, three-dimensional display device, and gesture operation input processing method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010290717A Division JP5711962B2 (en) 2010-12-27 2010-12-27 Gesture operation input processing apparatus and gesture operation input processing method

Publications (2)

Publication Number Publication Date
JP2015109111A true JP2015109111A (en) 2015-06-11
JP6053845B2 JP6053845B2 (en) 2016-12-27

Family

ID=53439357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015045530A Active JP6053845B2 (en) 2015-03-09 2015-03-09 Gesture operation input processing device, three-dimensional display device, and gesture operation input processing method

Country Status (1)

Country Link
JP (1) JP6053845B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200028771A (en) * 2018-09-07 2020-03-17 삼성전자주식회사 Electronic device and method for recognizing user gestures based on user intention

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6064354A (en) * 1998-07-01 2000-05-16 Deluca; Michael Joseph Stereoscopic user interface method and apparatus
JP2004265222A (en) * 2003-03-03 2004-09-24 Nippon Telegr & Teleph Corp <Ntt> Interface method, system, and program
US20060012675A1 (en) * 2004-05-10 2006-01-19 University Of Southern California Three dimensional interaction with autostereoscopic displays
US20070132721A1 (en) * 2005-12-09 2007-06-14 Edge 3 Technologies Llc Three-Dimensional Virtual-Touch Human-Machine Interface System and Method Therefor
JP2008117371A (en) * 2006-10-13 2008-05-22 Sony Corp Approach detection type information display device and information display method using the same
JP2008176438A (en) * 2007-01-17 2008-07-31 Tokai Rika Co Ltd Image display device
JP4318056B1 (en) * 2008-06-03 2009-08-19 島根県 Image recognition apparatus and operation determination method
JP2010009558A (en) * 2008-05-28 2010-01-14 Oki Semiconductor Co Ltd Image recognition device, electrical device operation control unit, electric appliance, image recognition program, and semiconductor device
WO2010038822A1 (en) * 2008-10-01 2010-04-08 株式会社ソニー・コンピュータエンタテインメント Information processing apparatus, information processing method, information recording medium, and program
JP2010522380A (en) * 2007-03-19 2010-07-01 ゼブラ・イメージング・インコーポレイテッド System and method for updating dynamic 3D display by user input
JP2010525432A (en) * 2007-04-20 2010-07-22 ソフトキネティック エス.エイ. Volume recognition method and system

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6064354A (en) * 1998-07-01 2000-05-16 Deluca; Michael Joseph Stereoscopic user interface method and apparatus
JP2004265222A (en) * 2003-03-03 2004-09-24 Nippon Telegr & Teleph Corp <Ntt> Interface method, system, and program
US20060012675A1 (en) * 2004-05-10 2006-01-19 University Of Southern California Three dimensional interaction with autostereoscopic displays
US20070132721A1 (en) * 2005-12-09 2007-06-14 Edge 3 Technologies Llc Three-Dimensional Virtual-Touch Human-Machine Interface System and Method Therefor
JP2008117371A (en) * 2006-10-13 2008-05-22 Sony Corp Approach detection type information display device and information display method using the same
JP2008176438A (en) * 2007-01-17 2008-07-31 Tokai Rika Co Ltd Image display device
JP2010522380A (en) * 2007-03-19 2010-07-01 ゼブラ・イメージング・インコーポレイテッド System and method for updating dynamic 3D display by user input
JP2010525432A (en) * 2007-04-20 2010-07-22 ソフトキネティック エス.エイ. Volume recognition method and system
JP2010009558A (en) * 2008-05-28 2010-01-14 Oki Semiconductor Co Ltd Image recognition device, electrical device operation control unit, electric appliance, image recognition program, and semiconductor device
JP4318056B1 (en) * 2008-06-03 2009-08-19 島根県 Image recognition apparatus and operation determination method
JP2010015553A (en) * 2008-06-03 2010-01-21 Shimane Pref Gov Image recognition device, manipulation determination method, and program
WO2010038822A1 (en) * 2008-10-01 2010-04-08 株式会社ソニー・コンピュータエンタテインメント Information processing apparatus, information processing method, information recording medium, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200028771A (en) * 2018-09-07 2020-03-17 삼성전자주식회사 Electronic device and method for recognizing user gestures based on user intention
KR102582863B1 (en) 2018-09-07 2023-09-27 삼성전자주식회사 Electronic device and method for recognizing user gestures based on user intention

Also Published As

Publication number Publication date
JP6053845B2 (en) 2016-12-27

Similar Documents

Publication Publication Date Title
JP5711962B2 (en) Gesture operation input processing apparatus and gesture operation input processing method
US8730164B2 (en) Gesture recognition apparatus and method of gesture recognition
EP2927634B1 (en) Single-camera ranging method and system
US8441435B2 (en) Image processing apparatus, image processing method, program, and recording medium
KR20210154814A (en) Head-mounted display with pass-through imaging
CN101739567B (en) Terminal apparatus and display control method
US10091489B2 (en) Image capturing device, image processing method, and recording medium
US9086742B2 (en) Three-dimensional display device, three-dimensional image capturing device, and pointing determination method
US20120026376A1 (en) Anamorphic projection device
WO2014141504A1 (en) Three-dimensional user interface device and three-dimensional operation processing method
US9727229B2 (en) Stereoscopic display device, method for accepting instruction, and non-transitory computer-readable medium for recording program
WO2011114564A1 (en) Three dimensional image display device and method of controlling thereof
US20120159330A1 (en) Method and apparatus for providing response of user interface
US20130169529A1 (en) Adjusting an optical guide of a three-dimensional display to reduce pseudo-stereoscopic effect
TWI657431B (en) Dynamic display system
US20140200080A1 (en) 3d device and 3d game device using a virtual touch
CN102508548A (en) Operation method and system for electronic information equipment
JP2013017146A (en) Display controller, display control method and program
KR20190027079A (en) Electronic apparatus, method for controlling thereof and the computer readable recording medium
EP3561570A1 (en) Head-mounted display apparatus, and visual-aid providing method thereof
CN102799378B (en) A kind of three-dimensional collision detection object pickup method and device
US20130187852A1 (en) Three-dimensional image processing apparatus, three-dimensional image processing method, and program
JP6053845B2 (en) Gesture operation input processing device, three-dimensional display device, and gesture operation input processing method
CN105867597B (en) 3D interaction method and 3D display equipment
US10345595B2 (en) Head mounted device with eye tracking and control method thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161129

R150 Certificate of patent or registration of utility model

Ref document number: 6053845

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250