JP2011039594A - 入力装置 - Google Patents
入力装置 Download PDFInfo
- Publication number
- JP2011039594A JP2011039594A JP2009183567A JP2009183567A JP2011039594A JP 2011039594 A JP2011039594 A JP 2011039594A JP 2009183567 A JP2009183567 A JP 2009183567A JP 2009183567 A JP2009183567 A JP 2009183567A JP 2011039594 A JP2011039594 A JP 2011039594A
- Authority
- JP
- Japan
- Prior art keywords
- image
- processing
- input device
- control
- processing circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
【課題】パソコンなどを遠隔操作するときのアルゴリズムを簡素化させるとともに、処理データ量を少なくさせて、演算量、メモリ使用量を低減させ、装置全体の価格を大幅に低減させるとともに、リアルタイムでパソコンを遠隔操作可能なビデオ映像による入力装置を提供する。
【解決手段】ウェブカメラ4によって、ユーザを撮影して得られた低解像度のカラー画像に対し、グレー化処理、画像分割/2値化処理、フレーム間差分処理、ヒストグラム処理、活動領域抽出処理、仮想カーソル制御処理/画面制御処理を行って、操作者の手の動きを検知させ、仮想カーソル25のサイズ制御、位置制御、色制御、クリック制御、操作対象画面の拡大制御、縮小制御、回転制御、上下スクロール制御、左右スクロール制御などを行わせる。
【選択図】図1
【解決手段】ウェブカメラ4によって、ユーザを撮影して得られた低解像度のカラー画像に対し、グレー化処理、画像分割/2値化処理、フレーム間差分処理、ヒストグラム処理、活動領域抽出処理、仮想カーソル制御処理/画面制御処理を行って、操作者の手の動きを検知させ、仮想カーソル25のサイズ制御、位置制御、色制御、クリック制御、操作対象画面の拡大制御、縮小制御、回転制御、上下スクロール制御、左右スクロール制御などを行わせる。
【選択図】図1
Description
本発明は、カメラによって操作者(ユーザ)の動作画像を取り込み、パソコンのカーソル操作やアプリケーションプログラムの選択及び実行等の制御する入力装置であって、特に、アルゴリズムを簡素化させると共に、処理データ量を極力少なくさせて、演算量、メモリ使用量を低減させるとともに、リアルタイムでパソコンのカーソルなどを制御させるようにした、ビデオ映像による入力装置に関する。
近年、カメラによって、ユーザを撮影して、画像解析し、この画像解析結果を使用して、オーディオ装置、エアコンなどの機器を操作する入力装置が種々、提案されている。
図24は、このような従来の映像による入力装置を説明するための操作入力装置のブロック図(特開2009−104297号)を示す。
図24に示す操作入力装置101は、可視光カメラ106(図25参照)などを使用してユーザを撮影し、カラー画像を出力する撮像手段102と、撮像手段102から出力されるカラー画像を解析し、ユーザの手の形状を検出する手領域検出手段103と、予め登録されている手形状と手領域検出手段103から出力される手形状とを比較し、操作指示内容を判定する手操作判定手段104と、手操作判定手段104の判定内容に基づき、選択メニューを音声、またはプロジェクト画像などでユーザに知らせる選択メニュー表現手段105とを備えている。
そして、可視光カメラ106で撮影したカラー画像から手領域を抽出するとともに、その形状、例えば手を傾ける、指を曲げるなど、どの形状になっているかを判定し、この判定内容に対応する手操作指示を音声、またはプロジェクト画像などでユーザに知らせる。
ところで、このような従来の操作入力装置101では、ユーザの手形状を正確に検出しなければならないことから、可視光カメラ106として、手の部分を詳細に撮影できる、高い解像度のカメラを使用しなければならず、操作入力装置101全体が高価になってしまうという問題があった。
また、従来の操作入力装置101では、手領域検出手段103によって、高い解像度の背景画像と、高い解像度の現在の画像とを処理しなければならないことから、ピクセル(画素)数、データ量が膨大になり、その分だけ、ハードディスクの容量、メモリ容量などを大きくしなければならず、操作入力装置101全体が高価になってしまうという問題があった。
さらに、従来の操作入力装置101では、手領域検出手段103として、図25に示す如く差分領域抽出手段110、肌色領域抽出手段111、2値化補正手段112、距離算出手段113、中央重点補正手段114、手領域候補検出手段115、輪郭長/面積算出手段116、手領域決定手段117など、複雑な演算を行わなければならないのみならず、かなり高速なCPU、または専用回路を使用しなければ、リアルタイムで、手の形状を検出することができないという問題があった。
このため、パソコンのカーソルなどを簡単に遠隔操作する入力装置として、このような従来の操作入力装置101を使用することが難しく、安価なカメラを使用でき、かつ少ない演算量、少ないメモリ量で、遠隔操作入力できる入力装置の開発が強く望まれていた。
本発明は、上記の事情に鑑み、請求項1では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量を大幅に少なくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの動きを検知させて、パソコンのカーソルなどを遠隔操作させることができる入力装置を提供することを目的としている。
また、請求項2では、パソコンなどから分離された、解像度が低い安価なカメラの使用を可能にするとともに、回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの動きを検知させて、パソコンのカーソルなどを遠隔操作させることができる入力装置を提供することを目的としている。
また、請求項3では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの片手動作を検知させて、パソコンのカーソル、操作対象画面のスクロールなどを遠隔操作させることができる入力装置を提供することを目的としている。
また、請求項4では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの両手動作を検知させて、操作対象画面の拡大/縮小、操作対象画面の回転などを遠隔操作させることができる入力装置を提供することを目的としている。
また、請求項5では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの手など、動いている部分のみを正確に検知させることができ、安定した仮想カーソル制御、クリック制御、操作対象画面制御を行わせることができる入力装置を提供することを目的としている。
また、請求項6では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの影などに起因する誤動作を防止させ、安定した仮想カーソル制御、クリック制御、操作対象画面制御を行わせることができる入力装置を提供することを目的としている。
また、請求項7では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、カメラで得られた画像の中からユーザの手画像より、少し広い範囲に含まれる画像のみを有効にし、それ以外の画像を無効にさせて、変化領域以外の部分に存在するノイズを除去させることができる入力装置を提供することを目的としている。
本発明は、上記の目的を達成するために、請求項1では、ビデオカメラで得られた操作者の画像を処理して、操作者の動作内容に応じた操作指示を生成する入力装置において、操作者を撮影するカラーカメラと、このカラーカメラから出力されるカラー画像に対し、グレー化処理、画像分割/2値化処理、フレーム間差分処理、ヒストグラム処理、活動領域抽出処理、仮想カーソル制御処理/画面制御処理を行って、前記操作者の手、または指先の動きを検出し、この検出結果に応じた操作指示を生成して、遠隔制御対象機器を制御する画像処理プログラムとを備えたことを特徴としている。
また、請求項2では、ビデオカメラで得られた操作者の画像を処理して、操作者の動作内容に応じた操作指示を生成する入力装置において、箱形に形成される入力装置筐体と、この入力装置筐体の前面に取り付けられ、操作者の画像を撮影するカラーカメラ本体と、グレー化処理回路、画像分割/2値化処理回路、フレーム間差分処理回路、ヒストグラム処理回路、活動領域抽出処理回路、仮想カーソル制御処理/画面制御処理回路を持ち、前記入力装置筐体内に配置され、ケーブルによって、遠隔操作対象機器などに接続される画像処理基板と、を備え、前記グレー化処理回路、前記画像分割/2値化処理回路、前記フレーム間差分処理回路、前記ヒストグラム処理回路、前記活動領域抽出処理回路、前記仮想カーソル制御処理/画面制御処理回路によって、前記カラーカメラ本体から出力されるカラー画像を処理して、前記操作者の手の動きを検出し、この検出結果に応じたポインティングデータを生成し、前記遠隔操作対象機器の動作を制御することを特徴としている。
また、請求項3では、請求項1又は2に記載の入力装置において、前記仮想カーソル制御処理/画面制御処理、または前記仮想カーソル制御処理/画面制御処理回路は、仮想カーソル活動領域画像上に活動矩形領域群が1つあるとき、その形状、移動有無に基づき、カールソル制御指示、または画面スクロール指示を生成する、ことを特徴としている。
また、請求項4では、請求項1乃至3の何れかに記載の入力装置において、前記仮想カーソル制御処理/画面制御処理、または前記仮想カーソル制御処理/画面制御処理回路は、仮想カーソル活動領域画像上に活動矩形領域群が2つあるとき、その移動方向に基づき、画面回転指示、画面拡大指示、画面縮小指示のいずれかを生成する、ことを特徴としている。
また、請求項5では、請求項1乃至4の何れかに記載の入力装置において、前記活動領域抽出処理、または前記活動領域抽出処理回路は、ヒストグラムの統計処理結果を使用して、前記ヒストグラムから仮想カーソル活動領域画像、仮想ボタンクリック活動領域画像を作成する、ことを特徴としている。
また、請求項6では、請求項1乃至5の何れかに記載の入力装置において、前記活動領域抽出処理、または前記活動領域抽出処理回路は、前記仮想カーソル活動領域画像、または前記仮想ボタンクリック活動領域画像に対し、多段階矩形オブジェクト抽出処理を行い、ノイズ成分を除去する、ことを特徴としている。
また、請求項7では、請求項1乃至6の何れかに記載の入力装置において、拡大/縮小矩形マスク作成処理、または拡大/縮小矩形マスク作成処理回路を付加し、前記拡大/縮小矩形マスク作成処理、または前記拡大/縮小矩形マスク作成処理回路によって、前記カラーカメラ、前記カラーカメラ本体で得られたカラー画像の中から、前記仮想カーソル活動領域画像上の変化領域矩形、または前記仮想ボタンクリック活動領域画像の変化領域矩形に対応する画像を抽出し、それ以外の画像をカットして、ノイズ成分を除去する、ことを特徴としている。
本発明による映像データによる入力装置は、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量を大幅に少なくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの動きを検知させて、パソコンのカーソルなどを遠隔操作させることができる。
ここで、本入力装置では、解像度が低い安価なカメラの使用を可能にするとともに、回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの動きを検知させて、パソコンのカーソルなどを遠隔操作させることができる。
また、本入力装置では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの片手動作を検知させて、パソコンのカーソル、画面スクロールなどを遠隔操作させることができる。
また、本入力装置では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの両手動作を検知させて、パソコンのカーソル、画面サイズ、などを遠隔操作させることができる。
また、本入力装置では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの手など、動いている部分のみを正確に検知させることができ、安定した仮想カーソル制御、クリック制御、操作対象画面制御を行わせることができる。
また、本入力装置では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、ユーザの影などに起因する誤動作を防止させ、安定した仮想カーソル制御、クリック制御、操作対象画面制御を行わせることができる。
さらに、本入力装置では、解像度が低い安価なカメラの使用を可能にするとともに、演算量、メモリ量、または回路規模を大幅に小さくさせることにより、装置全体のコストを大幅に低減させながら、カメラで得られた画像の中からユーザの手画像より、少し広い範囲に含まれる画像のみを有効にし、それ以外の画像を無効にさせて、変化領域以外の部分に存在するノイズを除去させることができる。
1.本発明の入力装置の第1の実施形態の説明
図1は、本発明による入力装置の実施の形態を示すブロック図を示す。
図1において、入力装置1aは、パソコン2のディスプレイ部3に設けられるウェブカメラ(請求項1のカラーカメラ)4と、パソコン2内に設けられるビデオキャプチャ5と、パソコン2内に設けられるハードディスク6と、パソコン2内に設けられるCPU7と、パソコン2内に設けられるメモリ8とによって構成されており、ユーザを撮影して得られた画像を解析して、ユーザの手、指先などの動きを検出し、パソコン2のディスプレイ部3に表示された仮想カーソル25(図11の(b)参照)、操作対象画面(OS画面、アプリケーション画面)などを制御し、現在、起動中のアプリケーションをコントロールする。
図1は、本発明による入力装置の実施の形態を示すブロック図を示す。
図1において、入力装置1aは、パソコン2のディスプレイ部3に設けられるウェブカメラ(請求項1のカラーカメラ)4と、パソコン2内に設けられるビデオキャプチャ5と、パソコン2内に設けられるハードディスク6と、パソコン2内に設けられるCPU7と、パソコン2内に設けられるメモリ8とによって構成されており、ユーザを撮影して得られた画像を解析して、ユーザの手、指先などの動きを検出し、パソコン2のディスプレイ部3に表示された仮想カーソル25(図11の(b)参照)、操作対象画面(OS画面、アプリケーション画面)などを制御し、現在、起動中のアプリケーションをコントロールする。
ウェブカメラ4は、320画素×240画素程度の解像度を持つカラーカメラであり、ビデオキャプチャ5から撮影指示が出されているとき、ユーザの画像を撮影して得られたカラービデオ信号をビデオキャプチャ5に供給する。
ビデオキャプチャ5は、システムバス9を介して、CPU7から撮影指示が供給されているとき、ウェブカメラ4を制御して、ユーザの画像を撮影させるとともに、撮影動作で得られたカラービデオ信号を取り込み、RGB信号形式のカラー画像に変換し、CPU7に供給する。
また、ハードディスク6は、OS(Operating System)、定数データなどが格納されるOS格納エリア10と、インターネットエクスプローラプログラム、ブラウザプログラムなどのアプリケーションプログラムが格納されるアプリケーション格納エリア11と、本発明で使用する画像処理プログラム(請求項1の画像処理プログラム)が格納される画像処理プログラム格納エリア12と、HSV(色相・彩度・明度)方式で、予め設定されている特定色(例えば、肌色)のカラー画像が抽出するのに必要なカラーマスク、2値化画像、ヒストグラム、仮想カーソル活動領域画像27(図6参照)、仮想ボタンクリック活動領域画像などが格納される画像格納エリア13とを備えており、CPU7から読み出し指示が出力されたとき、システムバス9を介して、これを取り込み、指定されたエリアに格納されているOS、定数データ、アプリケーションプログラム、画像処理プログラム、2値化画像、ヒストグラム、仮想カーソル活動領域画像27、仮想ボタンクリック活動領域画像などを読み出し、システムバス9を介して、CPU7に供給する。また、CPU7から書き込み指示、データが出力されたとき、システムバス9を介して、これらを取り込み、書き込み指示で指定されたエリア、例えば画像格納エリア13などにデータを記憶させる。
また、CPU7は、ハードディスク6に格納されているOS、定数データ、アプリケーションプログラムなどで指定された表示データを生成して、システムバス9に接続された表示インタフェース14に供給し、ディスプレイ部3に操作対象画面を表示させる。また、画像処理プログラムで記述された画像処理を行い、操作対象画面に表示されている仮想カーソル25のサイズ、位置などの制御、クリック制御、スクロール制御、画面回転制御、画面拡大制御、画面縮小制御などを行う。
また、メモリ8は、数百メガバイト〜数ギガバイト程度の容量を持ち、CPU7がアプリケーションプログラム、画像処理プログラムなどで指定された処理を行うときの一時データ格納エリアとして使用される。
次に、図2、図3、図4に示す各フローチャート、図5〜図20に示す各模式図を参照しながら、入力装置1aの画像処理動作、カーソル制御動作、画面制御動作などを説明する。
《2値化画像生成、格納》
まず、パソコン2の電源が投入されて、アプリケーションプログラム、画像処理プログラムが起動されると、図2に示すフローチャートに示す如くCPU7によって、ビデオキャプチャ5が制御されて、ウェブカメラ4の撮影動作で得られたカラービデオ信号が取り込まれて、RGB信号形式のカラー画像に変換され、メモリ8などに一時、記憶させられる(ステップS1)。
まず、パソコン2の電源が投入されて、アプリケーションプログラム、画像処理プログラムが起動されると、図2に示すフローチャートに示す如くCPU7によって、ビデオキャプチャ5が制御されて、ウェブカメラ4の撮影動作で得られたカラービデオ信号が取り込まれて、RGB信号形式のカラー画像に変換され、メモリ8などに一時、記憶させられる(ステップS1)。
また、この動作と並行し、CPU7によって、メモリ8などに一時、記憶させられているカラー画像と、ハードディスク6の画像格納リア13に格納されているカラーマスクとが読み出されるとともに、カラーマスクで、カラー画像がマスクされ、カラー画像の中から、予め設定されている特定色(例えば、肌色)のカラー画像が抽出される(ステップS2)。
この後、CPU7によって、カラー画像がグレー処理化されて、予め設定されている階調のモノクロ画像に変換されて、1フレーム分の画像容量が低減させられるとともに(ステップS3)、画面分割指示があれば、モノクロ画像が複数のエリアに分割された後、最大尤度しきい値法で、2値化されて、2値化画像が作成される(ステップS4)。
次いで、CPU7によって、2値化画像と、肌色画像との論理和が取られて、2値化画像中の肌色部分が抽出され、これが1フレーム分の2値化画像として、ハードディスク6の画像格納エリア13に格納される(ステップS5、S6)。
以下、これらの画像処理が繰り返され、ハードディスク6の画像格納エリア13に数フレーム分〜数十フレームの2値化画像がFIFO(First・In・First・Out)形式で、蓄積される。
《フレーム間差分、ヒストグラム作成》
また、この動作と並行し、図3のフローチャートに示す如くCPU7によって、ハードディスク6の画像格納エリア13に格納されている数フレーム分〜数十フレーム分の2値化画像の中から、最新の2値化画像を含む、連続する数フレームの2値化画像が順次、読み出され、フレーム間差分処理が行われるとともに、このフレーム間差分処理で得られた差分画像が各分割エリア毎に累積加算されて、ヒストグラムが作成される(ステップS10〜S14)。
また、この動作と並行し、図3のフローチャートに示す如くCPU7によって、ハードディスク6の画像格納エリア13に格納されている数フレーム分〜数十フレーム分の2値化画像の中から、最新の2値化画像を含む、連続する数フレームの2値化画像が順次、読み出され、フレーム間差分処理が行われるとともに、このフレーム間差分処理で得られた差分画像が各分割エリア毎に累積加算されて、ヒストグラムが作成される(ステップS10〜S14)。
《統計処理、変化領域抽出》
この後、CPU7によって、活動領域抽出処理が開始され(ステップS15)、図4のフローチャートに示すように、ヒストグラムの各分割エリアの濃度値に対する統計処理が行われ、平均値、濃度分散値、最大値、偏差(±1σ、±2σ)などが演算されるとともに(ステップS30)、図5の3次元濃度分布図に示す如く各分割エリア20(図6、図8参照)のうち、変化領域矩形抽出用のしきい値(例えば、平均値−1σ)より大きい濃度値になっている各分割エリア20が変化領域矩形45(図23参照)として、抽出される。
この後、CPU7によって、活動領域抽出処理が開始され(ステップS15)、図4のフローチャートに示すように、ヒストグラムの各分割エリアの濃度値に対する統計処理が行われ、平均値、濃度分散値、最大値、偏差(±1σ、±2σ)などが演算されるとともに(ステップS30)、図5の3次元濃度分布図に示す如く各分割エリア20(図6、図8参照)のうち、変化領域矩形抽出用のしきい値(例えば、平均値−1σ)より大きい濃度値になっている各分割エリア20が変化領域矩形45(図23参照)として、抽出される。
《仮想カーソルの活動領域決定》
次いで、CPU7によって、図6に示す如く有効にされた各分割エリア20のうち、仮想カーソル矩形抽出用のしきい値(例えば、最大値−1σ)より大きい濃度値になっている分割エリア(活動分割エリア)21が検知され、これらの各活動分割エリア21を含むように矩形状の活動矩形領域26が決定され、仮想カーソル活動領域画面27が作成される。
次いで、CPU7によって、図6に示す如く有効にされた各分割エリア20のうち、仮想カーソル矩形抽出用のしきい値(例えば、最大値−1σ)より大きい濃度値になっている分割エリア(活動分割エリア)21が検知され、これらの各活動分割エリア21を含むように矩形状の活動矩形領域26が決定され、仮想カーソル活動領域画面27が作成される。
また、ユーザが両手を動かしていれば、CPU7によって、上述した活動領域抽出処理を行ったとき、図7の3次元分布図に示す如く各分割エリア20のうち、変化領域矩形抽出用のしきい値(例えば、平均値−1σ)より大きい濃度値になっている分割エリア(変化分割エリア)21が抽出されて、上述した片手の場合と同様に処理され、図8に示す如く有効にされた各分割エリア20のうち、仮想カーソル矩形抽出用のしきい値(例えば、最大値−1σ)より大きい濃度値になっている分割エリア(活動分割エリア)21が検知され、これらの各活動分割エリア21を含むように矩形状の活動矩形領域26が決定され、仮想カーソル活動領域画像27が作成される(ステップS31)。
《仮想ボタンクリックの活動領域決定》
次いで、CPU7によって、有効にされた各分割エリア20のうち、仮想ボタンクリック矩形抽出用のしきい値(例えば、最大値−2σ)より大きい濃度値になっている分割エリア(活動分割エリア)21が検知され、これらの各活動分割エリア21を含むように、矩形状の活動矩形領域が決定され、仮想ボタンクリック活動領域画像(図示は省略する)が作成される(ステップS32)。
次いで、CPU7によって、有効にされた各分割エリア20のうち、仮想ボタンクリック矩形抽出用のしきい値(例えば、最大値−2σ)より大きい濃度値になっている分割エリア(活動分割エリア)21が検知され、これらの各活動分割エリア21を含むように、矩形状の活動矩形領域が決定され、仮想ボタンクリック活動領域画像(図示は省略する)が作成される(ステップS32)。
《影の影響除去》
この後、CPU7によって、仮想カーソル矩形抽出用のしきい値(例えば、最大値−1σ)を使用して得られた仮想カーソル活動領域画像27、仮想ボタンクリック矩形抽出用のしきい値(例えば、最大値−2σ)を使用して得られた仮想ボタンクリック活動領域画像に対し、各々、活動矩形領域26が左右に分割可能かどうかチェックされ、左右に分割可能であれば、図9に示す如く活動矩形領域26の水平方向中心点“A”が求められるとともに、水平方向中心点“A”から左側にある非活動領域と、活動領域との境界点“B”と、水平方向中心点“A”から右側にある非活動領域と、活動領域との境界点“C”とが検知され、これら境界点“B”、“C”を含む領域が各活動矩形領域26と判定され、それ以外の活動領域がユーザの影などによる不要な活動領域と判定され、無効にされる(2点抽出処理)。
この後、CPU7によって、仮想カーソル矩形抽出用のしきい値(例えば、最大値−1σ)を使用して得られた仮想カーソル活動領域画像27、仮想ボタンクリック矩形抽出用のしきい値(例えば、最大値−2σ)を使用して得られた仮想ボタンクリック活動領域画像に対し、各々、活動矩形領域26が左右に分割可能かどうかチェックされ、左右に分割可能であれば、図9に示す如く活動矩形領域26の水平方向中心点“A”が求められるとともに、水平方向中心点“A”から左側にある非活動領域と、活動領域との境界点“B”と、水平方向中心点“A”から右側にある非活動領域と、活動領域との境界点“C”とが検知され、これら境界点“B”、“C”を含む領域が各活動矩形領域26と判定され、それ以外の活動領域がユーザの影などによる不要な活動領域と判定され、無効にされる(2点抽出処理)。
次いで、CPU7によって、2点抽出処理が終了した各活動矩形領域26に対し、各々、活動矩形領域26が上下に分割可能かどうかチェックされ、上下分割可能であれば、図10に示す如く活動矩形領域26の上下方向中心点“A”が求められるとともに、上下方向中心点“A”から上側にある非活動領域と、活動領域との境界点“B”が検知され、これら境界点“B”を含む領域が活動矩形領域と判定され、下の活動領域がユーザの影などによる不要な活動領域と判定され、無効にされる(最小化処理)(ステップS33)。
この後、CPU7によって、これら2点抽出処理、最小化処理によって構成される多段階矩形オブジェクト抽出処理で得られた活動矩形領域26を含む仮想カーソル活動領域画像27、仮想ボタンクリック活動領域画像がハードディスク6の画像格納エリア13に格納される(ステップS34)。
《片手ジェスチャによる仮想カーソルの位置、大きさ、色制御》
この後、図3のフローチャートに示すごとく、CPU7によって、ハードディスク6の画像格納エリア13に格納されている各仮想カーソル活動領域画像27のうち、最新の活動矩形領域26を含む、数フレーム分の仮想カーソル活動領域画像27が読み出され(ステップS16)、仮想カーソル活動領域画像27内に、近接した1つ以上の活動矩形領域26によって構成される活動矩形領域群が存在しているかどうかチェックされる。
この後、図3のフローチャートに示すごとく、CPU7によって、ハードディスク6の画像格納エリア13に格納されている各仮想カーソル活動領域画像27のうち、最新の活動矩形領域26を含む、数フレーム分の仮想カーソル活動領域画像27が読み出され(ステップS16)、仮想カーソル活動領域画像27内に、近接した1つ以上の活動矩形領域26によって構成される活動矩形領域群が存在しているかどうかチェックされる。
そして、最新の仮想カーソル活動領域画像27内に活動矩形領域群が存在し、その数が“1”であり、かつほぼ矩形であれば(ステップS17、S18)、CPU7によって、活動矩形領域群の大きさ、移動方向が判定され、判定結果に対応するように、仮想カーソル制御が行われる(ステップS19)。
例えば、図11(a)に示す如く、前回とほぼ同じ、高さ、左右位置で、ユーザが指先を大きく回し、これに対応して、前回の処理で得られた大きな活動矩形領域群の位置と同じ位置で、大きな活動矩形領域群が得られているとき、CPU7によって、仮想カーソルの表示指示であると判定されて、図11(b)に示す如くディスプレイ部3に大きなサイズ、白色の仮想カーソル25が表示される。
また、ユーザが指先を大きく回しながら、上下方向、または左右方向に移動させ、これに対応して、前回の処理で得られた位置から移動する、大きな活動矩形領域群が得られているとき、CPU7によって、仮想カーソルの移動指示であると判定されて、指先の移動方向に対応するように、ディスプレイ部3に表示されている大きなサイズ、白色の仮想カーソル25が移動させられる。
また、図12(a)に示す如く、前回とほぼ同じ、高さ、左右位置で、ユーザが指先を小さく回し、これに対応して、前回の処理で得られた大きな活動矩形領域群の位置と同じ位置で、小さな活動矩形領域群が得られているとき、CPU7によって、仮想カーソルの移動停止であると判定されて、図12(b)に示す如くディスプレイ部3に表示されている仮想カーソル25の移動が停止させられるとともに、サイズが小さくされる。
この状態で、一定時間が経過すれば、CPU7によって、仮想カーソル25の色が赤色に変更され、大きな移動が禁止させられるとともに、OS側にカーソル移動指示がだされて、仮想カーソル25内に、実カーソル28が移動させられる。
この後、ユーザが指先を少し移動させれば、CPU7によって、これが検知されて、ディスプレイ部3に表示されている仮想カーソル25の位置が微調整されるとともに、OS側にカーソル位置調整指示が出されて、図13に示す如く実カーソル28の位置が微調整させられる。
次いで、ユーザが指先を動かすのを止めれば、CPU7によって、これが検知され、一定時間後に、図14に示す如くディスプレイ部3に表示されている仮想カーソル25の位置が固定されるとともに、仮想カーソル25の色が赤色からグレー色に変更され、ユーザにクリック可能になったことが知らされる。
この状態でも、ユーザが指先を再度、大きく回せば、CPU7によって、これが検知されて、ディスプレイ部3に表示されている仮想カーソル25の色が白色に戻され、仮想カーソル25が移動可能な状態に戻される。
《片手ジェスチャによるスクロール制御》
また、上述した仮想カーソル活動領域画像27に、活動矩形領域群が存在するかどうかなどをチェックしたとき、図15に示す如く活動矩形領域群の数が“1”で、水平方向に長ければ、CPU7によって、前回の活動矩形領域群に対し、どちらの方向に長くなったか判定されるとともに、長くなった方向に応じた右スクロール指示(または、左スクロール指示)が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が右方向(または、左方向)にスクロールさせられる。
また、上述した仮想カーソル活動領域画像27に、活動矩形領域群が存在するかどうかなどをチェックしたとき、図15に示す如く活動矩形領域群の数が“1”で、水平方向に長ければ、CPU7によって、前回の活動矩形領域群に対し、どちらの方向に長くなったか判定されるとともに、長くなった方向に応じた右スクロール指示(または、左スクロール指示)が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が右方向(または、左方向)にスクロールさせられる。
また、上述した仮想カーソル活動領域画像27に、活動矩形領域群が存在するかどうかなどをチェックしたとき、活動矩形領域群の数が“1”で、上下方向に長ければ、CPU7によって、前回の活動矩形領域群に対し、どちらの方向に長くなったか判定されるとともに、長くなった方向に応じた上スクロール指示(または、下スクロール指示)が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が上方向(または、下方向)にスクロールさせられる。
《片手ジェスチャによる実カーソルのクリック制御》
この後、CPU7によって、仮想カーソル25の色がグレーにされているかどうかチェックされ、仮想カーソル25の色がグレーにされていれば、ハードディスク6の画像格納エリア13に格納されている仮想ボタンクリック活動領域画像のうち、最新の活動矩形領域を含む、数フレーム分の仮想ボタンクリック活動領域画像が読み出され(ステップS21)、仮想ボタンクリック活動領域画像内に、近接した1つ以上の活動矩形領域26によって構成される活動矩形領域群が存在し、形状が変化しているかどうかチェックされ、活動矩形領域群の数が“1”であり、活動矩形領域群が予め設定された変化、例えば図16(a)に示す如くユーザが指さし状態から、1回だけ、手を広げ、活動矩形領域群が1回だけ、“小”から“大”に変化していれば(ステップS22)、シングルクリックであると判定され、OS側にシングルクリック指示が出されて、図16(b)に示す如く仮想カーソル25内にある実カーソル28によって、アイコンなどがシングルクリックされる。
この後、CPU7によって、仮想カーソル25の色がグレーにされているかどうかチェックされ、仮想カーソル25の色がグレーにされていれば、ハードディスク6の画像格納エリア13に格納されている仮想ボタンクリック活動領域画像のうち、最新の活動矩形領域を含む、数フレーム分の仮想ボタンクリック活動領域画像が読み出され(ステップS21)、仮想ボタンクリック活動領域画像内に、近接した1つ以上の活動矩形領域26によって構成される活動矩形領域群が存在し、形状が変化しているかどうかチェックされ、活動矩形領域群の数が“1”であり、活動矩形領域群が予め設定された変化、例えば図16(a)に示す如くユーザが指さし状態から、1回だけ、手を広げ、活動矩形領域群が1回だけ、“小”から“大”に変化していれば(ステップS22)、シングルクリックであると判定され、OS側にシングルクリック指示が出されて、図16(b)に示す如く仮想カーソル25内にある実カーソル28によって、アイコンなどがシングルクリックされる。
また、ユーザが指さし状態から、2回以上、手を広げたり、縮めたりし、活動矩形領域群が複数回、“小”から“大”に、“大”から“小”、“小”から“大”に変化していれば、CPU7によって、ダブルクリックであると判定され、OS側にダブルクリック指示が出されて、実カーソル25の位置にあるアイコンなどがダブルクリックされる(ステップS23)。
《両手ジェスチャによる画面拡大、縮小制御》
また、上述した仮想カーソル活動領域画像27に、活動矩形領域群が存在するかどうかなどをチェックしたとき、活動矩形領域群の数が“2”で、各々、矩形であれば(ステップS18)、CPU7によって、これら各活動矩形領域群の動きに応じて、ディスプレイ部3に表示されている操作対象画面の拡大、縮小、回転などが行われる(ステップS20)。
また、上述した仮想カーソル活動領域画像27に、活動矩形領域群が存在するかどうかなどをチェックしたとき、活動矩形領域群の数が“2”で、各々、矩形であれば(ステップS18)、CPU7によって、これら各活動矩形領域群の動きに応じて、ディスプレイ部3に表示されている操作対象画面の拡大、縮小、回転などが行われる(ステップS20)。
例えば、図17に示す2つの活動矩形領域群の距離が図18(a)に示す如く前回より広くなる方向に、移動していれば、CPU7によって、画面拡大指示が入力されたと判定されて、活動矩形領域群の距離変化比に応じた拡大率の画面拡大指示が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が拡大させられる。
また、2つの活動矩形領域群の距離が図18(b)に示す如く前回より狭くなる方向に、移動していれば、CPU7によって、画面縮小指示が入力されたと判定されて、活動矩形領域群の距離変化比に応じた縮小率の画面縮小指示が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が縮小させられる。
《両手ジェスチャによる画面回転制御》
また、図19に示す2つの活動矩形領域群のうち、少なくとも一方が上方向(または、下方向)に移動していれば、CPU7によって、画面回転指示が入力されたと判定されて、下側の活動矩形領域群に対する上側の活動矩形領域群の角度に応じた回転角度の画面回転指示が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が回転させられる。
また、図19に示す2つの活動矩形領域群のうち、少なくとも一方が上方向(または、下方向)に移動していれば、CPU7によって、画面回転指示が入力されたと判定されて、下側の活動矩形領域群に対する上側の活動矩形領域群の角度に応じた回転角度の画面回転指示が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が回転させられる。
この際、図20(a)に示す如く各活動矩形領域群の左右距離が狭い状態で、一方が大きく上方に移動し、下側の活動矩形領域群に対する上側の活動矩形領域群の角度が大きいとき、CPU7によって、大きな回転角度の画面回転指示が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が大きく回転させられる。
また、図20(b)に示す如く各活動矩形領域群の左右距離が広い状態で、一方が小さく上方に移動し、下側の活動矩形領域群に対する上側の活動矩形領域群の角度が小さいとき、CPU7によって、小さな回転角度の画面回転指示が生成されて、アプリケーション側に渡され、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)が小さく回転させられる。
このように、本発明の第1の実施形態においては、ウェブカメラ4によって、ユーザを撮影して得られた低解像度のカラー画像に対し、グレー化処理、画像分割/2値化処理、色フィルタリング処理、フレームバッファ処理、フレーム間差分処理、ヒストグラム処理、活動領域抽出処理、仮想カーソル制御処理/画面制御処理を行わせて、ユーザの手の動きを検知させ、仮想カーソル25のサイズ制御、位置制御、色制御、クリック制御、操作対象画面の拡大制御、縮小制御、回転制御、上下スクロール制御、左右スクロール制御などを行わせるようにしているので、次に述べる効果を得ることができる。
まず、解像度が高くない、安価なウェブカメラ4を使用させることができることから、入力装置1aのコストを低く抑えさせることができる(請求項1の効果)。
また、ウェブカメラ4によって、ユーザを撮影して得られた低解像度のカラー画像に対し、グレー化処理、画像分割/2値化処理、色フィルタリング処理を施して得られた2値化画像を画像格納エリア13に格納させるようにしているので、ハードディスク6の容量が小さい場合にも、入力装置1aを構成させることができ、装置全体のコストを低く抑えさせることができる(請求項1の効果)。
また、ウェブカメラ4によって、ユーザを撮影して得られた低解像度のカラー画像に対し、グレー化処理、画像分割/2値化処理、色フィルタリング処理など、少ない段数の画像処理を施して、1フレーム分の2値化画像を得るようにしているので、CPU7に大きな負担をかけないようにすることができ、これによって処理速度が速くない安価なCPU7を使用させた場合でも、ほぼリアルタイムで、ユーザの動きに対応するように、仮想カーソル25のサイズ制御、位置制御、色制御、クリック制御、操作対象画面の拡大制御、縮小制御、回転制御、上下スクロール制御、左右スクロール制御などを行わせることができ、装置全体のコストを低く抑えさせることができる(請求項1の効果)。
また、本入力装置の第1の実施形態では、ユーザが片手だけを動かしているとき、仮想カーソル制御指示、または操作対象画面のスクロール制御であると判定させ、仮想カーソル25のサイズ制御、位置制御、色制御、クリック制御、操作対象画面のスクロール制御などを行わせるようにしているので、片手だけで、ディスプレイ部3に表示されている仮想カーソル25のサイズ、位置、色、クリック、操作対象画面のスクロールなどを遠隔操作させることができる(請求項3の効果)。
また、本発明の第1の実施形態では、ユーザが両手を動かしているとき、右手の動き、左手の動きを各々、検出させ、操作対象画面の拡大/縮小制御指示、または操作対象画面の回転制御指示であると判定させるようにしているので、ユーザが右手、左手を動かすだけで、ディスプレイ部3に表示されているアプリケーション画面(操作対象画面)を拡大、縮小、回転させることができる(請求項4の効果)。
また、本発明の第1の実施形態では、活動領域抽出処理において、ヒストグラムを統計処理して得られた結果を使用し、ヒストグラムから仮想カーソル活動領域画像27、仮想ボタンクリック活動領域画像を作成させるようにしているので、ユーザの手など、動いている部分を正確に検知させることができ、安定した仮想カーソル制御、クリック制御、操作対象画面制御を行わせることができる(請求項5の効果)。
また、本発明の第1の実施形態では、活動領域抽出処理において、仮想カーソル活動領域画像27、仮想ボタンクリック活動領域画像に対し、多段階矩形オブジェクト抽出処理を行うようにしているので、ユーザの影などに起因する誤動作を防止させ、安定した仮想カーソル制御、クリック制御、操作対象画面制御を行わせることができる(請求項6の効果)。
2.本発明に係る入力装置の第2の実施形態の説明
図21は、本発明による入力装置の第2の実施形態を示すブロック図である。
図21に示す入力装置1bは、箱形に形成されたプラスチック部材などによって構成され、パソコン、テレビ、エアコン、大画面スクリーン装置などの遠隔操作対象機器の近傍の配置される入力装置筐体(図示は省略する)と、入力装置筐体の前面に取り付けられ、ユーザの画像を撮影するビデオカメラ本体(請求項2のカラーカメラ本体)30と、入力装置筐体内に配置され、USBケーブル、信号接続ケーブルなどのケーブルによって、パソコン、テレビ、エアコン、大画面スクリーン装置などの遠隔操作対象機器などに接続される画像処理基板31とを備えており、ユーザを撮影した画像を解析して、ユーザの手の動きに対応するポインティングデータを生成し、入力装置1b→ケーブル→遠隔操作対象機器なる経路で遠隔操作対象機器に供給し、この遠隔操作対象機器の動作を制御する。
図21は、本発明による入力装置の第2の実施形態を示すブロック図である。
図21に示す入力装置1bは、箱形に形成されたプラスチック部材などによって構成され、パソコン、テレビ、エアコン、大画面スクリーン装置などの遠隔操作対象機器の近傍の配置される入力装置筐体(図示は省略する)と、入力装置筐体の前面に取り付けられ、ユーザの画像を撮影するビデオカメラ本体(請求項2のカラーカメラ本体)30と、入力装置筐体内に配置され、USBケーブル、信号接続ケーブルなどのケーブルによって、パソコン、テレビ、エアコン、大画面スクリーン装置などの遠隔操作対象機器などに接続される画像処理基板31とを備えており、ユーザを撮影した画像を解析して、ユーザの手の動きに対応するポインティングデータを生成し、入力装置1b→ケーブル→遠隔操作対象機器なる経路で遠隔操作対象機器に供給し、この遠隔操作対象機器の動作を制御する。
ビデオカメラ本体30は、320画素×240画素程度の解像度を持つカラーカメラによって構成されおり、画像処理基板31から電源電圧、クロック信号などが出されているとき、ユーザの画像を撮影し、これによって得られたカラービデオ信号を画像処理基板31に供給する。
画像処理基板31は、ビデオカメラ本体30から出力されるカラービデオ信号をRGB形式のカラー画像に変換した後、HSV(色相・彩度・明度)方式で、予め設定されている特定色(例えば、肌色)のカラー画像を抽出するのに必要なカラーマスクを使用して、カラー画像中の肌色画像を抽出する肌色画像抽出回路32と、ビデオカメラ本体30から出力されるカラービデオ信号をRGB形式のカラー画像に変換した後、予め設定されている階調のモノクロ画像に変換するグレー化処理回路33と、グレー化処理回路33から出力されるモノクロ画像を予め設定されている画面分割数で分割する(但し、画面分割設定されていないとき、この画面分割処理はスキップされる)とともに、最大尤度しきい値法で、2値化して、2値化画像にする画像分割/2値化処理回路34と、画像分割/2値化処理回路34から出力される2値化画像と肌色画像抽出回路32から出力される肌色画像との論理和を取り、2値化画像中の肌色部分を抽出する色フィルタリング処理回路35と、この色フィルタリング処理回路34から出力される2値化画像を数フレーム分〜数十フレーム分、一時記憶するフレームバッファ回路36と、フレームバッファ回路36に記憶されている2値化画像を順次、読み出しながら、フレーム間差分処理を行い、差分画像を生成するフレーム間差分処理回路37とを備えている。
さらに、画像処理基板31は、フレーム間差分処理回路37からフレーム単位で出力される各差分画像を各分割エリア毎に、積算して、ヒストグラムを生成するヒストグラム処理回路38と、ヒストグラム処理回路38から出力されるヒストグラムに対し、統計処理を行うとともに、統計処理結果を用いて、仮想カーソル活動領域判定処理、仮想ボタンクリック活動領域判定処理、多段階矩形オブジェクト抽出処理などを行って、影などの影響を取り除いた仮想カーソル活動領域画像、仮想ボタンクリック活動領域画像を生成し、数画像分〜数十画像分、保持する活動領域抽出処理回路39と、活動領域抽出処理回路39に保持されている各仮想カーソル活動領域画像のうち、最新の仮想カーソル活動領域画像に活動矩形領域群が存在するとき、活動矩形領域群の数、形状、移動有無、移動方向などに基づき、仮想カーソル位置指示、仮想カーソル形状指示、仮想カーソル色指示、操作対象画面スクロール指示、操作対象画面拡大指示、操作対象画面縮小指示、操作対象画面回転指示などのポインティングデータを生成するとともに、仮想カーソルがクリック可能な状態になっているとき、活動領域抽出処理回路39に保持されている各仮想ボタンクリック活動領域画像のうち、最新の仮想ボタンクリック活動領域画像に活動矩形領域群が存在しているかどうかをチェックし、活動矩形領域群が存在しているとき、活動矩形領域群の形状などに基づき、シングルクリック指示、ダブルクリック指示などのポインティングデータを生成する仮想カーソル制御処理/画面制御処理回路40とを備えている。
そして、本第2の実施形態においても、上述した第1の実施形態と同様に、ビデオカメラ本体30から出力されるカラービデオ信号を処理して、ユーザの各手がどのように動いているかを判定し、この判定結果に応じて、仮想カーソル位置指示、仮想カーソル形状指示、仮想カーソル色指示、操作対象画面スクロール指示、操作対象画面拡大指示、操作対象画面縮小指示、操作対象画面回転指示などのポインティングデータを生成し、遠隔操作対象機器となっているパソコン、テレビ、エアコン、大画面スクリーン装置などに供給する。
このように、この第2の実施形態では、ビデオカメラ本体30によって、ユーザを撮影して得られた低解像度のカラー画像に対し、色フィルタリング処理、グレー化処理、画像分割/2値化処理、フレームバッファ処理、フレーム間差分処理、ヒストグラム処理、活動領域抽出処理、仮想カーソル制御処理/画面制御処理などを行わせて、ユーザの手の動きを検知させ、仮想カーソル位置指示、仮想カーソル形状指示、仮想カーソル色指示、操作対象画面スクロール指示、操作対象画面拡大指示、操作対象画面縮小指示、操作対象画面回転指示などのポインティングデータを生成し、遠隔操作対象機器に供給するようにしているので、遠隔操作対象機器側の仮想カーソルサイズ、仮想カーソル位置、仮想カーソル色、クリック、操作対象画面の上下スクロール、左右スクロール、拡大、縮小、回転などを遠隔操作させることができる(請求項2の効果)。
また、この第2の実施形態では、解像度が高くない、安価なビデオカメラ本体30を使用させることができることから、入力装置1bのコストを低く抑えさせることができる(請求項2の効果)。
また、この第2の実施形態では、ビデオカメラ本体30によって、ユーザを撮影して得られた低解像度のカラー画像に対し、グレー化処理、画像分割/2値化処理、色フィルタリング処理を施して得られた2値化画像をフレームバッファ回路36に格納させるようにしているので、フレームバッファ回路36の記憶容量が小さい場合にも、入力装置1bを構成させることができ、装置全体のコストを低く抑えさせることができる(請求項2の効果)。
さらに、この第2の実施形態では、ビデオカメラ本体30によって、ユーザを撮影して得られた低解像度のカラー画像に対し、グレー化処理、画像分割/2値化処理、色フィルタリング処理、フレームバッファ処理、フレーム間差分処理、ヒストグラム処理、活動領域抽出処理、仮想カーソル制御処理/画面制御処理など、少ない段数の画像処理を施して、ポインティングデータを生成させるようにしているので、カラーマスク理回路32、グレー化処理回路33、画像分割/2値化処理回路34、色フィルタリング処理回路35、フレームバッファ処理回路36、フレーム間差分処理回路37、ヒストグラム処理回路38、活動領域抽出処理回路39、仮想カーソル制御処理/画面制御処理回路40として、処理速度があまり速くない素子の使用を可能にして、装置全体のコストを低く抑えさせながら、ほぼリアルタイムで、ユーザの動きを検知させ、遠隔操作対象機器を制御させることができ、(請求項2の効果)。
そして、この第2の実施形態においても、上述した第1形態と同様に、ユーザが片手だけを動かしているとき、仮想カーソル制御指示、クリック制御指示、スクロール制御指示のいずれかであると判定させ、仮想カーソルサイズ指示、仮想カーソル位置指示、仮想カーソル色指示、スクロール制御指示、クリック指示などを示すポインティングデータを生成させるようにしているので、片手だけで、遠隔操作対象機器側のディスプレイに表示されている仮想カーソルのサイズ、位置、色、クリック動作、操作対象画面のスクロールなどを遠隔操作させることができる(請求項3の効果)。
また、この第2の実施形態においても、上述した第1形態と同様に、ユーザが両手を動かしているとき、右手の動き、左手の動きを各々、検出させ、操作対象画面の制御指示であると判定させ、操作対象画面拡大指示、操作対象画面縮小指示、操作対象画面回転指示などを示すポインティングデータを生成させるようにしているので、ユーザが右手、左手を動かすだけで、遠隔操作対象機器側のディスプレイに表示されている操作対象画面を拡大、縮小、回転させることができる(請求項4の効果)。
また、本発明の第2の実施形態では、活動領域抽出処理回路39において、ヒストグラムを統計処理させるとともに、統計処理結果を使用させて、ヒストグラムから仮想カーソル活動領域画像、仮想ボタンクリック活動領域画像を作成させるようにしているので、ユーザの手など、動いている部分を正確に検知させることができ、安定した仮想カーソル制御、クリック制御、操作対象画面制御を行わせることができる(請求項5の効果)。
また、本発明の第2の実施形態では、活動領域抽出処理回路39において、仮想カーソル活動領域画像、または仮想ボタンクリックの活動領域画像に対し、多段階矩形オブジェクト抽出処理を行うようにしているので、ユーザの影などに起因する誤動作を防止させ、安定した仮想カーソル制御、クリック制御、操作対象画面制御を行わせることができる(請求項6の効果)。
3.本発明の他の実施形態の説明
また、上述した各実施形態では、ウェブカメラ4、ビデオカメラ本体30で得られたカラー画像の全領域をグレー化し、2値化するようにしているが、図22フローチャート、図23の模式図に示す如くヒストグラムを統計処理、活動領域抽出処理で得られた変化領域矩形(活動矩形領域を含む矩形)45に対し、指定された拡大縮小率(例えば拡大率“10%”)で、拡大/縮小させた拡大/縮小矩形マスク46を作成させ(ステップS40)、この拡大/縮小矩形マスク46を使用させ、カラー画像(次フレームのカラー画像)の全領域をグレー化して得られたモノクロ画像などの中から活動領域部分を含む画像47だけを抽出させて、2値化処理させるようにしても良い(ステップS41)。
また、上述した各実施形態では、ウェブカメラ4、ビデオカメラ本体30で得られたカラー画像の全領域をグレー化し、2値化するようにしているが、図22フローチャート、図23の模式図に示す如くヒストグラムを統計処理、活動領域抽出処理で得られた変化領域矩形(活動矩形領域を含む矩形)45に対し、指定された拡大縮小率(例えば拡大率“10%”)で、拡大/縮小させた拡大/縮小矩形マスク46を作成させ(ステップS40)、この拡大/縮小矩形マスク46を使用させ、カラー画像(次フレームのカラー画像)の全領域をグレー化して得られたモノクロ画像などの中から活動領域部分を含む画像47だけを抽出させて、2値化処理させるようにしても良い(ステップS41)。
このようにすれば、モノクロ画像などの中から活動領域より、少し広い範囲に含まれる画像のみが有効にさせ、それ以外の領域にある画像を無効にさせて、変化領域以外の部分に存在するノイズを除去させることができる(請求項7の効果)。
また、上述した第1の実施形態及び第2の実施形態では、CPU7による色フィルタリング処理、または色フィルタリング処理回路35によって、肌色のカラー画像を抽出させるようにしているが、ユーザが特定色の操作器、例えば赤ペンなどを使用して、仮想カーソルの位置、クリック、操作対象画面のスクロール、操作対象画面の拡大、操作対象画面の縮小、操作対象画面の回転などを制御する場合には、赤色抽出用のカラーマスクを使用させ、CPU7による色フィルタリング処理、または色フィルタリング処理回路35によって、赤色のカラー画像を抽出させるようにしても良い。
これにより、ウェブカメラ4、ビデオカメラ本体30の撮影範囲に複数の人がいても、ユーザが持つ操作器の色に対応するカラー画像を抽出させて、仮想カーソル25のサイズ制御、位置制御、クリック制御、操作対象画面のスクロール制御、拡大制御、縮小制御、回転制御などを行わせることができる。
また、このような色フィルタリング処理は、ウェブカメラ4、ビデオカメラ本体30から出力されるカラービデオ信号に含まれるユーザの手など、動いている画像を抽出するために行っている処理であることから、ユーザが居る場所の照明条件が良好で、ユーザの手など、動いている画像と、背景画像とのコントラストが大きいとき、色フィルタリング処理を省略するようにしても良い。
1a、1b:入力装置
2:パソコン
3:ディスプレイ部
4:ウェブカメラ(カラーカメラ)
5:ビデオキャプチャ
6:ハードディスク
7:CPU
8:メモリ
9:システムバス
10:OS格納エリア
11:アプリケーション格納エリア
12:画像処理プログラム格納エリア
13:画像格納エリア
14:表示インタフェース
20:分割エリア
21:活動分割エリア
25:仮想カーソル
26:活動矩形領域
27:仮想カーソル活動領域画像
28:実カーソル
30:ビデオカメラ本体(カラーカメラ本体)
31:画像処理基板
32:肌色画像抽出回路
33:グレー化処理回路
34:画像分割/2値化処理回路
35:色フィルタリング処理回路
36:フレームバッファ回路
37:フレーム間差分処理回路
38:ヒストグラム処理回路
39:活動領域抽出処理回路
40:仮想カーソル制御処理/画面制御処理回路
45:変化領域矩形
46:拡大/縮小矩形マスク
47:マスク後の画像
2:パソコン
3:ディスプレイ部
4:ウェブカメラ(カラーカメラ)
5:ビデオキャプチャ
6:ハードディスク
7:CPU
8:メモリ
9:システムバス
10:OS格納エリア
11:アプリケーション格納エリア
12:画像処理プログラム格納エリア
13:画像格納エリア
14:表示インタフェース
20:分割エリア
21:活動分割エリア
25:仮想カーソル
26:活動矩形領域
27:仮想カーソル活動領域画像
28:実カーソル
30:ビデオカメラ本体(カラーカメラ本体)
31:画像処理基板
32:肌色画像抽出回路
33:グレー化処理回路
34:画像分割/2値化処理回路
35:色フィルタリング処理回路
36:フレームバッファ回路
37:フレーム間差分処理回路
38:ヒストグラム処理回路
39:活動領域抽出処理回路
40:仮想カーソル制御処理/画面制御処理回路
45:変化領域矩形
46:拡大/縮小矩形マスク
47:マスク後の画像
Claims (7)
- ビデオカメラで得られた操作者の画像を処理して、操作者の動作内容に応じた操作指示を生成する入力装置において、
操作者を撮影するカラーカメラと、
このカラーカメラから出力されるカラー画像に対し、グレー化処理、画像分割/2値化処理、フレーム間差分処理、ヒストグラム処理、活動領域抽出処理、仮想カーソル制御処理/画面制御処理を行って、前記操作者の手、または指先の動きを検出し、この検出結果に応じた操作指示を生成して、遠隔制御対象機器を制御する画像処理プログラムと、
を備えたことを特徴とする入力装置。 - ビデオカメラで得られた操作者の画像を処理して、操作者の動作内容に応じた操作指示を生成する入力装置において、
箱形に形成される入力装置筐体と、
この入力装置筐体の前面に取り付けられ、操作者の画像を撮影するカラーカメラ本体と、
グレー化処理回路、画像分割/2値化処理回路、フレーム間差分処理回路、ヒストグラム処理回路、活動領域抽出処理回路、仮想カーソル制御処理/画面制御処理回路を持ち、前記入力装置筐体内に配置され、ケーブルによって、遠隔操作対象機器などに接続される画像処理基板と、
を備え、
前記グレー化処理回路、前記画像分割/2値化処理回路、前記フレーム間差分処理回路、前記ヒストグラム処理回路、前記活動領域抽出処理回路、前記仮想カーソル制御処理/画面制御処理回路によって、前記カラーカメラ本体から出力されるカラー画像を処理して、前記操作者の手の動きを検出し、この検出結果に応じたポインティングデータを生成し、前記遠隔操作対象機器の動作を制御する、
ことを特徴とする入力装置。 - 前記仮想カーソル制御処理/画面制御処理、または前記仮想カーソル制御処理/画面制御処理回路は、仮想カーソル活動領域画像上に活動矩形領域群が1つあるとき、その形状、移動有無に基づき、カールソル制御指示、または画面スクロール指示を生成する、ことを特徴とする請求項1又は2に記載の入力装置。
- 前記仮想カーソル制御処理/画面制御処理、または前記仮想カーソル制御処理/画面制御処理回路は、仮想カーソル活動領域画像上に活動矩形領域群が2つあるとき、その移動方向に基づき、画面回転指示、画面拡大指示、画面縮小指示のいずれかを生成する、ことを特徴とする請求項1乃至3の何れかに記載の入力装置。
- 前記活動領域抽出処理、または前記活動領域抽出処理回路は、ヒストグラムの統計処理結果を使用して、前記ヒストグラムから仮想カーソル活動領域画像、仮想ボタンクリック活動領域画像を作成する、ことを特徴とする請求項1乃至4の何れかに記載の入力装置。
- 前記活動領域抽出処理、または前記活動領域抽出処理回路は、前記仮想カーソル活動領域画像、または前記仮想ボタンクリック活動領域画像に対し、多段階矩形オブジェクト抽出処理を行い、ノイズ成分を除去する、ことを特徴とする請求項1乃至5の何れかに記載の入力装置。
- 拡大/縮小矩形マスク作成処理、または拡大/縮小矩形マスク作成処理回路を付加し、前記拡大/縮小矩形マスク作成処理、または前記拡大/縮小矩形マスク作成処理回路によって、前記カラーカメラ、前記カラーカメラ本体で得られたカラー画像の中から、前記仮想カーソル活動領域画像上の変化領域矩形、または前記仮想ボタンクリック活動領域画像の変化領域矩形に対応する画像を抽出し、それ以外の画像をカットして、ノイズ成分を除去する、ことを特徴とする請求項1乃至6の何れかに記載の入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009183567A JP2011039594A (ja) | 2009-08-06 | 2009-08-06 | 入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009183567A JP2011039594A (ja) | 2009-08-06 | 2009-08-06 | 入力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011039594A true JP2011039594A (ja) | 2011-02-24 |
Family
ID=43767329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009183567A Pending JP2011039594A (ja) | 2009-08-06 | 2009-08-06 | 入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011039594A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014059803A (ja) * | 2012-09-19 | 2014-04-03 | Alps Electric Co Ltd | 入力装置 |
CN108459707A (zh) * | 2018-01-26 | 2018-08-28 | 上海萌王智能科技有限公司 | 一种利用智能终端识别动作并控制机器人的系统 |
-
2009
- 2009-08-06 JP JP2009183567A patent/JP2011039594A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014059803A (ja) * | 2012-09-19 | 2014-04-03 | Alps Electric Co Ltd | 入力装置 |
CN108459707A (zh) * | 2018-01-26 | 2018-08-28 | 上海萌王智能科技有限公司 | 一种利用智能终端识别动作并控制机器人的系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI489317B (zh) | 電子裝置的操作方法及系統 | |
US8643598B2 (en) | Image processing apparatus and method, and program therefor | |
JP5540002B2 (ja) | 画像センサ式ヒューマンマシンインターフェイスを提供するための方法、システムと関連モジュール、およびソフトウエアコンポーネント | |
TWI543610B (zh) | 電子裝置及其影像選擇方法 | |
US9405373B2 (en) | Recognition apparatus | |
US9507437B2 (en) | Algorithms, software and an interaction system that support the operation of an on the fly mouse | |
US20120293544A1 (en) | Image display apparatus and method of selecting image region using the same | |
CN111475059A (zh) | 基于近距离传感器和图像传感器的手势检测 | |
KR20130081580A (ko) | 표시 장치 및 그 제어 방법 | |
JP2012238293A (ja) | 入力装置 | |
JP2014211858A (ja) | ジェスチャに基づくユーザ・インターフェイスを提供するシステム、方法及びプログラム | |
US9218060B2 (en) | Virtual mouse driving apparatus and virtual mouse simulation method | |
CN110297545B (zh) | 手势控制方法、手势控制装置和系统、以及存储介质 | |
KR20210010930A (ko) | 헤드 제스처들을 통해 디스플레이 디바이스를 원격 제어하기 위한 방법, 시스템 및 컴퓨터 프로그램 | |
US20150016726A1 (en) | Method and electronic device for processing handwritten object | |
JP2013080266A (ja) | 入力装置 | |
JP2015108870A (ja) | 動作入力装置、動作入力プログラム及び動作入力方法 | |
US20200311398A1 (en) | Scene controlling method, device and electronic equipment | |
JP2016099643A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US9489077B2 (en) | Optical touch panel system, optical sensing module, and operation method thereof | |
JP2011039594A (ja) | 入力装置 | |
Khan et al. | Computer vision based mouse control using object detection and marker motion tracking | |
Xu et al. | Bare hand gesture recognition with a single color camera | |
JP5697351B2 (ja) | プロジェクタシステム | |
Yeh et al. | Vision-based virtual control mechanism via hand gesture recognition |