JP2011085966A - 情報処理装置、情報処理方法およびプログラム - Google Patents

情報処理装置、情報処理方法およびプログラム Download PDF

Info

Publication number
JP2011085966A
JP2011085966A JP2009235904A JP2009235904A JP2011085966A JP 2011085966 A JP2011085966 A JP 2011085966A JP 2009235904 A JP2009235904 A JP 2009235904A JP 2009235904 A JP2009235904 A JP 2009235904A JP 2011085966 A JP2011085966 A JP 2011085966A
Authority
JP
Japan
Prior art keywords
specific object
control signal
information
detected
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009235904A
Other languages
English (en)
Inventor
Masayuki Yokoyama
正幸 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009235904A priority Critical patent/JP2011085966A/ja
Publication of JP2011085966A publication Critical patent/JP2011085966A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)
  • Image Analysis (AREA)

Abstract

【課題】物体の動きを用いた操作入力の精度を高める。
【解決手段】特定対象物情報記憶部300は、物体が特定対象物であるかを判定するための判定情報を複数記憶する。動き検出部220は、対象動画に含まれる物体の動きを検出する。特定対象物情報選択部230は、検出された物体の動きの向きに基づいて、特定対象物情報記憶部300から1または複数の判定情報を選択する。特定対象物判定部240は、その選択された判定情報を用いて、動きが検出された物体が特定対象物であるか否かを判定する。評価値算出部250は、動きが検出された物体について、特定対象物であることが判定されてから、その判定がされなくなるまでの間の時間軸における長さに応じた所定の演算処理により評価値を算出する。制御信号生成部270は、その算出された評価値に基づいて、電子機器を制御するための制御信号を生成する。
【選択図】図2

Description

本発明は、情報処理装置に関し、特に、画像を解析して各種情報を生成する情報処理装置および情報処理方法ならびに当該方法をコンピュータに実行させるプログラムに関する。
従来、テレビジョン等の電子機器をユーザが操作する場合には、その電子機器に備えられている操作部材やリモコン(リモートコントローラ)を用いて、ユーザが所望の操作入力を行う。また、近年では、画像に含まれるユーザの手の動き等を認識し、これらの認識結果に基づいて、所望の電子機器を操作するための制御信号を生成するハンドジェスチャー認識技術が提案されている。このように、ユーザの手の動き等の認識結果に基づいて生成された制御信号により所望の電子機器を操作することができるため、ユーザ自身によるジェスチャーにより操作入力を行うことができる。
このように、ジェスチャーによるユーザインターフェース(UI)は、リモコン等を用いずに、ユーザの手指等のジェスチャーのみにより電子機器を操作することができるため、研究や開発が盛んに行われている。
例えば、人物を撮像した画像における所定領域の画像データを特定し、この所定領域の画像データにのみ基づいて認識対象の動きを認識し、この認識結果に基づいて所定の処理(頁送り/戻し等)を行う情報処理装置が提案されている(例えば、特許文献1参照。)。
特開2002−83302号公報(図5)
上述の従来技術では、認識対象(例えば、ユーザの手)の動きを認識する場合に、所定領域の画像データのみを用いて認識対象の動きを認識する。このため、例えば、所定領域の画像データに含まれるユーザの手の動き以外の動き(例えば、手の背景に存在する物体の動き)を誤認識するおそれがある。
また、上述の従来技術では、ユーザが手でジェスチャーを行う場合には、表示画面を見ながら、所定領域の画像データにその手が含まれるように行う必要がある。しかしながら、例えば、ユーザの手が所定領域の画像データに適切に含まれない場合には、その手のジェスチャーを適切に認識することができないおそれがある。
本発明はこのような状況に鑑みてなされたものであり、物体の動きを用いた操作入力の精度を高めることを目的とする。
本発明は、上記課題を解決するためになされたものであり、その第1の側面は、対象動画に含まれる物体の動きを検出する動き検出部と、上記動きが検出された物体が所定物体の形状および向きにより特定される特定対象物であるかを判定する特定対象物判定部と、上記動きが検出された物体について上記特定対象物であることが判定されてから上記特定対象物であることが判定されなくなるまでの間の時間軸における長さに基づいて所定の電子機器を制御するための制御信号を生成する制御信号生成部とを具備する情報処理装置および情報処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、対象動画に含まれる物体の動きを検出し、この動きが検出された物体が特定対象物であるかを判定し、動きが検出された物体について、特定対象物であることが判定されてからその判定がされなくなるまでの間の時間軸における長さに基づいて、所定の電子機器を制御するための制御信号を生成するという作用をもたらす。
また、この第1の側面において、上記特定対象物判定部は、上記動きが検出された物体が複数の上記特定対象物のうちの何れかの特定対象物であるかを判定し、上記制御信号生成部は、上記特定対象物判定部により判定された特定対象物の種類と上記時間軸における長さとに基づいて上記制御信号を生成するようにしてもよい。これにより、動きが検出された物体が、複数の特定対象物のうちの何れかの特定対象物であるかを判定し、この判定された特定対象物の種類と、その時間軸における長さとに基づいて、制御信号を生成するという作用をもたらす。
また、この第1の側面において、上記動きが検出された物体について上記特定対象物であることが判定されてから上記特定対象物であることが判定されなくなるまでの間の時間軸における長さに応じた所定の演算処理により上記制御信号を生成するための評価値を算出する評価値算出部をさらに具備し、上記制御信号生成部は、上記算出された評価値に基づいて上記制御信号を生成するようにしてもよい。これにより、動きが検出された物体について、その時間軸における長さに応じた所定の演算処理により評価値を算出し、この算出された評価値に基づいて制御信号を生成するという作用をもたらす。
また、この第1の側面において、上記評価値算出部は、上記動きが検出された物体が所定の規則に応じた複数の動作を行っている場合には上記複数の動作毎に上記評価値を算出し、上記制御信号生成部は、上記複数の動作毎に算出された評価値に基づいて上記制御信号を生成するようにしてもよい。これにより、動きが検出された物体が、所定の規則に応じた複数の動作を行っている場合には、その複数の動作毎に評価値を算出し、その複数の動作毎に算出された評価値に基づいて制御信号を生成するという作用をもたらす。
また、この第1の側面において、上記所定の規則に応じた複数の動作は、手話であり、
上記制御信号生成部は、上記手話について算出された評価値に基づいて上記手話を表す画像を表示させるための上記制御信号を生成するようにしてもよい。これにより、手話について算出された評価値に基づいて、手話を表す画像を表示させるための制御信号を生成するという作用をもたらす。
また、この第1の側面において、上記特定対象物判定部は、上記動きが検出された物体について上記特定対象物であることが判定された後に上記動き検出部による動きの検出がされなくなった場合には当該物体が上記特定対象物であることが判定されなくなるまで当該物体について上記判定を継続して行うようにしてもよい。これにより、動きが検出された物体について、特定対象物であることが判定された後に、その動きの検出がされなくなった場合には、その物体が特定対象物であることが判定されなくなるまでその物体について判定処理を継続して行うという作用をもたらす。
また、この第1の側面において、上記動きが検出された物体が上記特定対象物であるかを判定するための判定情報を複数記憶する記憶部と、上記検出された物体の動きの向きに基づいて上記複数の判定情報の中から1または複数の判定情報を選択する選択部とをさらに具備し、上記特定対象物判定部は、上記選択された判定情報を用いて上記動きが検出された物体が上記特定対象物であるかを判定するようにしてもよい。これにより、検出された物体の動きの向きに基づいて判定情報を選択し、この選択された判定情報を用いて、動きが検出された物体が特定対象物であるかを判定するという作用をもたらす。
また、この第1の側面において、上記動きが検出された物体が所定の規則に応じた一連の動作を行っているかを判定する一連動作判定部をさらに具備し、上記制御信号生成部は、上記所定の規則に応じた一連の動作を行っている物体について上記所定の規則に応じた上記特定対象物であることが判定されてから上記所定の規則に応じた上記特定対象物であることが判定されなくなるまでの間の時間軸における長さに基づいて上記制御信号を生成するようにしてもよい。これにより、動きが検出された物体が、所定の規則に応じた一連の動作を行っているかを判定し、所定の規則に応じた一連の動作を行っている物体について、所定の規則に応じた特定対象物であることが判定されてから、その判定がされなくなるまでの間の時間軸における長さに基づいて制御信号を生成するという作用をもたらす。
また、この第1の側面において、上記動きが検出された物体が上記所定の規則に応じた上記特定対象物であるかを判定するための判定情報を上記特定対象物毎に複数記憶する記憶部と、上記検出された物体の動きの向きおよび上記一連の動作に基づいて上記複数の判定情報の中から1または複数の判定情報を選択する選択部とをさらに具備し、上記特定対象物判定部は、上記選択された判定情報を用いて上記動きが検出された物体が上記所定の規則に応じた上記特定対象物であるかを判定するようにしてもよい。これにより、検出された物体の動きの向きおよび一連の動作に基づいて判定情報を選択し、この選択された判定情報を用いて、動きが検出された物体が、所定の規則に応じた特定対象物であるかを判定するという作用をもたらす。
また、この第1の側面において、上記制御信号生成部は、上記制御信号として、向き、大きさ、バイナリ値および位置の少なくとも1つに関する制御信号を生成するようにしてもよい。これにより、向き、大きさ、バイナリ値および位置の少なくとも1つに関する制御信号を生成するという作用をもたらす。
また、この第1の側面において、被写体を撮像して上記対象動画を生成する撮像部をさらに具備するようにしてもよい。これにより、被写体を撮像して対象動画を生成するという作用をもたらす。
また、この第1の側面において、上記電子機器は、上記情報処理装置であり、上記制御信号生成部は、上記情報処理装置が特定の処理を行うための上記制御信号を生成するようにしてもよい。これにより、情報処理装置が特定の処理を行うための制御信号を生成するという作用をもたらす。
また、本発明の第2の側面は、動きが検出された物体が所定物体の形状および向きにより特定される特定対象物であるかを判定するための判定情報を上記特定対象物毎に複数記憶する記憶部と、対象動画に含まれる物体の動きを検出する動き検出部と、上記検出された物体の動きの向きに基づいて上記複数の判定情報の中から1または複数の判定情報を選択する選択部と、上記選択された判定情報を用いて上記動きが検出された物体が上記特定対象物であるかを判定する特定対象物判定部と、上記特定対象物判定部による判定結果に基づいて所定の電子機器を制御するための制御信号を生成する制御信号生成部とを具備する情報処理装置および情報処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、対象動画に含まれる物体の動きを検出し、この検出された物体の動きの向きに基づいて判定情報を選択し、この選択された判定情報を用いて、動きが検出された物体が特定対象物であるかを判定し、この判定結果に基づいて所定の電子機器を制御するための制御信号を生成するという作用をもたらす。
本発明によれば、物体の動きを用いた操作入力の精度を高めることができるという優れた効果を奏し得る。
本発明の第1の実施の形態における情報処理システム100の全体構成例を示す図である。 本発明の第1の実施の形態における情報処理装置200の機能構成例を示すブロック図である。 本発明の第1の実施の形態における特定対象物情報記憶部300の記憶内容を模式的に示す図である。 本発明の第1の実施の形態における特定対象物判定部240による特定対象物の判定処理の対象となる特定対象物の例を模式的に示す図である。 本発明の第1の実施の形態における評価値保持部260の保持内容を模式的に示す図である。 本発明の第1の実施の形態における画像入力部210に入力された画像と、この画像において動きが検出された特定対象物との関係を示す図である。 本発明の第1の実施の形態における動き検出部220による動きベクトル検出処理の対象となる領域(対象領域)の設定方法の概略を示す図である。 本発明の第1の実施の形態における動き検出部220により動きを検出する動き検出方法を模式的に示す図である。 本発明の第1の実施の形態における特定対象物情報選択部230による特定対象物情報の選択方法および特定対象物判定部240による特定対象物の判定方法の流れを模式的に示す図である。 本発明の第1の実施の形態における特定対象物判定部240による判定処理の対象となる対象画像(現フレーム)に含まれる被写体の遷移例を示す図である。 本発明の第1の実施の形態における評価値算出部250による評価値算出の流れを示すシーケンスチャートである。 本発明の第1の実施の形態における制御信号生成部270による制御信号の生成方法を模式的に示す図である。 本発明の第1の実施の形態における情報処理装置200による制御信号生成処理の処理手順を示すフローチャートである。 本発明の第1の実施の形態における情報処理装置200による制御信号生成処理の処理手順のうちの評価値算出処理を示すフローチャートである。 本発明の第1の実施の形態における情報処理装置200による制御信号生成処理の処理手順のうちの制御信号生成処理を示すフローチャートである。 本発明の第1の実施の形態における情報処理システム100をテレビジョン801およびテレビゲーム装置803に適用する場合の例を模式的に示す図である。 本発明の第1の実施の形態における情報処理システム100を照明装置806およびクレーンゲーム装置809に適用する場合の例を模式的に示す図である。 本発明の第1の実施の形態における情報処理システム100をデジタルスチルカメラ812およびロボット装置813に適用する場合の例を模式的に示す図である。 肩を中心として人間の手を回転させる場合における手の動きの例を示す図である。 本発明の第2の実施の形態における情報処理装置500の機能構成例を示すブロック図である。 本発明の第2の実施の形態における特定対象物情報記憶部310の記憶内容を模式的に示す図である。 本発明の第2の実施の形態における向き相関情報記憶部600の記憶内容を模式的に示す図である。 本発明の第2の実施の形態における情報処理装置200による制御信号生成処理の処理手順を示すフローチャートである。 本発明の第3の実施の形態における情報処理装置700の機能構成例を示すブロック図である。 本発明の第3の実施の形態における手話解析結果保持部720の保持内容を模式的に示す図である。 本発明の第3の実施の形態における手話解析情報記憶部730の記憶内容を模式的に示す図である。 本発明の第3の実施の形態における情報処理装置700による手話解析の対象となる人間の手の動きと、この手の動きに対応する文字との関係を模式的に示す図である。
以下、本発明を実施するための形態(以下、実施の形態と称する)について説明する。説明は以下の順序により行う。
1.第1の実施の形態(制御信号の生成制御:特定対象物(例えば、手)に基づいて制御信号を生成する例)
2.第2の実施の形態(制御信号の生成制御:所定の規則により行われる一連の動作に基づいて制御信号を生成する例)
3.第3の実施の形態(制御信号の生成制御:手話を解析して解析結果を表示する例)
<1.第1の実施の形態>
[情報処理システムの構成例]
図1は、本発明の第1の実施の形態における情報処理システム100の全体構成例を示す図である。情報処理システム100は、撮像装置110と、電子機器120と、情報処理装置200とを備える。また、情報処理システム100において、撮像装置110および情報処理装置200は信号線131を介して接続され、電子機器120および情報処理装置200は信号線132を介して接続される。なお、撮像装置110および情報処理装置200と、電子機器120および情報処理装置200とのそれぞれは、無線回線および有線回線の何れにより接続されるようにしてもよい。
撮像装置110は、被写体を撮像して画像データ(ビデオデータ)を生成するものであり、生成された画像データを信号線131を介して情報処理装置200に順次出力する。具体的には、撮像装置110は、光学ユニット、撮像素子および信号処理部を備える。この撮像装置110において、光学ユニットを介して入射された被写体の光学像が撮像素子の撮像面に結像され、この状態で撮像素子が撮像動作を行い、信号処理部が撮像信号に対して信号処理を行うことにより画像データ(撮像画像)が生成される。そして、生成された画像データが、信号線131を介して、所定のフレームレートで情報処理装置200に順次出力される。撮像装置110は、例えば、生成された画像データを外部装置に出力するための外部出力端子を備えるデジタルスチルカメラやデジタルビデオカメラ(例えば、カメラ一体型レコーダ)等により実現される。また、撮像装置110は、例えば、単眼カメラにより実現することができる。なお、撮像装置110は、特許請求の範囲に記載の撮像部の一例である。
電子機器120は、情報処理装置200から出力された制御信号に基づいて、各種制御が行われる電子機器である。電子機器120は、例えば、外部装置からの操作信号に基づいて、各種操作が行われるテレビジョン等の映像視聴装置である。
情報処理装置200は、撮像装置110から出力された画像データに基づいて、電子機器120を制御するための制御信号を生成するものであり、生成された制御信号を信号線132を介して電子機器120に出力する。なお、情報処理装置200の構成については、図2を参照して詳細に説明する。
ここで、情報処理システム100は、例えば、撮像装置110の撮像範囲内に位置する人物140が、特定のジェスチャーを行うことにより電子機器120を操作することが可能なシステムである。例えば、人物140がその左手を撮像装置110の前で移動させることにより、情報処理装置200が、その左手の状態および移動量等に基づいて制御信号を生成し、この制御信号に基づいて電子機器120が制御される。例えば、電子機器120がテレビジョンである場合には、電源のオン/オフ、チャネルの切替、音量調整、画質調整等の操作を行うことができる。なお、情報処理システム100の適用例については、図16乃至図18を参照して詳細に説明する。
[情報処理装置の構成例]
図2は、本発明の第1の実施の形態における情報処理装置200の機能構成例を示すブロック図である。情報処理装置200は、画像入力部210と、動き検出部220と、特定対象物情報選択部230と、特定対象物判定部240と、評価値算出部250と、評価値保持部260とを備える。また、情報処理装置200は、制御信号生成部270と、制御信号出力部280と、特定対象物情報記憶部300とを備える。情報処理装置200は、例えば、画像解析により画像データから各特徴量を抽出し、この抽出された各特徴量を用いて各種情報処理を施すことが可能なパーソナルコンピュータ等の情報処理装置により実現することができる。
画像入力部210は、撮像装置110により生成された画像データを入力するものであり、入力された画像データを動き検出部220および特定対象物判定部240に順次出力する。
動き検出部220は、画像入力部210から出力された画像データを解析して、その画像データに含まれる被写体の動きを検出するものである。そして、動き検出部220は、検出された被写体の動きに関する情報(動き情報)を特定対象物情報選択部230、評価値算出部250および制御信号生成部270に出力する。動き検出部220は、例えば、画像入力部210から出力された画像データ(対象画像)に含まれる被写体のうち、所定範囲の領域(対象領域)に含まれる被写体の動きを対象領域毎に検出する。また、動き情報には、例えば、検出された動きの対象画像における向きおよび大きさと、動きが検出された対象領域の対象画像における位置および大きさとが含まれる。なお、対象画像に含まれる被写体の動きを検出する検出方法として、例えば、勾配法やブロックマッチング方法等の動きベクトル検出方法を用いることができる。また、以下では、「対象画像」と記載した場合には、対象画像そのものと、その対象画像を表示するための画像データとの双方の意味を含むものとして説明する。なお、この動きベクトル検出方法については、図7および図8を参照して詳細に説明する。
特定対象物情報記憶部300は、特定対象物の判定処理および制御信号の生成処理に用いられる複数の特定対象物情報を記憶するものであり、記憶されている特定対象物情報を特定対象物情報選択部230および制御信号生成部270に供給する。ここで、特定対象物情報は、特定対象物が対象領域に含まれるか否かを判定するための特定対象物判定情報303(図3に示す)と、この判定結果に基づいて制御信号を生成するための制御信号生成情報304(図3に示す)とを含む。特定対象物は、例えば、図3および図4に示すように、特定の姿勢とされた人間の手である。なお、特定対象物情報記憶部300に記憶されている特定対象物情報については、図3を参照して詳細に説明する。また、特定対象物情報記憶部300は、特許請求の範囲に記載の記憶部の一例である。
特定対象物情報選択部230は、特定対象物情報記憶部300に記憶されている複数の特定対象物情報の中から、特定対象物判定部240による判定処理に用いられる特定対象物判定情報303(図3に示す)を選択するものである。具体的には、特定対象物情報選択部230は、動き検出部220により動きが検出された場合には、その動き情報に基づいて特定対象物判定情報を選択する。また、特定対象物情報選択部230は、動きが検出された対象領域において、その検出後に動きが検出されなくなった場合には、その対象領域に関連付けて評価値保持部260に保持されている向き情報に基づいて特定対象物判定情報を選択する。そして、特定対象物情報選択部230は、選択された特定対象物判定情報を特定対象物判定部240に出力する。なお、この特定対象物判定情報の選択方法については、図9を参照して詳細に説明する。また、特定対象物情報選択部230は、特許請求の範囲に記載の選択部の一例である。
特定対象物判定部240は、特定対象物情報選択部230から出力された特定対象物判定情報を用いて、画像入力部210から出力された対象画像に特定対象物が含まれるか否かを判定するものである。具体的には、特定対象物判定部240は、画像入力部210から出力された対象画像において、動き検出部220により動きが検出された対象領域に特定対象物が含まれるか否かを判定する。この特定対象物の判定方法として、例えば、特定対象物の輝度分布情報が記録されているテンプレートと実画像とのマッチングによる判定方法(例えば、特開2004−133637参照。)を用いることができる。また、特定対象物が人間の手である場合には、対象領域に含まれる肌色の部分や人間の手の特徴量に基づいた判定方法を用いることができる。例えば、特定対象物判定情報として記憶されている特徴量と、対象領域に含まれる画像から抽出された特徴量とを比較して、これらの特徴量の類似度を算出し、この算出された類似度が閾値を超えた場合に、その対象領域に特定対象物が含まれると判定する。また、手を含む画像(サンプル画像)について、このサンプル画像上の2画素間の輝度差を学習し、この学習により得られた特徴量を基準データとして予め保持しておく。そして、この基準データを用いて、対象領域に含まれる画像について、弱判別器による特定対象物の判定処理を行う判定方法を用いることができる(例えば、特開2008−305342号参照。)。このような学習を行う学習器として、例えば、ニューラルネットワーク、SVM(Support vector machine)、ブースティング(Boosting)等を用いることができる。そして、特定対象物判定部240は、その判定結果を評価値算出部250に出力する。なお、特定対象物の判定処理については、図9を参照して詳細に説明する。
評価値算出部250は、特定対象物判定部240から出力された判定結果に基づいて、制御信号を生成するための評価値を算出するものである。具体的には、評価値算出部250は、特定対象物判定部240から出力された判定結果と、評価値保持部260に保持されている評価値とに基づいて、動きが検出された対象領域に対する新たな評価値を算出する。そして、評価値算出部250は、新たに算出された評価値、この評価値の算出対象となった対象領域の位置および大きさ、この対象領域において動き検出部220により検出された動きの向き等を評価値保持部260に保持させる。また、評価値算出部250は、動きが検出された対象領域において、その検出後に動きが検出されなくなった場合については、その対象領域から同一の特定対象物の検出がされなくなるまで、その対象領域に対する新たな評価値を算出する。なお、動きが検出された対象領域から同一の特定対象物が検出されなくなった場合には、評価値算出部250は、その対象領域に関する評価値の算出処理を終了し、その旨を制御信号生成部270に通知する。これにより、評価値保持部260に保持されているその対象領域に関する直前までの評価値が制御信号生成部270に供給され、その評価値が評価値保持部260から消去される。なお、評価値の算出方法については、図10および図11を参照して詳細に説明する。
評価値保持部260は、評価値算出部250により算出された評価値と、これに関する各情報とを保持するものであり、保持されている評価値と、これに関連付けて保持されている対象領域に関する各情報とを評価値算出部250に供給する。また、評価値保持部260は、保持されている評価値と、この評価値に対応する特定対象物に関する情報とを制御信号生成部270に供給する。また、評価値保持部260は、保持されている対象領域に関する各情報と、その対象領域に関連付けて保持されている動きの向きを特定対象物情報選択部230に供給する。なお、評価値保持部260における保持内容については、図5を参照して詳細に説明する。
制御信号生成部270は、動き検出部220から出力された動き情報と、評価値保持部260における保持内容と、特定対象物情報記憶部300における記憶内容とに基づいて、電子機器120を制御するための制御信号を生成するものである。そして、制御信号生成部270は、生成された制御信号を制御信号出力部280に出力する。この制御信号の生成については、図12を参照して詳細に説明する。
制御信号出力部280は、制御信号生成部270から出力された制御信号を、電子機器120に出力するものである。
[特定対象物情報記憶部の記憶内容例]
図3は、本発明の第1の実施の形態における特定対象物情報記憶部300の記憶内容を模式的に示す図である。特定対象物情報記憶部300には、対象領域の動きの向き情報301と、特定対象物識別情報302と、特定対象物判定情報303と、制御信号生成情報304とが関連付けて記憶されている。ここで、以下で示す人物の左右に関する表記については、ジェスチャーを行う人物を基準とした場合における左右を示すものとする。このため、人物の動作等に関する説明では、図面における左右と、説明に用いる左右とが異なる場合もある。
対象領域の動きの向き情報301には、対象領域において検出された動きの向きを示す情報が格納される。この動きの向きは、動き検出部220により検出される動きの向きに対応するものであり、例えば、動きベクトルにより特定される向きである。ここで、本発明の第1の実施の形態では、説明の容易のため、動き検出部220による検出対象となる向きを、上下左右の4つの向きとする例について説明する。このため、図3に示す例では、上下左右の4つの向きのみを示す。ただし、例えば、上下左右以外に、右上、右下、左上、左下の8つの向きとするようにしてもよく、さらに細かく16つの向き、32つの向き等とするようにしてもよい。
特定対象物識別情報302には、特定対象物を識別するための識別情報が格納される。特定対象物識別情報302には、例えば、特定対象物の種類に応じて#1、#2等が格納される。
特定対象物判定情報303には、特定対象物判定部240により行われる特定対象物の判定処理に用いられる特定対象物判定情報が格納される。この特定対象物判定情報は、動き検出部220により動きが検出された対象領域に、特定対象物が含まれるか否かを判定するために用いられる判定情報である。例えば、特定対象物を人間の手とする場合には、その手の輝度分布情報が記録されているテンプレートや、手の指等の各部の位置関係や形状を認識するための手画像の特徴や特性を示すデータ(特徴量)が格納される。また、例えば、弱判別器による特定対象物の判定処理を行う場合には、サンプル画像上の2画素間の輝度差により得られた特徴量を含む基準データが格納される。なお、図3に示す特定対象物判定情報303の各欄には、それぞれに対応する形態を示す図形を模式的に示す。
制御信号生成情報304には、制御対象となる電子機器120の制御信号を生成するための情報(制御信号生成情報)が格納される。この制御信号生成情報は、特定対象物の判定処理に用いられる特定対象物判定情報毎に関連付けて格納される。例えば、特定対象物識別情報302の「#1」に対応する特定対象物が、一定時間検出されている場合には、電子機器120の電源をオンする制御信号が生成される。
ここで、図3に示すように、本発明の第1の実施の形態における特定対象物は、同一形態であっても、その向きに応じて異なる特定対象物として、特定対象物情報記憶部300に記憶されている。例えば、特定対象物識別情報302の「#1」、「#11」、「#21」、「#31」に関連付けて格納されている右手は、その形態は同一であるが向きが異なる。すなわち、ユーザが所望する複数の操作を同一姿勢とする手の動きの向きに応じて行うことができる。
また、図3では、特定対象物のうちの一部のみを例示するが、例えば、手以外の人間の体の一部(例えば、顔、足、腕全体)や他の部材(例えば、ペットボトル、珈琲カップ)等を特定対象物とするようにしてもよい。図4では、図3に示す姿勢以外の姿勢の手を特定対象物とする場合における手の姿勢の例を示す。
[特定対象物の他の例]
図4は、本発明の第1の実施の形態における特定対象物判定部240による特定対象物の判定処理の対象となる特定対象物の例を模式的に示す図である。なお、図4では、各特定対象物について1つの向きの姿勢のみを代表して示す。また、これらの各特定対象物を、特定対象物判定部240による特定対象物の判定処理の対象とする場合には、各特定対象物に対応する特定対象物情報が、特定対象物情報記憶部300に記憶される。このように、特定対象物として、図3に示す手の姿勢以外に、各種の手の姿勢を用いることができる。
また、特定対象物情報記憶部300の記憶内容は、ユーザにより変更可能とするようにしてもよい。例えば、図1に示す撮像装置110によりユーザの所望の特定対象物(例えば、所望の姿勢をした手)を撮像してその特定対象物の画像を生成し、情報処理装置200がその画像に基づいて特定対象物判定情報を生成する。このように生成された特定対象物判定情報を特定対象物判定情報303に記憶するとともに、この特定対象物判定情報に対応する制御信号生成情報(例えば、ボリューム調整)をユーザが設定するようにしてもよい。これにより、ユーザの好みに応じて、電子機器120をさらに容易に操作することができる。
[評価値保持部の保持内容例]
図5は、本発明の第1の実施の形態における評価値保持部260の保持内容を模式的に示す図である。評価値保持部260には、対象領域情報261と、対象領域の動きの向き情報264と、特定対象物識別情報265と、評価値266とが関連付けて保持される。
対象領域情報261には、動き検出部220により動きが検出された対象領域に関する情報として、位置情報262およびサイズ情報263が保持される。位置情報262には、対象画像における対象領域の位置が保持される。この対象領域の位置として、例えば、対象領域に対応する矩形の左上隅の位置が保持される。サイズ情報263には、対象画像における対象領域の大きさが保持される。この対象領域の大きさとして、例えば、対象領域に対応する矩形の水平方向および垂直方向の長さ(例えば、その矩形の水平方向および垂直方向の各画素数)が保持される。この対象領域の位置およびサイズにより、対象画像における対象領域を特定することができる。なお、図5では、位置情報262およびサイズ情報263に保持される各情報の図示を省略する。
対象領域の動きの向き情報264には、対象領域において検出された動きの向きが保持される。また、動きが検出されなくなった対象領域については、その対象領域に特定対象物が含まれている間は、最後に検出された動きの向きが対象領域の動きの向き情報264に保持される。
対象領域の動きの向き情報264には、対象領域において検出された動きの向きを示す情報が格納される。この動きの向きは、図3に示す対象領域の動きの向き情報301に対応するものである。すなわち、この動きの向きは、動き検出部220により検出される動きの向きに対応するものであり、例えば、動きベクトルにより特定される向きである。
特定対象物識別情報265には、対象領域において動きが検出された特定対象物を識別するための識別情報が保持される。この特定対象物識別情報は、図3に示す特定対象物識別情報302に対応するものであり、例えば、対象領域において動きが検出された特定対象物の種類に応じて#1、#22等が保持される。
評価値266には、対象領域において特定対象物の動きが最初に検出されてから、その対象領域にその特定対象物が含まれることが判定され続けている間に、所定の演算処理によりその対象領域について算出された評価値が保持される。この評価値については、評価値算出部250に順次供給され、評価値の算出処理に用いられる。なお、図5では、評価値266に保持される各評価値の図示を省略する。
ここで、例えば、1人が左右の手を用いてジェスチャーを行う場合や、複数人がそれぞれの手を用いてジェスチャーを行う場合が想定される。このため、本発明の第1の実施の形態では、対象画像における複数の対象領域において特定対象物の動きが検出された場合には、各対象領域に関する評価値等を評価値保持部260に保持させる。
[特定対象物の検出例]
図6は、本発明の第1の実施の形態における画像入力部210に入力された画像と、この画像において動きが検出された特定対象物との関係を示す図である。図6(a)には、撮像装置110により生成されて画像入力部210に入力された画像400を示す。画像400には、特定の姿勢をした状態で手を移動させている人物401が含まれている。
図6(b)には、画像400に含まれる人物401の手が、特定対象物として検出された状態を模式的に示す。図6(b)に示す例では、特定対象物として検出された人物401の手を太線の枠402で囲んだ状態を示す。この枠402は、対象領域に対応するものとする。以下では、特定対象物の検出方法について説明する。
[動きベクトルの検出例]
図7は、本発明の第1の実施の形態における動き検出部220による動きベクトル検出処理の対象となる領域(対象領域)の設定方法の概略を示す図である。なお、動きベクトル検出処理により動きが検出された対象領域については、その位置および大きさが評価値保持部260に保持される。
図7(a)乃至(d)には、図6(a)に示す画像400について、対象領域411乃至414を設定する場合における遷移を示す。図7(a)乃至(d)の左側の画像では、対象領域411乃至414の動きベクトル検出処理における開始時の設定位置を太い実線で示す。また、図6(a)乃至(d)の右側の画像では、対象領域411乃至414の動きベクトル検出処理における終了時の設定位置を太い実線で示す。なお、1つの対象領域について動きベクトル検出処理の終了後には、図6(a)乃至(d)に示すように、一定の規則により拡大させた対象領域を用いて、新たな動きベクトル検出処理が開始される。そして、対象領域が一定の大きさに拡大されるまで、動きベクトル検出処理が行われる。
図6(a)に示す画像400について、動きベクトル検出の処理対象となる画像を特定する場合には、図7(a)に示すように、動き検出部220が画像400の左上隅に対象領域411を設定する。続いて、動き検出部220が、対象領域411に含まれる画像について動きベクトル検出処理を行う。この動きベクトル検出処理については、図8を参照して詳細に説明する。
続いて、動き検出部220が、対象領域411を右側方向(矢印421方向)に所定数の画素分(例えば、s画素分)だけシフトさせて、対象領域411内に含まれる画像について動きベクトル検出処理を行う。以降も同様にして、対象領域411が所定数の画素分だけ右側方向に順次シフトされて、対象領域411内に含まれる画像について動きベクトル検出処理が行われる。なお、図7(a)では、対象領域411を矢印421方向にs画素分だけシフトさせた場合における位置431と、この位置431を矢印421方向にs画素分だけシフトさせた場合における位置432とのそれぞれに対応する矩形を点線で示す。
そして、画像400の右端の位置415に対象領域411がシフトされて対象領域に含まれる画像について動きベクトル検出処理が行われると、対象領域411が所定数の画素分(例えば、r画素分)だけ下側にシフトされるとともに画像400の左端に設定される。すなわち、対象領域411が矢印422方向にシフトされる。なお、所定数sおよびrについては、同一の値とするようにしてもよく、異なる値とするようにしてもよい。
続いて、画像400の左端に設定直後の対象領域411に含まれる画像について動きベクトル検出処理が行われる。この処理後に、対象領域411が所定数の画素分だけ右側方向に順次シフトされて、対象領域411に含まれる画像について動きベクトル検出処理が順次行われる。
以下、同様に対象領域411に含まれる画像について動きベクトル検出処理が順次行われる。そして、画像400の左端および下端の位置416に対象領域411が設定されて対象領域411に含まれる画像について動きベクトル検出処理が行われる。続いて、画像400の右端および下端の位置417にシフトされて対象領域411に含まれる画像について動きベクトル検出処理が行われると、対象領域411に関する動きベクトル検出処理を終了する。
また、図7(b)乃至(d)に示すように、対象領域412乃至414についても同様に、対象領域412乃至414に含まれる画像について動きベクトル検出処理が順次行われる。すなわち、画像400の右端および下端の位置にシフトされて対象領域に含まれる画像について動きベクトル検出処理が行われると、その対象領域に関する動きベクトル検出処理を終了し、次の対象領域に関する動きベクトル検出処理を開始する。ここで、対象領域412乃至414を右側方向にシフトさせる画素の所定数については、例えば、対象領域411と同一の値とするようにしてもよく、各大きさに応じて変更するようにしてもよい。同様に、対象領域412乃至414を下側方向にシフトさせる画素の所定数についても、例えば、対象領域411と同一の値とするようにしてもよく、各大きさに応じて変更するようにしてもよい。
なお、この例では、対象画像において対象領域の大きさを変更しながら、動きベクトルを検出する例を示した。ただし、例えば、撮像装置110と人物140との距離が一定であり、特定対象物が一定の大きさとなることが想定される場合には、対象領域の大きさを一定として動きベクトルを検出するようにしてもよい。また、この例では、対象画像において対象領域を重複させながら、動きベクトルを検出する例を示したが、対象領域が重複しないようにして、動きベクトルを検出するようにしてもよい。このようにすることにより、動きベクトル検出処理を迅速に行うことができる。
図8は、本発明の第1の実施の形態における動き検出部220により動きを検出する動き検出方法を模式的に示す図である。この例では、ブロックマッチング法により動きベクトルを検出する動きベクトル検出方法について説明する。このブロックマッチング法による動きベクトル検出方法は、動画を構成する対象画像および参照画像を比較することにより、対象画像における対象領域の動きベクトルを検出する方法である。具体的には、現フレーム(対象画像)と、時間軸において現フレームよりも前に位置する参照フレーム(参照画像)とを比較することにより、現フレームにおける対象領域の動きベクトルを検出する。すなわち、現フレームにおける対象領域と似ている領域が参照フレームのどこにあるかを探索することにより、現フレームにおける対象領域の動きベクトルを検出する。
図8(a)には、動きベクトルの検出対象となる現フレーム(対象画像)430と、時間軸において現フレームよりも前に位置する参照フレーム(参照画像)440とを示す。この参照フレーム440は、例えば、動画を構成する時間的に連続するフレームのうち、時間軸において現フレームから所定数前に位置するフレームである。また、図8(a)では、現フレーム430における対象領域431について、動きベクトルを検出する場合を例にして説明する。なお、対象領域431は、図7に示す対象領域の設定方法により設定されるものとする。
例えば、動き検出部220が、現フレーム430における対象領域431について動きベクトル検出処理を行う場合には、参照フレーム440において、対象領域431に対して想定される最大の動き量の大きさに対応する領域(サーチ領域442)を設定する。なお、図8(a)では、参照フレーム440において、現フレーム430における対象領域431の位置に対応する領域441と、サーチ領域442とを太線の矩形で示す。
そして、動き検出部220が、対象領域431に含まれる画像と、サーチ領域442に含まれる画像とを比較することにより、対象領域431の動きベクトルを算出する。例えば、動き検出部220が、サーチ領域442において、対象領域431と同じ大きさの領域(探索領域)を設定する。例えば、図8(a)に示すように、サーチ領域442において、点線の矩形で示す探索領域443乃至447が設定される。そして、動き検出部220が、設定された探索領域に含まれる画像と、対象領域431に含まれる画像とを順次比較することにより、対象領域431に含まれる画像と最も相関の高い探索領域を検出する。例えば、サーチ領域442において、対象領域431に含まれる画像と最も相関の高い探索領域を探索領域445とする。この場合には、参照フレーム440における探索領域445に含まれる被写体が、現フレーム430における対象領域431の位置に動いたと推定することができる。
そして、動き検出部220が、参照フレーム440における探索領域445と、現フレーム430における対象領域431との位置関係に基づいて、動きベクトルを算出する。このように算出された動きベクトル451を図8(b)に示す。
図8(b)には、現フレーム430における対象領域431について検出された動きベクトル451を示す。なお、図8(b)では、現フレーム430において、図8(a)に示す参照フレーム440におけるサーチ領域442および探索領域445に対応する領域を点線の矩形442および445で示す。
このように、ブロックマッチング法による動きベクトルの検出方法では、1つの対象領域について1つの動きベクトルを算出する。つまり、対象領域単位で、フレーム間の相関判定(マッチング判定)処理を行い、対象領域毎に動きベクトルが算出される。
なお、これらの動きベクトルの検出処理については、動画を構成する各フレームについて行うようにしてもよく、一定間隔毎のフレームについてのみ行うようにしてもよい。
[特定対象物の判定例]
図9は、本発明の第1の実施の形態における特定対象物情報選択部230による特定対象物情報の選択方法および特定対象物判定部240による特定対象物の判定方法の流れを模式的に示す図である。この例では、図3に示す特定対象物判定情報303に記憶されている8つの特定対象物情報のうちから、動き検出部220により検出された動きベクトルに基づいて、判定処理に用いられる特定対象物情報を選択する例を示す。また、このように選択された特定対象物情報を用いて、対象領域に特定対象物が含まれるか否かを判定する例を示す。
図9(a)には、動き検出部220により検出された動きベクトルを模式的に示す。図9(a)に示す現フレーム430と、対象領域431と、動きベクトル451とは、図8(b)に示すものと同一であるため、同一の符号を付して説明する。
ここで、対象領域において動きベクトルが検出された場合には、特定対象物情報選択部230が、その検出された動きベクトルの大きさが閾値以上であるか否かを判断する。そして、その検出された動きベクトルの大きさが閾値以上である場合には、特定対象物情報選択部230が、その検出された動きベクトルの向きに基づいて、判定処理に用いられる特定対象物情報を特定対象物情報記憶部300から選択する。なお、その検出された動きベクトルの大きさが閾値未満である場合には、その動きベクトルが検出された対象領域については、判定処理が行われないため、特定対象物情報選択部230による特定対象物情報の選択処理が行われない。
図9(b)には、特定対象物情報選択部230により選択された特定対象物情報の例を示す。なお、対象領域431について検出された動きベクトルの大きさは、閾値以上であるものとする。また、図9(a)に示すように、対象領域431について検出された動きベクトル451の向きは左向き(図面では右向き)である。このため、特定対象物情報選択部230が、図3に示す特定対象物情報記憶部300に格納されている8つの特定対象物判定情報のうちから、対象領域の動きの向き情報301の「左」に対応する2つの特定対象物判定情報を選択する。図9(b)では、選択された2つの特定対象物判定情報453および454を点線の矩形452で囲んで示す。
図9(c)には、特定対象物情報選択部230により選択された特定対象物判定情報を用いて、特定対象物判定部240により行われる判定処理を模式的に示す。図9(c)に示すように、特定対象物情報選択部230により選択された2つの特定対象物判定情報453および454と、この選択処理の基準となった動きベクトルが検出された対象領域431に含まれる画像とが判定処理の対象となる。すなわち、特定対象物判定部240が、2つの特定対象物判定情報453および454と、対象領域431に含まれる画像とのそれぞれについて判定処理を行う。すなわち、特定対象物判定部240が、対象領域431に含まれる画像に、特定対象物判定情報453および454に対応する特定対象物の何れかが含まれるか否かを判定する。
図9(d)には、特定対象物判定部240による判定処理の判定結果を模式的に示す。例えば、図9(d)に示すように、特定対象物判定部240が、対象領域431に含まれる画像に、特定対象物判定情報454に対応する特定対象物が含まれると判定する。このように対象領域に含まれる画像に特定対象物が含まれると判定された場合には、特定対象物判定部240が、その判定結果を評価値算出部250に出力する。そして、評価値算出部250が、その判定結果に基づいて、対象領域431に関する評価値を算出する。
なお、対象領域に含まれる画像に特定対象物の何れも含まれていないと判定された場合についても、その判定結果が評価値算出部250に出力される。この場合には、評価値算出部250が、対象領域431に関する評価値の算出処理を終了する。
以上では、各対象領域について動きベクトルの検出処理を行い、一定の大きさの動きベクトルが検出された各対象領域について判定処理を行う例を示した。しかしながら、同一フレームにおける重複する複数の対象領域において動きベクトルが検出されることも想定される。この場合には、これらの動きベクトルのうち、大きさの値が最も大きい動きベクトルが検出された対象領域のみについて判定処理を行うようにしてもよい。または、これらの動きベクトルの各対象領域について判定処理を順次行い、各判定処理のうち、最も特定対象物に近いと判定された対象領域のみについて評価値を算出するようにしてもよい。これにより、同一の特定対象物について、複数の評価値が算出されることを防止することができる。
[評価値の算出例]
図10は、本発明の第1の実施の形態における特定対象物判定部240による判定処理の対象となる対象画像(現フレーム)に含まれる被写体の遷移例を示す図である。図10(a)乃至(c)には、右手460の親指を水平方向に立てた状態で、そのユーザの左側(図10では右側)に右手460を移動させている状態の遷移を示す。図10(d)には、図10(c)に示す位置に移動させた後に、その位置で右手460を停止させた状態を示す。図10(e)には、図10(d)に示す状態を一定時間維持した後に、右手460を開いた状態を示す。なお、図10(a)乃至(e)に示す横軸(H1乃至H5)は、右手460の現フレームにおける水平方向の位置を示す。また、図10(a)乃至(e)の遷移に要する時間は、時刻T=t1乃至t5までの時間であるものとする。
最初に、図10(a)に示すように、右手460の親指を水平方向に立てた状態で、ユーザの左側に右手460を移動させる(T=t1)。すなわち、親指を水平方向に立てた右手460を位置H1から位置H3まで矢印461の方向に移動させる。このように、移動させることにより、動き検出部220により、右手460の動きが検出される。この検出された動きベクトルの大きさは、閾値以上であるものとする。このように、動き検出部220により動きが検出された場合には、この検出された動きの向きに応じた特定対象物判定情報が特定対象物情報選択部230により選択される。例えば、図9(b)に示すように、特定対象物判定情報が選択される。続いて、特定対象物判定部240が、選択された特定対象物判定情報を用いて、動きが検出された対象領域に特定対象物が含まれるか否かを判定する。この場合には、図10(a)に示す右手460に対応する特定対象物が含まれることが判定されるものとする。
続いて、図10(b)に示すように、右手460の親指を水平方向に立てた状態で、ユーザの左側に右手460を移動させる(T=t2)。すなわち、親指を水平方向に立てた右手460を位置H3から位置H5まで矢印462の方向に移動させる。このように、右手460の移動を継続して行うことにより、図10(a)と同様に、動き検出部220により右手460の動きが順次検出され、この検出された動きの向きに応じた特定対象物判定情報が特定対象物情報選択部230により順次選択される。この検出された動きベクトルの大きさは、閾値以上であるものとする。続いて、特定対象物判定部240が、選択された特定対象物判定情報を用いて、動きが検出された対象領域に特定対象物が含まれるか否かを判定する。この場合についても、図10(b)に示す右手460に対応する特定対象物が含まれることが判定されるものとする。
続いて、図10(c)に示すように、位置H5まで移動させた後に、親指を水平方向に立てた状態で右手460をユーザが停止させる(T=t3)。この場合における右手460は、図10(a)および(b)に示す状態と同一とする。なお、図10(a)乃至(c)に示す移動については、その速度を一定とするようにしてもよく、一定としなくてもよい。ただし、その移動の開始時において、検出された動きベクトルの大きさが閾値以上となるようにする必要がある。
続いて、図10(d)に示すように、位置H5で、右手460を停止させた状態を維持する(T=t4)。この場合における右手460は、図10(a)乃至(c)に示す状態と同一とする。
このように、右手460の移動が停止することにより、動き検出部220により右手460の動きが検出されない。このように動きが検出されない場合には、その動きが検出された対象領域について、時間軸における前に検出された動きの向きに応じた特定対象物判定情報が特定対象物情報選択部230により選択される。すなわち、特定対象物情報選択部230が、その動きが検出された対象領域に対応して評価値保持部260の対象領域の動きの向き情報264に保持されている向きを取得し、この向きに応じた特定対象物判定情報を特定対象物情報記憶部300から選択する。なお、その動きが検出された対象領域に対応して評価値保持部260の評価値266に保持されている評価値が閾値未満である場合には、特定対象物判定情報の選択処理を行わず、その対象領域に関する評価値の算出処理を終了するようにしてもよい。
続いて、特定対象物判定部240が、選択された特定対象物判定情報を用いて、時間軸における前に動きが検出された対象領域に特定対象物が含まれるか否かを判定する。この場合についても、図10(a)に示す右手460に対応する特定対象物が含まれることが判定されるものとする。
続いて、図10(e)に示すように、位置H5で、右手460の状態を変化させる(T=t5)。例えば、図10(e)に示すように、右手460を開いた状態とする。
この場合についても同様に、特定対象物判定部240が、選択された特定対象物判定情報を用いて、時間軸における前に動きが検出された対象領域に特定対象物が含まれるか否かを判定する。この場合には、図10(a)乃至(d)に示す右手460に対応する特定対象物と同一の特定対象物が、含まれないことが判定される。
図11は、本発明の第1の実施の形態における評価値算出部250による評価値算出の流れを示すシーケンスチャートである。図11に示す例では、動き検出部220と、特定対象物判定部240と、評価値算出部250と、評価値保持部260との関係を概略的に示す。また、図11において、縦軸は時間軸を示す。なお、図11に示すシーケンスチャートは、図10に対応するものであり、図11に示す時刻t1乃至t5が、図10に示す時刻t1乃至t5に対応する。
図10(a)乃至(c)に示すように、時刻t1において、動き検出部220により動きが検出された後、時刻t3まで継続して動き検出部220により動きが検出される。この場合には、動きが検出された対象領域に特定対象物が含まれることが特定対象物判定部240により判定される。すなわち、動きが検出された対象領域から特定対象物が検出され続ける。このように、動きが検出された対象領域から特定対象物が検出され続ける場合には、この特定対象物の検出時間に応じて、評価値算出部250が、その対象領域に関する評価値の算出処理を行い、この算出処理の結果を評価値保持部260に順次保持させる。この評価値の算出処理では、直前の判定処理により同一の特定対象物が含まれると判定された対象領域について算出された評価値を用いて、現在の判定処理に関する評価値の算出が行われる。すなわち、評価値算出部250が、算出処理の結果を評価値保持部260に順次保持させ、次の算出処理では、評価値保持部260に保持された直前までの評価値を用いた算出処理が行われる。この場合に、評価値保持部260の対象領域情報261に基づいて、同一の特定対象物が含まれる対象領域に関する評価値が取得され、この取得された評価値が用いられる。
ここで、図10(a)乃至(c)に示すように、動き検出部220により動きが検出されている場合には、同一の特定対象物が含まれる対象領域が移動する。このため、直前の評価値算出処理により保持された評価値保持部260の対象領域情報261が、現在の評価値算出処理に係る対象領域に関する情報とは異なる。そこで、動き検出部220により動きが検出されている場合には、この検出された動きの大きさおよび向きを考慮して、同一の特定対象物が含まれる対象領域に関する評価値が評価値保持部260から取得され、この取得された評価値が用いられる。
例えば、図8(b)に示すように、動きベクトル451が検出され、対象領域431について評価値の算出処理を行う場合には、動きベクトル451の大きさおよび向きだけ戻った位置に対応する対象領域に関する評価値が評価値保持部260から取得される。すなわち、図8(a)に示す参照フレームにおける点線の矩形445の位置に対応する対象領域に関する評価値が評価値保持部260から取得される。そして、この取得された評価値が、対象領域431に関する評価値の算出処理に用いられる。なお、検出された動きベクトルに誤差が生じて、動きベクトルの大きさおよび向きだけ戻った位置に対応する対象領域に関する評価値が評価値保持部260に保持されていない場合が想定される。この場合には、その動きベクトルの大きさおよび向きだけ戻った位置に最も近い位置に対応する対象領域に関する評価値が取得される。
ここで、評価値算出部250により算出される評価値Eは、例えば、評価値保持部260に保持されている評価値を評価値E1とし、単位時間当たり加算される所定値を値P1とする場合には、次の式で求めることができる。
評価値E=E1+P1=t×P1
ここで、tは、同一の特定対象物が検出され続けた時間を示す。
また、評価値Eは、例えば、評価値保持部260に保持されている評価値を評価値E1とし、所定値を値P2とし、特定対象物判定部240による判定処理の際に算出された相関値を相関値C1とする場合には、次の式で求めることができる。
評価値E=E1+P2×C1
ここで、相関値は、例えば、特定対象物判定部240による判定処理の際に算出される類似度の程度を示す値である。
このように評価値算出部250により算出された評価値は、評価値保持部260に保持される。そして、評価値保持部260に保持されている評価値が、制御信号生成部270に順次供給される。
また、図10(c)および(d)に示すように、時刻t3以降は、動き検出部220により動きが検出されない。しかしながら、時刻t3まで動きが検出された対象領域については、特定対象物判定部240による判定処理が継続して行われる。また、この判定処理において、時刻t5までの間、特定対象物が継続して検出される。このように、動きが検出された対象領域から特定対象物が検出され続ける場合には、この特定対象物の検出時間に応じて、評価値算出部250が、その対象領域に関する評価値の算出処理を行い、この演算処理の結果を評価値保持部260に順次保持させる。なお、動きが検出されなくなった対象領域については、その対象領域に関する直前までの評価値(評価値保持部260に保持されている)が閾値未満である場合には、評価値算出部250が、その対象領域に関する評価値の算出処理を終了するようにしてもよい。
また、図10(e)に示すように、時刻t5において、時刻t3まで動きが検出された対象領域から同一の特定対象物の検出がされなくなる。このように、動きが検出された対象領域から同一の特定対象物が検出されなくなった場合には、評価値算出部250が、その対象領域に関する評価値の算出処理を終了する。このように評価値の算出処理が終了した場合には、評価値算出部250がその旨を制御信号生成部270に通知し、評価値保持部260に保持されているその対象領域に関する直前までの評価値が制御信号生成部270に供給される(矢印471)。そして、評価値算出部250が、その対象領域に関する評価値を評価値保持部260から消去する。
[制御信号の生成例]
図12は、本発明の第1の実施の形態における制御信号生成部270による制御信号の生成方法を模式的に示す図である。図12では、図3に示す特定対象物情報記憶部300の特定対象物判定情報303のうち、4つの特定対象物判定情報(#1、#2、#31、#32)を例にして説明する。
図12(a)乃至(d)には、各特定対象物判定情報を用いた判定処理の判定結果に基づいて評価値算出部250により算出される評価値の範囲と、その算出された評価値に基づいて生成される制御信号との関係を示す。なお、図12(a)には「#1」に対応する特定対象物判定情報に関する例を示し、図12(b)には「#31」に対応する特定対象物判定情報に関する例を示す。また、図12(c)には「#2」に対応する特定対象物判定情報に関する例を示し、図12(d)には「#32」に対応する特定対象物判定情報に関する例を示す。
ここで、図12(a)乃至(d)では、特定対象物判定情報と、この特定対象物判定情報ついて算出される評価値の範囲とを並べて示す。なお、図12(a)乃至(d)では、各評価値の範囲を同一の大きさで示すが、各評価値の範囲については、例えば、特定対象物毎に異なる範囲を設定するようにしてもよく、全ての特定対象物について同一の範囲を設定するようにしてもよい。なお、図12(a)乃至(d)に示す各評価値の最大値をM1乃至M4で示す。
図12(a)に示すように、制御信号生成部270が、「#1」に対応する特定対象物判定情報について算出された評価値に基づいて制御信号を生成する場合には、その評価値が閾値TH1を超えたか否かを判断する。そして、その評価値が閾値TH1を超えた場合には、制御信号生成部270が、電子機器120の電源をオンするための操作を行う制御信号を生成し、制御信号出力部280に出力する。この制御信号の生成は、例えば、評価値算出部250により算出されて評価値保持部260に保持されている評価値が、閾値TH1を超えた際に行うようにしてもよく、評価値の算出処理が終了した旨を評価値算出部250から受けた際に行うようにしてもよい。一方、その評価値が閾値TH1を超えていない場合には、制御信号生成部270が制御信号を生成しない。なお、その評価値が閾値TH1を超えていない場合には、制御信号生成部270が電子機器120の電源操作なしの制御信号を生成するようにしてもよい。
また、図12(b)では、制御信号生成部270が、「#31」に対応する特定対象物判定情報について算出された評価値に基づいて制御信号を生成する場合における一例を示す。なお、この制御信号の生成については、閾値TH2および制御信号の種類が異なる以外は、図12(a)に示す例と略同様であるため、ここでの説明を省略する。
図12(c)に示すように、制御信号生成部270が、「#2」に対応する特定対象物判定情報について算出された評価値に基づいて制御信号を生成する場合には、その評価値が閾値TH3を超えたか否かを判断する。そして、その評価値が閾値TH3を超えた場合には、制御信号生成部270が、電子機器120の音量を上昇させるための操作を行う制御信号を生成し、制御信号出力部280に出力する。ここで、音量の上昇操作については、電源のオン、オフとは異なり、多段階の操作を行うことが多い。そこで、この制御信号は、例えば、評価値算出部250により算出されて評価値保持部260に保持されている評価値が、閾値TH3を超えた後に、評価値の大きさに応じて順次生成することができる。また、評価値の算出処理が終了した旨を評価値算出部250から受けた後に、その時点の評価値の大きさに応じて、制御信号の生成を行うようにしてもよい。一方、その評価値が閾値TH3を超えていない場合には、制御信号生成部270が制御信号を生成しない。なお、その評価値が閾値TH3を超えていない場合には、制御信号生成部270が電子機器120の音量操作なしの制御信号を生成するようにしてもよい。
また、図12(d)では、制御信号生成部270が、「#32」に対応する特定対象物判定情報について算出された評価値に基づいて制御信号を生成する場合における一例を示す。なお、この制御信号の生成については、閾値TH4および制御信号の種類が異なる以外は、図12(c)に示す例と略同様であるため、ここでの説明を省略する。
このように、各制御信号の生成処理において、評価値が閾値以上である場合にのみ、制御信号を生成するようにすることにより、ノイズに対する信頼性を高めることができる。なお、以上で示した制御信号を生成するタイミングおよび閾値TH1乃至TH4については、ユーザ操作により設定するようにしてもよい。
[情報処理装置の動作例]
図13は、本発明の第1の実施の形態における情報処理装置200による制御信号生成処理の処理手順を示すフローチャートである。この例では、フレーム(対象画像)単位で制御信号生成処理を行う例について説明する。
最初に、動き検出部220が、対象画像において対象領域を設定する(ステップS901)。例えば、図7に示すように、対象画像において対象領域が設定される。続いて、動き検出部220が、設定された対象領域について動きベクトルを検出する動きベクトル検出処理を行う(ステップS902)。なお、ステップS902は、特許請求の範囲に記載の動き検出手順の一例である。
続いて、検出された動きベクトルの大きさが閾値以上であるか否かが判断される(ステップS903)。そして、その大きさが閾値以上である場合には(ステップS903)、特定対象物情報選択部230が、検出された動きベクトルの向きに基づいて、特定対象物情報記憶部300から特定対象物判定情報を選択する(ステップS904)。
続いて、特定対象物判定部240が、選択された特定対象物判定情報を用いて、設定された対象領域に特定対象物が含まれるか否かを判定する判定処理を行う(ステップS905)。なお、ステップS905は、特許請求の範囲に記載の特定対象物判定手順の一例である。続いて、その判定処理により算出される相関値が、閾値以上であるか否かが判断される(ステップS906)。すなわち、設定された対象領域に特定対象物が含まれるか否かが判断される。そして、その判定処理により算出される相関値が、閾値以上である場合には(ステップS906)、評価値算出部250が、評価値算出処理を行う(ステップS920)。この評価値算出処理については、図14を参照して詳細に説明する。なお、その判定処理により算出される相関値が、閾値未満である場合には(ステップS906)、ステップS912に進む。
続いて、評価値算出部250が、新たに算出された評価値、この評価値の算出対象となった対象領域の位置および大きさ、この対象領域において動き検出部220により検出された動きの向き等を評価値保持部260に保持させる(ステップS907)。すなわち、設定された対象領域に関する評価値保持部260の内容が更新される。続いて、制御信号生成部270が、制御信号生成処理を行う(ステップS930)。なお、制御信号生成処理については、図15を参照して詳細に説明する。なお、ステップS920、S930は、特許請求の範囲に記載の制御信号生成手順の一例である。
続いて、対象画像における全ての対象領域について動きベクトルの検出処理が終了したか否かが判断される(ステップS908)。対象画像における全ての対象領域について動きベクトルの検出処理が終了した場合には、1つの対象画像についての制御信号生成処理の動作を終了する。一方、対象画像における全ての対象領域について動きベクトルの検出処理が終了していない場合には(ステップS908)、ステップS901に戻る。
また、検出された動きベクトルの大きさが閾値未満である場合には(ステップS903)、特定対象物情報選択部230が、設定された対象領域の位置に対応する評価値を評価値保持部260から取得する(ステップS909)。続いて、特定対象物情報選択部230が、取得された評価値が閾値以上であるか否かを判断する(ステップS910)。取得された評価値が閾値以上である場合には(ステップS910)、特定対象物情報選択部230が、取得された評価値に対応する向きに基づいて、特定対象物情報記憶部300から特定対象物判定情報を選択し(ステップS911)、ステップS905に進む。一方、取得された評価値が閾値未満である場合には(ステップS910)、評価値算出部250が、取得された評価値に関する評価値保持部260の内容を初期化し(ステップS912)、ステップS901に戻る。
図14は、本発明の第1の実施の形態における情報処理装置200による制御信号生成処理の処理手順のうちの評価値算出処理(図13に示すステップS920の処理手順)を示すフローチャートである。
最初に、設定された対象領域から動きベクトルが検出されたか否かが判断される(ステップS921)。その動きベクトルが検出された場合には(ステップS921)、評価値算出部250が、検出された動きベクトルの大きさおよび向きに基づいて、同一の特定対象物が含まれる対象領域に関する評価値を評価値保持部260から取得する(ステップS922)。一方、設定された対象領域から動きベクトルが検出されていない場合には(ステップS921)、評価値算出部250が、設定された対象領域の位置に対応する評価値を評価値保持部260から取得する(ステップS923)。
続いて、評価値算出部250が、取得された評価値を用いて、設定された対象領域に関する新たな評価値を算出する(ステップS924)。
図15は、本発明の第1の実施の形態における情報処理装置200による制御信号生成処理の処理手順のうちの制御信号生成処理(図13に示すステップS930の処理手順)を示すフローチャートである。この例では、向き、ボリューム、バイナリ値に関する制御信号を生成する例を示す。
最初に、制御信号生成部270が、設定された対象領域に対応する評価値を評価値保持部260から取得する(ステップS931)。
続いて、制御信号生成部270が、取得された評価値は向きに関する評価値であるか否かを判断する(ステップS932)。その取得された評価値が向きに関する評価値である場合には(ステップS932)、制御信号生成部270が、その取得された評価値が閾値以上であるか否かを判断する(ステップS933)。その取得された評価値が閾値以上である場合には(ステップS933)、その取得された評価値に関連付けて評価値保持部260に保持されている向きに基づいて、向きに関する制御信号を生成する(ステップS934)。一方、その取得された評価値が閾値未満である場合には(ステップS933)、向きに関する制御信号を生成せずに、制御信号生成処理の動作を終了する。
また、その取得された評価値が向きに関する評価値でない場合には(ステップS932)、制御信号生成部270が、取得された評価値はボリュームに関する評価値であるか否かを判断する(ステップS935)。その取得された評価値がボリュームに関する評価値である場合には(ステップS935)、制御信号生成部270が、その取得された評価値が閾値以上であるか否かを判断する(ステップS936)。その取得された評価値が閾値以上である場合には(ステップS936)、その取得された評価値に基づいて、ボリュームに関する制御信号を生成する(ステップS937)。一方、その取得された評価値が閾値未満である場合には(ステップS936)、ボリューム「0」に関する制御信号を生成する(ステップS938)。
また、その取得された評価値がボリュームに関する評価値でない場合には(ステップS935)、制御信号生成部270が、取得された評価値はバイナリ値に関する評価値であるか否かを判断する(ステップS939)。その取得された評価値がバイナリ値に関する評価値である場合には(ステップS939)、制御信号生成部270が、その取得された評価値が閾値以上であるか否かを判断する(ステップS940)。その取得された評価値が閾値以上である場合には(ステップS940)、バイナリ値「1」に関する制御信号を生成する(ステップS941)。一方、その取得された評価値が閾値未満である場合には(ステップS940)、バイナリ値「0」に関する制御信号を生成する(ステップS942)。
なお、位置に関する制御信号を生成する場合には、向きに関する評価値を生成する場合と略同様とすることができる。すなわち、位置に関する評価値が閾値以上であるか否かを判断し、その評価値が閾値以上である場合には、その取得された評価値に関連付けて評価値保持部260に保持されている位置情報に基づいて、位置に関する制御信号を生成する。
このように、本発明の第1の実施の形態では、動きが検出された対象領域毎に特定対象物の判定処理を順次行い、この判定結果に基づいて所定の演算を順次行うことにより、時間的に累積した評価値を算出する。そして、この評価値に基づいて電子機器を制御するための制御信号を生成する。このように、時間的に累積した評価値を用いて制御信号を生成することにより、一時的なノイズによる誤検出を防止し、物体の動きを用いた操作入力の精度を高めることができる。
また、本発明の第1の実施の形態では、動きが検出された対象領域については、その動きが検出されなくなった後でも、その対象領域から特定対象物が検出されなくなるまで、特定対象物の判定処理を継続して行い、評価値を算出する。これにより、例えば、電子機器のボリューム操作を行う場合には、そのボリューム操作に係る手の動きをした後に、その手を停止させた状態でも、そのボリューム操作を継続して行うことができる。すなわち、所望の操作を続ける場合でも、その操作に係る手の動きを継続して行う必要がなく、一つの操作を継続する時間を大幅に増加させることができる。
また、本発明の第1の実施の形態では、動きが検出された対象領域について特定対象物の判定処理を行う場合に、その動きの向きに応じた特定対象物判定情報を用いて判定処理を行うことができる。また、動きが検出された対象領域について、その後動きが検出されなくなった場合には、最後に検出された動きの向きに応じた特定対象物判定情報を用いて判定処理を行うことができる。これにより、1つの対象領域について判定処理を行う際に用いられる特定対象物判定情報を低減させることができるため、判定処理に係るメモリ量や回路規模を大幅に低減することができ、その判定処理を迅速に行うことができる。また、検出された動きの向きに応じた特定対象物判定情報を用いて判定処理を行うため、判定処理の誤検出を低減させることができる。これにより、物体の動きを用いた操作入力の精度を高めることができる。
また、本発明の第1の実施の形態では、単眼カメラにより生成された画像データを用いて制御信号を生成することができるため、ステレオカメラ等を使用する場合と比較して、製造コストを低減させることができる。
なお、本発明の第1の実施の形態では、1つの特定対象物と、1つの制御信号とを関連付ける例を示したが、1つの制御信号に対して、複数の特定対象物を関連付けて、制御信号を生成するようにしてもよい。これにより、動きが検出された対象領域に含まれる特定対象物の姿勢が、一定の変化をした場合でも、これらの変化の前後でその対象領域に関する評価値の算出を継続して行うことができる。
[情報処理システムの適用例]
図16乃至図18は、本発明の第1の実施の形態における情報処理システム100を各電子機器に適用する場合の例を模式的に示す図である。なお、図16および図17に示す撮像装置110および情報処理装置200については、情報処理装置200から出力される制御信号以外は、図1に示す例と同様であるため、以下での詳細な説明を省略する。また、以下では、人物140が各電子機器を操作する例を示す。
図16(a)には、情報処理装置200に接続される電子機器をテレビジョン801とした場合における情報処理システム800を示す。図16(a)では、テレビジョン801の上面に撮像装置110が設置されている場合を例にして示す。テレビジョン801は、例えば、動画録画機能および動画再生機能を備える映像視聴装置であるものとする。この例では、人物140による手のジェスチャーにより、テレビジョン801の電源のオン/オフ、チャネルの切替、音量調整、画質調整、録画予約、録画記録指示、録画再生指示、方向指定によるカーソルやポインタの操作等を行うことができる。これにより、人物140が、テレビジョン801を用いて、各種テレビ番組や録画された動画(例えば、映画)を見る場合に、リモコン等の操作機器を用いずに、テレビジョン801から離れた状態で、各種操作を容易に行うことができる。すなわち、テレビジョン801を用いて各種映像を見ている状態で、自分自身の体のみを用いて、操作を行うことができる。
図16(b)には、情報処理装置200に接続される電子機器をテレビゲーム装置803とした場合における情報処理システム802を示す。テレビゲーム装置803は、表示装置804と接続され、表示装置804にゲーム内容を表示させるテレビゲーム装置である。図16(b)では、表示装置804の上面に撮像装置110が設置されている場合を例にして示す。また、テレビゲーム装置803は、人物140による操作入力に応じて、表示装置804における表示内容を制御する。表示装置804は、例えば、図16(b)に示すテレビジョン801を用いることができる。この例では、人物140による手のジェスチャーにより、テレビゲーム装置803の電源のオン/オフ、上下左右への移動操作、ボタン押下操作、音量調整、画質調整等を行うことができる。これにより、人物140が、テレビゲーム装置803を用いて、各種ゲームを楽しむ場合に、無線通信により接続されるコントローラ等の操作機器を用いずに、テレビゲーム装置803から離れた状態で、各種ゲーム操作を容易に行うことができる。これにより、コントローラ(例えば、機器自体の動きを検出して操作入力を行う操作リモコン)等の操作機器を用いて、ゲームを行う場合と比較して、さらに直感的な操作入力を実現することができる。さらに、ユーザ独自の操作入力を行うため、操作入力に関する登録(特定対象物情報、移動方向等)をユーザ毎に設定しておき、そのユーザ登録に応じて、操作入力を行うようにしてもよい。すなわち、ユーザの身体的な特徴(指先が器用、水平方向の動きが得意等)に応じて、ゲーム操作を行うことができる。
図17(a)には、情報処理装置200に接続される電子機器を照明装置806とした場合における情報処理システム805を示す。図17(a)では、撮像装置110および照明装置806が天井807に設置されている場合を例にして示す。また、この例では、人物140による手のジェスチャーにより、照明装置806の電源のオン/オフ、点滅制御、明るさの強度調整、タイマ設定等を行うことができる。これにより、人物140が、照明装置806の各種操作を行う場合に、リモコン等の操作機器を用いずに、照明装置806から離れた状態で、各種操作を容易に行うことができる。例えば、寝ている状態でも、手の動きのみにより、消灯操作を行うことができる。
図17(b)には、情報処理装置200に接続される電子機器をクレーンゲーム装置809とした場合における情報処理システム808を示す。クレーンゲーム装置809は、例えば、筐体内部に設置されているクレーン810を操作することにより、筐体内部に配置されている景品811を獲得するゲーム装置である。この例では、人物140による手のジェスチャーにより、クレーンゲーム装置809のクレーン810の水平面における移動操作や上下方向の移動操作(すなわち、モーターの回転方向の指定による操作)等を行うことができる。これにより、人物140が、クレーン810により景品811を獲得する場合に、各操作部材を用いずに、クレーンゲーム装置809から離れた状態で、各種操作を行いながら、ゲームを行うことができる。すなわち、クレーンゲーム装置809を行う場合に、ユーザの体の特徴的な動きを用いて操作を行うことができるため、各操作部材を用いて直接操作を行う場合と比較して、面白みを高めることができる。
図16および図17では、制御対象となる電子機器と、撮像装置110および情報処理装置200とが別体として構成されている例を示した。図18では、制御対象となる電子機器と、撮像装置110および情報処理装置200とが一体として構成されている例を示す。
図18(a)には、操作対象となる電子機器をデジタルスチルカメラ812とする例を示す。デジタルスチルカメラ812は、図1に示す撮像装置110および情報処理装置200を内蔵し、これらが一体で構成されている電子機器である。デジタルスチルカメラ812は、例えば、被写体を撮像して画像データ(静止画または動画)を生成し、この画像データを画像ファイルとして記録する撮像装置である。また、デジタルスチルカメラ812は、例えば、その位置を基準として、水平方向への移動(パンニング)および垂直方向への移動(チルチング)を自動で行うことが可能な撮像装置であるものとする。また、デジタルスチルカメラ812は、人物140による操作入力に応じて、各種制御が行われる。この例では、人物140による手のジェスチャーにより、デジタルスチルカメラ812の電源のオン/オフ、装置自体の水平方向または垂直方向の移動操作、ズーム操作、シャッターボタン押下操作等を行うことができる。例えば、シャッターボタン押下操作に対応するジェスチャーを決めのポーズとして設定することにより、ユーザの記念撮影では、常に同じ決めのポーズとする状態で撮影を行うことができる。これにより、人物140が、デジタルスチルカメラ812を用いて、静止画の撮影を行う場合に、リモコンやタイマ等の操作機器を用いずに、デジタルスチルカメラ812から離れた状態で、各種撮影操作を容易に行うことができる。また、他の撮影操作機能(例えば、笑顔時における撮影機能)との組合せにより、各種撮影操作(例えば、決めのポーズで笑顔となった際に撮影)を行うようにしてもよい。
図18(b)には、操作対象となる電子機器をロボット装置813とする例を示す。ロボット装置813は、図1に示す撮像装置110および情報処理装置200を内蔵し、これらが一体で構成されている電子機器である。ロボット装置813は、例えば、自動または手動操作により、平面上を移動して、所望の物体を掴むことが可能なロボット装置である。また、ロボット装置813は、人物140による操作入力に応じて、各種制御が行われる。この例では、人物140による手のジェスチャーにより、ロボット装置813の電源のオン/オフ、平面上における移動操作、所望の物体を掴む操作等を行うことができる。これにより、人物140が、ロボット装置813に所望の作業をさせる場合に、リモコンやタイマ等の操作機器を用いずに、ロボット装置813から離れた状態で、各種撮影操作を容易に行うことができる。また、他の操作機能(例えば、音の検知による移動機能)との組合せにより、各種操作を行うようにしてもよい。
このように、本発明の第1の実施の形態を位置、方向、ボリューム、スイッチ等の各種操作を行う電子機器に適用することができる。
<2.第2の実施の形態>
本発明の第1の実施の形態では、動きが検出された対象領域について同一の特定対象物の判定処理を順次行う例を示した。ここで、例えば、肩を中心として人間の手を回転させる場合のように、同じ動きを繰り返すことにより、操作入力を行うことも想定される。そこで、本発明の第2の実施の形態では、肩を中心にして腕を回す動きを利用して、操作入力を行う例を示す。
[手の動き例]
図19は、肩を中心として人間の手を回転させる場合における手の動きの例を示す図である。図19(a)には、人物550が、その肩を中心として右手で円551を描くように、右手を回転させた場合における右手の動きを模式的に示す。すなわち、図19(a)に示す例は、人物550を基準とした場合に、反時計回りに右手で円551を描くように、右手を回転させた場合における右手の動きの一例である。
図19(b)には、人物550が、その肩を中心として右手で円552を描くように、右手を回転させた場合における右手の動きを模式的に示す。すなわち、図19(b)に示す例は、人物550を基準とした場合に、時計回りに右手で円552を描くように、右手を回転させた場合における右手の動きの一例である。なお、図19(a)および(b)では、人物550の右腕の輪郭に対応する部分を点線で示す。また、これらの右手の動きの遷移については、図19(c)に示す。
図19(c)には、図19(a)および(b)に示す右手の動作を行う場合におけるその遷移を示す。この例では、図19(a)および(b)に示す例に対応させた場合における一定間隔毎の遷移を、人物550の姿勢561乃至568により示す。なお、図19(a)に示す右手の動作と、図19(b)に示す右手の動作とは、回転方向が異なる以外は略同一である。すなわち、図19(a)に示す右手の動作を行う場合には、人物550が姿勢561〜564〜568までの流れを繰り返す。一方、図19(b)に示す右手の動作を行う場合には、人物550が姿勢568〜564〜561までの流れを繰り返す。
ここで、図19(a)乃至(c)に示すように、肩を中心として人間の手を回転させる動作(いわゆる、腕をグルグルと回し続ける動作)については、対象領域について算出される動きの向きが頻繁に変更される。また、対象領域に含まれる特定対象物についても、腕の位置に応じて順次変更される可能性が高い。
そこで、本発明の第2の実施の形態では、肩を中心として人間の手を回転させる動き等のように、繰り返し行われる一連の動作については、動作の前後における向きの相関性の高さに基づいて、これらの一連の動作に関する評価値を算出する例を示す。これらの一連の動作は、所定の規則に応じた一連の動作である。
[情報処理装置の構成例]
図20は、本発明の第2の実施の形態における情報処理装置500の機能構成例を示すブロック図である。ここで、情報処理装置500は、本発明の第1の実施の形態における情報処理装置200の変形例であり、一連動作判定部510および向き相関情報記憶部600を設け、他の一部を変形したものである。このため、以下では、情報処理装置200と異なる部分を中心に説明し、情報処理装置200と共通する部分についての一部の説明を省略する。情報処理装置500は、特定対象物情報記憶部310と、一連動作判定部510と、特定対象物情報選択部520と、向き相関情報記憶部600とを備える。また、動き検出部220は、動き情報を一連動作判定部510に出力する。また、評価値保持部260は、保持されている対象領域に関する各情報と、その対象領域に関連付けて保持されている動きの向きを一連動作判定部510に供給する。
特定対象物情報記憶部310は、特定対象物の判定処理および制御信号の生成処理に用いられる複数の特定対象物情報を記憶するものであり、記憶されている特定対象物情報を特定対象物情報選択部230および制御信号生成部270に供給する。なお、特定対象物情報記憶部310に記憶されている特定対象物情報については、図21を参照して詳細に説明する。また、特定対象物情報記憶部310は、特許請求の範囲に記載の記憶部の一例である。
一連動作判定部510は、動き検出部220により動きが検出された物体が、所定の規則に応じた一連の動作を行っているか否かを判定するものである。具体的には、一連動作判定部510は、動き検出部220から出力された動きの向き(現在の動きの向き)と、評価値保持部260に保持されている動きの向き(直前に検出された動きの向き)とに基づいて、向き相関値を算出する。すなわち、一連動作判定部510は、現在の動きの向きと、直前に検出された動きの向きとが、向き相関情報記憶部600における記憶内容により特定される対応関係を有するか否かを判断する。そして、一連動作判定部510は、現在の動きの向きと、直前の動きの向きとが、その対応関係を有する場合には、向き相関値として「1」または「2」を算出する。一方、一連動作判定部510は、現在の動きの向きと直前の動きの向きとが、その対応関係を有しない場合には、向き相関値として「0」を算出する。すなわち、向き相関値として「1」または「2」が算出された場合には、所定の規則に応じた一連の動作を行っていることが判定され、向き相関値として「0」が算出された場合には、所定の規則に応じた一連の動作を行っていないことが判定される。そして、一連動作判定部510は、算出された向き相関値を特定対象物情報選択部520に出力する。
特定対象物情報選択部520は、一連動作判定部510から出力された向き相関値と、動き検出部220から出力された動き情報とに基づいて、特定対象物情報記憶部310から特定対象物判定情報を選択するものである。なお、特定対象物判定情報の選択方法については、図22を参照して詳細に説明する。また、特定対象物情報選択部520は、特許請求の範囲に記載の選択部の一例である。
向き相関情報記憶部600は、現在の動きの向きと、直前に検出された動きの向きとが、一定の対応関係を有するか否かを示す向き相関値を算出するための向き相関情報を記憶するものである。そして、向き相関情報記憶部600は、記憶されている向き相関情報を一連動作判定部510に供給する。なお、向き相関情報記憶部600における記憶内容については、図22を参照して詳細に説明する。
[特定対象物情報記憶部の記憶内容例]
図21は、本発明の第2の実施の形態における特定対象物情報記憶部310の記憶内容を模式的に示す図である。特定対象物情報記憶部310は、本発明の第1の実施の形態における特定対象物情報記憶部300の変形例であり、向き相関値311を設けた点と、1つの制御信号生成情報に対して複数の特定対象物判定情報が関連付けられている点が異なる。これらの点以外は、特定対象物情報記憶部310は、特定対象物情報記憶部300と略同様であるため、以下の説明では、図3に示す各情報と異なる部分を中心に説明し、共通する部分についての一部の説明を省略する。
特定対象物情報記憶部310には、向き相関値311と、特定対象物群識別情報312と、対象領域の動きの向き情報313と、特定対象物判定情報314と、制御信号生成情報315とが関連付けて記憶されている。なお、対象領域の動きの向き情報313、特定対象物判定情報314および制御信号生成情報315は、図3に示す同一名称の各情報に対応する。また、特定対象物群識別情報312は、図3に示す特定対象物識別情報302に対応する。
向き相関値311には、対象領域において算出された向き相関値を示す情報が格納される。この向き相関値は、一連動作判定部510により算出される向き相関値に対応するものである。すなわち、向き相関値「1」は、図19(a)に示すように、肩を中心として人間の手を反時計回りに回転させる動作が行われている場合に対応する。また、向き相関値「2」は、図19(b)に示すように、肩を中心として人間の手を時計回りに回転させる動作が行われている場合に対応する。また、向き相関値「0」は、肩を中心として人間の手を回転させる動作以外の動作(例えば、本発明の第1の実施の形態に示す場合と同様に直線状に移動する動作)に対応する。なお、相関値「0」に対応する各情報については、本発明の第1の実施の形態と略同様であるため、図21での図示を省略する。
特定対象物群識別情報312には、複数の特定対象物からなる特定対象物群を識別するための識別情報が格納される。特定対象物群識別情報312には、例えば、特定対象物の種類に応じて#51、#61等が格納される。
対象領域の動きの向き情報313には、対象領域において検出された動きの向きを示す情報が格納される。ここで、本発明の第2の実施の形態では、説明の容易のため、動き検出部220による検出対象となる向きを、上、下、左、右、右上、右下、左上、左下の8つの向きとする例について説明する。この8つの向きは、図19(c)に示す姿勢561乃至568に対応する。
特定対象物判定情報314には、特定対象物判定部240により行われる特定対象物の判定処理に用いられる特定対象物に関する特定対象物判定情報が格納される。ここで、本発明の第2の実施の形態では、上述したように、1つの制御信号生成情報に対して複数の特定対象物判定情報が関連付けて格納されている。このため、図21に示すように、特定対象物判定情報314には、1つの制御信号生成情報に対して複数の特定対象物判定情報が格納される。なお、図21では、特定対象物群識別情報312の「#51」、「#61」に対応する特定対象物判定情報314の一部(対象領域の動きの向き情報313の「左」、「左上」)にのみ、複数の特定対象物判定情報に対応する形態を示す図形を模式的に示す。そして、特定対象物判定情報314における他の欄の図示を省略する。
制御信号生成情報315には、制御対象となる電子機器120の制御信号を生成するための情報(制御信号生成情報)が格納される。なお、図21では、制御信号生成情報の一部のみを示し、他の図示を省略する。
[向き相関情報記憶部の記憶内容例]
図22は、本発明の第2の実施の形態における向き相関情報記憶部600の記憶内容を模式的に示す図である。向き相関情報記憶部600には、対象領域の動きの向き情報601と、直前の動きの向き情報602と、向き相関値603とが関連付けて記憶されている。
対象領域の動きの向き情報601には、対象領域について検出された動きの向きを示す情報が格納される。例えば、図21に示す対象領域の動きの向き情報313と同様に、上、下、左、右、右上、右下、左上、左下の8つの向きが格納される。
直前の動きの向き情報602には、直前の対象フレーム(対象画像)における対象領域において検出された動きの向きを示す情報が格納される。ここで、図19(c)に示すように、肩を中心として人間の手を回転させる動作が行われている場合には、対象フレームにおける手の動きの向きと、その直前の対象フレームにおける動きの向きとの間には、特定の対応関係が存在する。例えば、図19(a)に示す動作を行う場合において、姿勢561の際には、右手の向きが右となるのに対し、姿勢562の際には、右手の向きが右上となる。また、姿勢563の際には、右手の向きが上となるのに対し、姿勢564の際には、右手の向きが左上となる。
向き相関値603には、対象領域の動きの向き情報601および直前の動きの向き情報602の対応関係により特定される向き相関値が格納される。
例えば、図19(a)に示す動作が行われている場合において、対象フレームにおける対象領域において、下向きの動きが検出された場合には、直前の対象フレームにおけるその対象領域の動きの向きは左下となる。このため、向き相関値として「1」が算出される。また、例えば、図19(b)に示す動作が行われている場合において、対象フレームにおける対象領域において、下向きの動きが検出された場合には、直前の対象フレームにおけるその対象領域の動きの向きは右下となる。このため、向き相関値として「2」が算出される。このように、図19(a)または(b)に示す動作が行われている場合には、前後の対象フレームにおける対象領域について検出された動きの向きに関して、特定の対応関係を有する。このため、対象領域の動きの向き情報601および直前の向き情報602には、その特定の対応関係が格納されている。そして、向き相関情報記憶部600を用いて、図19(a)または(b)に示す動作が行われているか否かを判定することができる。
ここで、上述したように、動き検出部220により検出された動きの向きは、評価値保持部260に順次保持される。そして、一連動作判定部510は、動き検出部220により検出された動きの向き(現在の動きの向き)と、評価値保持部260に保持されている動きの向き(直前に検出された動きの向き)とに基づいて、向き相関値を算出する。具体的には、一連動作判定部510は、現在の動きの向きと、直前に検出された動きの向きとが、対象領域の動きの向き情報601および直前の向き情報602の対応関係を有するか否かを判断する。そして、一連動作判定部510は、現在の動きの向きと、直前の動きの向きとが、対象領域の動きの向き情報601および直前の向き情報602の対応関係を有する場合には、向き相関値として「1」または「2」を算出する。一方、一連動作判定部510は、現在の動きの向きと直前の動きの向きとが、対象領域の動きの向き情報601および直前の向き情報602の対応関係を有しない場合には、向き相関値として「0」を算出する。これらの向き相関値は、特定対象物情報選択部520に出力される。
続いて、特定対象物情報選択部520は、一連動作判定部510から出力された向き相関値と、動き検出部220により検出された動き情報とに基づいて、特定対象物情報記憶部310から特定対象物判定情報を選択する。具体的には、特定対象物情報選択部520は、一連動作判定部510から出力された向き相関値が「0」である場合には、本発明の第1の実施の形態と同様に、特定対象物情報を選択する。すなわち、動き検出部220により検出された動きの向きに応じて、向き相関値311「0」に関連付けられている特定対象物情報を選択する。一方、特定対象物情報選択部520は、一連動作判定部510から出力された向き相関値が「1」である場合には、動き検出部220により検出された動きの向きに応じて、向き相関値311の「1」に関連付けられている特定対象物情報を選択する。また、特定対象物情報選択部520は、一連動作判定部510から出力された向き相関値が「2」である場合には、動き検出部220により検出された動きの向きに応じて、向き相関値311の「2」に関連付けられている特定対象物情報を選択する。
なお、本発明の第2の実施の形態では、説明の容易のため、対応関係を有する向きを少なくして示すが、例えば、対象フレームの間隔等に応じて、対応関係を有する向きを設定することが好ましい。
[情報処理装置の動作例]
図23は、本発明の第2の実施の形態における情報処理装置200による制御信号生成処理の処理手順を示すフローチャートである。この例では、図19に示すように、肩を中心として人間の手を回転させる動作が行われている場合において制御信号生成処理を行う場合を例にして説明する。また、この例では、一連動作判定部510により算出された向き相関値が「0」である場合には、特定対象物の判定処理を行わない例を示す。なお、この例は、図13に示す制御信号生成処理の変形例である。このため、図13に示す処理手順と同一の処理手順については、同一の符号を付して説明を省略する。
動き検出部220により検出された動きベクトルの大きさが閾値以上である場合には(ステップS903)、一連動作判定部510が向き相関値を算出する(ステップS951)。すなわち、一連動作判定部510が、動き検出部220により検出された動きの向き(現在の動きの向き)と、評価値保持部260に保持されている動きの向き(直前に検出された動きの向き)とに基づいて、向き相関値を算出する。
続いて、特定対象物情報選択部520が、一連動作判定部510により算出された向き相関値が閾値以上であるか否かを判断する(ステップS952)。例えば、閾値を1とすることができる。一連動作判定部510により算出された向き相関値が閾値以上である場合には(ステップS952)、特定対象物情報選択部520が特定対象物判定情報を選択する(ステップS953)。すなわち、特定対象物情報選択部520が、その向き相関値と、動き検出部220により検出された動き情報とに基づいて、特定対象物情報記憶部310から特定対象物判定情報を選択する(ステップS953)。
また、検出された動きベクトルの大きさが閾値未満である場合(ステップS903)、または、算出された向き相関値が閾値未満である場合には(ステップS952)、ステップS954に進む。なお、特定対象物の判定処理により算出される相関値が閾値未満である場合にも(ステップS906)、ステップS954に進む。続いて、評価値算出部250が、設定された対象領域の評価値に関する評価値保持部260の内容を初期化する(ステップS954)。
なお、この例では、一連動作判定部510により算出された向き相関値が「0」である場合には、特定対象物の判定処理を行わず、設定された対象領域の評価値に関する評価値保持部260の内容を初期化する例を示した。ただし、上述したように、一連動作判定部510により算出された向き相関値が「0」である場合には、本発明の第1の実施の形態と同様に、特定対象物情報を選択し、特定対象物の判定処理を行うようにしてもよい。また、向き相関値が「0」である場合における処理については、ユーザが設定可能とするようにしてもよい。
図19に示すように、肩を中心として人間の手を回転させる動作が行われている場合には、手の姿勢(例えば、グーの姿勢)が同一であっても、被写体として画像に含まれる手の姿勢が変更することが想定される。そこで、本発明の第2の実施の形態では、肩を中心として人間の手を回転させる動作が行われている場合には、被写体として画像に含まれる手の姿勢が変更したとしても、手の姿勢が略同一であれば、同一の制御信号生成情報を生成するようにする。これにより、同一姿勢の手によりグルグル動作を行っている場合には、所望の期間だけ、ボリューム等の増加操作または減少操作を継続して行うことができる。
<3.第3の実施の形態>
本発明の第1および第2の実施の形態では、直線状に手を移動させる動作や肩を中心として人間の手を回転させる動作に基づいて制御信号を生成し、この制御信号に基づいて電子機器を操作する例を示した。しかしながら、上述した動作以外にも、所定の規則に応じた複数に基づいて制御信号を生成することも考えられる。例えば、所定の規則に応じた複数の動作として手話が広く知られている。この手話は、主に、手、指、腕を用いる手指動作または顔の部位等を用いる非手指動作が、所定の規則に応じた複数の動作として行われる。このように手話は、手指動作等により行われるため、上述した特定対象物の判定処理により、手話を解析することができると想定される。そこで、本発明の第3の実施の形態では、これらの手動動作および非手動動作に基づいて手話を解析して、この解析結果を手話の相手側に通知する例を示す。
[情報処理装置の構成例]
図24は、本発明の第3の実施の形態における情報処理装置700の機能構成例を示すブロック図である。ここで、情報処理装置700は、本発明の第1の実施の形態における情報処理装置200の変形例であり、手話解析情報記憶部730を設け、他の一部を変形したものである。このため、以下では、情報処理装置200と異なる部分を中心に説明し、情報処理装置200と共通する部分についての説明を一部省略する。情報処理装置700は、特定対象物情報記憶部320と、評価値算出部710と、手話解析結果保持部720と、手話解析情報記憶部730と、制御信号生成部740とを備える。
特定対象物情報記憶部320は、特定対象物の判定処理に用いられる複数の特定対象物情報を記憶するものであり、記憶されている特定対象物情報を特定対象物情報選択部230に供給する。なお、特定対象物情報記憶部320は、図3に示す特定対象物情報記憶部300の変形例であり、制御信号生成情報304が記憶されていない点が異なる。この点以外は、特定対象物情報記憶部300と略同様である。なお、特定対象物情報記憶部320は、特許請求の範囲に記載の記憶部の一例である。
評価値算出部710は、特定対象物判定部240から出力された判定結果に基づいて、制御信号を生成するための評価値を算出するものである。具体的には、評価値算出部710は、特定対象物判定部240から出力された判定結果と、手話解析結果保持部720に保持されている手話解析結果情報とに基づいて、所定の規則に応じた複数の動作に関する新たな評価値を算出する。そして、評価値算出部710は、新たに算出された評価値、この評価値の算出対象となった対象領域の位置および大きさ等を、所定の規則に応じた複数の動作毎に手話解析結果保持部720に保持させる。ここで、所定の規則に応じた複数の動作は、例えば、図27(a)に示す「山」を表す手話に対応する一連の2つの動作である。
手話解析結果保持部720は、所定の規則に応じた複数の動作に関する手話解析結果情報を保持するものであり、手話解析結果情報を評価値算出部710に供給する。なお、手話解析結果保持部720における保持内容については、図25を参照して詳細に説明する。
手話解析情報記憶部730は、手話解析結果保持部720に保持されている手話解析結果情報に関する制御信号の生成処理に用いられる手話解析情報を記憶するものであり、記憶されている手話解析情報を制御信号生成部740に供給する。なお、手話解析情報記憶部730における記憶内容については、図26を参照して詳細に説明する。
制御信号生成部740は、手話解析結果保持部720に保持されている手話解析結果情報と、手話解析情報記憶部730に記憶されている手話解析情報とに基づいて、その手話解析結果情報に対応する文字を表示させるための制御信号を生成するものである。なお、制御信号生成部740は、その手話解析結果情報に対応する文字を通知(例えば、音声出力)するための制御信号を生成するようにしてもよい。この制御信号の生成については、図27を参照して詳細に説明する。
[手話解析結果保持部の保持内容例]
図25は、本発明の第3の実施の形態における手話解析結果保持部720の保持内容を模式的に示す図である。手話解析結果保持部720は、本発明の第1の実施の形態における評価値保持部260の変形例であり、所定の規則に応じた複数の動作に関する手話解析結果情報を保持する点が異なる。この点以外は、手話解析結果保持部720は、評価値保持部260と略同様であるため、以下での説明では、その一部を省略して示す。
手話解析結果保持部720には、対象領域情報721および手話解析結果情報724が関連付けて保持される。なお、対象領域情報721における位置情報722およびサイズ情報723は、図5に示す同一名称の各情報に対応するものである。
手話解析結果情報724には、所定の規則に応じた複数の動作に関する手話解析結果情報が格納される。具体的には、各動作について、対象領域の動きの向き情報725と、特定対象物識別情報726と、評価値727とが保持される。なお、対象領域の動きの向き情報725、特定対象物識別情報726および評価値727は、図5に示す同一名称の各情報に対応するものである。すなわち、本発明の第1の実施の形態では、直線状に移動する特定対象物に基づいて制御信号を生成する例を示したが、本発明の第3の実施の形態では、所定の規則に応じた複数の動作を行う特定対象物に基づいて制御信号を生成する例を示す。例えば、図27(a)に示すように、所定の規則に応じた複数の動作を行う特定対象物に基づいて制御信号を生成する。このため、所定の規則に応じた複数の動作について、手話解析結果情報724における対象領域の動きの向き情報725、特定対象物識別情報726および評価値727に各情報を時系列で順次保持しておく。例えば、所定の規則に応じた複数の動作に関する各情報を、A1、A2…のように、対象領域の動きの向き情報725、特定対象物識別情報726および評価値727に時系列で順次保持する。そして、制御信号生成部740が、手話解析結果保持部720に保持されている手話解析結果と、手話解析情報記憶部730に記憶されている手話解析情報とに基づいて、その手話解析結果情報に対応する画像を表示させるための制御信号を生成する。その手話解析結果情報に対応する画像は、例えば、その手話解析結果情報に対応する手話を表す文字である。
また、例えば、1人が左右の手を用いて手話を行う場合や、複数人がそれぞれの手を用いて手話を行う場合が想定される。このため、本発明の第3の実施の形態では、対象画像における複数の対象領域において特定対象物の動きが検出された場合には、各対象領域に関する評価値等を手話解析結果保持部720に保持させる。
[手話解析情報記憶部の記憶内容例]
図26は、本発明の第3の実施の形態における手話解析情報記憶部730の記憶内容を模式的に示す図である。手話解析情報記憶部730には、手話解析情報731および言語情報735が関連付けて記憶されている。
手話解析情報731には、手話解析結果保持部720に保持されている手話解析結果情報に対応する手話解析情報が格納される。すなわち、手話解析情報731には、対象領域の動きの向き情報732と、特定対象物識別情報733と、評価値734とが保持される。なお、対象領域の動きの向き情報732、特定対象物識別情報733および評価値734は、図25に示す同一名称の各情報に対応するものである。すなわち、所定の規則に応じた複数の動作に関する各情報が、B1、B2…のように、対象領域の動きの向き情報732、特定対象物識別情報733および評価値734に時系列に記憶される。
言語情報735には、制御対象となる電子機器の制御信号を生成するための情報(制御信号生成情報)が格納される。この例では、手話解析情報に対応する画像を表示させるための制御信号生成情報が格納される。
例えば、制御信号生成部740が制御信号を生成する場合には、手話解析結果保持部720に保持されている手話解析結果情報と、手話解析情報731に格納されている手話解析情報とを比較し、この比較の結果に基づいて制御信号を生成する。具体的には、制御信号生成部740が、手話解析結果保持部720に保持されている手話解析結果情報と、手話解析情報731に格納されている手話解析情報との類似度を算出する。そして、類似度が閾値以上であると判断された場合には、制御信号生成部740が、その手話解析情報に関連付けて言語情報735に格納されている制御信号生成情報に基づいて、その手話解析情報に対応する画像を表示させるための制御信号を生成する。例えば、言語情報735の「山」に対応する手話解析情報と同一または略同一の手話解析結果情報が、手話解析結果保持部720に保持されている場合には、制御信号生成部740が、「山」に対応する画像を表示させるための制御信号を生成する。ここで、類似度が閾値以上である場合は、例えば、対象領域の動きの向き情報、特定対象物識別情報および評価値のうち、対象領域の動きの向き情報および特定対象物識別情報が一致し、評価値の差分値が所定範囲内となる場合とすることができる。
また、例えば、1人が左右の手を用いて手話を行う場合や、複数人がそれぞれの手を用いて手話を行う場合が想定される。このため、本発明の第3の実施の形態では、対象画像における複数の対象領域において特定対象物の動きが検出された場合には、各対象領域に関する評価値等を手話解析結果保持部720に保持させる。
[手話を解析してその言語を表示する例]
図27は、本発明の第3の実施の形態における情報処理装置700による手話解析の対象となる人間の手の動きと、この手の動きに対応する文字との関係を模式的に示す図である。図27(a)には、「山」に対応する手話(手動動作)が人物750により行われた場合におけるその手の遷移を模式的に示す。図27(a)に示すように、手話により「山」を伝える場合には、右手751を右上方向(矢印752の方向)に移動させた後、右手751を右下方向(矢印753の方向)に移動させる。
図27(b)には、図27(a)に示す人物750により、「山」に対応する手話(手動動作)が行われた場合に、その手話の解析結果を文字として表示させる情報処理システム760を示す。図27(b)に示す例では、人物750により行われた手話(手動動作)が撮像装置761により撮像され、その手話に対する解析結果として「山」の文字が表示装置762に表示される例を示す。すなわち、人物750により行われた手話(手動動作)に基づいて、「山」の文字を表示装置762に表示するための制御信号が生成され、この制御信号に基づいて表示装置762が「山」の文字を表示する。
このように、人物750により行われた手話に対応する文字が、表示装置762に順次表示される。例えば、手話を理解することができない人物754と、人物750とが手話により会話をする場合を想定する。この場合でも、手話に対応する文字を表示装置762に表示させることにより、人物754が表示装置762に表示される文字を読むことにより、人物750の手話を容易に理解することができる。
また、例えば、手話を行った人物が、自分自身の動作およびその解析結果を同時に見ることができるように、手話の動作(撮像画像)と、この手話の解析結果とを同時に並べて表示させるようにしてもよい。このように表示することにより、例えば、手話を行った人物が、自分自身の動作およびその解析結果を同時に見ることができるため、手話の練習等に用いることができる。
また、本発明の第3の実施の形態では、所定の規則に応じた複数の動作として手話を例にして説明した。しかしながら、例えば、手話以外の所定の規則に応じた複数の動作をユーザ設定等により手話解析情報記憶部730に記憶しておき、この記憶内容に基づいて、所定の規則に応じた複数の動作に関する制御信号を生成するようにしてもよい。また、例えば、所望の手話と同一の動きに関連付けて制御信号生成情報を記憶しておき、その手話を行うことにより、所望の操作を行うことができる。これにより、時間的に変化する手の動きや形状に基づいて、複雑な操作に関する制御信号を容易に生成することができる。例えば、手話をよく知っている人が、その手話を用いた制御信号生成情報を記憶しておくことにより、複雑な操作を容易に行うことができる。
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、本発明の実施の形態において明示したように、本発明の実施の形態における事項と、特許請求の範囲における発明特定事項とはそれぞれ対応関係を有する。同様に、特許請求の範囲における発明特定事項と、これと同一名称を付した本発明の実施の形態における事項とはそれぞれ対応関係を有する。ただし、本発明は実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において実施の形態に種々の変形を施すことにより具現化することができる。
また、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。この記録媒体として、例えば、CD(Compact Disc)、MD(MiniDisc)、DVD(Digital Versatile Disk)、メモリカード、ブルーレイディスク(Blu-ray Disc(登録商標))等を用いることができる。
100、760、800、802、805、808 情報処理システム
110、761 撮像装置
120 電子機器
131、132 信号線
200、500、700 情報処理装置
210 画像入力部
220 動き検出部
230、520 特定対象物情報選択部
240 特定対象物判定部
250、710 評価値算出部
260 評価値保持部
270、740 制御信号生成部
280 制御信号出力部
300、310、320 特定対象物情報記憶部
510 一連動作判定部
600 向き相関情報記憶部
720 手話解析結果保持部
730 手話解析情報記憶部
762 表示装置
801 テレビジョン
803 テレビゲーム装置
804 表示装置
806 照明装置
807 天井
809 クレーンゲーム装置
810 クレーン
811 景品
812 デジタルスチルカメラ
813ロボット装置

Claims (15)

  1. 対象動画に含まれる物体の動きを検出する動き検出部と、
    前記動きが検出された物体が所定物体の形状および向きにより特定される特定対象物であるかを判定する特定対象物判定部と、
    前記動きが検出された物体について前記特定対象物であることが判定されてから前記特定対象物であることが判定されなくなるまでの間の時間軸における長さに基づいて所定の電子機器を制御するための制御信号を生成する制御信号生成部と
    を具備する情報処理装置。
  2. 前記特定対象物判定部は、前記動きが検出された物体が複数の前記特定対象物のうちの何れかの特定対象物であるかを判定し、
    前記制御信号生成部は、前記特定対象物判定部により判定された特定対象物の種類と前記時間軸における長さとに基づいて前記制御信号を生成する
    請求項1記載の情報処理装置。
  3. 前記動きが検出された物体について前記特定対象物であることが判定されてから前記特定対象物であることが判定されなくなるまでの間の時間軸における長さに応じた所定の演算処理により前記制御信号を生成するための評価値を算出する評価値算出部をさらに具備し、
    前記制御信号生成部は、前記算出された評価値に基づいて前記制御信号を生成する
    請求項1記載の情報処理装置。
  4. 前記評価値算出部は、前記動きが検出された物体が所定の規則に応じた複数の動作を行っている場合には前記複数の動作毎に前記評価値を算出し、
    前記制御信号生成部は、前記複数の動作毎に算出された評価値に基づいて前記制御信号を生成する
    請求項3記載の情報処理装置。
  5. 前記所定の規則に応じた複数の動作は、手話であり、
    前記制御信号生成部は、前記手話について算出された評価値に基づいて前記手話を表す画像を表示させるための前記制御信号を生成する
    請求項4記載の情報処理装置。
  6. 前記特定対象物判定部は、前記動きが検出された物体について前記特定対象物であることが判定された後に前記動き検出部による動きの検出がされなくなった場合には当該物体が前記特定対象物であることが判定されなくなるまで当該物体について前記判定を継続して行う請求項1記載の情報処理装置。
  7. 前記動きが検出された物体が前記特定対象物であるかを判定するための判定情報を複数記憶する記憶部と、
    前記検出された物体の動きの向きに基づいて前記複数の判定情報の中から1または複数の判定情報を選択する選択部とをさらに具備し、
    前記特定対象物判定部は、前記選択された判定情報を用いて前記動きが検出された物体が前記特定対象物であるかを判定する
    請求項1記載の情報処理装置。
  8. 前記動きが検出された物体が所定の規則に応じた一連の動作を行っているかを判定する一連動作判定部をさらに具備し、
    前記制御信号生成部は、前記所定の規則に応じた一連の動作を行っている物体について前記所定の規則に応じた前記特定対象物であることが判定されてから前記所定の規則に応じた前記特定対象物であることが判定されなくなるまでの間の時間軸における長さに基づいて前記制御信号を生成する
    請求項1記載の情報処理装置。
  9. 前記動きが検出された物体が前記所定の規則に応じた前記特定対象物であるかを判定するための判定情報を前記特定対象物毎に複数記憶する記憶部と、
    前記検出された物体の動きの向きおよび前記一連の動作に基づいて前記複数の判定情報の中から1または複数の判定情報を選択する選択部とをさらに具備し、
    前記特定対象物判定部は、前記選択された判定情報を用いて前記動きが検出された物体が前記所定の規則に応じた前記特定対象物であるかを判定する
    請求項8記載の情報処理装置。
  10. 前記制御信号生成部は、前記制御信号として、向き、大きさ、バイナリ値および位置の少なくとも1つに関する制御信号を生成する請求項1記載の情報処理装置。
  11. 被写体を撮像して前記対象動画を生成する撮像部をさらに具備する請求項1記載の情報処理装置。
  12. 前記電子機器は、前記情報処理装置であり、
    前記制御信号生成部は、前記情報処理装置が特定の処理を行うための前記制御信号を生成する
    請求項1記載の情報処理装置。
  13. 動きが検出された物体が所定物体の形状および向きにより特定される特定対象物であるかを判定するための判定情報を前記特定対象物毎に複数記憶する記憶部と、
    対象動画に含まれる物体の動きを検出する動き検出部と、
    前記検出された物体の動きの向きに基づいて前記複数の判定情報の中から1または複数の判定情報を選択する選択部と、
    前記選択された判定情報を用いて前記動きが検出された物体が前記特定対象物であるかを判定する特定対象物判定部と、
    前記特定対象物判定部による判定結果に基づいて所定の電子機器を制御するための制御信号を生成する制御信号生成部と
    を具備する情報処理装置。
  14. 対象動画に含まれる物体の動きを検出する動き検出手順と、
    前記動きが検出された物体が所定物体の形状および向きにより特定される特定対象物であるかを判定する特定対象物判定手順と、
    前記動きが検出された物体について前記特定対象物であることが判定されてから前記特定対象物であることが判定されなくなるまでの間の時間軸における長さに基づいて所定の電子機器を制御するための制御信号を生成する制御信号生成手順と
    を具備する情報処理方法。
  15. 対象動画に含まれる物体の動きを検出する動き検出手順と、
    前記動きが検出された物体が所定物体の形状および向きにより特定される特定対象物であるかを判定する特定対象物判定手順と、
    前記動きが検出された物体について前記特定対象物であることが判定されてから前記特定対象物であることが判定されなくなるまでの間の時間軸における長さに基づいて所定の電子機器を制御するための制御信号を生成する制御信号生成手順と
    をコンピュータに実行させるプログラム。
JP2009235904A 2009-10-13 2009-10-13 情報処理装置、情報処理方法およびプログラム Pending JP2011085966A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009235904A JP2011085966A (ja) 2009-10-13 2009-10-13 情報処理装置、情報処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009235904A JP2011085966A (ja) 2009-10-13 2009-10-13 情報処理装置、情報処理方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2011085966A true JP2011085966A (ja) 2011-04-28

Family

ID=44078886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009235904A Pending JP2011085966A (ja) 2009-10-13 2009-10-13 情報処理装置、情報処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2011085966A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013037454A (ja) * 2011-08-05 2013-02-21 Ikutoku Gakuen 姿勢判定方法、プログラム、装置、システム
WO2014203463A1 (en) 2013-06-21 2014-12-24 Sony Corporation Information processing system, method and non-transitory computer-readable medium
WO2015098311A1 (ja) 2013-12-26 2015-07-02 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2015176461A (ja) * 2014-03-17 2015-10-05 セイコーエプソン株式会社 映像信号出力装置、映像信号出力方法、プログラム及び表示システム
JPWO2016103881A1 (ja) * 2014-12-25 2017-10-05 エイディシーテクノロジー株式会社 ロボット
KR20180032320A (ko) * 2016-09-22 2018-03-30 주식회사 케이티 알파맵(Alpha Map) 분석을 통한 양방향 서비스를 제공하는 사용자 단말, 셋톱 박스 및 방법
JP2018516422A (ja) * 2015-05-28 2018-06-21 アイサイト モバイル テクノロジーズ エルティーディー. スマートホームのためのジェスチャ制御システム及び方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013037454A (ja) * 2011-08-05 2013-02-21 Ikutoku Gakuen 姿勢判定方法、プログラム、装置、システム
WO2014203463A1 (en) 2013-06-21 2014-12-24 Sony Corporation Information processing system, method and non-transitory computer-readable medium
WO2015098311A1 (ja) 2013-12-26 2015-07-02 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2015176461A (ja) * 2014-03-17 2015-10-05 セイコーエプソン株式会社 映像信号出力装置、映像信号出力方法、プログラム及び表示システム
JPWO2016103881A1 (ja) * 2014-12-25 2017-10-05 エイディシーテクノロジー株式会社 ロボット
JP2018516422A (ja) * 2015-05-28 2018-06-21 アイサイト モバイル テクノロジーズ エルティーディー. スマートホームのためのジェスチャ制御システム及び方法
CN108369630A (zh) * 2015-05-28 2018-08-03 视觉移动科技有限公司 用于智能家居的手势控制系统和方法
KR20180032320A (ko) * 2016-09-22 2018-03-30 주식회사 케이티 알파맵(Alpha Map) 분석을 통한 양방향 서비스를 제공하는 사용자 단말, 셋톱 박스 및 방법
KR102200820B1 (ko) * 2016-09-22 2021-01-11 주식회사 케이티 알파맵(Alpha Map) 분석을 통한 양방향 서비스를 제공하는 사용자 단말, 셋톱 박스 및 방법

Similar Documents

Publication Publication Date Title
JP4816717B2 (ja) 画像処理装置、撮像装置、画像処理方法およびプログラム
CN101606384B (zh) 图像处理装置、运动图像再现装置及其处理方法
US8902194B2 (en) Electronic apparatus, display control method, and program
JP2011085966A (ja) 情報処理装置、情報処理方法およびプログラム
JP4274233B2 (ja) 撮影装置、画像処理装置、および、これらにおける画像処理方法ならびに当該方法をコンピュータに実行させるプログラム
JP4626692B2 (ja) 物体検出装置、撮像装置、物体検出方法およびプログラム
US8831282B2 (en) Imaging device including a face detector
US9685199B2 (en) Editing apparatus and editing method
JP5641970B2 (ja) 操作装置、再生装置及びテレビ受信装置
KR20090045870A (ko) 촬상 장치, 그 제어 방법 및 프로그램
US20080144890A1 (en) Image processing apparatus and image display method
CN109076159A (zh) 电子设备及其操作方法
JP2011188061A (ja) 画像処理装置、画像処理方法およびプログラム
KR20140099111A (ko) 카메라 장치의 동작을 제어하는 방법 및 상기 카메라 장치
TW200945895A (en) Image processor, animation reproduction apparatus, and processing method and program for the processor and apparatus
JP5794215B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2012198781A (ja) 情報処理装置、情報処理方法およびプログラム
US9860475B2 (en) Video processing apparatus, video processing method, and storage medium
CN104662889B (zh) 用于在便携式终端中进行拍摄的方法和设备
CN105991928A (zh) 图像处理装置以及图像处理方法
CN104170367B (zh) 一种图像捕获方法、装置及计算机可读介质
JP5272773B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP5464965B2 (ja) 画像処理装置及びその制御方法、並びにプログラム及び記憶媒体
US20160172004A1 (en) Video capturing apparatus
JP2011023867A (ja) 動画像再生装置および動画像再生方法