JP2014026566A - ジェスチャ検出装置、ジェスチャ検出方法及びプログラム - Google Patents

ジェスチャ検出装置、ジェスチャ検出方法及びプログラム Download PDF

Info

Publication number
JP2014026566A
JP2014026566A JP2012168074A JP2012168074A JP2014026566A JP 2014026566 A JP2014026566 A JP 2014026566A JP 2012168074 A JP2012168074 A JP 2012168074A JP 2012168074 A JP2012168074 A JP 2012168074A JP 2014026566 A JP2014026566 A JP 2014026566A
Authority
JP
Japan
Prior art keywords
gesture
trajectory
frequency analysis
predetermined
gesture detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012168074A
Other languages
English (en)
Other versions
JP6109505B2 (ja
Inventor
Hidetane Asano
秀胤 浅野
Kazunori Umeda
和昇 梅田
Kenji Terabayashi
賢司 寺林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Chuo University
Original Assignee
Chuo University
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chuo University, Pioneer Electronic Corp filed Critical Chuo University
Priority to JP2012168074A priority Critical patent/JP6109505B2/ja
Publication of JP2014026566A publication Critical patent/JP2014026566A/ja
Application granted granted Critical
Publication of JP6109505B2 publication Critical patent/JP6109505B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】人物が移動している最中に行った所定のジェスチャを適切に検出することが可能なジェスチャ検出装置を提供する。
【解決手段】ジェスチャ検出装置は、複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出手段と、軌跡検出手段によって検出された軌跡に対して周波数解析を行う周波数解析手段と、周波数解析手段による周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出手段と、を備える。これにより、人物が移動している最中に所定のジェスチャを行った場合にも、そのようなジェスチャを適切に検出することができる。
【選択図】図2

Description

本発明は、人物のジェスチャを検出する技術分野に関する。
この種の技術が、例えば特許文献1及び2に提案されている。特許文献1には、撮影画像を複数ブロックに分割し、2つの異なる時点の同一の画像データ群の位置の変化を取得することで、複数のブロックすべての位置の変化をジェスチャの特徴とみなす技術が提案されている。特許文献2には、ユーザの特徴点を世界座標系から、ユーザ姿勢に対して一意で且つユーザのある特徴点を基準としたユーザ座標系に変換することで、ユーザの位置や姿勢に依存しないジェスチャ推定を図った技術が提案されている。
特開2004−192150号公報 特開2000−149025号公報
ところで、人物が移動している最中に行った所定のジェスチャを検出することができれば便宜である。上記した特許文献1及び2に記載された技術は、基本的には、人物がほぼ静止している状態で行ったジェスチャ(つまり一箇所にほぼ止まった状態で行ったジェスチャ)を検出対象としており、人物が移動している状態(例えば歩行中)で行ったジェスチャを適切に検出することは困難であった。
本発明が解決しようとする課題としては、上記のものが一例として挙げられる。本発明は、人物が移動している最中に行った所定のジェスチャを適切に検出することが可能なジェスチャ検出装置、ジェスチャ検出方法及びプログラムを提供することを目的とする。
請求項1に記載の発明では、ジェスチャ検出装置は、複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出手段と、前記軌跡検出手段によって検出された前記軌跡に対して周波数解析を行う周波数解析手段と、前記周波数解析手段による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出手段と、を備えることを特徴とする。
請求項8に記載の発明では、ジェスチャ検出装置によって実行されるジェスチャ検出方法は、複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出工程と、前記軌跡検出工程によって検出された前記軌跡に対して周波数解析を行う周波数解析工程と、前記周波数解析工程による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出工程と、を備えることを特徴とする。
請求項9に記載の発明では、コンピュータを有するジェスチャ検出装置によって実行されるプログラムは、前記コンピュータを、複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出手段、前記軌跡検出手段によって検出された前記軌跡に対して周波数解析を行う周波数解析手段、前記周波数解析手段による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出手段、として機能させることを特徴とする。
本実施例の基本概念を説明するための図を示す。 本実施例に係るジェスチャ検出装置が適用されたシステムの概略構成を示す。 用いた撮影画像とフロー追跡を行った箇所の一例を示す。 フロー追跡結果の一例を示す。 関数当てはめを行った結果の一例を示す。 関数当てはめを行った結果の他の例を示す。 周波数解析結果の一例を示す。 手振り検出結果の一例を示す。 本実施例に係る処理フローを示す。
本発明の1つの観点では、ジェスチャ検出装置は、複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出手段と、前記軌跡検出手段によって検出された前記軌跡に対して周波数解析を行う周波数解析手段と、前記周波数解析手段による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出手段と、を備える。
上記のジェスチャ検出装置は、所定の空間を撮影することで得られた撮影画像に基づいて、人物が当該所定の空間で行ったジェスチャを検出するために好適に利用される。軌跡検出手段は、複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する。つまり、軌跡検出手段は、複数フレーム間に物体が移動した軌跡を検出する。周波数解析手段は、検出された軌跡に対して周波数解析を行う。具体的には、周波数解析手段は、周波数変換を行うことで、周波数ごとの強度(つまりパワースペクトル)を得る。そして、ジェスチャ検出手段は、周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、つまり所定の周波数範囲においてパワースペクトルにおける強度が所定値以上となっている場合に、所定のジェスチャが行われたと判定する。例えば、ジェスチャ検出手段は、ある程度の周期性をもってなされる人物の動作を、所定のジェスチャとして検出する。
上記のジェスチャ検出装置によれば、人物が移動(例えば歩行)している最中に所定のジェスチャを行った場合にも、そのようなジェスチャを適切に検出することができる。また、ジェスチャ検出装置は、人物の姿勢解析などを行わないため、姿勢解析などを行う場合と比較して処理量を低減することができる。
上記のジェスチャ検出装置の一態様では、前記周波数解析手段は、前記軌跡検出手段によって検出された前記軌跡に対して所定の関数を当てはめ、当てはめた前記所定の関数と前記軌跡との残差に対して前記周波数解析を行う。
上記の態様では、周波数解析手段は、軌跡に対して当てはめた関数を人物の移動などに起因する成分として扱い、当てはめた関数と軌跡との残差を、所定のジェスチャに起因する成分が含まれている可能性があるものとして扱う。この態様によれば、軌跡検出手段によって検出された軌跡から、人物の移動などに起因する成分を適切に除去することができ、人物が移動している最中に行った所定のジェスチャを精度良く検出することができる。
上記のジェスチャ検出装置の他の一態様では、前記ジェスチャ検出手段は、前記所定の周波数範囲として手振りに応じた周波数範囲を用いて、前記所定のジェスチャとして手振りを検出する。これにより、人物が移動している最中に行った手振りを適切に検出することができる。
上記のジェスチャ検出装置の他の一態様では、前記軌跡検出手段は、前記複数フレームとして、前記手振りに応じた周波数範囲に基づいたフレーム数を用いる。例えば、軌跡検出手段は、少なくとも1周期分の手振りが含まれるようなフレーム数を用いることができる。
上記のジェスチャ検出装置において好適には、前記軌跡検出手段は、前記複数フレームの各々から、前記物体の動きをオプティカルフローとして求め、前記複数フレームの各々から求められた前記オプティカルフローを追跡することで、前記軌跡を検出する。
また好適には、前記ジェスチャ検出手段は、前記ピークに対して用いる前記所定値を、前記周波数解析の結果に応じて変更する。例えば、ジェスチャ検出手段は、全体的なパワースペクトルにおける強度のレベルに応じて、所定値を変更する。この例では、全体的な強度のレベルが高い場合には所定値を大きくし、全体的な強度のレベルが低い場合には所定値を小さくすることができる。
本発明の他の観点では、ジェスチャ検出装置によって実行されるジェスチャ検出方法は、複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出工程と、前記軌跡検出工程によって検出された前記軌跡に対して周波数解析を行う周波数解析工程と、前記周波数解析工程による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出工程と、を備える。
本発明の更に他の観点では、コンピュータを有するジェスチャ検出装置によって実行されるプログラムは、前記コンピュータを、複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出手段、前記軌跡検出手段によって検出された前記軌跡に対して周波数解析を行う周波数解析手段、前記周波数解析手段による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出手段、として機能させる。
以下、図面を参照して本発明の好適な実施例について説明する。
(1)基本概念
まず、図1を参照して、本実施例の基本概念について説明する。図1に示すように、本実施例では、所定の空間をカメラ2にて撮影することで得られた撮影画像(動画像)に基づいて、人物が当該所定の空間で行った所定のジェスチャを検出する。例えば、本実施例では、人物が移動中(歩行中)に行った手振りを検出することを図っている。
なお、本明細書では、検出対象としている「手振り」は、人物が歩行に伴って行う手の振り(歩行中に無意識に行う手の振り)を意味するのではなく、当該手の振りとは別に人物が意識的に行う手の振りを意味するものとする。
(2)全体構成
次に、図2を参照して、本実施例に係るジェスチャ検出装置1の構成について説明する。ここでは、ジェスチャ検出装置1が行う処理の概要について簡単に説明する。
図2は、本実施例に係るジェスチャ検出装置1が適用されたシステムの概略構成を示す。図2に示すように、ジェスチャ検出装置1は、主に、軌跡検出部11と、周波数解析部12と、ジェスチャ検出部13と、記憶部14と、を有する。例えば、ジェスチャ検出装置1は、パーソナルコンピュータのCPU(Central Processing Unit)によって実現される。
軌跡検出部11は、カメラ2による撮影により生成された撮影画像が入力される。そして、軌跡検出部11は、複数フレーム分の撮影画像(言い換えると所定時間内に撮影された複数枚の撮影画像)に基づいて、物体の動きについての軌跡を検出する。この場合、軌跡検出部11は、記憶部14に記憶された複数フレーム分の撮影画像に関するデータに基づいて、軌跡を検出する。
周波数解析部12は、軌跡検出部11によって検出された軌跡に対して、周波数解析を行う。具体的には、周波数解析部12は、軌跡検出部11によって検出された軌跡に対して所定の関数を当てはめ、当てはめた関数と軌跡との残差(以下では「当てはめ誤差」とも呼ぶ。)に対して周波数解析を行う。
ジェスチャ検出部13は、周波数解析部12による周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定する。具体的には、ジェスチャ検出部13は、所定の周波数範囲として手振りに応じた周波数範囲(3〜6[Hz]程度)を用いて、所定のジェスチャとして手振りを検出する。
(3)具体的な処理内容
以下では、ジェスチャ検出装置1内の軌跡検出部11、周波数解析部12及びジェスチャ検出部13が行う処理内容について詳細に説明する。具体的には、「オプティカルフロー算出」、「フロー追跡」、「関数当てはめ」、「周波数解析」、「手振り検出」について説明する。
(3−1)オプティカルフロー算出
まず、軌跡検出部11が行うオプティカルフローの算出について説明する。
軌跡検出部11は、カメラ2より入力された撮影画像から、オプティカルフローを算出する。このオプティカルフローは、画像中における物体の動きをベクトルで表したものに相当する。例えば、軌跡検出部11は、現在入力された撮影画像(つまり現フレームの撮影画像)と、当該撮影画像の1フレーム前の撮影画像とを比較することで、オプティカルフローを算出する。軌跡検出部11は、撮影画像を構成する全ての画素に対して、オプティカルフローを算出する処理を行う。また、軌跡検出部11は、算出したオプティカルフローに関するデータを記憶部14に記憶させる。つまり、軌跡検出部11は、オプティカルフローを算出するたびに、オプティカルフローに関するデータを記憶部14に記憶させる。これにより、記憶部14には、複数フレームについてのオプティカルフローに関するデータが記憶されることとなる。なお、オプティカルフローの算出に当たっては、公知の種々の手法を適用することができる。
このように本実施例では、人物の動作解析の手がかりとして、撮影画像のオプティカルフローを用いる。これにより、人物の姿勢解析などを行わないため、処理量を低減することができる。
(3−2)フロー追跡
次に、軌跡検出部11が上記したオプティカルフローの算出の後に行う、フロー追跡について説明する。
軌跡検出部11は、複数フレームの各々から算出したオプティカルフローを追跡することで、物体の動きについての軌跡を検出する。具体的には、軌跡検出部11は、記憶部14に記憶されたオプティカルフローに関するデータを参照して、現在フレームから過去のフレームの方向に遡った所定数のフレーム分のオプティカルフローを追跡することで、物体の動きについての軌跡を求める。軌跡検出部11は、所定数のフレーム間における画像上での位置の時間変化を軌跡として求める。例えば、軌跡は、時間軸(フレームにて規定したものでも良い)に対して画像上での座標値の変化を示したデータである。
また、軌跡検出部11は、撮影画像を構成する全ての画素に対して、オプティカルフローを追跡して軌跡を求める処理を行う。この場合、軌跡検出部11は、画像中で変化があった各画素ごとに、所定数のフレーム間において画像内を移動した軌跡を求める。
更に、軌跡検出部11は、オプティカルフローを追跡する所定数のフレームとして、手振りに応じた周波数範囲(3〜6[Hz]程度)に基づいたフレーム数を用いる。具体的には、軌跡検出部11は、少なくとも1周期分の手振り(好適な例では2〜3周期分の手振り)が含まれるようなフレーム数を用いる。以下では、30[fps]で撮影を行うカメラ2を用い、所定数のフレームとして30フレームを用いた場合(言い換えると1秒間に得られたフレーム数を用いる場合)を例に挙げる。
図3及び図4を参照して、上記したようなオプティカルフローの追跡結果(以下では単に「フロー追跡結果」とも呼ぶ。)の具体例について説明する。ここでは、図3に示すように、カメラ2で撮影される所定の空間内を、人物が右から左の方向に歩いた場合を例に挙げる(この例では、人物は手振りをしていないものとする)。また、人物の胴(胴体)、腕及び足についてのオプティカルフローの追跡を行った場合を例に挙げる。なお、画像の左上を基準とした横方向を「u方向」とし、画像の左上を基準とした縦方向を「v方向」とする(以下同様とする)。
図4は、図3に示したように人物が移動した際の、人物の胴(胴体)、腕及び足についてのフロー追跡結果の一例を示している。図4は、横軸にフレームを示し(30フレーム分を示している)、縦軸にフロー追跡結果(pixel)を示している。フレームにて規定された横軸は、時間軸に相当するものである。また、縦軸に示すフロー追跡結果の値は、画像中におけるu方向又はv方向の位置(つまり座標値)に相当し、そのような座標値の最小値を「0」にして基準としている。なお、図4における横軸及び縦軸の規定は、後述する図5及び図6でも同様である。
具体的には、図4では、フロー追跡結果として、30フレーム間における胴のu方向及びv方向の軌跡と、30フレーム間における腕のu方向及びv方向の軌跡と、30フレーム間における足のu方向及びv方向の軌跡と、を示している。より詳しくは、胴に対応する画像中の箇所に含まれる1画素についてのu方向及びv方向の軌跡と、腕に対応する画像中の箇所に含まれる1画素についてのu方向及びv方向の軌跡と、足に対応する画像中の箇所に含まれる1画素についてのu方向及びv方向の軌跡と、を示している。
なお、図4に示したような胴、腕及び足についてのフロー追跡結果は、ジェスチャ検出装置1に相当するパーソナルコンピュータの使用者などが、軌跡検出部11が求めた複数の軌跡の中から、胴、腕及び足に対応する軌跡を特定し、そのような胴、腕及び足に対応する軌跡を抽出して示したものである。ジェスチャ検出装置1(軌跡検出部11)は、あくまでオプティカルフローを追跡して軌跡を求める処理のみを行い、そのような軌跡が人物のどの部位に対応するものかを特定する処理は行わない。このような図4を提示したのは、フロー追跡結果の説明を分かり易くするといった便宜上の理由による。ここで述べた内容は、後述する図5乃至図7についても同様に適用されるものとする。
(3−3)関数当てはめ
次に、周波数解析部12が上記した軌跡検出部11によるフロー追跡の後に行う、関数当てはめについて説明する。
周波数解析部12は、軌跡検出部11によって求められた軌跡に対して所定の関数を当てはめる。つまり、周波数解析部12は、物体の動きについての軌跡に対して所定の関数をフィッティングする(言い換えると関数近似を行う)。そして、周波数解析部12は、当てはめた関数と軌跡との残差に対して周波数解析を行う。周波数解析については次のセクションで詳述する。
このように関数当てはめを行う理由は以下の通りである。所定数のフレーム分だけオプティカルフローを追跡した場合(例えばオプティカルフローを1秒間追跡した場合)、人物の移動(歩行)などに起因する成分は、軌跡においては複雑な波形として表れない。他方で、手振りに起因する成分は、3〜6[Hz]程度の高周波として軌跡に重畳する。このことから、オプティカルフローの追跡結果に対して関数当てはめを行うと、その当てはめた関数を人物の移動などに起因する成分とみなすことができる共に、当てはめた関数と軌跡との残差を手振りに起因する成分(正確には手振りが含まれている可能性がある成分である。以下同様とする。)とみなすことができる。したがって、関数当てはめを行うことで、軌跡を、人物の移動などに起因する成分と、手振りに起因する成分とに分離することができる。言い換えると、軌跡から、人物の移動などに起因する成分を除去することができる。
以上述べた理由より、本実施例では、周波数解析部12は、軌跡検出部11によって求められた軌跡に対して所定の関数を当てはめる。なお、周波数解析部12は、撮影画像を構成する各画素ごとに、軌跡検出部11によって求められた軌跡に対して関数を当てはめる処理を行う。
図5及び図6を参照して、軌跡に対して関数当てはめを行った結果の具体例について説明する。
図5は、人物が手振りを行った場合の関数当てはめに関する結果の一例を示している。図5(a)は、オプティカルフローの追跡により得られた軌跡(つまりフロー追跡結果)の一例と、そのような軌跡に対して関数を当てはめた結果(以下では単に「当てはめ結果」とも呼ぶ。)の一例と、を示している。具体的には、図5(a)では、人物が移動中に手振りを行った場合の腕のu方向の軌跡と、当該軌跡に対して関数を当てはめた場合の当てはめ結果と、を示している。加えて、図5(a)では、人物が静止した状態で手振りを行った場合の腕のu方向の軌跡と、当該軌跡に対して関数を当てはめた場合の当てはめ結果と、を示している。なお、ここでは、三次関数を当てはめた場合の結果を示している。
図5(b)は、図5(a)に示した軌跡と当てはめ結果との残差(当てはめ誤差)を示している。具体的には、図5(b)では、図5(a)に示した、人物が移動中に手振りを行った場合の腕のu方向の軌跡と当該軌跡に対して当てはめた関数とについての、当てはめ誤差を示している。加えて、図5(b)では、図5(a)に示した、人物が静止した状態で手振りを行った場合の腕のu方向の軌跡と当該軌跡に対して当てはめた関数とについての、当てはめ誤差を示している。図5(b)より、手振りが行われた場合には、当てはめ誤差が周期的に変動するような波形になっていることがわかる。
図6は、人物が手振りを行わなかった場合の関数当てはめに関する結果の一例を示している。図6(a)は、オプティカルフローの追跡により得られた軌跡(つまりフロー追跡結果)の一例と、そのような軌跡に対して関数を当てはめた結果(当てはめ結果)の一例と、を示している。具体的には、図6(a)では、人物が移動中に手振りを行わなかった場合の腕のu方向の軌跡と、当該軌跡に対して関数を当てはめた場合の当てはめ結果と、を示している。加えて、図6(a)では、人物の移動中における足のu方向の軌跡と、当該軌跡に対して関数を当てはめた場合の当てはめ結果と、を示している。なお、ここでも、三次関数を当てはめた場合の結果を示している。
図6(b)は、図6(a)に示した軌跡と当てはめ結果との残差(当てはめ誤差)を示している。具体的には、図6(b)では、図6(a)に示した、人物が移動中に手振りを行わなかった場合の腕のu方向の軌跡と当該軌跡に対して当てはめた関数とについての、当てはめ誤差を示している。加えて、図6(b)では、図6(a)に示した、人物の移動中における足のu方向の軌跡と当該軌跡に対して当てはめた関数とについての、当てはめ誤差を示している。図6(b)より、手振りが行われなかった場合には、当てはめ誤差は、図5(b)に示したような周期的に変動する波形になっていないことがわかる(足についての当てはめ誤差も同様である)。
なお、上記では三次関数を軌跡に当てはめる例を示したが、三次関数を用いることに限定はされず、種々の関数(例えば三角関数や指数関数など)を軌跡に当てはめる関数として用いることができる。
(3−4)周波数解析
次に、周波数解析部12が上記した関数当てはめの後に行う、周波数解析について説明する。
周波数解析部12は、軌跡に対して当てはめた関数と当該軌跡との残差(当てはめ誤差)に対して、周波数解析を行う。具体的には、周波数解析部12は、当てはめ誤差に対して周波数変換を適用することで、周波数ごとの強度(つまりパワースペクトル)を得る。この場合、周波数解析部12は、撮影画像を構成する各画素ごとに、当てはめ誤差に対して周波数解析を行う。なお、周波数解析の手法としては、公知の種々の手法を適用することができる。
図7は、周波数解析結果の一例を示している。図7は、横軸に周波数[Hz]を示し、縦軸に強度を示している。具体的には、人物が移動中に手振りを行った場合の腕のu方向についての周波数解析結果と、人物が移動中に手振りを行った場合の腕のv方向についての周波数解析結果と、人物の移動中における胴のu方向についての周波数解析結果と、人物の移動中における胴のv方向についての周波数解析結果と、を示している。これらの周波数解析結果は、撮影画像を構成する1つの画素について30フレーム間に得られたデータに関する結果である。
図7より、人物が移動中に手振りを行った場合の腕のu方向について、3[Hz]においてかなり大きなピークが発生していることがわかる。他方で、腕のv方向や、胴のu方向及びv方向については、このような大きなピークが発生していないことがわかる。
(3−5)手振り検出
次に、ジェスチャ検出部13が上記した周波数解析部12による周波数解析の後に行う、手振り検出について説明する。ジェスチャ検出部13は、周波数解析部12による周波数解析によって得られたパワースペクトルに基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、手振りが行われたと判定する。具体的には、ジェスチャ検出部13は、手振りに応じた周波数範囲(例えば3〜6[Hz])において、パワースペクトルにおける強度が所定値以上となっている場合に、手振りが行われたと判定する。この場合、ジェスチャ検出部13は、パワースペクトルにおける強度が所定値以上である場合に特異点が存在するものと判断し、その特異点の位置(画像上の位置)を手振りが行われた位置として検出する。つまり、ジェスチャ検出部13は、1つの画素について得られたパワースペクトルにおいて、所定の周波数範囲で強度が所定値以上となっている場合に、当該画素は特異点であると判断する、つまり当該画素の位置を手振りが行われた位置として検出する。例えば、ジェスチャ検出部13は、図7に示すような周波数解析結果が得られた場合には、3[Hz]においてパワースペクトルにおける強度がかなり大きくなっていることから、その周波数解析結果が得られた画像の位置を手振りが行われた位置として検出する。
また、ジェスチャ検出部13は、上記のようなピークを判定するための所定値を、周波数解析結果に応じて適宜変更する。1つの例では、ジェスチャ検出部13は、撮影画像を構成する画素全体で得られた、パワースペクトルにおける強度の大きさに応じて、ピークを判定するための所定値を変更する。この例では、ジェスチャ検出部13は、撮影画像において全体的に強度が大きい場合には所定値を大きくし、撮影画像において全体的に強度が小さい場合には所定値を小さくする。他の例では、ジェスチャ検出部13は、1つの画素で得られた、全周波数帯域でのパワースペクトルにおける強度の大きさに応じて、ピークを判定するための所定値を変更する。この例では、ジェスチャ検出部13は、各周波数帯域において全体的に強度が大きい場合には所定値を大きくし、各周波数帯域において全体的に強度が小さい場合には所定値を小さくする。このように所定値を変更するのは、人物が移動した場合にはパワースペクトルにおける強度が全体的に大きくなる傾向にあり、人物が移動しなかった場合にはパワースペクトルにおける強度が全体的に小さくなる傾向にあるからである。なお、画素全体で得られたパワースペクトルにおける強度の平均値や、1つの画素で得られた全周波数帯域でのパワースペクトルにおける強度の平均値などに応じて、ピークを判定するための所定値を変更すると良い。
図8は、手振り検出結果の具体例を示している。図8は、ジェスチャ検出部13によって検出された特異点の位置(手振りが検出された位置)を、撮影画像に対してハッチングした図を示している。なお、図8では、撮影画像を模式的に表している。
図8(a)は、人物が移動中に手振りを行った場合の検出結果の一例を示し、図8(b)は、人物が静止した状態で手振りを行った場合の検出結果の一例を示している。図8(a)でハッチングした領域は、横方向(u方向)の手振りが検出された箇所を示している。図8(b)でハッチングした領域は、横方向(u方向)の手振りが検出された箇所と、縦方向(v方向)の手振りが検出された箇所と、縦横両方向(つまり斜め方向)の手振りが検出された箇所と、を示している。図8(a)及び(b)より、人物の手振りが適切に検出できていることがわかる。
なお、上記した本実施例では、基本的には画素ごとに独立して手振りの検出を行うため、手振りが検出された領域が散在する傾向にある(例えば図8参照)。具体的には、比較的大きな面積を有する領域だけでなく、当該領域から若干離れた場所に位置するかなり小さな面積を有する領域が、手振りが行われた領域として決定される場合がある。したがって、他の例では、近傍領域の検出結果に応じて、手振りが行われた領域を決定しても良い。例えば、手振りが検出された画素が所定数以上まとまって存在する場合には、そのような画素によって形成される領域を、手振りが行われた領域として決定し、手振りが検出された画素が所定数以上まとまって存在しない場合には、そのような画素によって形成される領域を、手振りが行われた領域から除外することができる。
(4)処理フロー
次に、図9を参照して、本実施例においてジェスチャ検出装置1が行う処理フローについて説明する。なお、当該フローは、撮影画像を構成する各画素ごとに並列に実行される。
ステップS101では、カメラ2による撮影によって生成された撮影画像がジェスチャ検出装置1に入力される。そして、ステップS102では、ジェスチャ検出装置1内の軌跡検出部11が、入力された撮影画像よりオプティカルフローを算出する。この後、ステップS103では、軌跡検出部11が、記憶部14に記憶されたオプティカルフローに関するデータを参照して、現在フレームから過去のフレームの方向に遡った所定数のフレーム分のオプティカルフローを追跡することで、物体の動きについての軌跡を求める。
次に、ステップS104では、ジェスチャ検出装置1内の周波数解析部12が、軌跡検出部11によって求められた軌跡に対して所定の関数を当てはめる。そして、ステップS105では、周波数解析部12が、軌跡に対して当てはめた関数と当該軌跡との残差(当てはめ誤差)に対して周波数変換を適用することで、周波数ごとの強度(つまりパワースペクトル)を得る。
次に、ステップS106では、ジェスチャ検出装置1内のジェスチャ検出部13が、周波数解析部12による周波数解析によって得られたパワースペクトルに基づいて、特異点が存在するか否かを判定する。この場合、ジェスチャ検出部13は、手振りに応じた周波数範囲(例えば3〜6[Hz])において、パワースペクトルにおける強度が所定値以上であるか否かを判定することで、特異点が存在するか否かを判定する。
特異点が存在する場合(ステップS106:Yes)、ジェスチャ検出部13は、その特異点の位置を手振りが行われた位置として検出する(ステップS107)。これに対して、特異点が存在しない場合(ステップS106:No)、処理は終了する。
(5)本実施例による作用効果
以上説明した本実施例によれば、人物の手振りを適切に検出することができる。具体的には、人物が移動している最中に行った手振りを適切に検出することができる。また、本実施例では、人物の動作解析の手がかりとしてオプティカルフローを用い、人物の姿勢解析などを行わないため、姿勢解析などを行う場合と比較して処理量を低減することができる。
ここで、本実施例と前述した特許文献1及び2に記載の技術とを比較する。特許文献1に記載された技術では、ユーザはカメラの近くに位置し、ある程度の大きさ以上でカメラに写る必要があり、また、あまり速い動きがあった場合には対応することが困難となる。これに対して、本実施例では、ユーザがある程度の大きさ以上でカメラ2に写る必要は特になく、また、ある程度の速い動きにも対応することができる。更に、特許文献1に記載された技術では、ジェスチャ認識アルゴリズムは他の手法を組み合わせる必要があるが、本実施例では、上記以外の他のジェスチャ認識アルゴリズムを組み合わせる必要はない。
他方で、特許文献2に記載された技術では、ユーザがマーカなどを身に付ける必要があり、また、マーカなどを用いない場合には画像からの姿勢推定を行う必要がある。これに対して、本実施例では、ユーザがマーカなどを身に付ける必要はなく、また、画像からの姿勢推定を行う必要もない。
(6)変形例
以下では、上記の実施例に好適な変形例について説明する。なお、下記の変形例は、任意に組み合わせて上述の実施例に適用することができる。
(6−1)変形例1
変形例1は、撮影画像を得るためのカメラ2に、距離画像センサを適用するものである。距離画像センサを用いた場合には、撮影画像中の人物などの距離が分かるため、人物などの位置を連続的に精度良く取得することができる。また、撮影画像において色が似ているような箇所についても、適切に動きを検出することができる。加えて、赤外カメラを更に適用した場合には、暗闇などでも適切に動きを検出することができる。
(6−2)変形例2
変形例2は、軌跡に対して当てはめる関数を適宜変更するものである。つまり、軌跡に対して当てはめる関数を複数用意し、状況などに応じて、用いる関数を変更することができる。また、状況などに応じて、複数の関数を組み合わせて用いることができる。例えば、カメラ2が機械的に振動しているような特殊な環境で検出を行う場合に、そのような振動成分を除去するための関数を、上記した人物の移動などに起因する成分を除去するための関数と合わせて用いることができる。
(6−3)変形例3
上記した実施例では、撮影画像中の物体の動きを検出する手法として、オプティカルフローを用いる手法を示したが、オプティカルフローを用いることに限定はされない。動きを検出する手法としては、公知の種々の手法を適用することができる。
また、画像認識と動き検出とを組み合わせて行っても良い。1つの例では、テンプレートマッチングなどを用いて、撮影画像から人物の部位を認識し、認識された部位についての動きを検出することができる。
(6−4)変形例4
上記では、周波数解析を行う前に関数当てはめを行う実施例を示した。つまり、実施例では、軌跡に対して所定の関数を当てはめ、当てはめた関数と軌跡との残差に対して周波数解析を行っていた。変形例4では、このような関数当てはめを行わずに、周波数解析を行う。具体的には、変形例4では、軌跡検出部11によって求められた軌跡に対して周波数解析を直接行う。これによっても、人物が手振りを行っている場合には、手振りに応じた周波数範囲においてピークが生じるようなパワースペクトルが得られるものと考えられる。
(6−5)変形例5
上記では、所定のジェスチャとして手振りを検出する実施例を示したが、手振りを検出することに限定はされない。手振り以外にも、ある程度の周期性をもってなされる人物の動作を、所定のジェスチャとして検出することができる。例えば、人物の首振りなどを検出することができる。
(7)適用例
本発明は、テレビや、ホームAVや、各種の家電についての、ジェスチャ操作インタフェースとして好適に適用することができる。
1 ジェスチャ検出装置
2 カメラ
11 軌跡検出部
12 周波数解析部
13 ジェスチャ検出部
14 記憶部

Claims (9)

  1. 複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出手段と、
    前記軌跡検出手段によって検出された前記軌跡に対して周波数解析を行う周波数解析手段と、
    前記周波数解析手段による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出手段と、を備えることを特徴とするジェスチャ検出装置。
  2. 前記周波数解析手段は、前記軌跡検出手段によって検出された前記軌跡に対して所定の関数を当てはめ、当てはめた前記所定の関数と前記軌跡との残差に対して前記周波数解析を行うことを特徴とする請求項1に記載のジェスチャ検出装置。
  3. 前記周波数解析手段は、前記所定の関数と前記軌跡との残差を、前記所定のジェスチャに起因する成分が含まれている可能性があるものとして扱い、当該残差に対して前記周波数解析を行うことを特徴とする請求項2に記載のジェスチャ検出装置。
  4. 前記ジェスチャ検出手段は、前記所定の周波数範囲として手振りに応じた周波数範囲を用いて、前記所定のジェスチャとして手振りを検出することを特徴とする請求項1乃至3のいずれか一項に記載のジェスチャ検出装置。
  5. 前記軌跡検出手段は、前記複数フレームとして、前記手振りに応じた周波数範囲に基づいたフレーム数を用いることを特徴とする請求項4に記載のジェスチャ検出装置。
  6. 前記軌跡検出手段は、前記複数フレームの各々から、前記物体の動きをオプティカルフローとして求め、前記複数フレームの各々から求められた前記オプティカルフローを追跡することで、前記軌跡を検出することを特徴とする請求項1乃至5のいずれか一項に記載のジェスチャ検出装置。
  7. 前記ジェスチャ検出手段は、前記ピークに対して用いる前記所定値を、前記周波数解析の結果に応じて変更することを特徴とする請求項1乃至6のいずれか一項に記載のジェスチャ検出装置。
  8. ジェスチャ検出装置によって実行されるジェスチャ検出方法であって、
    複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出工程と、
    前記軌跡検出工程によって検出された前記軌跡に対して周波数解析を行う周波数解析工程と、
    前記周波数解析工程による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出工程と、を備えることを特徴とするジェスチャ検出方法。
  9. コンピュータを有するジェスチャ検出装置によって実行されるプログラムであって、
    前記コンピュータを、
    複数フレーム分の撮影画像に基づいて、物体の動きについての軌跡を検出する軌跡検出手段、
    前記軌跡検出手段によって検出された前記軌跡に対して周波数解析を行う周波数解析手段、
    前記周波数解析手段による前記周波数解析の結果に基づいて、所定の周波数範囲において所定値以上のピークが発生している場合に、所定のジェスチャが行われたと判定するジェスチャ検出手段、として機能させることを特徴とするプログラム。
JP2012168074A 2012-07-30 2012-07-30 ジェスチャ検出装置、ジェスチャ検出方法及びプログラム Expired - Fee Related JP6109505B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012168074A JP6109505B2 (ja) 2012-07-30 2012-07-30 ジェスチャ検出装置、ジェスチャ検出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012168074A JP6109505B2 (ja) 2012-07-30 2012-07-30 ジェスチャ検出装置、ジェスチャ検出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014026566A true JP2014026566A (ja) 2014-02-06
JP6109505B2 JP6109505B2 (ja) 2017-04-05

Family

ID=50200124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012168074A Expired - Fee Related JP6109505B2 (ja) 2012-07-30 2012-07-30 ジェスチャ検出装置、ジェスチャ検出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6109505B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116883946A (zh) * 2023-07-24 2023-10-13 武汉星巡智能科技有限公司 老人异常行为实时检测方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09305773A (ja) * 1996-05-13 1997-11-28 Nec Corp 運動検出装置
JP2000149025A (ja) * 1998-11-13 2000-05-30 Nec Corp ジェスチャ認識装置及び方法
JP2012123538A (ja) * 2010-12-07 2012-06-28 Pioneer Electronic Corp 周期動作検出装置及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09305773A (ja) * 1996-05-13 1997-11-28 Nec Corp 運動検出装置
JP2000149025A (ja) * 1998-11-13 2000-05-30 Nec Corp ジェスチャ認識装置及び方法
JP2012123538A (ja) * 2010-12-07 2012-06-28 Pioneer Electronic Corp 周期動作検出装置及び方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6016026453; 奥田 雄人 外1名: '離散ウェーブレット変換を用いたジェスチャ認識' 情報処理学会 シンポジウム 画像の認識・理解シンポジウム(MIRU) 2011 [online] , 20110720, 第726頁-第731頁, 情報処理学会 *
JPN7016001912; 浅野 秀胤 外5名: '小さな手振り検出を用いた家電操作システムの構築' 映像情報メディア学会2011年年次大会講演予稿集 一般講演 第9部門 9-9, 20110801, 社団法人映像情報メディア学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116883946A (zh) * 2023-07-24 2023-10-13 武汉星巡智能科技有限公司 老人异常行为实时检测方法、装置、设备及存储介质
CN116883946B (zh) * 2023-07-24 2024-03-22 武汉星巡智能科技有限公司 老人异常行为实时检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP6109505B2 (ja) 2017-04-05

Similar Documents

Publication Publication Date Title
KR101606628B1 (ko) 포인팅 방향 검출 장치 및 그 방법과, 프로그램 및 컴퓨터 판독가능한 매체
JP6395506B2 (ja) 画像処理装置および方法、プログラム、並びに撮像装置
US9952667B2 (en) Apparatus and method for calibration of gaze detection
JP2015526927A (ja) カメラ・パラメータのコンテキスト駆動型調整
US10582116B2 (en) Shooting control method, shooting control apparatus and user equipment
JP2000163196A (ja) ジェスチャ認識装置及びジェスチャ認識機能を有する指示認識装置
CN108778123B (zh) 步态分析装置、步态分析方法和计算机可读记录介质
JP4153818B2 (ja) ジェスチャ認識装置、ジェスチャ認識方法及びジェスチャ認識プログラム
TWI479430B (zh) 以自然影像進行的手勢辨識方法
JP6579950B2 (ja) カメラの撮影画像に映る人物を検出する画像解析装置、プログラム及び方法
JP2014048882A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6873344B2 (ja) 疲労判定装置、疲労判定方法、および疲労判定プログラム
JP6007523B2 (ja) 生成装置、生成プログラムおよび生成方法
US9857878B2 (en) Method and apparatus for processing gesture input based on elliptical arc and rotation direction that corresponds to gesture input
Quek et al. A parallel algorithm for dynamic gesture tracking
CN111160088A (zh) Vr体感数据检测方法、装置、计算机设备及存储介质
US11386564B2 (en) Method, system, and computer-accessible recording medium for motion recognition based on an atomic pose
US20130329964A1 (en) Image-processing device and image-processing program
JP2017205134A (ja) 体調検出装置、体調検出方法及び体調検出プログラム
JP2004303014A (ja) ジェスチャ認識装置、ジェスチャ認識方法及びジェスチャ認識プログラム
CN110910426A (zh) 动作过程和动作趋势识别方法、存储介质和电子装置
JP6109505B2 (ja) ジェスチャ検出装置、ジェスチャ検出方法及びプログラム
JP2012181710A (ja) オブジェクト追跡装置、方法、及びプログラム
KR101909326B1 (ko) 얼굴 모션 변화에 따른 삼각 매쉬 모델을 활용하는 사용자 인터페이스 제어 방법 및 시스템
JP7113274B2 (ja) 下肢筋力推定システム、下肢筋力推定方法、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170308

R150 Certificate of patent or registration of utility model

Ref document number: 6109505

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees