JP4185421B2 - 処理情報入力装置、処理情報入力方法、この方法のプログラム、およびこのプログラムを記録した記録媒体 - Google Patents

処理情報入力装置、処理情報入力方法、この方法のプログラム、およびこのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4185421B2
JP4185421B2 JP2003302446A JP2003302446A JP4185421B2 JP 4185421 B2 JP4185421 B2 JP 4185421B2 JP 2003302446 A JP2003302446 A JP 2003302446A JP 2003302446 A JP2003302446 A JP 2003302446A JP 4185421 B2 JP4185421 B2 JP 4185421B2
Authority
JP
Japan
Prior art keywords
motion
video
image
computer
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003302446A
Other languages
English (en)
Other versions
JP2005071208A (ja
Inventor
憲作 藤井
賢一 荒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003302446A priority Critical patent/JP4185421B2/ja
Publication of JP2005071208A publication Critical patent/JP2005071208A/ja
Application granted granted Critical
Publication of JP4185421B2 publication Critical patent/JP4185421B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Position Input By Displaying (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Description

本発明は、コンピュータ利用者の動きから、コンピュータ上の処理情報を入力するための処理情報入力装置および方法に関する。
ユビキタス(時空自在)という言葉が一般に利用されているように、日常生活のさまざまな場面においてコンピュータが利用できる環境が整いつつある。このようなコンピュータが遍在し利用者の実世界の作業を支援するような環境では、コンピュータをコンピュータとして意識せずに自然で直感的に利用できるインタフェースが求められている。これらの問題を鑑み、画像情報を利用して利用者の動きを認識する技術が提案されている。
この種の従来技術としては、オプティカルフローによる方法が知られている(例えば、特許文献1参照)。この方法は、画像中の物体の移動による映像の変化を光学的な流れとしてみなして分析し、物体の動きを認識する手法である。
また、他の従来技術としては、人物の動きにより周辺の流体に拡散現象が生じるものとし、その状況をセル状に離散化したモデルで解析し、動きを認識する方法がある(例えば、特許文献2参照)。
しかし、特許文献1では、オプティカルフローに着目しているので、オプティカルフローが精度良く検出できない場合の処理が困難であった。
また、セル状拡散モデルを利用して動きを認識する方法は、拡散モデルの濃度値の分布をある軸方向へ投影したものを特徴量として利用しており、局所的に動きが異なるといった場合についての考慮がなされていない。
特開平10−334270号公報 特開2002−8042号公報
本発明は、前記の課題を解決ため、コンピュータに対する情報入力のための新たな装置、特に、利用者の動きでコンピュータ上の処理情報を入力できる処理情報入力装置、処理情報入力方法、この方法のプログラム、およびこのプログラムを記録した記録媒体を提供することを目的とする。
本発明は、前記の課題を解決するため、利用者の動き登録時に利用者を撮影した複数の第1の映像および利用者の動き識別時に利用者を撮影した単数の第2の映像を入力する画像入力部(過程)と、前記入力された映像に対し、利用者の動きパターン画像を生成する動き検出部(過程)と、前記第1の映像の各々に対して、当該第1の映像、前記生成された動きパターン画像、及びそれに対応するコンピュータ上での処理内容を登録する動き登録部(過程)と、前記第2の映像の動きパターン画像と、前記登録された第1の映像の動きパターン画像との相関値をそれぞれに求め、相関値が第1のしきい値以上の第1の映像の動きパターン画像を求める動き識別部(過程)と、前記動き識別部(過程)で求められた第1の動きパターン画像に対応する、前記動き登録部(過程)にて登録された処理内容をコンピュータに実行させる動き処理部(過程)と、を備え、
前記動き検出部(過程)は、処理対象の映像について、各画素についてフレーム間での画素値の差を算出する手段(ステップ)と、該画素値の差が第2のしきい値を越える場合に、該画素にフレーム番号を割り当てた画像を生成する手段(ステップ)と、前記フレーム番号を割り当てた画像をもとに、フレーム番号が割り当てられた各画素に対して最小のフレーム番号を画素値とする動きパターン画像を生成する手段(ステップ)とを有し、コンピュータに対する処理情報入力を利用者の直感的な動きで行えるようにする。
また、前記動き登録部(過程)は、前記第1の映像に対して、当該第1の映像のフレーム数をも登録する手段(ステップ)を有し、前記動き識別部(過程)は、前記第2の映像のフレーム数と第1の映像のフレーム数が等しい場合に限り、動きパターン画像間の相関値を求める手段(ステップ)を有し、複数の動き速度の異なる同じ動きを、動き構成フレーム数の違いにより登録および識別できるようにする。
また、本発明のプログラムは、前記処理情報入力方法における処理過程を、コンピュータで実行可能に構成したことを特徴とする。
また、本発明の記録媒体は、前記処理情報入力方法における処理過程を、コンピュータに実行させるためのプログラムを、該コンピュータが読み取り可能な記録媒体に記録したことを特徴とする。
以上説明したように、本発明によれば、利用者の動きにより、コンピュータ上での処理を実行することができ、動きによる直感的な入力を支援することができる。
以下、本発明の実施形態について図面を参照しながら詳細に説明する。
図1は、本実施形態による情報入力装置の機能ブロック図を示す。図1に示すように、情報入力装置は、画像入力部1、動き登録部2、動き検出部3、動き識別部4、動き処理部5から構成されている。
画像入力部1は、利用者の動きを撮影した画像を入力し、図示省略するメモリに格納する。この画像入力は、CCDを撮像素子として用いたカメラ6などを利用することができる。
また、動き処理部5は、動き識別部4の識別結果に基づき、動き登録部2に登録された処理内容をコンピュータに実行させる。この処理内容は、コンピュータの操作に関することであれば、特に制限されるものではなく、情報を入力したり、表示させたり、といった、通常、入力デバイスを利用して実施している処理を実行させることができる。
図2、図3、及び図4は、図1の動き登録部2、動き検出部3、動き識別部4の各部の処理を示すフローチャートである。以下、この流れにしたがって詳細に説明する。
動き登録部2では、動きを撮影した画像、及びそれに対応するコンピュータ上での処理内容を登録することが行われる。この処理は図2に示す手順で以下のように行われる。
[ステップ1]動きに対応するコンピュータ上での処理内容を入力する。
[ステップ2]動き開始、終了指示とともに実施された動きを撮影した画像を画像入力部から入力する。
[ステップ3]入力された画像群から、動き構成フレーム数を算出する。
[ステップ4]入力された画像群から動き検出部で生成された動きパターン画像を取得する。
[ステップ5]動きパターン画像、動き構成フレーム数、及び対応する処理内容を格納する。
動き検出部3では、入力された画像群から動きパターン画像を生成する。この処理は図3に示す手順で以下のように行われる。
[ステップ11]登録されている動き構成フレーム数を取得する。
[ステップ12]取得したフレーム数の画像をメモリから読み出す。
[ステップ13]各画像の画素についてフレーム間での画素値の差を算出する。
[ステップ14]画素値の差がしきい値を越える場合に、その画素値にフレーム番号を割り当てる。
[ステップ15]フレーム番号が割り当てられた画素が存在している領域を抽出する。
[ステップ16]抽出した領域内の各画素に対して、最小のフレーム番号の値をその画素の画素値として、その領域と同じサイズの動きパターン画像を生成する。
また、領域を抽出する処理は、通常の画像処理で利用される領域分割処理と同じであり、これらの手法は、従来の手法と特に変わるところがないので、ここではその詳細な説明は省略する。
また、ステップ14で利用するしきい値は、あらかじめ決めておくか、平均値、度数、偏差値などといった統計的に算出される値を利用して動的に算出してもよく、これらの値の算出手法は、従来の手法と特に変わるところがないので、ここではその詳細な説明は省略する。
動き識別部4では、画像入力部1から得る利用者の動きパターン画像と、動き登録部2に登録されている動きパターン画像との照合に基づき、利用者の動きを認識する。この処理は図4に示す手順で以下のように行われる。
[ステップ21]登録されている動きパターン画像を取得する。
[ステップ22]動き検出部3で生成された動きパターン画像、及び動き構成フレーム数を入力する。
[ステップ23]登録されている動きパターン画像から、入力された動き構成フレーム数を有する動きパターン画像を選択する。
[ステップ24]これらの画像群に対して、入力された動きパターン画像の画像サイズを補正し、相関値を算出する。
[ステップ25]相関値がしきい値を越える場合に、それに対応する登録されている動きパターン画像に照合が得られたと判断する。
ここで、相関値の算出は、通常の画像処理で利用される、例えば、以下の式で示される正規化相互相関値を利用するとしてよい。基準画像T(x,y)、入力画像I(x,y)とすると、相関値R(x,y)は、
Figure 0004185421
で表される。
以下では、これまで説明してきた利用者の動き情報入力装置において、コンピュータに対する情報入力を直感的な動きで行う際の具体的な手順を説明する。
動き登録部2において、ある動き(ここでは利用者が手を左から右へ振る)を登録し、この利用者の動きをコンピュータ上ではメールの受信という処理を対応させていたとする。このとき、この利用者の動きは図5に示すように、全6フレームの画像501〜506から構成されたとする。図中のTは時刻である。
これら画像群から、動き検出部3において動きパターン画像を生成する。各画素について、フレーム間での画素値の差がしきい値を越える場合に、フレーム番号が割り当てられる。図5に示す画像に対して、各フレーム間での画素値の差を算出すると、図6に示す画像603〜605での画素がしきい値を越えることになる。これらの画素に対し、図7の703〜705には図示のようなフレーム番号が割り当てられる。
これに対して、フレーム番号が割り当てられた画素が存在している領域を抽出すると、図8の801に示すような動き領域となる。この領域内の各画素に対して、最小のフレーム番号を画素値として、図8の802に示すような動きパターン画像が生成される。この動きパターン画像においては、各画素の画素値は、その画素の位置で動きが検出された最初のフレーム数(時刻)を表している。したがって、画素値によって利用者の動きを辿ることができる。
こうして、検出および登録された動きパターン画像に対し、入力された動きがどれに対応するかを認識することにより、それに対応する処理が実行されることになる。ここでは、動き構成フレーム数が6であることから、6フレームの画像群が逐次入力され、動き識別部4による動き識別処理が行われる。例えば、ある瞬間に、図9に示す全6フレームの画像群が入力されたとする。これに対し、図に示すようなフレーム番号901〜906が割り当てられ、図10に示すようにしきい値を越えた画素が抽出され、これらの画素が図11の1101に示す動き領域が抽出され、1102に示す動きパターン画像が生成される。この1102と図8の802の動きパターン画像との相関値が算出され、各画素値を見て分かるように、これらの画像の相関は高くなく、この動きが識別されないことになる。
続いて、ある瞬間に、図12に示す全6フレームの画像群が入力されたとする。これに対し、図13に示すようなフレーム番号が割り当てられ、図14の1401に示す動き領域が抽出され、1402に示す動きパターン画像が生成される。この1402と図8の802との相関値が算出され、この相関は非常に高いことから、同じ動きであると識別される。こうして識別された動きに対応する処理、ここでは、図1ではパソコン(PC)7によりメールの受信が実行されることになる。
また、例えば画像の右下から左上へ手を上げた場合には、図15に示すような全6フレームの画像群が入力されることになり、図16に示す過程を経て、図7の1701に示す動き領域が抽出され、1702に示す動きパターン画像が生成される。
このように、いろいろな動き、あるいは、動き速度をかえたものを複数登録しておき、それぞれに対応する処理を実行させることにより、動きによる直感的な入力を支援することができる。
更には、これらの動きを複数組み合わせた場合も考えられる。例えば、図18には、右手(上側)を左から右へ、左手(下側)を右から左へ振った場合を示している。この場合、図19に示す過程を経て、図20の2001に示す動き領域が抽出され、2002に示す動きパターン画像が生成される。このように、従来技術では難しかった、局所的に異なる動きを行った場合も、良好に動きを識別することができる。
以上、本発明を実施形態例に基づき具体的に説明したが、木発明は上述の実施形態に限定されるものではなく、幅広く応用することができる。
また、本発明は、図1に示した装置の一部又は全部の処理機能をプログラムとして構成してコンピュータを用いて実現すること、あるいは図2〜図4で示した処理手順をプログラムとして構成してコンピュータに実行させることができる。また、コンピュータでその各部の処理機能を実現するためのプログラム、あるいはコンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、フレキシブルディスク、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることが可能であり、また、インターネットのような通信ネットワークを介して配布したりすることが可能である。
本発明に係る利用者の動き情報入力装置の機能ブロック図。 本発明に係る各部の動きを示す処理フロー。 本発明に係る各部の動きを示す処理フロー。 本発明に係る各部の動きを示す処理フロー。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。 本発明に係る処理の一例を説明するための図。
符号の説明
1 画像入力部
2 動き登録部
3 動き検出部
4 動き識別部
5 動き処理部
6 カメラ
7 パソコン(PC)

Claims (6)

  1. コンピュータ利用者の動きから、コンピュータ上の処理情報を入力するための処理情報入力装置であって、
    利用者の動き登録時に利用者を撮影した複数の第1の映像を入力、および利用者の動き識別時に利用者を撮影した単数の第2の映像を入力する画像入力部と、
    前記入力された映像に対し、利用者の動きパターン画像を生成する動き検出部と、
    前記第1の映像の各々に対して、当該第1の映像、前記生成された動きパターン画像、及びそれに対応するコンピュータ上での処理内容を登録する動き登録部と、
    前記第2の映像の動きパターン画像と、前記登録された第1の映像の動きパターン画像との相関値をそれぞれに求め、相関値が第1のしきい値以上の第1の映像の動きパターン画像を求める動き識別部と、
    前記動き識別部で求められた第1の動きパターン画像に対応する、前記動き登録部にて登録された処理内容をコンピュータに実行させる動き処理部と、を備え、
    前記動き検出部は、処理対象の映像について、
    各画素についてフレーム間での画素値の差を算出する手段と、
    該画素値の差が第2のしきい値を越える場合に、該画素にフレーム番号を割り当てた画像を生成する手段と、
    前記フレーム番号を割り当てた画像をもとに、フレーム番号が割り当てられた各画素に対して最小のフレーム番号を画素値とする動きパターン画像を生成する手段と、
    を有することを特徴とする処理情報入力装置。
  2. 請求項1において、
    前記動き登録部は、前記第1の映像に対して、当該第1の映像のフレーム数をも登録する手段を有し、
    前記動き識別部は、前記第2の映像のフレーム数と第1の映像のフレーム数が等しい場合に限り、動きパターン画像間の相関値を求める手段を有する、
    ことを特徴とする処理情報入力装置。
  3. コンピュータ利用者の動きから、コンピュータ上の処理情報を入力するための処理情報入力方法であって、
    利用者の動き登録時に利用者を撮影した複数の第1の映像を入力、および利用者の動き識別時に利用者を撮影した単数の第2の映像を入力する画像入力過程と、
    前記入力された映像に対し、利用者の動きパターン画像を生成する動き検出過程と、
    前記第1の映像の各々に対して、当該第1の映像、前記生成された動きパターン画像、及びそれに対応するコンピュータ上での処理内容を登録する動き登録過程と、
    前記第2の映像の動きパターン画像と、前記登録された第1の映像の動きパターン画像との相関値をそれぞれに求め、相関値が第1のしきい値以上の第1の映像の動きパターン画像を求める動き識別過程と、
    前記動き識別過程で求められた第1の動きパターン画像に対応する、前記動き登録過程にて登録された処理内容をコンピュータに実行させる動き処理過程と、を備え、
    前記動き検出過程は、処理対象の映像について、
    各画素についてフレーム間での画素値の差を算出するステップと、
    該画素値の差が第2のしきい値を越える場合に、該画素にフレーム番号を割り当てた画像を生成するステップと、
    前記フレーム番号を割り当てた画像をもとに、フレーム番号が割り当てられた各画素に対して最小のフレーム番号を画素値とする動きパターン画像を生成するステップと、
    を有することを特徴とする処理情報入力方法。
  4. 請求項3において、
    前記動き登録過程は、前記第1の映像に対して、当該第1の映像のフレーム数をも登録するステップを有し、
    前記動き識別過程は、前記第2の映像のフレーム数と第1の映像のフレーム数が等しい場合に限り、動きパターン画像間の相関値を求めるステップを有する、
    ことを特徴とする処理情報入力方法。
  5. 前記請求項3および4の処理情報入力方法における処理過程を、コンピュータで実行可能に構成したことを特徴とするプログラム。
  6. 前記請求項3および4の処理情報入力方法における処理過程を、コンピュータに実行させるためのプログラムを、該コンピュータが読み取り可能な記録媒体に記録したことを特徴とする記録媒体。
JP2003302446A 2003-08-27 2003-08-27 処理情報入力装置、処理情報入力方法、この方法のプログラム、およびこのプログラムを記録した記録媒体 Expired - Fee Related JP4185421B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003302446A JP4185421B2 (ja) 2003-08-27 2003-08-27 処理情報入力装置、処理情報入力方法、この方法のプログラム、およびこのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003302446A JP4185421B2 (ja) 2003-08-27 2003-08-27 処理情報入力装置、処理情報入力方法、この方法のプログラム、およびこのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2005071208A JP2005071208A (ja) 2005-03-17
JP4185421B2 true JP4185421B2 (ja) 2008-11-26

Family

ID=34406711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003302446A Expired - Fee Related JP4185421B2 (ja) 2003-08-27 2003-08-27 処理情報入力装置、処理情報入力方法、この方法のプログラム、およびこのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4185421B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4736052B2 (ja) * 2006-07-21 2011-07-27 ブラザー工業株式会社 操作信号出力装置及び操作システム
NL2003662C2 (nl) 2009-10-16 2011-04-19 Sara Lee De Nv Werkwijze, controle-eenheid voor een apparaat en apparaat voorzien van een controle-eenheid.
KR101953165B1 (ko) 2012-02-24 2019-05-22 토마스 제이. 모스카릴로 제스처 인식 디바이스들 및 방법들
JP6091407B2 (ja) * 2013-12-18 2017-03-08 三菱電機株式会社 ジェスチャ登録装置
US10474886B2 (en) * 2014-08-13 2019-11-12 Rakuten, Inc. Motion input system, motion input method and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000075991A (ja) * 1998-08-28 2000-03-14 Aqueous Research:Kk 情報入力装置

Also Published As

Publication number Publication date
JP2005071208A (ja) 2005-03-17

Similar Documents

Publication Publication Date Title
AU2017261537B2 (en) Automated selection of keeper images from a burst photo captured set
CN108604378B (zh) 视频流的图像分割和修改
US8254630B2 (en) Subject extracting method and device by eliminating a background region using binary masks
JP5106271B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2005210573A (ja) 映像表示システム
KR20070064269A (ko) 화상 처리 장치 및 방법, 및 프로그램
JP2009042876A (ja) 画像処理装置及びその方法
JP4206053B2 (ja) ユーザインタフェース装置およびユーザインタフェースプログラム
Abiko et al. Single image reflection removal based on GAN with gradient constraint
CN109086725B (zh) 手部跟踪方法及机器可读存储介质
JP2010225118A (ja) 画像処理装置、方法及びプログラム
US20060056668A1 (en) Image processing apparatus and image processing method
CN115240203A (zh) 业务数据处理方法、装置、设备及存储介质
JP4185421B2 (ja) 処理情報入力装置、処理情報入力方法、この方法のプログラム、およびこのプログラムを記録した記録媒体
JPWO2020021879A1 (ja) 画像処理装置、および画像処理方法、並びにプログラム
JP6373446B2 (ja) ビデオフレームを選択するプログラム、システム、装置、及び方法
JP2015011526A (ja) 行動認識装置、方法及びプログラム並びに認識器構築装置
US11410398B2 (en) Augmenting live images of a scene for occlusion
CN115546906A (zh) 检测图像中人脸活度的系统和方法及电子设备
JP2007140695A (ja) 不審顔検出システム、不審顔検出方法および不審顔検出プログラム
JP2014229092A (ja) 画像処理装置、画像処理方法、および、そのプログラム
JP5464965B2 (ja) 画像処理装置及びその制御方法、並びにプログラム及び記憶媒体
JP2007304675A (ja) 画像合成方法および装置ならびにプログラム
JP2008148183A (ja) 画像処理装置、画像処理方法、および画像処理プログラム
US20230410505A1 (en) Video manipulation detection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080902

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080905

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees