JP5782061B2 - 移動物体の動作を認識する方法および携帯式コンピュータ - Google Patents

移動物体の動作を認識する方法および携帯式コンピュータ Download PDF

Info

Publication number
JP5782061B2
JP5782061B2 JP2013047459A JP2013047459A JP5782061B2 JP 5782061 B2 JP5782061 B2 JP 5782061B2 JP 2013047459 A JP2013047459 A JP 2013047459A JP 2013047459 A JP2013047459 A JP 2013047459A JP 5782061 B2 JP5782061 B2 JP 5782061B2
Authority
JP
Japan
Prior art keywords
image
gesture
blur
difference
portable computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013047459A
Other languages
English (en)
Other versions
JP2014174776A (ja
Inventor
泰史 塚本
泰史 塚本
潤 杉山
潤 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
Lenovo Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Singapore Pte Ltd filed Critical Lenovo Singapore Pte Ltd
Priority to JP2013047459A priority Critical patent/JP5782061B2/ja
Priority to US14/171,029 priority patent/US20140254870A1/en
Publication of JP2014174776A publication Critical patent/JP2014174776A/ja
Application granted granted Critical
Publication of JP5782061B2 publication Critical patent/JP5782061B2/ja
Priority to US15/582,338 priority patent/US9864436B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Studio Devices (AREA)

Description

本発明は、カメラが撮影した静止画像から移動物体の動作を認識する技術に関し、さらには、少ないフレームで移動物体の動作を認識する技術に関する。
デスクトップ型コンピュータ、ノートブック型コンピュータ(ノートPC)、タブレット型コンピュータまたはスマートフォンなどでは、リアルタイムの映像をモニターに映すことができるWebカメラを搭載して、テレビ電話をしたり写真やビデオ動画の撮影をしたりすることができる。
特許文献1は、カメラが撮影したモーション・ブラーのパラメータから人物の動きのパターンを認識する発明を開示する。同文献にはモーション・ブラーの範囲を物体の速度を示す指標として使用することが記載されている。またモーション・ブラーの方向の変化から物体の軌道を得ることが記載されている。さらに、モーション・ブラーをジェスチャに関連付けることも記載されている。特許文献2は、対象物の明るさやカメラの揺れといった撮影環境に変動があったときに高い精度で移動物体を検出する発明を開示する。同文献には、第1の画像とその直前に入力された第2の画像の濃度の差分に相当する差分画像から移動物体を検出することが記載されている。
特表2009−500709号公報 特開平10−93957号公報
コンピュータは、キーボード、タッチパッド、タッチスクリーン、ポインティング・デバイス、および操作ボタンなどのさまざまな入力デバイスを備えている。これまでWebカメラは静止画や動画の撮影に利用することがほとんどであったが、入力デバイスの一部として利用することも可能である。たとえば、待機状態のコンピュータをウェイクさせるには、キーボードやポインティング・デバイスを操作することが一般的であるが、Webカメラで撮影したユーザが手を振る動作のようなモーション・ジェスチャ(以下、単にジェスチャ)を認識してウェイクさせることも可能である。
ジェスチャを認識する従来の方法では、手のひらのようなジェスチャを行う物体を画像のフレームごとに認識して、その物体の中心の軌跡のベクトルがジェスチャとして定義された軌跡を辿るかどうかを判断していた。その方法で手を振るジェスチャを認識するには、ジェスチャの毎秒のサイクル数の2倍以上のフレーム・レート(fps)で画像を取得しないと画像の取りこぼしができて認識できなくなるためフレーム・レートは高くなる傾向にあった。
Webカメラでは電子シャッターのシャッター速度(露光時間または電荷蓄積時間)を調整して露光制御を行う。ジェスチャ認識のためにフレーム・レートを上げると必然的に露光時間が短くなる。したがって、従来の方法で暗所においてジェスチャを認識する際には光量が不足する。またそれを補うためにAGCゲインを上げるとノイズも多くなるため安定した認識ができない。暗所での光量不足を補うためにWebカメラはフレーム・レートを下げて露光時間を長くすることができるが、露光時間を長くすると動く物体の画像にはモーション・ブラーが発生して物体の形を認識できなくなる。
したがって、Webカメラを使った従来の方法で安定したジェスチャ認識を行うことができるのは、フレーム・レートを高くできる明るい場所に限られ、暗い場所では原理的にジェスチャ認識ができなかった。高感度のイメージ・センサを採用したり、光学系の性能向上で対策をしたりすることも可能であるが、コンピュータに搭載するWebカメラとしては必要以上の機能になってしまうため採用が困難である。
特に電池で動作する携帯式コンピュータではジェスチャ認識のために消費電力が増加することは好ましくない。ウェイクのためにいつ行われるか不明なジェスチャを認識するためには、システムが待機状態の間継続してジェスチャを認識できる状態を維持する必要がある。これまでのジェスチャ認識の方法は、高度な認識が可能である一方で、高いフレーム・レートで多量の情報を処理しているため、カメラ、インターフェースおよびプロセッサの消費電力が大きく、長時間に渡ってジェスチャの認識が可能な状態にしておくことはできない。
そこで本発明の目的は、カメラが撮影した静止画像で移動物体の動作を認識する方法を提供することにある。さらに本発明の目的は、環境の明るさの変化に対して安定して移動物体の動作を認識する方法を提供することにある。さらに本発明の目的は、ジェスチャでコンピュータの動作を制御する方法を提供することにある。さらに本発明の目的は、低消費電力で移動物体の動作を認識する方法を提供することにある。さらに本発明の目的は、そのような方法を実現する携帯式コンピュータ、カメラ・システムおよびコンピュータ・プログラムを提供することにある。
本発明は物体が所定の経路を移動する動作をコンピュータが認識する方法を提供する。最初に基準パターンを定義する。つぎに、物体を撮影したイメージ・センサからフレームを受け取る。つぎに受け取ったフレームが含む物体のブラー画像の形状を特定する。そして、基準パターンと特定したブラー画像の形状を比較して物体の動作を認識する。ブラー画像の形状は、所定の経路を移動する間に物体の輪郭が描く軌跡で形成される。
ブラー画像を撮影するためには、露光時間を長く設定することになるため暗所でも安定して認識できる。また、露光時間を長くするとフレーム・レートも必然的に下がるためシステムの消費電力を低減することができる。物体の所定の動作は人間の体で行うジェスチャとすることができる。ジェスチャの場合の基準パターンの形状は、肘または肩を中心とする腕の往復動作によりブラー画像が形成される扇形とすることができる。認識が完了するまでに受け取るフレームの数は1個でもよいが、所定のフレーム・レートで撮影された連続する複数のフレームでもよい。ブラー画像の形状を特定する際には、複数のフレームがそれぞれ含むブラー画像を合成して合成画像を生成することができる。
ブラー画像の形状を特定するときには、背景画像と各フレームを比較して階調値の差を計算して2値化したブラー画像を生成することができる。あるいは、フレーム同士を比較して対応する画素の階調値の差を計算して2値化したブラー画像を生成することでブラー画像の形状を特定することができる。合成画像は、2値化したブラー画像の論理和を計算して生成することができる。物体の所定の動作は往復動作とすることができる。認識した結果は、コンピュータのコマンドとしてシステムに送ることができる。システムは、受け取ったコマンドでコンピュータのパワー・ステートを制御したり、特定のアプリケーションを起動したりすることができる。
本発明により、カメラが撮影した静止画像で移動物体の動作を認識する方法を提供することができた。さらに本発明により、環境の明るさの変化に対して安定して移動物体の動作を認識する方法を提供することができた。さらに本発明により、ジェスチャでコンピュータの動作を制御する方法を提供することができた。さらに本発明により、低消費電力で移動物体の動作を認識する方法を提供することができた。さらに本発明により、そのような方法を実現する携帯式コンピュータ、カメラ・システムおよびコンピュータ・プログラムを提供することができた。
ノートPCで実現したカメラ・システム10のハードウェアの構成を説明するための機能ブロック図である。 カメラ・モジュール100の構成を説明するための機能ブロック図である。 カメラ・システム10のソフトウェアの構成を説明するための機能ブロック図である。 フレーム・レートと露光時間の関係を説明する図である。 ジェスチャ認識アプリケーション201の構成を説明するための機能ブロック図である。 カメラ・システム10がジェスチャを認識する手順を説明するフローチャートである。 背景画像291とその前景に存在する人間が手を周期的に振っている様子を抽象的に示す図である。 基準画像登録部263に登録された基準パターンの形状を示す図である。 背景画像291とフレーム・シーケンス300から差分画像データ群350および合成画像データ群400を生成する例を説明するための図である。 フレーム転送周期Tfとジェスチャ周期Tjの関係を説明する図である。 フレーム・シーケンス300から差分画像データ群500および合成画像データ群550を生成する例を説明するための図である。
[ノートPCのハードウェア構成]
図1は、ノートPCに実現したカメラ・システム10のハードウェアの構成を説明するための機能ブロック図である。CPU11はメモリ・コントローラとPCI Expressコントローラを内蔵しており、メイン・メモリ13、ビデオ・カード15およびチップ・セット19に接続されている。ビデオ・カード15にはLCD17が接続されている。チップ・セット19は、SATA、USB、PCI Express、LPCなどのコントローラおよびRTC(Real Time Clock)などを内蔵している。SATAコントローラにはHDD21が接続されている。USBコントローラはUSBホスト・コントローラ、ルート・ハブ、および入出力ポートを構成する複数のハブで構成されている。
カメラ・モジュール100は、USB2.0規格またはUSB3.0規格に適合するUSBデバイスである。カメラ・モジュール100は、差動信号でデータ転送する1対または3対のUSBバス50でUSBコントローラのUSBポートに接続されている。カメラ・モジュール100が接続されるUSBポートは、ハブを他のUSBデバイスと共用してもよいが、USBシステムの選択サスペンド機構を利用してカメラ・モジュール100の電力を効果的に制御するためには当該USBポートがカメラ・モジュール100の専用のハブに接続されていることが望ましい。
ここに、USBシステムの選択サスペンドでは、USBクライアント・ドライバが、USBデバイスがアイドルであると決定したときにUSBバス・ドライバにリクエスト・パケットを送る。当該USBハブに接続されているすべてのUSBデバイスがアイドルになると、それを受けてUSBバス・ドライバが当該USBハブに繋がるUSBバスをアイドル状態に遷移させ、そのバスの状態遷移を検知したUSBデバイスが選択サスペンド状態に遷移する。したがって、カメラ・モジュール100がアイドル状態になる時間が長いほどUSBバスがアイドル状態になる時間が長くなり、結果としてカメラ・モジュール100が選択サスペンド状態に遷移する時間も長くなる。
カメラ・モジュール100は、ノートPCの筐体に組み込む組込タイプでもよいし、ノートPCの筐体に取り付けたUSBコネクタに接続する外付けタイプでもよい。また、カメラ・モジュール100は、ワイヤレスUSBでノートPCに接続してもよい。本発明にかかるカメラ・システム10は従来から存在していた動画を撮影する動画モードに加えて本発明で導入したジェスチャ・モードで画像データを転送することができる。ジェスチャ・モードは、図3のジェスチャ認識アプリケーション201がジェスチャを認識するためのフレームを取得する際に使用する転送モードである。
ジェスチャ・モードではカメラ・モジュール100が、露光時間を長くして各フレームがジェスチャのモーション・ブラーを撮影できるように動画モードに比べて低いフレーム・レートでフレームを転送する。ここにフレームは、すべての水平ラインで構成された画像データで静止画像の1単位に相当する。インターレース方式では1フレームが2つのフィールドで構成される。ジェスチャ・モードの詳細は後に説明する。
カメラ・モジュール100は、動画モードおよびジェスチャ・モードに加えて、静止画像を撮影する際の画像を確認するためのモニタリング・モードでも動作する。モニタリング・モードでは動画モードに比べてフレームの画素数を低くすることができる。ノートPC10のCPU11、チップ・セット19、メイン・メモリ13などのハードウェアと、図3に示すジェスチャ認識アプリケーション201、各階層のデバイス・ドライバ207、209、211、213、静止画像転送サービス203およびオペレーティング・システム205などのソフトウェアはカメラ・システム10の主要な要素を構成する。
EC25は、コンピュータ10の筐体内部の温度を制御したり、デバイスの電力を制御したりするマイクロ・コントローラである。EC25は、CPU11とは独立して動作する。EC25には加速度センサー27およびDC/DCコンバータ29が接続され、さらに、図示しないキーボード、マウス、充電器、および排気ファンなどが接続される。図示しない電池またはAC/DCアダプタはDC/DCコンバータ29に電力を供給する。DC/DCコンバータ29は、コンピュータ10を構成するデバイスに電力を供給する。
[カメラ・モジュール]
図2は、カメラ・モジュール100の構成を説明するための機能ブロック図である。図3は、カメラ・システム10のソフトウェアの構成を説明するための機能ブロック図である。カメラ・モジュール100は、ジェスチャ・モードにおいてVGA(640×480)、QVGA(320×240)、WVGA(800×480)およびWQVGA(400×240)などの画面解像度(画素数)のフレームを転送することができる。光学機構101は、光学レンズおよび光学フィルタなどで構成され、被写体の像をイメージ・センサ103に結像させる。
イメージ・センサ103は、画素を構成するフォト・ダイオードに蓄積された光量に対応する電荷を電気信号に変換して出力するCMOSイメージ・センサ、ノイズを抑圧するCDS回路、ゲインを調整するAGC回路、アナログ信号をディジタル信号に変換するAD変換回路などで構成され、被写体の像の輝度に対応するディジタル信号を出力する。イメージ・センサ103は、動画モードで動作するときに30fpsのフレーム・レートで画像データを転送することができる。
CMOSイメージ・センサは、ローリング・シャッターといわれる電子シャッターを備えている。ローリング・シャッターはシステムが指定しなければ、1ラインまたは数ラインを1ブロックにして撮影環境に最適になるように露光時間を制御する。ローリング・シャッターは1フレーム期間またはインターレース方式の場合は1フィールド期間に各画素を構成するフォト・ダイオードに蓄積される信号電荷を撮影の途中にリセットして露光時間を制御する。なお、イメージ・センサ103は、CMOSイメージ・センサに代えてCCDイメージ・センサを採用することもできる。
イメージ・シグナル・プロセッサ(ISP)105は、画素欠陥およびシェーディングを補正する補正処理、イメージ・センサ103の分光特性を人間の視感度に合わせて補正するホワイト・バランス処理、RGBベイヤー配列の信号から一般的なRGBデータを出力する補間処理、イメージ・センサ103のカラー・フィルターが持つ分光特性を理想特性に近づける色補正処理などを行う画像信号処理回路である。ISP105はさらに、被写体の解像感を高めるための輪郭補正処理およびLCD17の非線形な入出力特性を補正するガンマ処理などを行う。
エンコーダ107は、ISP105から受け取った画像データを圧縮する。エンド・ポイント・バッファ109は、システムとの間で双方向に転送するデータを一時的に記憶することでUSB転送のための複数のパイプを形成する。シリアル・インターフェース・エンジン(SIE)111は、エンド・ポイント・バッファ109から受け取った画像データをUSB規格に適合するようにパケット化してトランシーバ113に送ったり、トランシーバ113から受け取ったパケットを解析してペイロードをMPU115に送ったりする。
SIE111は、USBバス50が所定の時間以上アイドル状態のときに、選択サスペンド状態に遷移するためにMPU115に割り込みをかける。SIE111は、USBバス50がレジュームしたときにサスペンドしているMPU115を動作させる。トランシーバ113は、USB通信のための送信用のトランシーバと受信用のトランシーバを含む。MPU115は、USB転送のためのエニュメレーションを実行し、さらに撮影および画像データの転送をするためにカメラ・モジュール100の動作を制御する。カメラ・モジュール100は、USB規格に規定するパワー・マネジメントに準拠する。MPU115は、SIE111から割り込みがかかったときに、内部クロックを中断させて自らも含めてカメラ・モジュール100をサスペンド状態に遷移させることができる。
MPU115は、USBバス50がレジュームしたときにカメラ・モジュール100をパワー・オン状態または撮影状態に復帰させることができる。MPU115は、システムから受け取ったコマンドを解釈して動画モード(含むモニタリング・モード)またはジェスチャ・モードで画像データを転送するように各部の動作を制御する。MPU115は、ジェスチャ・モードによるフレームを転送するときにUSBバス50がアイドル状態のときは、USBバス・ドライバ211にアイドル状態を解除するための再開信号を送る。
ジェスチャ認識アプリケーション201は、ジェスチャ・モードを有効にするコマンドをMPU115に送る際に、さまざまなパラメータを指定して露光時間を設定することができる。1つの方法では、ジェスチャ認識アプリケーション201がカメラ・モジュール100に対して静止画像を転送するフレーム・レートだけを指定する。MPU115は、ローリング・シャッターの露光時間、ホワイト・バランス、およびAGC回路のゲインなどのキャリブレーションを行ったあとに、指定されたフレーム・レートに対して現在の撮影条件で可能な最大の露光時間を設定する。
MPU115はさらに設定した露光時間に対して現在の撮影条件で最適となるその他のパラメータをイメージ・センサ103およびISP105の所定のレジスタに設定する。他の方法では、ジェスチャ認識アプリケーション201が露光時間、ACGゲイン、ガンマ・カーブ、コントラストおよび絞りなどのブラー画像の撮影に影響を与えるいくつかのパラメータを指定する。MPU115は指定されたパラメータに対して現在の撮影条件で最適となる他のパラメータを設定する。露光時間が指定されたときにMPU115はそれに応じたフレーム・レートを設定することができる。
このときの様子を図4で説明する。図4(A)は動画モードのときにフレーム・レートF1が30fpsの画像データを転送する様子を示し、図4(B)はジェスチャ・モードのときに一例としてフレーム・レートF2が5fpsの画像データを転送する様子を示している。ここではノンインターレース方式を例にして説明するが本発明はインターレース方式で出力するカメラ・モジュールを採用してもよい。
図4(A)では、各フレーム転送周期Tf1(1/F1)において1行〜N行までのラインが順次走査されてデータが出力される。各ラインの時間は、露光時間151と読み取り時間153で構成されている。図4(B)では、フレーム周期Tf2(1/F2)において1行〜N行までのラインが順次走査されてデータが出力される。各ラインは、露光時間155と読み取り時間153で構成されている。
読み取り時間153と157は駆動周波数と解像数に依存する。フレーム・レートF2がF1の1/6になってフレーム転送周期Tf2が6倍になると、露光時間を最大で6倍程度まで延長できる。露光時間が長いほど、移動物体を撮影したときのブラー画像の面積が大きくなる。後に説明するようにブラー画像の面積は、パターン認識に利用する情報量に相当する。ここにブラー画像とは、1フレームにおいて撮影した移動物体の輪郭が形成する画像をいう。ジェスチャ認識アプリケーション201は、ブラー画像の輪郭からブラー画像の形状を特定する。本実施の形態では一例として移動物体はジェスチャをする人間の腕としているが、本発明はこれに限定するものではなく、移動する機械装置や自然物などの他の物体とすることもできる。
ジェスチャ・モードでは、フレームを転送しないときにカメラ・モジュール100が選択サスペンド状態に遷移して、設定していたパラメータが消失する場合がある。MPU115は、一度設定したパラメータをフラッシュROM119に記憶し、各フレーム転送周期でパラメータをフラッシュROM119から読み出して設定することもできる。フラッシュROMは、MPU115が実行するプログラムを格納する。MPU115は、システムから受け取ったコマンドを解釈して、カメラ・モジュール100をジェスチャ・モードまたは動画モードで動作させることができる。
カメラ・モジュール100は、USBバス50から電力の供給を受けて動作するバス・パワード・デバイスである。ただし、カメラ・モジュール100は、独自の電力で動作するセルフ・パワード・デバイスであってもよい。セルフ・パワード・デバイスである場合は、MPU115はUSBバス50の状態に追従するように独自に供給を受けている電力を制御する。
カメラ・モジュール100は、USB規格に基づいて選択サスペンド状態とパワー・オン状態の間を遷移する。カメラ・モジュール100は、選択サスペンド状態のときに複数のロー・パワー状態に遷移してよい。カメラ・モジュール100は、ジェスチャ・モードで動作してフレーム転送周期が長いときには、フレームを送らない時間帯にイメージ・センサ103だけを動作させて最も消費電力の少ないロー・パワー状態に遷移することができる。
なお、図1および図2は本実施の形態を説明するために、本実施の形態に関連する主要なハードウェアの構成および接続関係を簡略化して記載したに過ぎないものである。ここまでの説明で言及した以外にも、カメラ・システム10を構成するには多くのデバイスが使われる。しかしそれらは当業者には周知であるので、ここでは詳しく言及しない。図で記載した複数のブロックを1個の集積回路もしくは装置としたり、逆に1個のブロックを複数の集積回路もしくは装置に分割して構成したりすることも、当業者が任意に選択することができる範囲においては本発明の範囲に含まれる。たとえば、カメラ・モジュール100のインターフェースを、MIPI(Mobile Industry Processor Interface)とし、システムをSOC(System-on-a-chip)で構成することでもよい。
[カメラ・システムのソフトウェア構成]
図3は、カメラ・システム10のソフトウェアの構成を説明するための機能ブロック図である。図3に示すソフトウェアはHDD21に格納されメイン・メモリ13にロードされてCPU11により実行される。動画像アプリケーション204は、カメラ・モジュール100から動画データを取得してLCD17に表示したりHDD21に記録したりする周知のプログラムである。動画像アプリケーション204は、テレビ電話プログラムまたは動画像撮影プログラムとすることができる。動画像アプリケーション204は、従来の方法で高度のジェスチャ認識するジェスチャ・エンジンとすることもできる。
ジェスチャ・アプリケーション201は、ジェスチャ・モードのときにカメラ・モジュール100からフレーム・シーケンスを取得してブラー画像のパターン認識を行い、認識したジェスチャに対応するコマンドを出力する新規なプログラムである。なおフレーム・シーケンスは、動画データとしては不自然な映像になるほど低いフレーム・レートで転送される静止画像の連続的なフレーム群をいう。一例としては、ジェスチャ認識アプリケーション201が出力するコマンドにより、ノートPC10のパワー・ステートを制御したり、動画像アプリケーション204を起動したりすることができる。
ジェスチャ・アプリケーション201は、ユーザがジェスチャ・モードに適用するカメラ・システム10のパラメータを設定したりジェスチャ・モードをイネーブルに設定したりするためのユーザ・インターフェースを含むことができる。ジェスチャ・アプリケーション201は、ノートPCがAC/DCアダプタから電力の供給を受けている間だけ実行するようにしてもよいが、カメラ・システム10は小さい消費電力で動作するので、特に電池パックから電力の供給を受けている間に動作させる場合に適している。
ストリーミング・サービス206は、OS205が提供するサービス・プログラムで動画モードまたはモニタリング・モードでのフレームを動画像アプリケーション204に送ったり、動画像アプリケーション204が発行したコマンドをUSBカメラ・ドライバ207に渡したりする。静止画像転送サービス203は、OS205のユーザ・モードで動作するプログラムで、ジェスチャ・モードで転送されるフレーム・シーケンスをジェスチャ認識アプリケーション201に送ったり、ジェスチャ認識アプリケーション201から受け取ったコマンドやパラメータをUSBカメラ・ドライバ207に送ったりする。
USBカメラ・ドライバ207は、カメラ・モジュール100の動作を制御したりデータ転送を制御したりするデバイス・ドライバである。USBクラス・ドライバ209は、USBビデオ・クラスに定義された共通の処理を行うデバイス・ドライバである。USBバス・ドライバ211は、USBコントローラに接続されたUSBバスの動作を制御する。
USBバス・ドライバ211は、USBカメラ・ドライバ207からカメラ・モジュール100を選択サスペンドに遷移させる指示を受け取ったときに、カメラ・モジュール100に接続されたUSBバス50をアイドル状態に遷移させ、レジュームさせる指示またはデータ転送の指示を受け取ったときにUSBバスをアクティブ状態(レジューム状態)に遷移させる。USBホスト・コントロール・ドライバ213は、カメラ・モジュール100に対するデータ転送とUSBホスト・コントローラの動作を制御する。
[ジェスチャ認識アプリケーション]
図5はジェスチャ認識アプリケーション201の構成を説明するための機能ブロック図である。インターフェース部251は、ジェスチャ・モードのときに静止画像転送サービス203から受け取ったフレームを順番に差分画像生成部257に送る。OS205は、加速度センサー27が検出した加速度値が所定値を越えたあとに所定値以下まで低下したときに、ノートPCの位置が変化してカメラ・モジュール100が撮影する背景画像が変化したことを示す通知をする。
通知を受け取ったインターフェース部251は、静止画像転送サービス203から受け取った複数のフレームを背景画像生成部253に記憶する。これに加えてインターフェース部251はジェスチャ・モードにおいて定期的に複数のフレームを取得して背景画像生成部255に記憶する。インターフェース部251は、ユーザが設定したジェスチャ・モードのイネーブル/ディスエーブル設定、フレーム・レート、露光時間、コントラストおよびAGCゲインなどのパラメータを静止画像転送サービス203に送る。
背景画像生成部253は、インターフェース部251から受け取ったフレームから背景画像を生成する。ジェスチャ・モードで撮影した静止画像は、移動物体を撮影した場合にブラー画像を含む。背景画像生成部253は、受け取ったブラー画像を含む可能性のある複数のフレームの対応する画素について階調値の差を計算し2値化してブラー画像を特定する。背景画像生成部253はフレームから特定したブラー画像を除いた複数の背景画像の論理和を計算してブラー画像を含まない背景画像を生成し背景画像記憶部255に記憶する。
差分画像生成部257は、インターフェース部251から受け取ったフレームと背景画像記憶部255から受け取った背景画像のフレームの対応する画素について階調差を計算して2値化した差分画像を生成し合成画像生成部259に送る。合成画像生成部259は、受け取った差分画像を論理和計算で順番に合成して合成画像を生成しパターン認識部261に送る。基準画像登録部265は、所定のコマンドに関連付けられた複数の基準パターンを登録する。
パターン認識部261は、合成画像生成部259が生成した合成画像の特徴を周知のアルゴリズムで抽出して基準画像登録部263に登録された複数の基準パターンと比較する。パターン認識部261は、合成画像がいずれかの基準パターンに一致すると判断したときに当該基準パターンに関連付けられたコマンドをOS205に出力する。図5に示した各要素は、CPU11、メイン・メモリ13などのハードウェアと協働して、ノートPCに特定の機能をもたらすハードウェア要素となる。
[ジェスチャ認識の手順]
つぎにカメラ・システム10が、大きな消費電力を必要とする高度なジェスチャ認識を行うジェスチャ・エンジンを起動するために、本実施の形態にかかる簡易な方法でジェスチャを認識する手順を図6のフローチャートを参照して説明する。図7はブラー画像を生成する移動物体の一例として、背景画像291とその前景に存在する人間が腕293を周期的に振っている様子を抽象的に示している。図8は、基準画像登録部263に登録された基準パターンの形状を示している。図8(A)は、カメラに正対した人間が腕293を下に下げて肩を中心に左右に振っているときのブラー画像の基準パターンに対応する。
図8(B)は、カメラに正対している人間が前方に突き出した腕293を肘で曲げてカメラ・モジュール100に対して左右に振っているときのブラー画像の基準パターンに対応する。図8(C)と(D)は、カメラ・モジュール100に対して左横または右横を向いた人間が前方に突き出した腕を肘で曲げて自身に対して前後に振ったときのブラー画像の基準パターンに対応する。図9は、背景画像291とフレーム・シーケンス300から差分画像群350および合成画像群400を生成する例を説明するための図である。
ブロック601でインターフェース部251はカメラ・モジュール100にジェスチャ・モードをイネーブルにするコマンドと露光時間に関連するパラメータを送る。ブロック603でカメラ・モジュール100がジェスチャ・モードに移行し指定されたパラメータとその他の適切なパラメータを設定する。ブロック605でカメラ・モジュール100は、たとえばフレーム・レートを5fpsに設定し露光時間をその範囲で可能な最大値に設定して撮影したフレーム・シーケンス300の転送を開始する。
ユーザは適当なタイミングでカメラ・モジュール100に対してジェスチャをする。ジェスチャを開始するタイミングとフレームを転送するタイミングは同期しないため、フレーム転送周期に対する任意の時刻でジェスチャの撮影を開始する。ブロック607で、背景画像を更新するタイミングが到来しているときはブロック631に移行する。背景画像を更新するタイミングは、加速度センサー27がノートPCの移動を検知したときまたはあらかじめ定めた定期的な周期で到来する。ブロック631で背景画像生成部253が新たに生成した複数のフレームを背景画像記憶部255に記憶する。
ブロック609で差分画像生成部257は、フレーム・シーケンス300を構成するフレーム301〜309を順番に受け取る。フレーム301〜309は、カメラの前で前方に延ばした手を、肘を中心に右から左に1往復したジェスチャを撮影したときの画像である。ジェスチャの周期に対して露光時間が適切に設定されることにより各フレームはジェスチャをする腕の動作に対応するブラー画像301a〜309aを含む。差分画像生成部257は各フレーム301〜309について、その時点で背景画像記憶部255に記憶されている最新の背景画像の対応する画素との階調差を計算して2値化した差分画像351〜359を生成する。
計算した階調差は、ブラー画像301a〜309aのように表示が変化している画素では大きな値になるが、変化のない背景画像291を表示する画素では小さな値になる。したがって、ジェスチャを撮影する前はインターフェース部251が背景画像291だけを受け取るため、差分画像の階調はほとんどの画素で無意味な小さな値になる。
差分画像生成部257は、階調差を計算した各画素に対して一定の閾値を設定し各画素の階調を2値化する。差分画像生成部257は、たとえば、閾値を超えた画素については論理値1を設定し、閾値未満の画素については論理値0を設定する。差分画像351〜359では、背景画像291が取り除かれ、ブラー画像301a〜309aが2値化した差分画像351a〜359aに変換される。
差分画像生成部257は差分画像351〜359を合成画像生成部259に送る。差分画像351〜359は、フレーム301〜309がジェスチャとは無関係な物体の移動とともに撮影されたノイズとなるブラー画像(ノイズ・ブラー)も含む。ノイズ・ブラーは、パターン認識の精度を低下させるが、基準パターン281〜287はノイズ・ブラーと区別できるように比較的単純な形状にしており、パターン認識の過程でその影響は排除される。差分画像生成部257はジェスチャを認識するまでブロック615からブロック605に戻るパスでフレーム301〜309を受け取るたびに差分画像351〜359を生成して合成画像生成部259に送る。
ブロック613で合成画像生成部259は、受け取った差分画像351〜359と1つ前に受け取った差分画像の各画素について設定された論理値の論理和を計算し、合成画像群400を生成する。差分画像351と論理和計算をする画像は2値化したブラー画像を含まないためブラー画像351と合成画像401は同じ画像となっている。差分画像401を生成したあとは、合成画像生成部259はつぎに受け取った差分画像353と直近に生成した合成画像401との論理和計算をして新たな合成画像403を生成する。差分画像355〜357が追加されるたびに、合成画像405〜409が生成されてブラー画像301a〜309aの情報量は増加し基準パターン283の形状に近付いていく。
合成画像409は、ほぼ基準パターン283に近い形状になる。ブロック615でパターン認識部261は、合成画像401〜409を受け取るたびに、基準パターン281〜287のそれぞれと比較する特徴を周知のアルゴリズムを採用して比較する。特徴は、たとえば扇形が開いている向き、中心角または面積などとすることができる。基準パターン281〜287は比較的単純なパターンで構成されているため、パターン認識をするCPU11の負担を軽くすることができる。
パターン認識部261は、合成画像の抜けている部分を補完して合成画像405または407でジェスチャが基準パターン283に一致していると判断することもできる。パターン認識部261は、合成画像401〜409がいずれかの基準パターン281〜287に一致したと判断したときにブロック633で当該基準パターンに関連付けられたコマンドをOS205に送る。ブロック635でOS205は、ノートPCを操作するための高度な処理を行うジェスチャ・エンジンを起動する。
ブロック635からブロック605に戻って、インターフェース部251はさらにフレーム・シーケンスを受け取る。コマンドを出力した直後は、合成画像生成部259にそれまでの合成画像が残っているためそれらを認識対象から除外する必要がある。パターン認識部261はコマンドを出力したあとの所定の数の合成画像を無視することができる。その後、前回のコマンド出力の基礎になった2値化されたブラー画像の影響がなくなった合成画像を受け取るようになった時点で、パターン認識部261は新たなジェスチャの認識を再開する。ジェスチャ・モードでは露光時間を意図的に長くして撮影するため、明るい場所から暗い場所まで撮影環境の影響を受けないでジェスチャを認識することができる。
本発明における認識の対象は、ブラー画像全体の輪郭が形成する形状である。ジェスチャの速度および露光時間自体は直接輪郭形状に影響しないが、それを適切に選択することで、認識までに必要とするジェスチャの回数、認識時間、消費電力および暗所撮影の点で有利になる。図10は、フレーム転送周期Tfとジェスチャ周期Tjの関係を説明する図である。
ジェスチャが往路で位置P1から位置P2まで腕を振り、復路で位置P2から位置P1まで腕を振る動作であるとする。フレーム・レートFの逆数であるフレーム転送周期Tfが露光時間にほぼ等しいと仮定して説明すると、フレーム転送周期Tfを長くするほど、1フレームが含むブラー画像の基準パターンとの比較に利用できる情報量は多くなる。しかし、フレーム転送周期Tfを長くするとジェスチャを開始してからジェスチャ認識アプリケーション201が最初のフレームを取得するまでの時間が長くなってジェスチャの認識が遅れることになる。
ジェスチャの往路(位置P1から位置P2)または復路(位置P2から位置P1)の全体に渡って内部が充足するように描かれたブラー画像は基準パターンとの比較に必要な十分な情報量といえる。ただし、補完法を採用したり基準パターンの数が少なかったりする場合は必ずしもそれだけの情報量がなくても正確に認識できる。フレーム転送周期Tfを長くしても、往路または復路ですでに得た情報以上の情報が得られない場合は、認識時間の遅延をもたらすだけとなるのでフレーム転送周期Tfには上限を設定することができる。
ここにフレーム転送周期Tfの上限は認識に利用できる十分な情報量を得ることができる最低の時間として定義することが可能になる。ジェスチャを開始する時刻t0とフレーム転送のタイミングは同期させることができない。図10の例ではジェスチャ周期Tjより短いフレーム転送周期Tf1を設定して、時刻t1で撮影を開始して時刻t2で終了したフレームには、往路および復路でジェスチャの位置P1からP3までのブラー画像の情報が欠けることになる。
その情報は、2回目の往路のジェスチャの撮影が終わる時刻t3で得ることができる。一方、ジェスチャ周期Tjに等しいフレーム転送周期Tf2を設定して、時刻t1で撮影を開始して時刻t4で終了したフレームには、1回目の復路のジェスチャの全体を撮影したブラー画像の情報が含まれる。したがって、フレーム転送周期Tfをジェスチャ周期Tjより長くしても、すでに得た情報以上に合成画像に加える有用な情報は得られず、認識までの時間が長くなるだけである。したがって発明を限定する必要はないが、フレーム転送周期Tfの最大値(フレーム・レートの最小値)はジェスチャ周期Tjと露光時間が一致するように定めることができる。
本発明は、ジェスチャの方向を認識してコマンドの数を増やすこともできる。そのためにジェスチャ認識アプリケーション201は、図10で位置P1から開始するジェスチャまたは位置P2から開始するジェスチャのいずれが行われたかを認識する。この場合に、ジェスチャの開始位置を認識するためにはフレーム転送周期Tfの最大値をTf<Tj/4とすることができる。
フレーム転送周期Tfを短くすると暗所でのジェスチャ認識が困難になり、システムの消費電力が増大する。許容できるカメラ・システムの消費電力はシステムごとに異なる。したがって、フレーム転送周期Tfの最小値は、これらの点を考慮してシステムごとに定めることができる。なお、ジェスチャを認識するためにカメラ・モジュール100に設定するパラメータは、カメラ・モジュール100とパターン認識部261などのカメラ・システム10の性能、撮影環境、基準パターンの数および許容されるジェスチャ回数などに依存するため、カメラ・システムごとに実験で決めることができる。
つぎに、カメラ・システム10の省電力機能について説明する。カメラ・モジュール100はジェスチャ・モードのときに低いフレーム・レートに設定される。図4の例では動画モードのフレーム・レート30fpsに比べてジェスチャ・モードのフレーム・レートは5fpsと1/6になる。その結果、カメラ・モジュール100は、フレームを転送しない時間が増加するために、選択サスペンド状態に入る時間が長くなり消費電力が低下する。
また、USBバス50を使用してデータ転送する時間が1/6になるため、USBバスがアイドル状態に遷移する時間が長くなる。さらに、ジェスチャ・モードではフレーム・レートが低く、さらに基準パターンも比較的単純な数個のパターンに限定すればパターン認識をするCPU11の負担が軽くなるため、CPU11はより深いスリープ・ステートに遷移することができる。このようにカメラ・システム10はカメラ・モジュール100、USBバス50、およびCPU11の消費電力が低下するため、不特定のタイミングで行われる移動物体の動作を撮影できる状態を低消費電力で長時間維持することが必要な用途に適している。
[用途]
このような撮影環境の影響を受けないで低消費電力で待機しながらパターン認識ができるという特徴を利用して、本発明にかかるジェスチャ認識の方法をさまざまな用途に適用することができる。1つの用途として電子機器のパワー・ステートの制御がある。ノートPCでは、ACPIが規定するパワー・オン状態(S0ステート)において、アイドル状態のデバイスの消費電力をランタイム・アイドル検出またはS0アイドルというマイクロソフト(登録商標)社が提唱する手法を採用して低減する場合がある。
ランタイム・アイドル状態検出では、システムがアイドル状態のときにCPU11がアクティブ状態とスリープ状態の間を定期的にまたは割り込みに応じて遷移しながらLCD17やその他の多くのデバイスが省電力状態に遷移する。このときジェスチャ・モードで動作するカメラ・システム10がジェスチャを認識してシステムをウェイクさせることができる。あるいは強制的にアイドル状態に遷移させることもできる。カメラ・システム10が認識する対象は、人体の部位の動作によるジェスチャに限定するものではなく、移動物体の動作全般に適用することができる。たとえば、特定の場所を通過する動物の姿、機械の動作、または自然環境の変化などの特有の動作をブラー画像として検出してコマンドを発行し静止画像や動画像を撮影することができる。
図8には複数の基準パターン281〜287を示したが、基準パターンは1個でもよい。その場合パターン認識部261はノイズ・ブラーとジェスチャのブラー画像を区別できればよいため、パターン認識をするCPU11の負担は一層軽くなる。カメラ・システム10をノートPCにおいて実現する例を説明したが、ジェスチャ認識アプリケーション201を、カメラ・モジュール100のフラッシュROM119に格納してMPU115が認識とコマンドの出力まで行うようにしてもよい。その場合は、ノートPC10をCPU11の電力が停止するサスペンド状態(S3ステート)からウェイクさせることもできるようになる。
[他の合成画像の生成方法]
図9を参照して背景画像291とフレーム・シーケンス300から差分画像群350および合成画像群400を生成する例を説明したが、図11を参照して合成画像を生成する他の方法を説明する。図11は、図9と同じようにインターフェース部251が受け取るフレーム・シーケンス300、差分画像生成部257が生成する差分画像群500および合成画像生成部259が生成する合成画像群550を示している。図11の方法では、背景画像生成部253および背景画像記憶部255は必要としない。
差分画像生成部257は、各フレーム301〜309を順番に受け取って差分画像501〜509を生成する。このとき差分画像生成部257は、連続する2個のフレームから差分画像を生成する。たとえば、背景画像のフレームとフレーム301から差分画像501を生成し、フレーム301とフレーム303から差分画像503を生成する。
合成画像生成部259は差分画像501〜509を受け取るたびに最新の合成画像との間で論理和計算を繰り返して合成画像551〜559を生成する。この方法では、背景画像の生成および更新をする必要がなくなるが、往路のジェスチャを撮影したフレームと復路のジェスチャを撮影したフレームのブラー画像が重なった画素領域は2値化したブラー画像として抽出できなくなる。この場合片道のジェスチャで認識できるように露光時間を長くするか、ジェスチャの往路と復路の周期を変えるようにして対処することができる。
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることはいうまでもないことである。
10 カメラ・システム
100 カメラ・モジュール
151、155 露光時間
153、157 読み取り時間
281〜287 基準パターン
291 背景画像
293 人間の腕
300 フレーム・シーケンス
301〜309 フレーム
301a〜309a ブラー画像
351〜259、501〜509 差分画像
351a〜359a 2値化したブラー画像
401〜409、551〜559 合成画像

Claims (8)

  1. 物体の所定の周期による往復動作を携帯式コンピュータが認識する方法であって、
    基準パターンを定義するステップと、
    前記物体を撮影したイメージ・センサから連続する複数のフレームを受け取るステップと、
    背景画像と各フレームが含むブラー画像を比較し、対応する画素の階調値の差を計算して2値化した差分画像を生成し、該差分画像を合成した合成画像から前記物体の往復動作に対応するブラー画像の形状を特定するステップと、
    前記基準パターンと前記特定したブラー画像の形状を比較するステップと、
    前記携帯式コンピュータが所定値以上の加速度を検出したときに前記背景画像を更新するステップと
    を有する方法。
  2. 前記ブラー画像の形状を特定するステップが、前記差分画像の論理和を計算するステップを含む請求項1に記載の方法。
  3. 所定の周期で往復動作をするジェスチャで携帯式コンピュータの動作を制御する方法であって、
    コマンドを関連付けた基準パターンを定義するステップと、
    前記ジェスチャが描くブラー画像を撮影するために前記携帯式コンピュータが搭載するイメージ・センサの露光時間を設定するステップと、
    前記イメージ・センサから前記ジェスチャを撮影した連続する複数のフレームを受け取るステップと、
    背景画像と各フレームが含むブラー画像を比較し、対応する画素の階調値の差を計算して2値化した差分画像を生成し、該差分画像を合成した合成画像から前記ジェスチャのブラー画像の形状を特定するステップと、
    前記ブラー画像の形状が前記基準パターンに一致すると判断したときに前記コマンドをシステムに送るステップと、
    前記携帯式コンピュータが所定値以上の加速度を検出したときに前記背景画像を更新するステップと
    を有する方法。
  4. 前記コマンドに応答して前記携帯式コンピュータがパワー・ステートを変更するステップを有する請求項3に記載の方法。
  5. 前記コマンドに応答して前記携帯式コンピュータが所定のアプリケーション・プログラムを起動するステップを有する請求項3に記載の方法。
  6. 前記基準パターンの形状が肘または肩を中心とする腕の往復動作によりブラー画像が形成される扇形である請求項3から請求項5のいずれかに記載の方法。
  7. 所定の周期で往復動作をするジェスチャを撮影することが可能なカメラ・モジュールを搭載する携帯式コンピュータであって、
    コマンドが関連付けられた基準パターンを格納する基準画像登録部と、
    前記ジェスチャの背景画像を生成する背景画像生成部と、
    前記背景画像と前記ジェスチャを撮影した各フレームの対応する画素の階調差を計算して2値化した差分画像を生成する差分画像生成部と、
    前記差分画像の論理和を計算して合成画像を生成する合成画像生成部と、
    前記合成画像と前記基準パターンを比較して両者が一致したと判断したときに前記コマンドを出力するパターン認識部とを有し、
    前記背景画像生成部は、前記携帯式コンピュータが所定値以上の加速度を検出したときに前記背景画像を更新する携帯式コンピュータ。
  8. イメージ・センサを搭載する携帯式コンピュータに、
    基準パターンを格納する機能と、
    人体の部位が往復動作をするジェスチャを撮影した前記イメージ・センサから連続する複数のフレームを受け取る機能と、
    背景画像と各フレームを比較して対応する画素の階調値の差を計算し2値化した差分画像を生成して前記ジェスチャのブラー画像の形状を特定する機能と、
    前記基準パターンと前記特定したブラー画像の形状を比較する機能と、
    前記携帯式コンピュータが所定値以上の加速度を検出したときに前記背景画像を更新する機能と
    を実現させるためのコンピュータ・プログラム。
JP2013047459A 2013-03-11 2013-03-11 移動物体の動作を認識する方法および携帯式コンピュータ Active JP5782061B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013047459A JP5782061B2 (ja) 2013-03-11 2013-03-11 移動物体の動作を認識する方法および携帯式コンピュータ
US14/171,029 US20140254870A1 (en) 2013-03-11 2014-02-03 Method for recognizing motion gesture commands
US15/582,338 US9864436B2 (en) 2013-03-11 2017-04-28 Method for recognizing motion gesture commands

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013047459A JP5782061B2 (ja) 2013-03-11 2013-03-11 移動物体の動作を認識する方法および携帯式コンピュータ

Publications (2)

Publication Number Publication Date
JP2014174776A JP2014174776A (ja) 2014-09-22
JP5782061B2 true JP5782061B2 (ja) 2015-09-24

Family

ID=51487882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013047459A Active JP5782061B2 (ja) 2013-03-11 2013-03-11 移動物体の動作を認識する方法および携帯式コンピュータ

Country Status (2)

Country Link
US (2) US20140254870A1 (ja)
JP (1) JP5782061B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10146318B2 (en) 2014-06-13 2018-12-04 Thomas Malzbender Techniques for using gesture recognition to effectuate character selection
JP5980879B2 (ja) * 2014-10-28 2016-08-31 レノボ・シンガポール・プライベート・リミテッド ジェスチャの認識方法、ジェスチャ入力システムおよび電子機器
US20160170548A1 (en) * 2014-12-16 2016-06-16 Nobuyuki Suzuki Apparatus, system and method for communication of touch sensor information
CN107533359B (zh) * 2015-05-20 2019-04-23 三菱电机株式会社 信息处理装置和联锁控制方法
EP3168711A1 (en) * 2015-11-11 2017-05-17 ams AG Method, optical sensor arrangement and computer program product for passive optical motion detection
JP6868478B2 (ja) * 2017-06-16 2021-05-12 株式会社Nttドコモ コード動画連携装置及びコード動画連携プログラム
JP6635093B2 (ja) * 2017-07-14 2020-01-22 カシオ計算機株式会社 画像記録装置、画像記録方法及びプログラム
JP7066541B2 (ja) 2018-06-19 2022-05-13 本田技研工業株式会社 制御装置および制御方法
JP7109736B2 (ja) * 2018-06-28 2022-08-01 株式会社東京精密 補助装置及び補助方法
JP6962878B2 (ja) 2018-07-24 2021-11-05 本田技研工業株式会社 操作補助システムおよび操作補助方法
CN109348124B (zh) * 2018-10-23 2021-06-11 Oppo广东移动通信有限公司 图像传输方法、装置、电子设备和存储介质
CN114639158A (zh) * 2020-11-30 2022-06-17 伊姆西Ip控股有限责任公司 计算机交互方法、设备和程序产品

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4878843A (en) * 1988-06-08 1989-11-07 Kuch Nina J Process and apparatus for conveying information through motion sequences
EP0849697B1 (en) * 1996-12-20 2003-02-12 Hitachi Europe Limited A hand gesture recognition system and method
US20020036617A1 (en) * 1998-08-21 2002-03-28 Timothy R. Pryor Novel man machine interfaces and applications
US7036094B1 (en) * 1998-08-10 2006-04-25 Cybernet Systems Corporation Behavior recognition system
JP4332649B2 (ja) * 1999-06-08 2009-09-16 独立行政法人情報通信研究機構 手の形状と姿勢の認識装置および手の形状と姿勢の認識方法並びに当該方法を実施するプログラムを記録した記録媒体
US6766036B1 (en) * 1999-07-08 2004-07-20 Timothy R. Pryor Camera based man machine interfaces
US6647131B1 (en) * 1999-08-27 2003-11-11 Intel Corporation Motion detection using normal optical flow
US6654483B1 (en) * 1999-12-22 2003-11-25 Intel Corporation Motion detection using normal optical flow
US7095401B2 (en) * 2000-11-02 2006-08-22 Siemens Corporate Research, Inc. System and method for gesture interface
US8745541B2 (en) * 2003-03-25 2014-06-03 Microsoft Corporation Architecture for controlling a computer using hand gestures
US7308112B2 (en) * 2004-05-14 2007-12-11 Honda Motor Co., Ltd. Sign based human-machine interaction
JP4475143B2 (ja) * 2004-11-29 2010-06-09 セイコーエプソン株式会社 画像補正装置
CN101213563A (zh) * 2005-06-30 2008-07-02 皇家飞利浦电子股份有限公司 识别物体运动模式的方法
JP2007172577A (ja) * 2005-11-25 2007-07-05 Victor Co Of Japan Ltd 操作情報入力装置
JP5168837B2 (ja) * 2006-07-27 2013-03-27 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
US7606411B2 (en) * 2006-10-05 2009-10-20 The United States Of America As Represented By The Secretary Of The Navy Robotic gesture recognition system
US20080136775A1 (en) * 2006-12-08 2008-06-12 Conant Carson V Virtual input device for computing
WO2008139399A2 (en) * 2007-05-15 2008-11-20 Philips Intellectual Property & Standards Gmbh Method of determining motion-related features and method of performing motion classification
US8565535B2 (en) * 2007-08-20 2013-10-22 Qualcomm Incorporated Rejecting out-of-vocabulary words
US8005263B2 (en) * 2007-10-26 2011-08-23 Honda Motor Co., Ltd. Hand sign recognition using label assignment
US8385971B2 (en) * 2008-08-19 2013-02-26 Digimarc Corporation Methods and systems for content processing
US9639744B2 (en) * 2009-01-30 2017-05-02 Thomson Licensing Method for controlling and requesting information from displaying multimedia
JP4548542B1 (ja) * 2009-06-30 2010-09-22 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
GB2474536B (en) * 2009-10-13 2011-11-02 Pointgrab Ltd Computer vision gesture based control of a device
TWI476632B (zh) * 2009-12-08 2015-03-11 Micro Star Int Co Ltd 運動物體辨識方法及基於運動物體辨識之指令輸入方法
JP2011204019A (ja) * 2010-03-25 2011-10-13 Sony Corp ジェスチャ入力装置、ジェスチャ入力方法およびプログラム
US8396252B2 (en) * 2010-05-20 2013-03-12 Edge 3 Technologies Systems and related methods for three dimensional gesture recognition in vehicles
US20120019728A1 (en) * 2010-07-26 2012-01-26 Darnell Janssen Moore Dynamic Illumination Compensation For Background Subtraction
FR2967804B1 (fr) * 2010-11-19 2013-01-04 Total Immersion Procede et dispositif de detection et de suivi d'objets non rigides en mouvement, en temps reel, dans un flux video, permettant a un utilisateur d'interagir avec un systeme informatique
US8811719B2 (en) * 2011-04-29 2014-08-19 Microsoft Corporation Inferring spatial object descriptions from spatial gestures
JP5547139B2 (ja) * 2011-07-29 2014-07-09 株式会社東芝 認識装置、方法及びプログラム
US8891868B1 (en) * 2011-08-04 2014-11-18 Amazon Technologies, Inc. Recognizing gestures captured by video
KR101189633B1 (ko) * 2011-08-22 2012-10-10 성균관대학교산학협력단 손가락 움직임에 따른 포인터 제어명령어 인식 방법 및 손가락 움직임에 따라 포인터를 제어하는 모바일 단말
JP2013069224A (ja) * 2011-09-26 2013-04-18 Sony Corp 動作認識装置、動作認識方法、操作装置、電子機器、及び、プログラム
WO2013063767A1 (en) * 2011-11-01 2013-05-10 Intel Corporation Dynamic gesture based short-range human-machine interaction
JP6243112B2 (ja) * 2011-12-09 2017-12-06 ソニー株式会社 情報処理装置、情報処理方法、および記録媒体
US8749485B2 (en) * 2011-12-20 2014-06-10 Microsoft Corporation User control gesture detection
US9587804B2 (en) * 2012-05-07 2017-03-07 Chia Ming Chen Light control systems and methods
JP5895720B2 (ja) * 2012-06-06 2016-03-30 富士通株式会社 被写体追跡装置、被写体追跡方法及び被写体追跡用コンピュータプログラム
US20140118244A1 (en) * 2012-10-25 2014-05-01 Pointgrab Ltd. Control of a device by movement path of a hand
US20140118257A1 (en) * 2012-10-29 2014-05-01 Amazon Technologies, Inc. Gesture detection systems
US20150092040A1 (en) * 2013-10-01 2015-04-02 Broadcom Corporation Gesture-Based Industrial Monitoring

Also Published As

Publication number Publication date
JP2014174776A (ja) 2014-09-22
US20140254870A1 (en) 2014-09-11
US20170308174A1 (en) 2017-10-26
US9864436B2 (en) 2018-01-09

Similar Documents

Publication Publication Date Title
JP5782061B2 (ja) 移動物体の動作を認識する方法および携帯式コンピュータ
US10356320B2 (en) Information processing device and image input device
US11611715B2 (en) System and method for event camera data processing
CN111586286A (zh) 利用多个相机改变图像的倍率的电子装置及方法
JP5485956B2 (ja) カメラ・モジュールが画像データを転送する方法およびコンピュータ
JP2015526927A (ja) カメラ・パラメータのコンテキスト駆動型調整
WO2019067054A1 (en) GENERATING STATIC IMAGES USING AN EVENT CAMERA
JP5980879B2 (ja) ジェスチャの認識方法、ジェスチャ入力システムおよび電子機器
US20220044043A1 (en) Integrated circuit and sensor data processing method
WO2021218694A1 (zh) 一种视频处理方法及移动终端
US20200084387A1 (en) Low power mode for one or more cameras of a multiple camera system
EP3621292B1 (en) Electronic device for obtaining images by controlling frame rate for external moving object through point of interest, and operating method thereof
WO2017173585A1 (zh) 一种拍照方法及终端
US20190045099A1 (en) Electronic device for playing video based on movement information and operating method thereof
WO2024001506A1 (zh) 显示方法与电子设备
JP2024533962A (ja) オブジェクトを追跡するための電子デバイス
JP2024535666A (ja) レイテンシを低減するためのカメラ初期化
CN115633262A (zh) 图像处理方法和电子设备
CN109164917B (zh) 电子设备控制方法、存储介质及电子设备
KR20210107958A (ko) 디지털 영상 안정화 장치, 그것의 동작 방법, 및 그것을 갖는 전자 장치
WO2022179412A1 (zh) 识别方法及电子设备
US9946956B2 (en) Differential image processing

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150210

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150401

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20150410

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20150416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150716

R150 Certificate of patent or registration of utility model

Ref document number: 5782061

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250