JP2024032042A - 検出方法、検出装置及びプログラム - Google Patents

検出方法、検出装置及びプログラム Download PDF

Info

Publication number
JP2024032042A
JP2024032042A JP2022135471A JP2022135471A JP2024032042A JP 2024032042 A JP2024032042 A JP 2024032042A JP 2022135471 A JP2022135471 A JP 2022135471A JP 2022135471 A JP2022135471 A JP 2022135471A JP 2024032042 A JP2024032042 A JP 2024032042A
Authority
JP
Japan
Prior art keywords
image
hand
image display
display area
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022135471A
Other languages
English (en)
Inventor
聖 井上
Sei Inoue
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2022135471A priority Critical patent/JP2024032042A/ja
Priority to US18/456,963 priority patent/US20240069647A1/en
Publication of JP2024032042A publication Critical patent/JP2024032042A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/0304Detection arrangements using opto-electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Abstract

【課題】より適切に検出対象を検出することができる検出方法、検出装置及びプログラムを提供する。【解決手段】検出方法は、コンピュータが実行する検出方法であって、画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得し、撮影画像のうち画像表示領域を除いた外部領域で抽出された対象物の少なくとも一部を検出対象として検出する。これにより、より適切に検出対象を検出することができる。【選択図】図3

Description

本発明は、検出方法、検出装置及びプログラムに関する。
従来、操作者のジェスチャーを検出し、検出されたジェスチャーに応じて機器の動作を制御する技術がある。この技術では、操作者を撮影して得られた撮影画像において、操作者の体のうちジェスチャーを行う特定の一部(例えば、手)を検出対象として検出する。特許文献1には、予め撮影された背景画像と、操作者を撮影した撮影画像との差分に基づいて、ジェスチャーを行う検出対象を検出する方法が開示されている。
特開2015-22624号公報
しかしながら、物を保持している手や、画像表示面に画像として表示されている手などの、ジェスチャーを行っていない手が撮影画像に写っている場合には、この手が検出対象として誤検出されると、ジェスチャーの誤検出が生じて機器が意図しない動作を行ってしまうという課題がある。
この発明の目的は、より適切に検出対象を検出することができる検出方法、検出装置及びプログラムを提供することにある。
上記課題を解決するため、本発明に係る検出方法は、
コンピュータが実行する検出方法であって、
画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得し、
前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する。
上記課題を解決するため、本発明に係る検出装置は、
画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得し、
前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する、
処理部を備える。
上記課題を解決するため、本発明に係るプログラムは、
コンピュータに、
画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得する処理、
前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する処理、
を実行させる。
本発明によれば、より適切に検出対象を検出することができる。
情報処理システムの構成を示す模式図である。 検出装置の機能構成を示すブロック図である。 人の手を含む投影画像が写っている撮影画像の例を示す図である。 機器制御処理の制御手順を示すフローチャートである。 手検出処理の制御手順を示すフローチャートである。 撮影画像の他の例を示す図である。 変形例に係る手検出処理の制御手順を示すフローチャートである。
以下、本発明の実施の形態を図面に基づいて説明する。
<情報処理システムの概要>
図1は、本実施形態の情報処理システム1の構成を示す模式図である。
情報処理システム1は、検出装置10と、撮影装置20と、プロジェクタ30とを備える。検出装置10は、無線又は有線により撮影装置20及びプロジェクタ30と通信接続されており、撮影装置20及びプロジェクタ30との間で、制御信号や画像データ等のデータの送受信を行うことが可能となっている。
情報処理システム1の検出装置10は、操作者80(被写体、人)が手81(対象物、検出対象)によって行うジェスチャーを検出し、検出したジェスチャーに応じてプロジェクタ30の動作(投影画像Imの投影動作や、各種設定を変更する動作等)を制御する情報処理装置である。本明細書では、操作者80の右手81R及び左手81Lのうち任意の一方を指す場合には「手81」と記す。
詳しくは、撮影装置20は、撮影装置20の正面に位置する操作者80及び操作者80の手81を撮影して、撮影画像50(図3参照)の画像データを検出装置10に送信する。検出装置10は、撮影装置20から受信した撮影画像50を解析して、操作者80の手81及び指を検出し、操作者80が手81によって所定のジェスチャーを行ったか否かを判別する。本実施形態において、操作者80が手81によって行うジェスチャーは、手81の指の向き又は動きによって行うジェスチャーであるものとする。検出装置10は、操作者80が、手81によって所定のジェスチャーを行ったと判別すると、制御信号をプロジェクタ30に送信し、検出したジェスチャーに応じた動作を行うようにプロジェクタ30を制御する。これにより、例えば、操作者80が、撮影装置20から見て右方向に一本の指(例えば、人差し指)を向けるジェスチャーを行うことで、プロジェクタ30が投影している投影画像Imを次の投影画像Imに切り替え、一本の指を左方向に向けるジェスチャーを行うことで、投影画像Imを1つ前の投影画像Imに切り替える、といった直感的な操作が可能となる。
本実施形態では、スクリーン40が壁に掛けられており、このスクリーン40の画像表示面41に対して撮影装置20により投影画像Imが投影(表示)されるものとする。画像表示面41は、スクリーン40の表裏面のうち撮影装置20に向いている側の面である。本実施形態では、画像表示面41が占める領域により、投影画像Imが投影(表示)される画像表示領域RDが構成される。また、スクリーン40は、「画像表示領域を構成する部材」に相当する。以下では、操作者80が立っている床面に垂直、かつ鉛直方向上向きの方向をZ方向とし、床面に平行、かつ、Z方向から見てプロジェクタ30による投影方向に平行な方向をY方向とし、Y方向及びZ方向に垂直な方向をX方向とする。Y方向は、プロジェクタ30から操作者80に向かう向きを正方向とし、X方向は、プロジェクタ30から操作者80に向かって右方向を正方向とする。
本実施形態では、操作者80は、スクリーン40に対向する位置(スクリーン40の画像表示面41側(-Y方向側)の位置)に立って、スクリーン40に投影されている投影画像Imを見ているものとする。また、操作者80は、左手81Lで、プロジェクタ30を操作するためのジェスチャーを行っているものとする。撮影装置20による撮影範囲Rは、操作者80のうちの少なくとも上半身と、スクリーン40の画像表示面41とを含む。
<情報処理システムの構成>
図2は、検出装置10の機能構成を示すブロック図である。
検出装置10は、CPU11(Central Processing Unit)と、RAM12(Random Access Memory)と、記憶部13と、操作部14と、表示部15と、通信部16と、バス17などを備える。検出装置10の各部は、バス17を介して接続されている。検出装置10は、本実施形態ではノートPCであるが、これに限られず、例えば据置型のPC、スマートフォン、又はタブレット型端末などであってもよい。
CPU11は、記憶部13に記憶されているプログラム131を読み出して実行し、各種演算処理を行うことで、検出装置10の動作を制御するプロセッサである。CPU11は、「処理部」に相当する。なお、検出装置10は、複数のプロセッサ(複数のCPU等)を有していてもよく、本実施形態のCPU11が実行する複数の処理を、当該複数のプロセッサが実行してもよい。この場合には、複数のプロセッサが「処理部」に相当する。また、この場合において、複数のプロセッサが共通の処理に関与してもよいし、あるいは、複数のプロセッサが独立に異なる処理を並列に実行してもよい。
RAM12は、CPU11に作業用のメモリ空間を提供し、一時データを記憶する。
記憶部13は、コンピュータとしてのCPU11により読み取り可能な非一時的な記録媒体であり、プログラム131及び各種データを記憶する。記憶部13は、例えばHDD(Hard Disk Drive)、SSD(Solid State Drive)等の不揮発性メモリを含む。プログラム131は、コンピュータが読み取り可能なプログラムコードの形態で記憶部13に格納されている。記憶部13に記憶されるデータとしては、撮影装置20から受信したカラー画像及び深度画像に係る撮影画像データ132などがある。
操作部14は、表示部15の表示画面に重ねられて設けられたタッチパネル、物理ボタン、マウスなどのポインティングデバイス、及びキーボードなどの入力装置のうち少なくとも1つを有し、入力装置に対する入力操作に応じた操作情報をCPU11に出力する。
表示部15は、液晶ディスプレイなどの表示装置を備え、CPU11からの表示制御信号に従って表示装置において各種表示を行う。
通信部16は、ネットワークカード又は通信モジュール等により構成され、撮影装置20及びプロジェクタ30との間で所定の通信規格に従ってデータの送受信を行う。
図1に示す撮影装置20は、カラーカメラを備える。
カラーカメラは、スクリーン40の画像表示領域RD、操作者80、及びこれらの背景を含む撮影範囲Rを撮影して、撮影範囲Rの二次元のカラー画像に係るカラー画像データを生成する。カラー画像データの各画素は、R(赤)、G(緑)、及びB(青)等の色情報を含む。撮影装置20のカラーカメラは、撮影装置20の正面に位置する操作者80及びスクリーン40を所定のフレームレートで連続して撮影する。
カラーカメラにより生成されたカラー画像データは、撮影画像データ132(図2参照)として検出装置10の記憶部13に記録される。
本実施形態では、上記のカラー画像が、「撮影範囲を撮影して得られた撮影画像」に相当する。
図1に示すプロジェクタ30は、投影画像Imの画像データに応じた強度分布の投影光を高指向性で照射することにより、スクリーン40の画像表示面41(すなわち、画像表示領域RD)に投影画像Imを投影する。詳しくは、プロジェクタ30は、光源と、当該光源から出力された光の強度分布を調整して光像を形成するデジタルマイクロミラー素子(DMD)等の表示素子と、表示素子が形成した光像を集光して投影画像Imとして投影する投影レンズ群などを備える。プロジェクタ30は、検出装置10から送信される制御信号に従って、投影する投影画像Imを変更したり、投影態様に係る設定(明るさ、色合い等)を変更したりする。
<情報処理システムの動作>
次に、情報処理システム1の動作について説明する。
検出装置10のCPU11は、撮影装置20が撮影した1又は2以上の撮影画像50を解析して、撮影画像50に写っている操作者80が、手81によって所定のジェスチャーを行ったか否かを判別する。CPU11は、手81によってジェスチャーが行われたと判別すると、検出したジェスチャーに応じた動作をプロジェクタ30に行わせるための制御信号をプロジェクタ30に送信する。
ここで、手81によるジェスチャーは、例えば、撮影装置20から見て指を或る方向(右方向、左方向、下方向、及び上方向等)に動かしたり、所定の形状(円形等)の軌跡を描くように指の先端を動かしたり、2以上の指の先端同士の距離を変動させたり、指の曲げ伸ばしを行ったりする動作などである。これらの各ジェスチャーには、プロジェクタ30の1つの動作が予め対応付けられている。例えば、指を右方向に向けるジェスチャーに、投影されている投影画像Imを次の投影画像Imに切り替える動作を対応付け、指を左方向に向けるジェスチャーに、投影されている投影画像Imを1つ前の投影画像Imに切り替える動作を対応付けてもよい。この場合には、指を右方向/左方向に向けるジェスチャーを行うことで、投影画像Imを次の画像/前の画像に切り替えることができる。また、親指の先端と人差し指の先端との距離を増大/減少させるジェスチャーに、それぞれ投影画像Imを拡大/縮小させる動作を対応付けてもよい。これらはジェスチャーとプロジェクタ30の動作との対応付けの一例であり、任意のジェスチャーに、プロジェクタ30の任意の動作を対応付けることができる。また、操作部14に対するユーザ操作に応じて、ジェスチャーとプロジェクタ30の動作との対応付けを変更したり、新たな対応付けを生成したりすることが可能であってもよい。
このように、操作者80の手81のジェスチャーによりプロジェクタ30を操作する場合には、撮影装置20が撮影した画像において手81(及び指)を正確に検出することが重要となる。手81を正しく検出できなければ、ジェスチャーを正しく認識することができず、操作性が激しく低下するためである。
しかしながら、撮影装置20による撮影範囲Rに、スクリーン40の画像表示領域RDが含まれている場合には、画像表示領域RDにおいて、人の手81Iを含む投影画像Imが投影される場合がある。
図3は、人の手81Iを含む投影画像Imが写っている撮影画像50の例を示す図である。
図3に示すx軸及びy軸は、撮影画像50内の画素の位置を表す直交座標系の座標軸である。
図3に示すように、撮影画像50に投影画像Imが写っており、かつ、この投影画像Imに人の手81Iが含まれる場合には、投影画像Im内の手81が検出対象として誤検出されてしまうことがある。投影画像Im内の手81が誤検出されると、ジェスチャーの誤検出が生じて、プロジェクタ30が意図しない動作を行ってしまう。
そこで、本実施形態では、操作者80の手81と、スクリーン40の画像表示領域RDとの位置関係に基づいて、投影画像Im内の、ジェスチャーを行っていない手81を検出対象から除外し、ジェスチャーを行っている操作者80の手81を適切に検出対象として検出する。
以下、図4及び図5を参照して、検出装置10のCPU11が、操作者80の手81を検出する動作、及び、手81によるジェスチャーを検出してプロジェクタ30の動作を制御する動作について説明する。CPU11は、上記動作を実現するために、図4に示す機器制御処理、及び図5に示す手検出処理を実行する。
図4は、機器制御処理の制御手順を示すフローチャートである。
機器制御処理は、例えば、検出装置10、撮影装置20及びプロジェクタ30の電源が投入され、プロジェクタ30を操作するためのジェスチャーの受け付けが開始された場合に実行される。
機器制御処理が開始されると、CPU11は、撮影装置20に制御信号を送信して、カラーカメラによる撮影を開始させる(ステップS101)。撮影が開始されると、CPU11は、手検出処理を実行する(ステップS102)。
図5は、手検出処理の制御手順を示すフローチャートである。
手検出処理が呼び出されると、CPU11は、操作者80及び手81を撮影した撮影画像50(撮影画像データ132)を取得する(ステップS201)。また、CPU11は、取得した撮影画像50において、手81に対応する手領域の候補(以下では、単に「手81の候補」と記す)を抽出する(ステップS202)。撮影画像50において手81の候補を抽出する処理は、撮影画像50において対象物を抽出する処理に相当する。
図3に示す撮影画像50においては、スクリーン40の前方に立っている操作者80が、左手81Lの人差し指を左方(-x方向)に向けるジェスチャーを行っている。また、投影画像Im内に写っている人が、手81Iの人差し指を上方(-y方向)に向けている。このため、図3に示す撮影画像50が取得された場合には、CPU11は、ステップS202において、操作者80の左手81Lと、投影画像Im内の手81Iとを、手81の候補として抽出することとなる。
ステップS202において撮影画像50から手81の候補を抽出する方法は、特には限られないが、例えば以下のような方法を用いることができる。まず、カラー画像の色情報に基づいて、色に係る閾値処理を行うことで、カラー画像のうち肌の色(手81の色)に相当する領域を抽出する。次に、抽出された各領域について、指に相当する突出部が含まれるか否かを判別する。抽出された各領域のうち、指に相当する突出部が含まれると判別された領域を、手81に対応する手領域の候補として抽出する。
なお、CPU11は、抽出した手81に相当する手領域を表すマスク画像を生成し、そのマスク画像データを以降の処理に用いてもよい。マスク画像データは、例えば、手領域に対応する画素の画素値を「1」とし、手領域以外の領域に対応する画素の画素値を「0」とした画像である。
CPU11は、ステップS202において手81の候補が抽出されたか否かを判別する(ステップS203)。手81の候補が抽出されたと判別された場合には(ステップS203で“YES”)、CPU11は、撮影画像50において、スクリーン40の画像表示領域RDを検出(特定)する(ステップS204)。
図3に示すように、本実施形態のスクリーン40は、画像表示面41の四隅に、スクリーン40の4つの角部を表す直角二等辺三角形の標識60が、各角部に設けられている。このように、スクリーン40における予め定められた位置に標識60が設けられている場合には、CPU11は、撮影画像50における標識60の位置に基づいて画像表示領域RDを検出することができる。図3に示す例では、CPU11は、標識60のうち直角となっている頂点の位置を特定し、少なくとも3つの標識60の頂点の位置に基づいて、画像表示領域RDを表す矩形領域を特定する。標識60の形状、及びスクリーン40における標識60の位置は、図3に示したものに限られない。
なお、撮影画像50から画像表示領域RDを特定する方法は、スクリーン40に設けられた標識60を用いる方法に限られない。
例えば、図6に示すように、予め定められた位置(例えば、四隅)に標識60を含む投影画像Imを画像表示領域RDに投影させ、撮影画像50における標識60の位置に基づいて画像表示領域RDを検出してもよい。これにより、標識60の位置から、投影画像Imの範囲を正確に検出し、また、画像表示領域RDを検出することができる。また、この方法では、投影画像Imの範囲を正確に検出できるので、スクリーン40の画像表示面41に代えて、当該投影画像Imの範囲を画像表示領域RDとしてもよい。投影画像Imに標識60を設けるためには、標識60のデータを含む投影画像Imの画像データを用いて投影画像Imを投影してもよいし、検出装置10からプロジェクタ30に投影画像Imの画像データを送信する際に、当該画像データに標識60のデータを付加し、標識60のデータが付加された画像データを用いて投影画像Imを投影してもよい。
また、撮影画像50に含まれる物体同士の境界線を抽出し、矩形をなしている境界線がある場合に、当該矩形の頂点の位置に基づいて画像表示領域RDを特定してもよい。
また、撮影装置20とスクリーン40との位置関係が決まっている場合には、当該位置関係に基づいて、撮影画像50における画像表示領域RDの範囲を予め特定しておいてもよい。すなわち、予め画像表示領域RDの範囲を特定するためのキャリブレーションを行ってもよい。
CPU11は、画像表示領域RDが検出されたか否かを判別し(ステップS205)、画像表示領域RDが検出されたと判別された場合には(ステップS205で“YES”)、画像表示領域RDの内部に手81の候補があるか否かを判別する(ステップS206)。ここでは、CPU11は、手81の領域の全体が画像表示領域RDの内部に入っているものを、画像表示領域RDの内部にある手81の候補とする。また、図6に示す操作者80の右手81Rのように、手81の領域が、撮影画像50において画像表示領域RDの内部から外部にわたって(画像表示領域RDの境界線をまたいで)延在している場合には、CPU11は、当該手81が画像表示領域RDの外部にあると判別する。手81が画像表示領域RDの内部から外部にわたって延在している場合には、当該手81が、画像表示領域RDに表示されている手81Iであることはあり得ず、ジェスチャーを行っている操作者80の手81である可能性があるためである。
画像表示領域RDの内部に手81の候補があると判別された場合には(ステップS206で“YES”)、CPU11は、画像表示領域RDの内部にある手81の候補を、検出対象の候補から除外する(ステップS207)。
CPU11は、撮影画像50のうち画像表示領域RDを除いた外部領域REに手81の候補があるか否かを判別する(ステップS208)。外部領域REに手81の候補があると判別された場合には(ステップS208で“YES”)、CPU11は、外部領域REにある手81の候補のうち、面積が最大である手81の候補を、ジェスチャー判別用の手81(検出対象)として検出する(ステップS209)。
また、ステップS205において、画像表示領域RDが検出されなかったと判別された場合(ステップS205で“NO”)、又は、ステップS206において、画像表示領域RDの内部に手81の候補がないと判別された場合には(ステップS206)、外部領域REに手81の候補があることとなる。このため、CPU11は、処理をステップS209に移行させ、外部領域REにある手81の候補のうち、面積が最大である手81の候補を、ジェスチャー判別用の手81(検出対象)として検出する。なお、撮影画像50に画像表示領域RDが検出されなかった場合には、撮影画像50の全体が外部領域REに相当するものとする。
ステップS209が終了すると、CPU11は、手検出処理を終了させて、処理を図4の機器制御処理に戻す。
また、ステップS203において、手81の候補が抽出されていないと判別された場合(ステップS203で“NO”)、又は、ステップS208において、外部領域REに手81の候補がないと判別された場合には(ステップS208で“NO”)、CPU11は、ジェスチャー判別用の手81を検出せずに手検出処理を終了させて、処理を図4の機器制御処理に戻す。
なお、ステップS209において、面積が最大であるものをジェスチャー判別用の手81として検出したが、これ以外の方法で1つのジェスチャー判別用の手81を決定してもよい。例えば、手81の指の形状などに基づいて、手81である可能性の高さの指標値を導出し、最も指標値が大きい手81を、ジェスチャー判別用の手81として検出してもよい。
また、図5のフローチャートでは、まず手81の候補を抽出した後に(ステップS202)、画像表示領域RDを検出したが(ステップS204)、この順序に限定されず、先に画像表示領域RDを検出し、その後に手81の候補を抽出してもよい。
図4の手検出処理(ステップS102)が終了すると、CPU11は、手検出処理において、ジェスチャー判別用の手81が検出されたか否かを判別する(ステップS103)。手81が検出されたと判別された場合には(ステップS103で“YES”)、CPU11は、手81における指の向き、又は、複数フレームの撮影画像50にわたる指の先端の位置の動きから、操作者80の手81によるジェスチャーを検出したか否かを判別する(ステップS104)。ジェスチャーを検出したと判別された場合には(ステップS104で“YES”)、CPU11は、検出したジェスチャーに応じた動作を行わせるための制御信号を、プロジェクタ30に送信する(ステップS105)。当該制御信号を受信したプロジェクタ30は、制御信号に応じた動作を行う。
ステップS105が終了した場合、ステップS103において手81が検出されていないと判別された場合(ステップS103で“NO”)、又は、ステップS104においてジェスチャーが検出されないと判別された場合には(ステップS104で“NO”)、CPU11は、情報処理システム1におけるジェスチャーの受け付けを終了するか否かを判別する(ステップS106)。ここでは、CPU11は、例えば、検出装置10、撮影装置20又はプロジェクタ30の電源をオフする操作がなされている場合に、ジェスチャーの受け付けを終了すると判別する。
ジェスチャーの受け付けを終了しないと判別された場合には(ステップS106で“NO”)、CPU11は、処理をステップS102に戻し、次のフレーム期間に撮影された撮影画像に基づいて手81を検出するための手検出処理を実行する。ステップS102~S106のループ処理は、例えば、撮影装置20による撮影のフレームレートで(すなわち、撮影画像50が生成されるたびに)繰り返し実行される。
ジェスチャーの受け付けを終了すると判別された場合には(ステップS106で“YES”)、CPU11は、機器制御処理を終了させる。
<変形例>
続いて、上記実施形態の変形例について説明する。本変形例は、手検出処理の制御手順が上記実施形態と異なる。以下では、上記実施形態との相違点について説明し、上記実施形態と共通する構成については説明を省略する。
図7は、変形例に係る手検出処理の制御手順を示すフローチャートである。
本変形例に係る手検出処理では、まず画像表示領域RDを検出(特定)し、次いで、画像表示領域RDの外部領域REにおいて手81の候補を抽出する。このような手順とすることで、最終的に候補から除外されることとなる、画像表示領域RDの内部の手81を、初めから抽出しないようにすることができる。
本変形例に係る手検出処理が呼び出されると、CPU11は、操作者80及び手81を撮影した撮影画像50(撮影画像データ132)を取得する(ステップS301)。
CPU11は、撮影画像50において、スクリーン40の画像表示領域RDを検出(特定)する(ステップS302)。ステップS302の処理内容は、図5のステップS204と同一である。
CPU11は、画像表示領域RDが検出されたか否かを判別し(ステップS303)、画像表示領域RDが検出されたと判別された場合には(ステップS303で“YES”)、画像表示領域RDの外部領域REにおいて手81の候補を抽出する(ステップS304)。ステップS304の処理内容は、抽出する対象範囲が外部領域REである点を除いて、図5のステップS202と同一である。
一方、画像表示領域RDが検出されなかったと判別された場合には(ステップS303で“NO”)、CPU11は、撮影画像50の全体において手81の候補を抽出する(ステップS305)。ステップS305の処理内容は、図5のステップS202と同一である。
ステップS304又はステップS305が終了すると、CPU11は、手81の候補が抽出されたか否かを判別する(ステップS306)。手81の候補が抽出されたと判別された場合には(ステップS306で“YES”)、CPU11は、抽出された手81の候補のうち、面積が最大である手81の候補を、ジェスチャー判別用の手81(検出対象)として検出する(ステップS307)。よって、ステップS304において、外部領域REにある手81の候補が抽出されている場合には、外部領域REにおいて抽出された手81の候補の中からジェスチャー判別用の手81が検出される。
ステップS307が終了すると、CPU11は、手検出処理を終了させて、処理を図4の機器制御処理に戻す。
また、ステップS306において、手81の候補が抽出されていないと判別された場合には(ステップS306で“NO”)、CPU11は、ジェスチャー判別用の手81を検出せずに手検出処理を終了させて、処理を図4の機器制御処理に戻す。
<効果>
以上のように、本実施形態に係る検出方法は、コンピュータとしてのCPU11が実行する検出方法であって、投影画像Imが表示されている画像表示領域RDの少なくとも一部と、操作者80の手81(対象物)の少なくとも一部と、を含む撮影画像50を取得し、撮影画像50のうち画像表示領域RDを除いた外部領域REで抽出された手81の少なくとも一部を検出対象として検出する。これにより、撮影画像50に写っている画像表示領域RDに、人の手81Iを含む投影画像Imが表示されている場合であっても、当該手81Iを検出対象から除外し、ジェスチャーを行っている操作者80の手81を検出対象として適切に検出することができる。
また、撮影画像50における画像表示領域RDを特定し、撮影画像50のうち、特定された画像表示領域RDを除いた外部領域REで抽出された手81の少なくとも一部を検出対象として検出することで、画像表示領域RDに写っている手81を検出対象から除外することができる。
また、撮影画像50における画像表示領域RDを特定し、撮影画像50において手81を抽出し、抽出された手81が、撮影画像50における画像表示領域RDを除いた外部領域REにあるか否かを判別し、外部領域REにあると判別された手81の少なくとも一部を検出対象として検出する。このように、一旦撮影画像50の全体において手81の候補を抽出してから、手81が外部領域REにあるか否かを判別することにより、ジェスチャーを行っている操作者80の手81の検出漏れを生じにくくすることができる。
また、変形例に係る検出方法は、撮影画像50における画像表示領域RDを特定し、撮影画像50のうち、特定された画像表示領域RDを除いた外部領域REにおいて手81を抽出し、抽出された手81の少なくとも一部を検出対象として検出する。これにより、撮影画像50に写っている画像表示領域RDに、人の手81Iを含む投影画像Imが表示されている場合であっても、当該手81Iを検出対象から除外し、ジェスチャーを行っている操作者80の手81を検出対象として適切に検出することができる。また、最終的に候補から除外されることとなる、画像表示領域RDの内部の手81を、始めから抽出しないようにすることができる。よって、画像表示領域RDの内部における手81の抽出処理、及び、画像表示領域RDの内部において抽出された手81を候補から除外する処理を省略できるため、CPU11の処理負荷を軽減することができる。
また、複数の手81が抽出された場合には、複数の手81のうち面積が最大である手81を検出対象として検出する。これにより、複数の手81のうち、ジェスチャーを行っている操作者80の手81である可能性の高い手81を検出対象として適切に検出することができる。
また、抽出された手81が、撮影画像50において画像表示領域RDの内部から外部にわたって延在している場合には、当該手81が、画像表示領域RDの外部にあると判別する。手81が画像表示領域RDの内部から外部にわたって延在している場合には、当該手81が、画像表示領域RDに表示されている手81Iであることはあり得ず、ジェスチャーを行っている操作者80の手81である可能性がある。よって、このような手81について、画像表示領域RDの外にあると判別することで、当該手81を適切に検出対象として検出することができる。
また、画像表示領域RDを構成するスクリーン40には、予め定められた位置に標識60が設けられており、撮影画像50における標識60の位置に基づいて画像表示領域RDを特定する。これにより、深度情報を含まない撮影画像50に基づいて、簡易に画像表示領域RDを特定することができる。
また、画像表示領域RDに表示される投影画像Imは、予め定められた位置に標識60を含んでいてもよく、撮影画像50における標識60の位置に基づいて画像表示領域RDを特定してもよい。これにより、深度情報を含まない撮影画像50に基づいて、簡易に画像表示領域RDを検出することができる。また、標識60の位置から、投影画像Imの範囲を正確に検出することができるので、当該範囲を画像表示領域RDとみなすこともできる。よって、スクリーン40に対して投影画像Imが小さい場合に、スクリーン40のうち投影画像Imが投影されていない範囲を画像表示領域RDの外部領域REとして扱うことができ、当該範囲に操作者80の手81が写っている場合に、当該手81を検出対象として適切に検出することができる。
また、本実施形態に係る検出装置10は、CPU11を備え、CPU11は、投影画像Imが表示されている画像表示領域RDの少なくとも一部と、操作者80の手81(対象物)の少なくとも一部と、を含む撮影画像50を取得し、撮影画像50のうち画像表示領域RDを除いた外部領域REで抽出された手81の少なくとも一部を検出対象として検出する。これにより、撮影画像50に写っている画像表示領域RDに、人の手81Iを含む投影画像Imが表示されている場合であっても、当該手81Iを検出対象から除外し、ジェスチャーを行っている操作者80の手81を検出対象として適切に検出することができる。
また、本実施形態に係るプログラム131は、コンピュータとしてのCPU11に、投影画像Imが表示されている画像表示領域RDの少なくとも一部と、操作者80の手81(対象物)の少なくとも一部と、を含む撮影画像50を取得する処理、撮影画像50のうち画像表示領域RDを除いた外部領域REで抽出された手81の少なくとも一部を検出対象として検出する処理、を実行させる。これにより、撮影画像50に写っている画像表示領域RDに、人の手81Iを含む投影画像Imが表示されている場合であっても、当該手81Iを検出対象から除外し、ジェスチャーを行っている操作者80の手81を検出対象として適切に検出することができる。
<その他>
なお、上記実施形態における記述は、本発明に係る検出方法、検出装置及びプログラムの一例であり、これに限定されるものではない。
例えば、上記実施形態では、検出装置10、撮影装置20、及びプロジェクタ30(ジェスチャーによる操作対象機器)が別個となっている例を用いて説明したが、この態様に限られない。
例えば、検出装置10と撮影装置20とが一体となっていてもよい。一例を挙げると、検出装置10の表示部15のベゼルに、撮影装置20のカラーカメラが組み込まれていてもよい。
また、検出装置10と操作対象機器とが一体となっていてもよい。例えば、上記実施形態におけるプロジェクタ30に検出装置10の機能を組み込み、検出装置10が実行していた処理をプロジェクタ30の図示しないCPUが実行してもよい。この場合には、プロジェクタ30が「検出装置」に相当し、プロジェクタ30のCPUが「処理部」に相当する。
また、撮影装置20と操作対象機器とが一体となっていてもよい。例えば、上記実施形態におけるプロジェクタ30の筐体に、撮影装置20のカラーカメラが組み込まれていてもよい。
また、検出装置10、撮影装置20及び操作対象機器が全て一体となっていてもよい。例えば、操作対象機器としての検出装置10の表示部15のベゼルにカラーカメラが組み込まれた態様において、操作者80の手81(指)のジェスチャーにより検出装置10の動作を制御してもよい。
また、操作者80は人に限られず、ロボットや動物等であってもよい。
また、上記実施形態では、操作者80が手81によって行うジェスチャーは、手81の指の向き又は動きによって行うジェスチャーであるものとしたが、これに限られず、例えば手81の全体の動きによって行うジェスチャー等であってもよい。また、画像表示面41を指先でタッチするジェスチャーであってもよい。
また、撮影装置20は、カラーカメラに加えて深度カメラを有していてもよい。深度カメラは、スクリーン40の画像表示領域RD、操作者80、及びこれらの背景を含む撮影範囲Rを撮影して、撮影範囲Rの深度情報を含む深度画像に係る深度画像データを生成する。深度画像は、各画素が、画像表示領域RD、操作者80、及びこれらの背景の構造物(以下、「測距対象物」と記す)の奥行き(深度カメラから測距対象物までの距離)に係る深度情報を含む。撮影装置20がカラーカメラ及び深度カメラを有する場合には、深度画像の深度情報に基づいて画像表示面41、すなわち画像表示領域RDを特定してもよい。例えば、深度画像において深度が連続している平面状の矩形領域を画像表示領域RDとして特定してもよい。
深度カメラとしては、例えば、TOF(Time Of Flight)方式で距離を検出するもの、又はステレオ方式で距離を検出するものなどを用いることができる。また、カラーカメラ及び深度カメラは、撮影範囲Rを少なくとも含む範囲を撮影可能であればよく、カラーカメラにより撮影される画角と、深度カメラにより撮影される画角とが異なっていてもよい。また、カラーカメラにより撮影される画角と、深度カメラにより撮影される画角とが重複する撮影範囲Rにおいては、カラー画像の画素と、深度画像の画素との対応付けがなされていることが好ましい。これにより、カラー画像における任意の画素を指定した場合に、深度画像において当該画素に対応する画素を特定することができる。よって、カラー画像における任意の画素について、深度情報を取得することができる。
また、上記実施形態では、撮影範囲Rにスクリーン40の画像表示領域RDの全体が含まれている場合を例に挙げて説明したが、これに限られず、画像表示領域RDの一部のみが撮影範囲Rに含まれる態様、すなわち、撮影画像50に画像表示領域RDの一部のみが写る態様であってもよい。
また、以上の説明では、本発明に係るプログラムのコンピュータ読み取り可能な媒体として記憶部13のHDD、SSDを使用した例を開示したが、この例に限定されない。その他のコンピュータ読み取り可能な媒体として、フラッシュメモリ、CD-ROM等の情報記録媒体を適用することが可能である。また、本発明に係るプログラムのデータを通信回線を介して提供する媒体として、キャリアウエーブ(搬送波)も本発明に適用される。
また、上記実施形態における検出装置10、撮影装置20及びプロジェクタ30の各構成要素の細部構成及び細部動作に関しては、本発明の趣旨を逸脱することのない範囲で適宜変更可能であることは勿論である。
本発明の実施の形態を説明したが、本発明の範囲は、上述の実施の形態に限定するものではなく、特許請求の範囲に記載された発明の範囲とその均等の範囲を含む。
以下に、この出願の願書に最初に添付した特許請求の範囲に記載した発明を付記する。付記に記載した請求項の項番は、この出願の願書に最初に添付した特許請求の範囲の通りである。
〔付記〕
<請求項1>
コンピュータが実行する検出方法であって、
画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得し、
前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する、
検出方法。
<請求項2>
前記撮影画像における前記画像表示領域を特定し、
前記撮影画像のうち、特定された前記画像表示領域を除いた前記外部領域で抽出された前記対象物の少なくとも一部を前記検出対象として検出する、
請求項1に記載の検出方法。
<請求項3>
前記撮影画像における前記画像表示領域を特定し、
前記撮影画像において前記対象物を抽出し、
抽出された前記対象物が、前記撮影画像のうち前記画像表示領域を除いた前記外部領域にあるか否かを判別し、
前記外部領域にあると判別された前記対象物の少なくとも一部を前記検出対象として検出する、
請求項1に記載の検出方法。
<請求項4>
前記撮影画像における前記画像表示領域を特定し、
前記撮影画像のうち、特定された前記画像表示領域を除いた外部領域において、前記対象物を抽出し、
抽出された前記対象物の少なくとも一部を前記検出対象として検出する、
請求項1に記載の検出方法。
<請求項5>
複数の前記対象物が抽出された場合には、前記複数の対象物のうち面積が最大である対象物を前記検出対象として検出する、
請求項1に記載の検出方法。
<請求項6>
抽出された前記対象物が、前記撮影画像において前記画像表示領域の内部から外部にわたって延在している場合には、当該対象物が、前記画像表示領域の外部にあると判別する、
請求項1に記載の検出方法。
<請求項7>
前記画像表示領域を構成する部材には、予め定められた位置に標識が設けられており、
前記撮影画像における前記標識の位置に基づいて前記画像表示領域を特定する、
請求項2~4のいずれか一項に記載の検出方法。
<請求項8>
前記画像表示領域に表示される画像は、予め定められた位置に標識を含み、
前記撮影画像における前記標識の位置に基づいて前記画像表示領域を特定する、
請求項2~4のいずれか一項に記載の検出方法。
<請求項9>
画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得し、
前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する、
処理部を備える検出装置。
<請求項10>
コンピュータに、
画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得する処理、
前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する処理、
を実行させるプログラム。
1 情報処理システム
10 検出装置
11 CPU(処理部)
12 RAM
13 記憶部
131 プログラム
132 撮影画像データ
14 操作部
15 表示部
16 通信部
17 バス
20 撮影装置
30 プロジェクタ
40 スクリーン
41 画像表示面
50 撮影画像
60 標識
80 操作者(被写体)
81、81L、81R、81I 手(対象物、検出対象の候補、検出対象)
Im 投影画像(画像)
R 撮影範囲
RD 画像表示領域
RE 外部領域

Claims (10)

  1. コンピュータが実行する検出方法であって、
    画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得し、
    前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する、
    検出方法。
  2. 前記撮影画像における前記画像表示領域を特定し、
    前記撮影画像のうち、特定された前記画像表示領域を除いた前記外部領域で抽出された前記対象物の少なくとも一部を前記検出対象として検出する、
    請求項1に記載の検出方法。
  3. 前記撮影画像における前記画像表示領域を特定し、
    前記撮影画像において前記対象物を抽出し、
    抽出された前記対象物が、前記撮影画像のうち前記画像表示領域を除いた前記外部領域にあるか否かを判別し、
    前記外部領域にあると判別された前記対象物の少なくとも一部を前記検出対象として検出する、
    請求項1に記載の検出方法。
  4. 前記撮影画像における前記画像表示領域を特定し、
    前記撮影画像のうち、特定された前記画像表示領域を除いた外部領域において、前記対象物を抽出し、
    抽出された前記対象物の少なくとも一部を前記検出対象として検出する、
    請求項1に記載の検出方法。
  5. 複数の前記対象物が抽出された場合には、前記複数の対象物のうち面積が最大である対象物を前記検出対象として検出する、
    請求項1に記載の検出方法。
  6. 抽出された前記対象物が、前記撮影画像において前記画像表示領域の内部から外部にわたって延在している場合には、当該対象物が、前記画像表示領域の外部にあると判別する、
    請求項1に記載の検出方法。
  7. 前記画像表示領域を構成する部材には、予め定められた位置に標識が設けられており、
    前記撮影画像における前記標識の位置に基づいて前記画像表示領域を特定する、
    請求項2~4のいずれか一項に記載の検出方法。
  8. 前記画像表示領域に表示される画像は、予め定められた位置に標識を含み、
    前記撮影画像における前記標識の位置に基づいて前記画像表示領域を特定する、
    請求項2~4のいずれか一項に記載の検出方法。
  9. 画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得し、
    前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する、
    処理部を備える検出装置。
  10. コンピュータに、
    画像が表示されている画像表示領域の少なくとも一部と、対象物の少なくとも一部と、を含む撮影画像を取得する処理、
    前記撮影画像のうち前記画像表示領域を除いた外部領域で抽出された前記対象物の少なくとも一部を検出対象として検出する処理、
    を実行させるプログラム。
JP2022135471A 2022-08-29 2022-08-29 検出方法、検出装置及びプログラム Pending JP2024032042A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022135471A JP2024032042A (ja) 2022-08-29 2022-08-29 検出方法、検出装置及びプログラム
US18/456,963 US20240069647A1 (en) 2022-08-29 2023-08-28 Detecting method, detecting device, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022135471A JP2024032042A (ja) 2022-08-29 2022-08-29 検出方法、検出装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2024032042A true JP2024032042A (ja) 2024-03-12

Family

ID=89999246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022135471A Pending JP2024032042A (ja) 2022-08-29 2022-08-29 検出方法、検出装置及びプログラム

Country Status (2)

Country Link
US (1) US20240069647A1 (ja)
JP (1) JP2024032042A (ja)

Also Published As

Publication number Publication date
US20240069647A1 (en) 2024-02-29

Similar Documents

Publication Publication Date Title
JP6075122B2 (ja) システム、画像投影装置、情報処理装置、情報処理方法およびプログラム
CN104166509B (zh) 一种非接触式屏幕交互方法及系统
US9645735B2 (en) Information processing device and information processing method
US10642422B2 (en) Information processing apparatus, control method for the information processing apparatus, and storage medium
JP2014143548A (ja) 画像処理装置、画像処理方法および画像処理プログラム
US10276133B2 (en) Projector and display control method for displaying split images
JP2012185630A (ja) 投影装置
JP2016184362A (ja) 入力装置、入力操作検出方法及び入力操作検出用コンピュータプログラム
JP2012185631A (ja) 投影装置
US11073949B2 (en) Display method, display device, and interactive projector configured to receive an operation to an operation surface by a hand of a user
JP2016103137A (ja) ユーザインタフェース装置、画像処理装置及び制御用プログラム
JP2024103514A (ja) オブジェクト姿勢制御プログラムおよび情報処理装置
JPWO2018096827A1 (ja) 表示制御装置、表示制御方法及びコンピュータプログラム
US10073614B2 (en) Information processing device, image projection apparatus, and information processing method
JP6000553B2 (ja) 情報処理装置及びその制御方法
JP6555958B2 (ja) 情報処理装置、その制御方法、プログラム、および記憶媒体
JP2015170206A (ja) 検出装置および検出方法
JP2023033559A (ja) 情報処理装置、表示制御方法、及びプログラム
JP2024032042A (ja) 検出方法、検出装置及びプログラム
JP2018055685A (ja) 情報処理装置、その制御方法、プログラム、および記憶媒体
JP2024032043A (ja) 検出方法、検出装置及びプログラム
JP6898021B2 (ja) 操作入力装置、操作入力方法、及びプログラム
JP2018063555A (ja) 情報処理装置、情報処理方法及びプログラム
JP7537470B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2017022590A (ja) 画像処理装置、画像処理装置の制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240807