JP6136504B2 - 対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ - Google Patents

対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ Download PDF

Info

Publication number
JP6136504B2
JP6136504B2 JP2013085298A JP2013085298A JP6136504B2 JP 6136504 B2 JP6136504 B2 JP 6136504B2 JP 2013085298 A JP2013085298 A JP 2013085298A JP 2013085298 A JP2013085298 A JP 2013085298A JP 6136504 B2 JP6136504 B2 JP 6136504B2
Authority
JP
Japan
Prior art keywords
image
detection
unit
target image
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013085298A
Other languages
English (en)
Other versions
JP2014207622A (ja
Inventor
田中 清明
清明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2013085298A priority Critical patent/JP6136504B2/ja
Priority to EP14154828.9A priority patent/EP2793166A3/en
Priority to US14/191,918 priority patent/US9430710B2/en
Priority to CN201410078994.9A priority patent/CN104104860B/zh
Publication of JP2014207622A publication Critical patent/JP2014207622A/ja
Application granted granted Critical
Publication of JP6136504B2 publication Critical patent/JP6136504B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/167Detection; Localisation; Normalisation using comparisons between temporally consecutive images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • H04N9/8047Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)
  • Indication In Cameras, And Counting Of Exposures (AREA)
  • Camera Data Copying Or Recording (AREA)
  • Image Processing (AREA)

Description

本発明は、撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラに関するものである。
従来、撮像機器および表示デバイスなどにおいて、使い易いユーザインタフェースを提供したり、自動的に最適な画像を取得したりするために、撮影対象または表示対象を自動認識するニーズが高まっている。このようなニーズの一例として、人、動物などの顔(対象物)の画像である顔画像(対象画像)を検出し、検出した顔画像に対し、フォーカスおよび露出が最適となるように調整したり、文字(対象画像)を認識し、認識した文字の領域を自動的にOCR(Optical Character Recognition)の対象にしたりするような機能が挙げられる。
このような自動認識の技術においては、誤認識(誤検出)が発生したり、認識(検出)の一時的な失敗が発生したりする場合がある。このような問題点に対し、種々の工夫がなされている。
例えば、誤認識される画像は、検出されたり検出されなかったりする。そこで、特許文献1に記載の符号化処理装置では、或るフレームにて顔領域が検出された場合でも、当該フレーム以降の所定の枚数以上の連続するフレームにて当該顔領域が連続して検出されていない場合、当該フレームにて検出された顔領域の検出履歴を無効と判定している。
また、認識に一時的に失敗した画像は、その後には連続で認識に成功することが多い。そこで、特許文献2に記載の区画線認識装置では、路面の撮影画像から区画線の画像(対象画像)を検出するものであり、当該区画線の画像が所定回数未検出であったとしても、所定回数連続して再検出された場合には、当該再検出を確定している。これにより、一旦未検出となった区画線をより適切に再検出することができる。
特開2009−005239号公報(2009年01月08日公開) 特開2013−003634号公報(2013年01月07日公開)
誤検出される対象画像については、上述のように、検出されたり検出されなかったりするので、検出情報が出力されたり、出力されなかったりする。このため、例えば、検出された対象画像の領域に、当該対象画像を検出したことを示す検出枠(検出マーク)を表示する場合、当該検出枠が表示されたり表示されなかったりして、見映えが悪い。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、誤検出された対象画像の検出結果が出力されることを防止できる対象画像検出デバイスなどを提供することにある。
本発明に係る対象画像検出デバイスは、撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する対象画像検出デバイスであって、上記課題を解決するために、情報を記憶する記憶部と、動画像を構成する複数の前記撮影画像を順次取得する取得手段と、該取得手段が前記撮影画像を取得すると、取得した撮影画像に含まれる対象画像を検出し、検出結果を生成して、前記記憶部に検出履歴として蓄積する検出手段と、前記記憶部の検出履歴を参照して、対象物が同じである対象画像の検出結果が直近の所定数の検出結果に含まれるかを判定し、含まれる場合に当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しない判定手段とを備えることを特徴としている。
また、本発明に係る対象画像検出デバイスの制御方法は、撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する対象画像検出デバイスの制御方法であって、上記課題を解決するために、動画像を構成する複数の前記撮影画像を順次取得する取得ステップと、該取得ステップにて取得された撮影画像に含まれる対象画像を検出し、検出結果を生成して、記憶部に検出履歴として蓄積する検出ステップと、前記記憶部の検出履歴を参照して、対象物が同じである対象画像の検出結果が直近の所定数の検出結果に含まれるかを判定し、含まれる場合に当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しない判定ステップとを含むことを特徴としている。
上記構成および方法によると、動画像を構成する複数の撮影画像が順次取得され、取得された撮影画像に含まれる対象画像が検出され、検出結果が記憶部に検出履歴として蓄積される。一般に、誤検出の対象画像は、前記撮影画像から検出されたり検出されなかったりする。そこで、本発明では、対象物が同じである対象画像の検出結果が、直近の所定数の検出結果に含まれるかを判定し、含まれる場合に適正な検出として当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しない。これにより、誤検出の対象画像の検出結果が出力されることを防止できる。
なお、上記所定数は、1以上の整数である。また、対象画像の対象物が同じであるかの判定は、位置、大きさ、類似度などの情報の少なくとも1つに基づいて行われる。
本発明に係る対象画像検出デバイスでは、前記判定手段は、前記検出手段が検出した対象画像と対象物が同じである対象画像を、直近の所定数の検出結果に含まれるかを判定してもよい。この場合、連続して検出される対象画像の検出結果が出力され、その他の検出結果が出力されないので、誤検出の対象画像の検出結果が出力されることを確実に防止できる。
ところで、検出すべき対象画像であったとしても、常に連続して検出されるとは限らず、一時的に検出できない場合もある。この場合、検出枠等の検出マークが一時的に消えることになり、見映えが悪いなどの問題点が発生する。
そこで、本発明に係る対象画像検出デバイスでは、前記判定手段は、直近の所定期間のうち、少なくとも所定数の検出結果に、対象物が同じである対象画像の検出結果が含まれるかを判定してもよい。この場合、対象画像が一時的に検出できなくても、直近の所定期間に少なくとも所定数の対象画像が検出されていれば、当該対象画像の検出結果が出力される。その結果、一時的に検出できなかったことによる問題点を解消することができる。
本発明に係る対象画像検出デバイスでは、前記検出手段は、検出した対象画像を識別する識別情報を、前記検出結果に対応付けて前記記憶部に蓄積しており、今回検出した対象画像が、過去に検出した対象画像と対象物が同じである場合、当該過去に検出した対象画像の識別情報と同じ識別情報を、今回検出した対象画像の検出結果に対応付けて前記記憶部に蓄積しており、前記判定手段は、前記判定を、前記対象画像の識別情報を用いて行うことが好ましい。この場合、判定手段は、前記記憶部の履歴情報から、前記対象画像の識別情報のみを利用して前記判定を行うことができるので、迅速な処理および動作が可能となる。
なお、被写体の撮影を行って、動画像を構成する複数の撮影画像を作成する撮影部と、情報を表示する表示部とを備えるデジタルカメラであって、前記撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する、請求項1から4までの何れか1項に記載の対象画像検出デバイスと、前記対象画像検出デバイスからの検出結果に基づいて、前記対象画像を検出したことを示す検出マークを当該撮影画像に合成し、合成した画像を前記表示部に表示させる合成手段とを備えるデジタルカメラであれば、上述と同様の効果を奏する。なお、検出マークとしては、検出した対象画像の領域を示す検出枠等任意のマークを利用することができる。
本発明の各態様に係る対象画像検出デバイスは、コンピュータによって実現してもよく、この場合には、コンピュータを上記対象画像検出デバイスが備える各手段として動作させることにより上記対象画像検出デバイスをコンピュータにて実現させる対象画像検出デバイスの制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
以上のように、本発明に係る対象画像検出デバイスは、対象物が同じである対象画像の検出結果が、直近の所定数の検出結果に含まれるかを判定し、含まれる場合に適正な検出として当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しないので、誤検出の対象画像の検出結果が出力されることを防止できるという効果を奏する。
本発明の一実施形態であるデジタルカメラの概略構成を示すブロック図である。 上記デジタルカメラの表示部にて表示される表示画像の変遷の一例を示す図である。 上記デジタルカメラにおける制御部が行う処理の流れを示すフローチャートである。 上記制御部における顔検出部が行う顔検出処理の流れを示すフローチャートである。 上記デジタルカメラにおける適正検出判定部の一例について、各フレームの入力データおよび出力データを表形式で示す図である。 上記適正検出判定部の別の例について、各フレームの入力データおよび出力データを表形式で示す図である。 上記適正検出判定部のさらに別の例について、各フレームの入力データおよび出力データを表形式で示す図である。 上記適正検出判定部のさらに別の例について、各フレームの入力データおよび出力データを表形式で示す図である。 上記適正検出判定部の他の例について、各フレームの入力データおよび出力データを表形式で示す図である。 従来のデジタルカメラの表示部にて表示される表示画像の変遷の一例を示す図である。
〔実施の形態1〕
(デジタルカメラの概要)
本発明の一実施形態について図1〜図4を参照して説明する。なお、以下では、「同じ顔画像」どうしは、対象物である顔が同じである顔画像(対象画像)どうしを意味している。
図1は、本実施形態であるデジタルカメラの概略構成を示すブロック図である。図示のように、デジタルカメラ10は、撮影部11での撮影により、動画像を構成する複数の撮影画像が順次作成され、画像処理部12にて順次画像処理されて、表示部13にてライブビュー画像として順次表示される。また、デジタルカメラ10は、ユーザが操作部14のシャッターボタン(図示せず)を押すと、画像処理部12にて画像処理された撮影画像が、画像圧縮部15にて画像圧縮された後、画像記録部16に記録される。
(デジタルカメラの詳細)
次に、本実施形態のデジタルカメラ10の詳細について説明する。上述のように、デジタルカメラ10は、撮影部11、画像処理部12、表示部13、操作部14、画像圧縮部15、画像記録部16、および画像合成部(合成手段)17を備えている。さらに、図1に示すように、デジタルカメラ10は、制御部(対象画像検出デバイス)20および記憶部21を備えている。
撮影部11は、被写体の撮影を行うものであり、例えばレンズ群、絞り、撮像素子などの光学系と、アンプ、A/Dコンバータなどの回路系とを備えている。撮像素子の例としては、CCD、CMOS(Complementary Metal-oxide Semiconductor)イメージセンサなどが挙げられる。撮影部11は、上記撮影により撮影画像を生成し、撮影画像のデータに変換して画像処理部12に送信する。
画像処理部12は、撮影部11からの撮影画像のデータに対し、マトリックス演算、γ補正、ホワイトバランスの調整などの画像処理を行うものである。また、画像処理部12は、画像処理された撮影画像のデータから、表示用、記録用、および顔検出用の撮影画像のデータを作成し、それぞれ、表示部13、画像圧縮部15、および制御部20に送信する。なお、表示用および顔検出用の撮影画像のデータは同じであってもよい。
画像合成部17は、画像処理部12からの撮影画像に対し、制御部20からの画像(例えば、OSD(On-Screen Display)用画像)を合成するものである。画像合成部17は、合成した画像である合成画像のデータを表示部13に送信する。
表示部13は、LCD(液晶表示素子)、有機EL(Electroluminescence)ディスプレイ、プラズマディスプレイなどの表示デバイスによって構成されている。表示部13は、画像合成部17からの合成画像のデータに基づいて、文字や画像などの各種の情報を表示出力する。
操作部14は、ユーザの操作によりユーザから各種の入力を受け付けるものであり、入力用ボタン、タッチパネル、その他の入力デバイスによって構成されている。操作部14は、ユーザが操作した情報を操作データに変換して制御部20に送信する。なお、入力デバイスの他の例としては、キーボードと、テンキーと、マウスなどのポインティングデバイスとが挙げられる。
画像圧縮部15は、画像処理部12からの撮影画像のデータを、JPEG(Joint Photographic Experts Group)、MPEG(Moving Picture Expert Group)などの方式に従って圧縮するものである。画像圧縮部15は、圧縮した撮影画像のデータを画像記録部16に記録する。
画像記録部16は、情報を記録するものであり、特に画像圧縮部15が圧縮した撮影画像のデータを記録するものである。画像記録部16は、フラッシュメモリ、ハードディスクなどの不揮発性の記憶装置によって構成される。
制御部20は、デジタルカメラ10内における各種構成の動作を統括的に制御する。制御部20は、例えばCPU(Central Processing Unit)およびメモリを含むコンピュータによって構成され、該コンピュータに制御プログラムを実行させることにより、各種構成の動作制御を行う。なお、制御部20の詳細については後述する。
記憶部21は、フラッシュメモリ、ROM(Read Only Memory)などの不揮発性の記憶装置と、RAM(Random Access Memory)などの揮発性の記憶装置とによって構成されるものである。不揮発性の記憶装置に記憶される内容としては、上記した制御プログラム、OS(operating system)プログラム、その他の各種プログラム、各種の動作設定値などが挙げられる。一方、揮発性の記憶装置に記憶される内容としては、作業用ファイル、テンポラリファイルなどが挙げられる。なお、記憶部21の詳細については後述する。
本実施形態では、制御部20は、画像処理部12にて処理された撮影画像を取得し、取得した撮影画像に含まれる顔画像を検出し、検出した顔画像の領域を示す検出枠(検出マーク)の画像を作成して、画像合成部17に送信するものである。これにより、画像処理部12からの撮影画像に対し、制御部20からの検出枠の画像が、画像合成部17にて合成され、合成された合成画像が表示部13を介して表示出力される。
さらに、本実施形態では、制御部20は、今回検出した顔画像と同じ顔画像が、直近の所定数(例えば2)の撮影画像のうち、当該所定数含まれているか、すなわち今回の撮影画像を含めて(所定数+1)回連続して含まれているかを判定する。制御部20は、連続して含まれていると判定した場合、当該顔画像は、誤検出されたものではなく、適正に検出されたものであるとして、上記検出枠の画像を作成する。一方、連続して含まれてはいないと判定した場合、当該顔画像は、誤検出の可能性があるとして、上記検出枠の画像の作成を省略する。従って、本実施形態の場合、撮影画像に顔画像が検出されても、すぐには検出枠が表示されず、(所定数+1)回以上連続して検出された場合に、検出枠が表示されることになる。
図2は、本実施形態のデジタルカメラ10により順次表示される合成画像の一例を示す図である。一方、図10は、従来のデジタルカメラにより順次表示される合成画像の一例を比較例として示す図である。図2および図10の例では、犬の顔画像は、第1〜第6フレームの全ての撮影画像で検出されており、熊のヌイグルミの顔画像は、第2・第6フレームの撮影画像で誤検出されているとしている。
従来のデジタルカメラは、撮影画像から顔画像を検出すると、当該撮影画像に対し、検出した顔画像の領域に検出枠の画像を合成して表示している。従って、図10の(a)〜(f)に示すように、犬の顔画像に関する検出枠fdは、第1〜第6フレームの全てにおいて表示される。一方、熊のヌイグルミの顔画像に関する検出枠fbは、第2・第6フレームにおいてのみ表示されるので、検出枠が点滅することになり、見映えが悪く、表示品質が低下することなる。
これに対し、本実施形態のデジタルカメラ10では、図2の(a)〜(f)に示すように、犬の顔画像に関しては、第1フレームでは、1回検出したのみであるので、検出枠fdを表示せず、第2フレームでは、2回連続して検出したのみであるので、検出枠fdを表示しない。そして、第3フレーム以降では、3回以上連続して検出しているので、検出枠fdを表示する。このように、本実施形態では、適正な検出であっても、検出当初の所定数のフレームには検出枠fdが表示されないが、1フレームの期間は、1/30秒であり、ユーザにとって極めて短時間であるので、問題とはならない。
一方、熊のヌイグルミの顔画像に関しては、第1・3・4・5フレームでは、検出していないので、検出枠fbを表示せず、第2・6フレームでは、1回検出したのみであるので、検出枠fbを表示しない。すなわち、3回以上連続して検出したフレームが存在しないので、検出枠fbが表示されない。従って、誤検出による検出枠の点滅を防止することができ、表示品質の低下を防止することができる。
(制御部および記憶部の詳細)
次に、制御部20および記憶部21の詳細について、図1を参照して説明する。同図には、制御部20および記憶部21において、顔画像の検出に関する構成が示されている。図示のように、制御部20は、画像取得部(取得手段)30、顔検出部(検出手段)31、適正検出判定部(判定手段)32、および検出枠生成部(合成手段)33を備える構成である。また、記憶部21は、検出履歴記憶部40、および閾値記憶部41を含む構成である。
検出履歴記憶部40は、上記顔検出の検出結果を検出履歴として蓄積している。上記検出結果は、検出された顔画像のID(識別情報)(以下、「顔ID」と称する。)、特徴情報、サイズ、および位置情報を含んでいる。さらに、上記検出結果は、検出された顔画像の検出日時、その他の情報を含んでもよい。閾値記憶部41は、適正な検出であるかを判定するための閾値を記憶している。
画像取得部30は、画像処理部12から撮影画像のデータを取得するものである。画像取得部30は、上記撮影画像のデータを取得すると、取得した上記撮影画像のデータを顔検出部31に送出する。
顔検出部31は、時系列順の複数の撮影画像からなる動画像に関して、上記撮影画像から顔画像を検出する顔検出機能と、検出された顔画像を、続く撮影画像から検出することにより、上記顔画像を追跡する顔追跡機能とを有するものである。なお、顔画像の検出には、テンプレートマッチングを利用したり、肌色領域を検出したり、顔の輪郭を検出したり、顔の特徴点を検出したりするなど、公知の顔検出技術を利用することができる。
具体的には、顔検出部31は、画像取得部30から撮影画像のデータを受け取ると、当該撮影画像から顔画像を検出する。顔検出部31は、検出した顔画像の検出結果を検出履歴として検出履歴記憶部40に蓄積すると共に、当該検出結果のうち、顔IDを適正検出判定部32に送出する。
さらに、顔検出部31は、検出履歴記憶部40の検出履歴を参照して、直近に検出した顔画像と同じ顔画像が、今回検出した顔画像に存在するかを判定する(顔追跡)。顔検出部31は、同じ顔画像には、同じ顔IDを付与する。なお、顔検出部31が行う顔検出および顔追跡の具体的な処理は、従来と同様であるので、その説明を省略する。
適正検出判定部32は、顔検出部31における顔画像の検出が、適正であるか否かを判定するものである。具体的には、適正検出判定部32は、検出履歴記憶部40を参照して、顔検出部31から受け取った顔IDが、直近の所定数(例えば2)のフレームの検出履歴に含まれるかを判断する。含まれる場合、適正な検出であるとして、当該顔IDを検出枠生成部33に送出する。一方、含まれない場合、適正な検出ではないとして、当該顔IDの検出枠生成部33への送出を省略する。なお、適正検出判定部32は、送出すべき顔IDが存在しない場合、検出枠生成部33に対し、何も送出しなくてもよいし、顔画像を検出しなかった(未検出)旨を通知してもよい。
検出枠生成部33は、顔画像を検出した旨を示す検出枠の画像を生成するものである。具体的には、検出枠生成部33は、適正検出判定部32から顔IDを取得すると、取得した顔IDに対応するサイズおよび位置情報を、検出履歴記憶部40の検出履歴から検索する。次に、検出枠生成部33は、検索したサイズおよび位置情報に従って、検出枠の画像を作成し、作成した検出枠の画像のデータを画像合成部17に送信する。これにより、画像合成部17は、画像処理部12からの撮影画像に対し、検出枠生成部33からの検出枠の画像を合成し、合成した画像を、表示部13を介して表示出力することになる。
(制御部の処理動作)
次に、上記構成の制御部20における処理動作について説明する。図3は、制御部20が行う処理の流れを示すフローチャートである。図示のように、撮影部11にて撮影された動画像における一撮影画像を画像取得部30が取得すると、顔検出部31は、取得された撮影画像から顔画像を検出し、該検出結果を検出履歴として検出履歴記憶部40に蓄積する(S10)。次に、適正検出判定部32は、顔検出部31が検出した顔画像のうち、直近の所定数の撮影画像にも同じ顔画像を含まれているものを、適正に検出された顔画像として抽出する(S11)。
そして、検出枠生成部33は、適正検出判定部32が抽出した顔画像に関する検出枠の画像を、検出履歴記憶部40の検出履歴を参照して作成し、画像合成部17に送信する(S12)。これにより、画像処理部12にて画像処理された撮影画像が、画像合成部17にて検出枠の画像と合成されて、表示部13にて表示されることになる。その後、制御部20の処理を終了する。
次に、制御部20における顔検出部31および適正検出判定部32の処理動作について説明する。図4は、顔検出部31が行う顔検出処理の流れを示すフローチャートである。なお、この顔検出処理は、検出された顔画像ごとに実行される。
図4に示すように、顔検出部31は、撮影画像から顔画像を検出すると、検出履歴記憶部40の検出履歴を参照して、今回検出した顔画像と同じ顔画像が、直近に検出した顔画像に存在するか否かを判断する(S20)。存在する場合、該当する顔画像の顔IDを、今回検出した顔画像に付与する一方(S21)、存在しない場合、新たな顔IDを、今回検出した顔画像に付与する(S22)。次に、今回検出した顔画像の検出結果に、付与した顔IDを関連づけて、検出履歴として検出履歴記憶部40に蓄積する(S23)。その後、顔検出処理を終了する。
〔実施例1〕
次に、適正検出判定部32における動作の一例を、図5を参照して説明する。図5は、適正検出判定部32にて入出力されるデータの一例をフレームごとに表形式で示す図である。図5の例は、図2の例に対応するものである。
なお、図示の例では、顔検出部31は、第1フレームにて検出し、その後追跡している犬の顔画像に対し、顔IDとしてID1を付与している。また、顔検出部31は、熊のヌイグルミの顔画像について、第2フレームにて検出した時に顔IDとしてID2を付与し、第3〜第5フレームにて検出できなかったため追跡できず、このため、第6フレームにて検出した時には、顔IDとしてID2とは別のID3を付与している。
図5の例では、適正検出判定部32は、第1フレームでは、ID1が入力されるが、直近の2フレームが存在しないので、未検出であるとして何も出力しない。第2フレームでは、ID1・ID2が入力されるが、直近の2フレームが存在しないので、未検出であるとして何も出力しない。第3〜第5フレームでは、ID1が入力され、直近の2フレームでもID1が入力されているので、ID1を出力する。第6フレームでは、ID1・ID3が入力され、ID1は、直近の2フレームでも入力されているので出力される一方、ID3は、直近の2フレームにて入力されていないので、出力されない。
〔実施例2〕
次に、適正検出判定部32における動作の別の例を、図6を参照して説明する。図6は、適正検出判定部32にて入出力されるデータの一例をフレームごとに表形式で示す図である。図示の例では、適正検出判定部32は、今回検出された顔画像が、直近の1フレームでも検出されている場合、すなわち、2フレーム連続して検出されている場合に、適正に検出された顔画像としている。
図6の例では、適正検出判定部32は、第1フレームでは、ID1が入力されるが、直近の1フレームが存在しないので、未検出であるとして何も出力しない。第2・4・6・8・10・12フレームでは、未検出であるとして何も入力されないので、未検出であるとして何も出力しない。第3・5・7・9・11・13フレームでは、それぞれ、新たなID2〜ID7が入力されるが、直近の1フレームにて入力されていないので出力せず、その結果、未検出であるとして何も出力しない。第14・第15フレームでは、ID7が入力され、直近の1フレームでもID7が入力されているので、ID7を出力する。
従って、本実施例では、第1・3・5・7・9・11・13〜15フレームにて、顔検出部31が顔画像を検出しているが、検出枠生成部33は、2フレーム連続して同じ顔画像(ID7)が検出される第14・15フレームでのみ検出枠を生成する。これにより、検出枠は、第1〜13フレームでは表示されず、第14・第15フレームで表示されることになる。その結果、第1〜12フレームにて検出枠が点滅表示されることを防止でき、表示品質の低下を防止できる。
〔実施の形態2〕
次に、本発明の別の実施形態について説明する。本実施形態のデジタルカメラ10は、図1に示すデジタルカメラ10に比べて、適正検出判定部32における判定処理が異なるのみであり、その他の構成は同様である。なお、上記実施形態で説明した構成および処理動作と同様の構成および処理動作には、同一の符号を付して、その説明を省略する。
本実施形態では、適正検出判定部32は、検出履歴記憶部40を参照して、直近の所定数(例えば4)のフレームに少なくとも所定数(例えば2)のフレームの検出履歴に含まれるかを判断する。含まれる場合、適正な検出であるとして、当該顔IDを検出枠生成部33に送出する。一方、含まれない場合、適正な検出ではないとして、当該顔IDの検出枠生成部33への送出を省略する。
〔実施例3〕
次に、本実施形態における適正検出判定部32における動作の一例を、図7を参照して説明する。図7は、適正検出判定部32にて入出力されるデータの一例をフレームごとに表形式で示す図である。図示の例では、適正検出判定部32は、今回検出された顔画像が、直近の4フレームのうち、少なくとも2フレームに検出されている場合、適正に検出された顔画像としている。
図7の例では、適正検出判定部32は、第1・2フレームでは、直近の2フレームが存在しないので、未検出であるとして何も出力しない。第3・4フレームでは、直近のフレームのうち、ID1が1フレームしか入力されていないので、出力せず、その結果、未検出であるとして何も出力しない。第5〜7フレームでは、直近の4フレームのうち、ID1が2フレーム入力されているので、ID1を出力する。
従って、本実施例では、第5フレームにて、顔検出部31が顔画像を検出していないが、直近の4フレームのうち、2フレームにて同じ顔画像(ID1)が検出しているので、検出枠生成部33は、検出枠を生成する。これにより、顔画像の検出に一時的に失敗したことにより、検出枠の表示が遅延することを防止することができる。
〔実施例4〕
次に、本実施形態における適正検出判定部32における動作の別の例を、図8を参照して説明する。図8は、適正検出判定部32にて入出力されるデータの一例をフレームごとに表形式で示す図である。図示の例では、適正検出判定部32は、今回検出された顔画像が、直近の5フレームのうち、少なくとも3フレームに検出されている場合、適正に検出された顔画像としている。
図8の例では、適正検出判定部32は、第1・2フレームでは、直近の3フレームが存在しないので、未検出であるとして何も出力しない。第3フレームでは、直近の3フレームしか存在しないが、ID1が3フレーム入力されているので、ID1を出力する。このように、直近の5フレーム全ての検出履歴を調べる必要はない。
なお、上記実施形態では、適正検出判定部32は、直近の数フレームの検出履歴を参照しているが、直近の十数フレームの検出履歴を参照してもよい。
〔実施の形態3〕
次に、本発明の他の実施形態について説明する。本実施形態のデジタルカメラ10は、図1に示すデジタルカメラ10に比べて、適正検出判定部32における判定処理が異なるのみであり、その他の構成は同様である。なお、上記実施形態で説明した構成および処理動作と同様の構成および処理動作には、同一の符号を付して、その説明を省略する。
本実施形態では、適正検出判定部32は、検出履歴記憶部40を参照して、顔検出部31から受け取った顔IDが、直近の所定期間(例えば2秒)の検出履歴に含まれるかを判断する。含まれる場合、適正な検出であるとして、当該顔IDを検出枠生成部33に送出する。一方、含まれない場合、適正な検出ではないとして、当該顔IDの検出枠生成部33への送出を省略する。
〔実施例5〕
次に、本実施形態における適正検出判定部32における動作の一例を、図9を参照して説明する。図9は、適正検出判定部32にて入出力されるデータの一例を0.2秒ごとに表形式で示す図である。図示の例では、適正検出判定部32は、今回検出された顔画像が、直近の2秒間に連続して検出している場合、適正に検出された顔画像としている。
図9の例では、適正検出判定部32は、ID1が連続して入力されているが、開始から2秒間は、出力せず、その結果、未検出であるとして何も出力しない。そして、開始から2.2秒後は、直近の2秒間にID1が入力されているので、IDを出力する。
このように、適正検出判定部32は、フレーム単位の代わりに時間単位で判定することもできる。
〔ソフトウェアによる実現例〕
デジタルカメラ10は、の制御ブロック(特に制御部20)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、デジタルカメラ10は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
例えば、上記実施形態では、撮影画像から人、動物などの顔画像を検出して認識しているが、人、動物などの全身の画像を検出してもよいし、ボール、車両その他の物体の画像を検出してもよい。すなわち、本発明は、取得した撮影画像に含まれる任意の対象画像の検出に適用可能である。
また、上記実施形態では、本発明をデジタルカメラ10に適用しているが、携帯電話機、スマートフォン、PDA(Personal Digital Assistant)など、撮影部を有する任意の電子機器に本発明を適用可能である。
以上のように、本発明に係る対象画像検出デバイスは、対象物が同じである対象画像の検出結果が、直近の所定数の検出結果に含まれるかを判定し、含まれる場合に適正な検出として当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しないことにより、誤検出の対象画像の検出結果が出力されることを防止できるので、顔検出だけでなく、ボール検出、車両検出など、撮影画像から対象画像を検出する任意のデバイスに適用することができる。
10 デジタルカメラ
11 撮影部
12 画像処理部
13 表示部
14 操作部
15 画像圧縮部
16 画像記録部
17 画像合成部(合成手段)
20 制御部(対象画像検出デバイス)
21 記憶部
30 画像取得部(取得手段)
31 顔検出部(検出手段)
32 適正検出判定部(判定手段)
33 検出枠生成部(合成手段)
40 検出履歴記憶部
41 閾値記憶部

Claims (6)

  1. 撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する対象画像検出デバイスであって、
    情報を記憶する記憶部と、
    動画像を構成する複数の前記撮影画像を順次取得する取得手段と、
    該取得手段が前記撮影画像を取得すると、取得した撮影画像に含まれる対象画像を検出し、検出結果を生成して、前記記憶部に検出履歴として蓄積する検出手段と、
    前記記憶部の検出履歴を参照して、対象物が同じである対象画像の検出結果が直近の所定数aのうち、少なくとも所定数bの検出結果に含まれるかを、最近の検出結果に関係なく判定し(但し、aおよびbは自然数であり、かつ、aはbよりも大きい)、含まれる場合に当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しない判定手段とを備えることを特徴とする対象画像検出デバイス。
  2. 前記検出手段は、
    検出した対象画像を識別する識別情報を、前記検出結果に対応付けて前記記憶部に蓄積しており、
    今回検出した対象画像が、過去に検出した対象画像と対象物が同じである場合、当該過去に検出した対象画像の識別情報と同じ識別情報を、今回検出した対象画像の検出結果に対応付けて前記記憶部に蓄積しており、
    前記判定手段は、前記判定を、前記対象画像の識別情報を用いて行うことを特徴とする請求項1に記載の対象画像検出デバイス。
  3. 被写体の撮影を行って、動画像を構成する複数の撮影画像を作成する撮影部と、情報を表示する表示部とを備えるデジタルカメラであって、
    前記撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する、請求項1または2に記載の対象画像検出デバイスと、
    前記対象画像検出デバイスからの検出結果に基づいて、前記対象画像を検出したことを示す検出マークを当該撮影画像に合成し、合成した画像を前記表示部に表示させる合成手段とを備えることを特徴とするデジタルカメラ。
  4. 請求項1または2に記載の対象画像検出デバイスとしてコンピュータを機能させるための制御プログラムであって、コンピュータを上記各手段として機能させるための制御プログラム。
  5. 請求項4に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
  6. 撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する対象画像検出デバイスの制御方法であって、
    動画像を構成する複数の前記撮影画像を順次取得する取得ステップと、
    該取得ステップにて取得された撮影画像に含まれる対象画像を検出し、検出結果を生成して、記憶部に検出履歴として蓄積する検出ステップと、
    前記記憶部の検出履歴を参照して、対象物が同じである対象画像の検出結果が直近の所定数aのうち、少なくとも所定数bの検出結果に含まれるかを、最近の検出結果に関係なく判定し(但し、aおよびbは自然数であり、かつ、aはbよりも大きい)、含まれる場合に当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しない判定ステップとを含むことを特徴とする対象画像検出デバイスの制御方法。
JP2013085298A 2013-04-15 2013-04-15 対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ Active JP6136504B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2013085298A JP6136504B2 (ja) 2013-04-15 2013-04-15 対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ
EP14154828.9A EP2793166A3 (en) 2013-04-15 2014-02-12 Target-image detecting device, control method and control program thereof, recording medium, and digital camera
US14/191,918 US9430710B2 (en) 2013-04-15 2014-02-27 Target-image detecting device, control method and control program thereof, recording medium, and digital camera
CN201410078994.9A CN104104860B (zh) 2013-04-15 2014-03-05 对象图像检测设备及其控制方法以及控制程序、记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013085298A JP6136504B2 (ja) 2013-04-15 2013-04-15 対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ

Publications (2)

Publication Number Publication Date
JP2014207622A JP2014207622A (ja) 2014-10-30
JP6136504B2 true JP6136504B2 (ja) 2017-05-31

Family

ID=50112739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013085298A Active JP6136504B2 (ja) 2013-04-15 2013-04-15 対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ

Country Status (4)

Country Link
US (1) US9430710B2 (ja)
EP (1) EP2793166A3 (ja)
JP (1) JP6136504B2 (ja)
CN (1) CN104104860B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373381B2 (en) * 2016-03-30 2019-08-06 Microsoft Technology Licensing, Llc Virtual object manipulation within physical environment
JP6924413B2 (ja) * 2017-12-25 2021-08-25 オムロン株式会社 データ生成装置、データ生成方法及びデータ生成プログラム
JP7423325B2 (ja) * 2020-01-29 2024-01-29 キヤノン株式会社 表示制御装置およびその制御方法
CN111798698B (zh) * 2020-06-24 2022-04-08 中国第一汽车股份有限公司 一种前方目标车辆的确定方法、装置及车辆

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4489608B2 (ja) * 2004-03-31 2010-06-23 富士フイルム株式会社 ディジタル・スチル・カメラ,画像再生装置および顔画像表示装置ならびにそれらの制御方法
JP4350725B2 (ja) * 2005-08-05 2009-10-21 キヤノン株式会社 画像処理方法、画像処理装置、及び、画像処理方法をコンピュータに実行させるためのプログラム
JP5156196B2 (ja) * 2006-03-31 2013-03-06 イーストマン コダック カンパニー 撮像装置
JP4863937B2 (ja) 2007-06-25 2012-01-25 株式会社ソニー・コンピュータエンタテインメント 符号化処理装置および符号化処理方法
JP2010049148A (ja) * 2008-08-25 2010-03-04 Nikon Corp 画像認識装置及び撮像装置
JP5127692B2 (ja) * 2008-12-25 2013-01-23 キヤノン株式会社 撮像装置及びその追尾方法
JP5317710B2 (ja) * 2009-01-07 2013-10-16 キヤノン株式会社 画像処理装置、その制御方法、プログラム及び記録媒体
JP5272775B2 (ja) * 2009-02-12 2013-08-28 株式会社ニコン 電子スチルカメラ
JP5398341B2 (ja) * 2009-05-11 2014-01-29 キヤノン株式会社 物体認識装置及び物体認識方法
JP5510287B2 (ja) * 2010-11-22 2014-06-04 カシオ計算機株式会社 被写体検出装置、被写体検出方法及びプログラム
JP5810654B2 (ja) 2011-06-13 2015-11-11 トヨタ自動車株式会社 区画線認識装置、区画線認識方法、プログラム及び媒体

Also Published As

Publication number Publication date
US9430710B2 (en) 2016-08-30
CN104104860A (zh) 2014-10-15
EP2793166A2 (en) 2014-10-22
JP2014207622A (ja) 2014-10-30
US20140307918A1 (en) 2014-10-16
EP2793166A3 (en) 2017-01-11
CN104104860B (zh) 2017-11-10

Similar Documents

Publication Publication Date Title
JP5141317B2 (ja) 対象画像検出デバイス、制御プログラム、および該プログラムを記録した記録媒体、ならびに対象画像検出デバイスを備えた電子機器
JP4506801B2 (ja) 画像認識装置、画像認識方法、画像認識プログラム
US11523062B2 (en) Image capture apparatus and method for controlling the same
US11068706B2 (en) Image processing device, image processing method, and program
US8441554B2 (en) Image capturing apparatus capable of extracting subject region from captured image
KR20110053820A (ko) 이미지 처리 방법 및 장치
JPWO2008149709A1 (ja) 携帯端末、携帯端末の制御方法、携帯端末の制御プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP6136504B2 (ja) 対象画像検出デバイス、その制御方法および制御プログラム、記録媒体、並びにデジタルカメラ
JP2013228930A (ja) 被写体領域検出装置、その制御方法、および制御プログラム、並びに撮像装置および表示装置
US20160189392A1 (en) Object tracking apparatus, control method therefor and storage medium
JP2010171797A (ja) 撮像装置及びプログラム
US20200020086A1 (en) Information processing method and information processing apparatus
JP2016092513A (ja) 画像取得装置、ブレ軽減方法及びプログラム
JP2006128793A (ja) 撮像装置、及びその制御方法
JP5482852B2 (ja) 対象画像検出デバイス、その制御方法、制御プログラム、および該プログラムを記録した記録媒体、ならびに対象画像検出デバイスを備えた電子機器
JP5222429B2 (ja) 被写体追跡装置及びその制御方法
JP2010161644A (ja) 電子カメラ
JP2016021155A (ja) 撮像装置
JP6456121B2 (ja) 撮像装置および撮像方法
WO2016175003A1 (ja) 撮影装置、撮影装置の制御方法、および制御プログラム
JP5375988B2 (ja) 画像信号再生装置、画像信号再生方法、撮像装置、および撮像方法
JP2012119798A (ja) 画像生成方法、画像生成装置及びプログラム
JP5029529B2 (ja) 撮像装置、撮像方法、画像信号再生装置および画像信号再生方法
JP2010004357A (ja) 撮像装置及び撮像方法
JP2010154374A (ja) 撮像装置および被写体追跡方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151023

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20151028

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160304

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161025

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170223

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170417

R150 Certificate of patent or registration of utility model

Ref document number: 6136504

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250