JPWO2009130899A1 - 画像処理装置、画像処理方法、及び画像処理用集積回路 - Google Patents

画像処理装置、画像処理方法、及び画像処理用集積回路 Download PDF

Info

Publication number
JPWO2009130899A1
JPWO2009130899A1 JP2010509079A JP2010509079A JPWO2009130899A1 JP WO2009130899 A1 JPWO2009130899 A1 JP WO2009130899A1 JP 2010509079 A JP2010509079 A JP 2010509079A JP 2010509079 A JP2010509079 A JP 2010509079A JP WO2009130899 A1 JPWO2009130899 A1 JP WO2009130899A1
Authority
JP
Japan
Prior art keywords
image
captured image
captured
reduced
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010509079A
Other languages
English (en)
Other versions
JP5247798B2 (ja
Inventor
裕史 杉澤
裕史 杉澤
冨田 裕人
裕人 冨田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2010509079A priority Critical patent/JP5247798B2/ja
Publication of JPWO2009130899A1 publication Critical patent/JPWO2009130899A1/ja
Application granted granted Critical
Publication of JP5247798B2 publication Critical patent/JP5247798B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

所定時間毎に撮像され順次入力される撮像画像において、特定処理の対象となる画像範囲を特定する画像処理装置であって、入力された1つの撮像画像に基づいて、K(K≧1)種の倍率の縮小画像を前記所定時間内に生成する処理能力を有し、撮像画像が入力される毎に、各々異なるL(L>K)種の倍率のうち、当該撮像画像についてのM(M≦K)種以下の倍率を、当該撮像画像の前に入力された撮像画像について指定した倍率に基づいて選択し、選択したM種以下の倍率で生成した各縮小画像とテンプレート画像とを照合し、照合結果に基づいて前記画像範囲を特定する。

Description

本発明は、画像処理技術に関し、特に、撮像画像から一定条件に合致する画像範囲を特定する技術に関する。
デジタルカメラ等において、所定時間(例えば、33ms)毎に撮像した撮像画像(フレーム画像)から、その撮像画像よりサイズが小さい特定画像(例えば顔画像)が含まれる範囲を特定し、特定した範囲に、枠を表示したり、ピントを合わせたりといった特定処理を行うものが知られている。
この特定画像が含まれる範囲を特定する方法に、特定画像を検出するためのテンプレート画像(撮像画像より小さい一定サイズのもの)と、撮像画像に基づいて段階的に縮小率を変えて生成した複数の縮小画像とを照合して特定画像を検出する方法がある。つまり、矩形である縮小画像の左上の画素から右下の画素までテンプレート画像をずらしながら照合する処理を各縮小画像に対して行うことで特定画像を検出し、この結果に基づいて特定画像が含まれる範囲を特定する。
ここで、複数の縮小画像を生成する際の各縮小率は、生成された複数の縮小画像とテンプレート画像とを照合することで、撮像画像中に含まれている様々な大きさの特定画像を検出することができるように予め設定される。
しかしながら、この縮小画像を生成する処理は、一般的に比較的長い時間を要する処理であるため、1つの撮像画像から生成する縮小画像の数が多くなる程、撮像間隔時間(この例では、33ms)内に特定画像が検出できないケースが生じることになる。
特に、移動する被写体を撮像している場合において、例えば、撮像のフレームレートと同じレートで表示するときに、ある撮像画像について、撮像間隔時間を経過した後に特定画像が検出されたとすると、特定した画像範囲と、実際に被写体が写っている範囲とが比較的大きくずれてしまうという問題が生じうる。例えば、特定処理として、特定した画像範囲に枠を表示する処理を行う場合には、実際に被写体が写っている位置とは異なる位置に枠が表示されてしまうことになる。
これに対しては、縮小画像の生成の順番をデジタルカメラの撮影モードに応じて切り替えることで、撮像間隔時間内に特定画像を検出する可能性を高める方法が知られている(例えば、特許文献1)。
特許文献1に係る撮像装置は、原画像G0を段階的に縮小した縮小画像G1〜G7(この例では、G1、G2、・・・、G7の順でサイズが小さくなる)を生成することが可能であり、人物を撮影するモード等、少人数の近景撮影が予測されるモードでは、撮像画像に含まれる顔画像のサイズが大きくなることが多いため、G7、G6、・・・、G0の順で縮小画像を生成しテンプレート画像と照合する。また、風景を撮影するモード等、遠景撮影が予定されるモードでは、撮像画像に含まれる顔画像のサイズが小さくなることが多いため、G0、G1、・・・、G7の順で縮小画像を生成しテンプレート画像と照合する。
この結果、撮像間隔時間内に全種類の縮小画像とテンプレートとの照合が完了しないまま、次の撮像画像についての処理に移らなければならない場合でも、撮像間隔時間内に特定画像を検出する可能性を高めることができる。
特開2007−135115号公報
しかしながら、近年、高フレームレート撮影に対するユーザのニーズが高まっている。このようなニーズに応えようとすれば、上述の問題、即ち、撮像間隔時間を経過した後に特定画像が検出されることによって、特定した画像範囲と、実際に被写体が写っている範囲とが比較的大きくずれてしまうという問題がより生じやすくなる。
この問題を解決するために、より短い時間で各縮小画像を生成できるような高スペックのハードウェアを用いて高速に処理する方法も考えられるが、これには、比較的大きな設計変更を伴うため、現状のハードウェア資源を用いて解決できる方が望ましい。
そこで、本発明はかかる問題に鑑みてなされたものであり、現状のハードウェア資源を用いつつ、従来とは異なる方法で、撮像間隔時間内に、特定画像を検出することが可能な画像処理装置を提供することを目的とする。
上記課題を解決するために、本発明に係る画像処理装置は、所定時間毎に撮像され順次入力される撮像画像において、特定処理の対象となる画像範囲を特定する画像処理装置であって、入力された1つの撮像画像に基づいて、K(K≧1)種の倍率の縮小画像を前記所定時間内に生成する処理能力を有し、各々異なるL(L>K)種の倍率のうち指定された倍率の縮小画像を生成する縮小画像生成手段と、前記縮小画像生成手段により生成された各縮小画像とテンプレート画像とを照合し、照合結果を送出する照合手段と、前記照合手段から送出された照合結果に基づいて、前記画像範囲を特定する特定手段と、撮像画像が入力される毎に、当該撮像画像についてのM(M≦K)種以下の倍率を、当該撮像画像の前に入力された撮像画像について指定した倍率に基づいて選択し、選択したM種以下の倍率を前記縮小画像生成手段に指定して各縮小画像を生成させて、生成された各縮小画像を前記照合手段に照合させ、少なくともその照合結果に基づいて、当該撮像画像についての前記画像範囲を前記特定手段に特定させる制御手段とを備えることを特徴とする。
上述の構成を備える本発明に係る画像処理装置は、各撮像画像について、L種の倍率のうちの、自装置の処理能力(所定時間内に生成できる縮小画像の種類数K)以下のM種以下の倍率で各縮小画像を生成し、各縮小画像とテンプレート画像とを照合するので、所定時間内にテンプレート画像に対応する画像を検出できる可能性を高めることができる。
また、前記制御手段は、撮像画像が入力される毎に、前記L種の倍率を昇順又は降順に並べた場合における先頭からの順番が奇数番目となる各倍率のうちN(N≦M)個の倍率を含むM個以下の倍率と、偶数番目となる各倍率のうちN個の倍率とを含むM個以下の倍率とを交互に、前記M種以下の倍率として前記縮小画像生成手段に指定することとしてもよい。
これにより、L種の倍率を昇順又は降順に並べた場合における先頭からの順番が奇数番目になる倍率で生成した各縮小画像と、偶数番目になる倍率で生成した各縮小画像とを交互に用いてテンプレート画像との照合を行うので、L種の倍率から任意のM種以下の倍率を選択する場合と比較し、各撮像画像に含まれる様々な大きさの、テンプレート画像に対応する画像を検出できる可能性を高めることができる。
また、前記制御手段は、一の撮像画像の前に入力された撮像画像について指定したM種以下の倍率のうちの1つ以上の倍率を、前記照合手段から送出された、当該撮像画像についての、テンプレート画像に対応する画像を検出した旨を示す照合結果に基づいて選択し、選択した倍率を、前記縮小画像生成手段に指定する、前記一の撮像画像についての前記M種以下の倍率に含ませることとしてもよい。
これにより、一の撮像画像の前に入力された撮像画像についての各縮小画像の生成に用いた各倍率のうち、テンプレート画像に対応する画像を検出した際の倍率を選択することにより、その検出に係る倍率を用いて一の撮像画像についての縮小画像を生成することになる。従って、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースにおいて、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性を更に高めることができる。
ここで、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースとは、例えば、所定時間を十分短い時間(例えば33ms)とした場合や、被写体が静止している場合が考えられる。
また、前記制御手段は、一の撮像画像の前に入力された撮像画像について指定したM種以下の倍率のうちの1つ以上の倍率を、前記照合手段から送出された、当該撮像画像についての、テンプレート画像に対応する画像を検出した旨を示す照合結果に基づいて選択し、前記L種の倍率を昇順又は降順に並べた場合における先頭からの順番が、選択した倍率についての順番の直前又は直後となる倍率を、前記一の撮像画像についての前記N個の倍率に含ませることとしてもよい。
これにより、一の撮像画像の前に入力された撮像画像についての縮小画像の生成に用いた倍率のうち、テンプレート画像に対応する画像を検出した際の倍率を選択することにより、その選択した倍率の近傍の倍率を用いて一の撮像画像についての縮小画像を生成することになる。従って、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースにおいて、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性を更に高めることができる。
一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースでは、一の撮像画像の前に入力された撮像画像において検出できた倍率の近傍の倍率で、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性が高いためである。
また、前記照合手段は、各縮小画像とテンプレート画像とを照合することにより、当該テンプレート画像に対応する画像範囲を検出した場合に、検出した各画像範囲を示す各範囲情報を前記照合結果として送出し、前記特定手段は、前記照合手段から送出された、一の撮像画像についての各範囲情報及び当該撮像画像の前に入力された撮像画像についての各範囲情報に基づいて前記特定を行うこととしてもよい。
これにより、一の撮像画像について、予め用意されているL種の倍率のうちのM種以下の倍率で生成した各縮小画像とテンプレート画像とを照合して検出した各画像範囲を示す各範囲情報だけでなく、その一の撮像画像の前に入力された撮像画像についての各範囲情報とに基づいて一の撮像画像についての画像範囲を特定するので、誤差の影響を抑えて画像範囲を特定できる可能性を高めることができる。
また、前記特定手段は、前記照合手段から送出された、前記一の撮像画像についての各範囲情報及び前記前に入力された撮像画像についての各範囲情報のうち、所定基準で定まる近接した位置関係にある各画像範囲を示す各範囲情報に基づいて、1つの画像範囲を特定することとしてもよい。
これにより、近接した位置関係にある各画像範囲を示す、一の撮像画像及びその前に入力された撮像画像についての各範囲情報に基づいて1つの画像範囲を特定するので、誤差の影響を抑えて画像範囲を特定できる。
また、前記制御手段は、前記縮小画像生成手段に指定する、一の撮像画像についての前記M種以下の倍率を、前記照合手段から送出された、当該撮像画像より前に入力された撮像画像についての照合結果に基づいて決定することとしてもよい。
これにより、一の撮像画像の前に入力された撮像画像についての縮小画像の生成に用いた倍率のうち、例えば、テンプレート画像に対応する画像を検出した際の倍率を選択した場合には、その検出に係る倍率を用いて一の撮像画像についての縮小画像を生成するので、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースにおいて、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性を更に高めることができる。
また、前記画像処理装置は、前記テンプレート画像の候補となる複数のテンプレート候補画像を保持しており、前記照合手段は、一の撮像画像の前に入力された撮像画像についての照合結果に基づいて、当該一の撮像画像についての照合に用いる前記テンプレート画像を前記テンプレート候補画像の中から選択することとしてもよい。
これにより、例えば、一の撮像画像の前に入力された撮像画像についてテンプレート画像に対応する画像を検出した場合に、そのテンプレート画像を一の撮像画像の照合に用いることによって、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースにおいて、より短時間で、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性を高めることができる。
また、前記照合手段は、各縮小画像とテンプレート画像とを照合することにより、当該テンプレート画像に対応する画像範囲を検出した場合に、検出した各画像範囲を示す各範囲情報を前記照合結果として送出し、前記特定手段は、前記照合手段から送出された、一の撮像画像についての各範囲情報及び当該撮像画像の前に入力された撮像画像についての各範囲情報に基づいて前記特定を行うこととしてもよい。
これにより、一の撮像画像について、予め用意されているL種の倍率のうちのM種以下の倍率で生成した各縮小画像とテンプレート画像とを照合して検出した各画像範囲を示す各範囲情報だけでなく、その一の撮像画像の前に入力された撮像画像についての各範囲情報とに基づいて一の撮像画像についての画像範囲を特定するので、誤差の影響を抑えて画像範囲を特定できる可能性を高めることができる。
また、前記特定手段は、前記照合手段から送出された、前記一の撮像画像についての各範囲情報及び前記前に入力された撮像画像についての各範囲情報のうち、所定基準で定まる近接した位置関係にある各画像範囲を示す各範囲情報に基づいて、1つの画像範囲を特定することとしてもよい。
これにより、近接した位置関係にある各画像範囲を示す、一の撮像画像及びその前に入力された撮像画像についての各範囲情報に基づいて1つの画像範囲を特定するので、誤差の影響を抑えて画像範囲を特定できる。
また、前記画像処理装置は、更に撮像画像が入力される毎に、当該撮像画像を表示すると共に、当該撮像画像について前記特定手段が特定した画像範囲に対応する当該撮像画像上の位置に、当該画像範囲を示す枠を表示する表示手段を備えることとしてもよい。
入力された撮像画像について特定された画像範囲の位置に枠が表示されるので、ユーザは、特定処理の対象となっている画像範囲を容易に認識することができる。
画像処理装置100の機能ブロック図である。 顔検出装置180による顔検出方法を説明するための図である。 縮小IDと縮小率等の対応の一例を示す図である。 撮像画像1000の画像メモリ130上の配置を説明するための図である。 画像処理装置100の動作を示すフローチャートである。 特定回路184による顔画像範囲の特定処理を示すフローチャートである。 画像処理装置100が顔画像範囲を特定していく様子を時系列で説明するための図である。 従来の画像処理装置が顔画像範囲を特定していく様子を時系列で説明するための図である。 変形例に係る画像処理装置の動作を示すフローチャートである。 実施の形態で説明した顔検出装置180を含む半導体集積回路200の構成例を示す図である。
以下、本発明に係る画像処理装置の一実施形態を説明する。
≪実施の形態≫
<概要>
実施の形態に係る画像処理装置は、所定時間(例えば、33ms)毎に撮像され生成された各撮像画像から顔画像が含まれる画像範囲(以下、「顔画像範囲」という)を特定するものである。
各撮像画像は、4VGA(1280×960画素)サイズであり、比較的サイズが大きいことから、この画像処理装置は、その一部の領域の画像(以下、「検出対象画像」という)に絞り込んで顔画像の検出処理を行う。ここで、検出対象画像は、従来から行われているエッジ検出等の方法で、何らかの物体があると検出された領域の画像である。
この画像処理装置は、検出対象画像を既定サイズ毎に処理して顔画像を検出する。つまり、この既定サイズの画像(以下、「照合対象画像」という)を、段階的に縮小した各縮小画像を生成し、生成した各縮小画像と顔画像のテンプレート画像とを照合することで、顔画像を検出する。
各縮小画像を生成する際の縮小率として、この画像処理装置は、段階的に縮小の程度が大きくなるように設定された12種類の縮小率を用いることが可能であるが、撮像画像毎に、12種類の縮小率全てではなく、このうちの6種類の縮小率を用いて各縮小画像を生成する。
なお、本実施の形態では、この画像処理装置は、所定時間以内に、6種類の縮小率で縮小画像を生成することが可能な処理能力を有するものと想定している。
また、この画像処理装置は、連続して撮像された2つの撮像画像についてのテンプレート画像との照合結果を用いて、顔画像範囲を特定する。
このように、この画像処理装置は、12種類の縮小率のうちの6種類の縮小率で各縮小画像を生成するので、各撮像画像に対する縮小画像の生成及び照合にかかる処理量は抑えつつも、連続して撮像された2つの撮像画像についての照合結果を用いて顔画像範囲を特定するので、12種類の縮小画像を生成しそれぞれと照合する処理を行う場合と比較しても大きく精度を落とすことなく顔画像範囲を特定できる。
<構成>
まず、画像処理装置100の構成について説明する。
図1は、画像処理装置100の機能ブロック図である。
画像処理装置100は、同図に示す通り、カメラ110、カメラ入力回路120、画像メモリ130、LCD(Liquid Crystal Display)140、LCD出力回路150、物体検出回路160、プロセッサ170、顔検出装置180を備える。
プロセッサ170とその他の構成要素とのデータの授受は、プロセッサバス101を介して行われ、また、画像メモリ130への、カメラ110を除く他の構成要素からのアクセスは、メモリバス102を介して行われる。
ここで、カメラ110は、一定のフレームレート(例えば、30fps(frame per second))で撮像を行い、順次生成した4VGAサイズの撮像画像(データ)をカメラ入力回路120に送出する機能を有する。
カメラ入力回路120は、カメラ110から受領した撮像画像に対し、高画質化のための各種フィルタ処理を施し、画像メモリ130に格納する機能を有する。フィルタ処理後の撮像画像を画像メモリ130へ格納すると、カメラ入力回路120はその旨をプロセッサ170へ通知する。
画像メモリ130は、フィルタ処理後の撮像画像を記憶するためのメモリ領域である。
LCD140は、液晶ディスプレイ(LCD)を含み、LCD出力回路150の指示に応じて、画像を表示する機能を有する。
LCD出力回路150は、撮像のフレームレートと同じフレームレートで、画像メモリ130に記憶されている撮像画像を読み出してLCD140に表示させると共に、プロセッサ170からの指示に応じて特定した顔画像範囲を示す矩形の枠をLCD140に表示させる機能を有する。
物体検出回路160は、プロセッサ170からの指示に応じて、画像メモリ130に記憶されている撮像画像を読み出し、物体の検出処理を行い、検出の有無を示す情報を含む検出結果をプロセッサ170に送出する機能を有する。
この物体の検出は、例えば、物体が写っていない状態の撮像画像と画像メモリ130に記憶されている撮像画像とのエッジ検出結果を比較することにより行い、特に、物体を検出した場合には、検出した物体が含まれる矩形の検出対象画像の座標値(例えば、左上端及び右下端の座標値)を検出結果に含めてプロセッサ170に送出する。
プロセッサ170は、内部メモリ(不図示)に記憶されている制御プログラムを実行することにより、画像処理装置100全体の制御や装置内の各ブロックへの指示や通知を行う機能を有する。
特に、プロセッサ170は、物体検出回路160から検出した旨の情報を含む検出結果を受領した場合に、検出対象画像の座標値(その検出結果に含まれる座標値)及び各縮小画像を生成する際の縮小率を顔検出装置180に通知し、物体検出回路160から検出しなかった旨の情報を含む検出結果を受領した場合には、その旨を顔検出装置180に通知する。
また、プロセッサ170は、顔検出装置180から受領した、特定した顔画像範囲を示す座標値等に基づいて、LCD出力回路150に特定した顔画像範囲を示す矩形の枠を表示させる機能を有する。
顔検出装置180は、プロセッサ170から通知された座標値が示す検出対象画像を、既定サイズ(QVGAサイズ(320×240画素))単位で処理して顔画像範囲を特定する機能を有する。より詳細には、この既定サイズの画像(照合対象画像)を縮小した各縮小画像と各テンプレート画像とを照合することにより顔画像を検出し、照合結果に基づいて顔画像範囲を特定する。
ここで、各テンプレート画像は、各々顔の向きが異なるものであり、各テンプレート画像を用いて照合することで、縮小画像に含まれる様々な方向を向いた顔画像を検出することができる。
顔検出装置180は、結果メモリ181と、解像度変換回路182と、顔検出回路183と、特定回路184とを備える。
ここで、結果メモリ181は、顔検出装置180が処理中の撮像画像についての各照合結果のリスト(以下、「結果リスト」という)と、その撮像画像の1つ前に撮像された撮像画像についての結果リストとを格納するためのメモリ領域である。
解像度変換回路182は、プロセッサ170から通知された座標値が示す検出対象画像の中で、縮小画像の生成対象とする照合対象画像(QVGAサイズ)を決定し、決定した照合対象画像をプロセッサ170から通知された各縮小率で縮小した各縮小画像を生成して顔検出回路183に送出する機能を有する。
なお、照合対象画像は、例えば、PCT/JP2008/000961において開示されている、検出対象画像の中を左上から右下までオーバラップ領域を設けるように決定する方法を用いて同様に決定することができるため、ここでは詳細な説明は省略する。
また、本実施の形態での縮小率は、照合対象画像のサイズ(QVGAサイズ)を「1」とした際の、縮小後の画像のサイズの割合で示す。従って縮小率が大きい(例えば、0.82)ということは、縮小の程度が小さいということを意味し、逆に縮小率が小さい(例えば、0.11)ということは、縮小の程度が大きいということを意味する。
また、本実施の形態では、縮小率が1.0の場合、つまり、縮小画像が照合対象画像そのものである場合も含めて縮小画像と呼ぶこととする。
顔検出回路183は、解像度変換回路182から受領した縮小画像と、各テンプレート画像(それぞれ24×24画素の一定サイズ)とを照合することにより、縮小画像に含まれている顔画像を検出する回路である。
より詳細には、受領した縮小画像の中で、左上の画素から右下の画素までテンプレート画像をずらしながらこのテンプレート画像と照合する処理を各テンプレート画像について行い、各照合結果を顔検出装置180が処理中の撮像画像についての結果リストとして結果メモリ181に格納する。
上述の照合結果には、検出の有無を示す情報の他、特に、顔画像を検出した場合には、検出した矩形の顔画像の左上端の座標値(縮小画像上の座標値)を撮像画像上の座標に変換した座標値と、検出した顔画像を含む縮小画像についての縮小率を示す情報(以下、「縮小ID」という)と、検出に用いたテンプレートの顔の向きを示す情報(以下、「テンプレートID」という)とが含まれる。
以下では、顔検出回路183は、一例として、顔の向きが正面、右向き、左向きの3つのテンプレート画像を用いて照合を行うものする。また、顔の向きが正面、右向き、左向きの3つのテンプレート画像のテンプレートIDはそれぞれ「0」、「1」、「2」であるものとする。
また、上述の縮小画像上の座標値から撮像画像上の座標値への変換は、縮小画像と撮像画像とが相似の関係にあることから、両画像の水平方向サイズ及び垂直方向サイズの比率を用いて単純な比例計算を行うことで実現できるため、詳細な説明は省略する。
特定回路184は、顔検出装置180が処理中の撮像画像及びその1つ前に撮像された撮像画像についての結果メモリ181に格納されている各結果リストに含まれる各照合結果に基づいて顔画像範囲を特定し、特定した顔画像範囲を示す座標値等をプロセッサ170に送出する機能を有する。顔画像範囲の特定方法は後に詳細に説明する。
<顔検出>
次に、顔検出装置180による顔検出方法について説明する。
図2は、顔検出装置180による顔検出方法を説明するための図である。
同図において、照合対象画像1021及び照合対象画像1022は、それぞれ顔画像を含み、照合対象画像1021に含まれる顔画像の方が、照合対象画像1022に含まれる顔画像より大きいものになっている。
照合対象画像1021と、一定サイズ(例えば24×24画素)のテンプレート画像とを照合し顔画像を検出するためには、照合対象画像1021に含まれる顔画像の大きさを、テンプレート画像の顔画像の大きさと同程度にまで縮小する必要がある。縮小画像1031は、この縮小後の画像を示している。
顔検出回路183は、縮小画像1031の中で、左上の画素から右下の画素まで、テンプレート画像をずらしながら照合することで、顔画像を検出する。
照合対象画像1022から顔画像を検出する場合も同様に、顔検出回路183は、照合対象画像1022を縮小した縮小画像1032とテンプレート画像とを照合する。
ここで、縮小画像1032のサイズは、縮小画像1031のサイズより大きく、つまり、縮小画像1032は、縮小画像1031より縮小の程度が低いことが分かる。照合対象画像1022に含まれている顔画像の大きさは、照合対象画像1021に含まれているものより小さいため、より低い縮小の程度でテンプレート画像の顔画像の大きさと同程度にまで縮小できるためである。
このように、照合対象画像から顔画像を検出するためには、照合対象画像に含まれる顔画像の大きさに応じた縮小率で縮小した縮小画像とテンプレート画像と照合する必要がある。しかしながら、実際に検出を行う時点では、照合対象画像に含まれる顔画像の大きさは分からないため、顔検出回路183は、縮小率を段階的に変えた各縮小画像とテンプレート画像とを照合することにより顔画像を検出している。
各縮小画像の縮小率は、例えば、図3に示すように1/1.22倍ずつ段階的に変えるように決定することができる。
図3は、縮小IDと縮小率等の対応の一例を示す図である。
同図において、「(1/1.22)^n」の記載は、(1/1.22)のn乗であることを示している。
同図は、例えば、縮小IDが「0」である場合の縮小率は「(1/1.22)^0、つまり1.0」であり、対応する縮小率で照合対象画像を縮小した場合の縮小画像の水平方向サイズは「320画素」で、垂直方向サイズは「240画素」であることを示している。
また、縮小IDが「11」である場合の縮小率は「(1/1.22)^11倍」であり、縮小画像の水平方向サイズは「33画素」で、垂直方向サイズは「25画素」であることを示している。
なお、縮小画像のサイズが、テンプレート画像のサイズ(この実施の形態の例では24×24画素)より小さくなると、照合ができなくなることから、この例では、縮小IDが「11」である場合の縮小率が最も小さく、つまり、この場合が、縮小の程度が最も高いものとなっている。
<データ>
次に、撮像画像の画像メモリ130上の配置について説明する。
図4は、撮像画像1000の画像メモリ130上の配置を説明するための図である。
撮像画像1000は、上述したように4VGA(1280×960画素)サイズの画像データであり、撮像画像1000を構成する各画素の画素値データは、画像メモリ130上の連続領域に連続して記憶される。つまり、同図に示す画素1001、・・・、1002、1003、・・・、1004、・・・、1005の順で連続領域に記憶される。
ここで、画素1001が記憶される画像メモリ130上の領域のアドレス値をBASEと表現すると、各画素データが記憶される領域のアドレス値は、次の数式で算出される。なお、数式中の水平方向サイズとは、撮像画像1000の水平方向サイズ、つまり1280である。また、ここでは、画素1001の座標値を(0,0)とし、右方向にX軸を、下方向にY軸を取っている。また、1アドレスを、1画素分の画素データが格納される画像メモリ130上の領域を示すものとして説明する。
[数1]
アドレス値=BASE+水平方向サイズ×Y座標+X座標
例えば、座標値が(640,240)である画素1004が記憶される画像メモリ130上の領域のアドレス値は、「BASE+1280×240+640」である。
顔検出装置180の解像度変換回路182は、決定した照合対象画像の座標値から算出したアドレス値を用いて、この照合対象画像を画像メモリ130から読み出すことができる。
<動作>
次に、上記構成を備え、上記データを取り扱う画像処理装置100の動作について説明する。
図5は、画像処理装置100の動作を示すフローチャートである。
プロセッサ170は、カメラ入力回路120から撮像画像を画像メモリ130へ格納した旨の通知を受領すると、撮像回数をカウントアップすると共に、物体検出回路160に検出処理を開始させ、その物体検出回路160から検出結果を受領すると、その検出結果が物体を検出した旨の情報を含むか否かを判定する(ステップS1)。
物体を検出した旨の情報が含まれている場合には(ステップS1:YES)、プロセッサ170は、その検出に係る撮像画像の撮像順が偶数番目か否かを上述の撮像回数に基づいて判定する(ステップS2)。例えば、撮像回数が1であれば否定的な判定を行い、撮像回数が2であれば肯定的な判定を行う。
プロセッサ170は、12種類の縮小IDのうち、検出に係る撮像画像の撮像順が偶数番目である場合には(ステップS2:YES)、偶数の縮小ID(0、2、4、・・・、10)を選択し(ステップS3)、検出に係る撮像画像の撮像順が奇数番目である場合には(ステップS2:NO)、奇数の縮小ID(1、3、5、・・・、11)を選択する(ステップS4)。
プロセッサ170は、選択した各縮小IDと、受領した検出結果に含まれる検出対象画像の座標値とを顔検出装置180に通知する(ステップS5)。
顔検出装置180の解像度変換回路182は、プロセッサ170により通知された座標値が示す検出対象画像の中で1つの照合対象画像を決定し(ステップS6)、決定した照合対象画像が記憶されている画像メモリ130上のアドレス値を数1に示す数式に従って算出し、その照合対象画像を画像メモリ130から読み出す(ステップS7)。
解像度変換回路182は、ステップS5で通知された各縮小IDのうちの1つの縮小IDを選択し、選択した縮小IDに対応する縮小率で読み出した照合対象画像を縮小した縮小画像を生成し、顔検出回路183に送出する(ステップS8)。ここで、解像度変換回路182は、例えば、まだ選択していない各縮小IDのうち、最小の縮小IDを選択するものとする。
顔検出回路183は、顔検出装置180が処理中の撮像画像についての空の結果リストを結果メモリ181に生成し、各テンプレート画像について、そのテンプレート画像を、解像度変換回路182から受領した縮小画像の中で左上の画素から右下の画素までずらしながら照合し、照合結果を、生成した結果リストに登録する(ステップS9)。
解像度変換回路182は、ステップS5で通知された全ての縮小IDを選択したか否かを判定し(ステップS10)、全ての縮小IDを選択していない場合には(ステップS10:NO)、未選択の縮小IDで縮小画像を生成するために、再びステップS7から処理を行う。
一方、全ての縮小IDを選択している場合には(ステップS10:YES)、検出対象画像全体を処理したか否かを判定し(ステップS11)、検出対象画像全体を処理していない場合には(ステップS11:NO)、次の照合対象画像を処理するために、再びステップS6から処理を行う。
また、ステップS11で検出対象画像全体を処理している場合には(ステップS11:YES)、特定回路184は、結果メモリ181に格納されている2つの結果リストに含まれる各照合結果に基づいて、顔画像範囲の特定処理を行う(ステップS12)。
一方、ステップS1において、物体検出回路160から受領した検出結果に物体を検出しなかった旨の情報が含まれている場合には(ステップS1:NO)、プロセッサ170は、その旨を顔検出装置180に通知し、顔検出回路183は、顔検出装置180が処理中の撮像画像についての空の結果リストを結果メモリ181に生成し、特定回路184は、上記同様に、顔画像範囲の特定処理を行う(ステップS12)。
ステップS12の処理の結果として特定回路184から送出された特定した顔画像範囲についての情報に基づき、プロセッサ170は、撮像画像上に描画すべき顔画像範囲の座標値(左上端の座標値及び右下端の座標値)をLCD出力回路150に通知し、LCD出力回路150は、画像メモリ130から読み出した撮像画像上にプロセッサ170から通知された顔画像範囲を示す矩形を描画してLCD140に表示させ、一連の処理を終了する。なお、ステップS12の処理結果として特定回路184から顔画像範囲を特定できなかった旨の通知を受領した場合、プロセッサ170は、LCD出力回路150への上述の座標値の通知を行わないこととしてもよいし、直近に特定回路184から受領した特定した顔画像範囲についての情報に基づき上記の座標値の通知を行うようにしてもよい。
以下、ステップS12の顔画像範囲の特定処理について説明する。
図6は、特定回路184による顔画像範囲の特定処理を示すフローチャートである。
特定回路184は、結果メモリ181に格納されている2つの結果リストそれぞれに含まれる各照合結果について、その照合結果に含まれる検出した顔画像の左上端の座標値(撮像画像上の座標値)と縮小IDに基づいて、検出した顔画像の中心点を算出する(ステップS13)。
例えば、検出した顔画像の左上端の座標値が(92,48)で、縮小IDが「2」であるとした場合に、顔画像のサイズは、テンプレート画像のサイズ(24×24画素)と、縮小IDに対応する縮小率((1/1.22)^2)に基づいて「36×36画素」と求めることができる。従って、この検出した顔画像の中心点は、(92+36/2,48+36/2)、つまり(110,66)と求めることができる。
なお、物体検出回路160により物体が検出されなかった場合(ステップS1:NO)には、上述の通り、空の結果リストが生成されるだけで、その結果リストには照合結果が含まれていない。また、顔検出回路183により顔画像が全く検出されなかった場合には、結果リストに含まれる各照合結果には座標値が含まれていない。従って、結果として、1つの結果リストに含まれる各照合結果についてだけ中心点を算出する場合がある。
また、特に図示していないが、いずれの結果リストにも検出した顔画像の左上端の座標値が含まれていない場合には、特定回路184は、顔画像範囲を特定できなかった旨をプロセッサ170に通知し、特定処理を終了する。
特定回路184は、算出した各中心点のうち、グループが決定していない点があるか否かを判定し(ステップS14)、グループが決定していない中心点がある場合には(ステップS14:YES)、そのグループが決定してない中心点のうちの1つの中心点を選択する(ステップS15)。以下、この中心点を「選択点」という。なお、特定回路184は、例えば、まだグループが決定していない中心点のうち、最小の縮小IDを含む照合結果に含まれている座標値と対応する中心点を選択するものとする。
特定回路184は、選択点以外の、グループが決定していない他の中心点のうち、その選択点の縮小IDと所定範囲(例えば、±2以内)の縮小IDの中心点を、その選択点が所属するグループに所属する中心点の候補とする(ステップS16)。以下、この候補となった各中心点を「候補点」という。
例えば、選択点の縮小IDが「2」である場合には、縮小IDが「0」〜「4」の中心点が、候補点となる。
特定回路184は、選択点と各候補点との距離を算出し(ステップS17)、算出した距離が所定値(例えば、20)以内である候補点を、選択点と同一のグループに所属するものと決定する(ステップS18)。
例えば、選択点の座標値が(110,66)であり、候補点の座標値が(118,68)であるとすると、両点の距離は「8.2」であり、この候補点は、選択点と同一のグループに所属するものと決定される。
特定回路184は、同一のグループに所属する各中心点の座標値及び各顔画像の大きさに基づいて、1つの顔画像範囲を特定し、この特定した顔画像範囲の左上端の座標値及び大きさをプロセッサ170に送出する(ステップS19)。
より詳細には、例えば、上述の例で、同一のグループと決定された2つの中心点(110,66)と(118,68)とがある場合に、各中心点の座標の平均値は(114,67)である。
また、(110,66)を中心点とした顔画像の大きさは、上述の通り「36×36画素」であり、(118,68)を中心点とした顔画像の大きさを、例えば、「44×44画素」であるとすると、これらの顔画像の大きさの平均値は、「40×40画素」である。
特定回路184は、中心点が、算出した各中心点の座標の平均値(114,67)であり、大きさが、算出した顔画像の大きさの平均値「40×40画素」である画像範囲を1つの顔画像範囲と特定し、特定した顔画像範囲の左上端の座標値(114−40/2,67−40/2)、つまり(94,47)と、大きさ「40×40画素」をプロセッサ170に送出する。
ステップS19の処理が完了すると、特定回路184は、再びステップS14から処理し、グループが決定していない中心点がない場合には(ステップS14:NO)、顔検出装置180が処理中の撮像画像の1つ前の撮像画像についての結果リストを結果メモリ181から削除し、顔画像範囲の特定処理を終了する。
<考察>
以下では、画像処理装置100及び従来の画像処理装置それぞれが顔画像範囲を特定していく様子を図7、図8を用いて比較して説明する。
<画像処理装置100>
まず、画像処理装置100について説明する。
図7は、画像処理装置100が顔画像範囲を特定していく様子を時系列で説明するための図である。
ここで、撮像画像は、33ms間隔でカメラ110により撮像され生成された撮像画像1011〜1013を示している。撮像画像1011〜1013の撮像順はn〜n+2であり、nは偶数であるものとする。
また、表示画像は、33ms間隔でLCD140に表示される表示画像1041〜1043を示している。
まず、T1において、撮像画像1011が生成されると、この例では撮像画像1011の撮像順は偶数番目なので、T2までに、偶数の縮小ID(0、2、・・・、10)を用いて各縮小画像が生成され各テンプレートとの照合処理が行われる。
次に、T2において、撮像画像1012が生成されると、この撮像画像1012について、奇数の縮小ID(1、3、・・・、11)を用いて、T1における撮像画像1011と同様に縮小処理及び照合処理が行われると共に、撮像画像1011について、顔画像範囲の特定処理が行われる。
この顔画像範囲の特定は、撮像画像1011についての各照合結果と、撮像画像1011の1つ前に撮像された撮像画像についての各照合結果に基づいて行われ、特定された顔画像範囲を示す矩形の枠S1が、撮像画像1011上に描画され(表示画像1041)、T3まで表示が継続される。
なお、表示画像1041上には、点線で表す楕円C0、C1と点線で表す各矩形とが図示されているが、これらは説明のためのものであり実際には表示されない。このことは、表示画像1042、1043においても同様である。
ここで、点線で表す各矩形は検出した各顔画像を示しており、楕円C0は、撮像画像1011の1つ前に撮像された撮像画像で検出された各顔画像が含まれる範囲を示しており、楕円C1は、撮像画像1011で検出された各顔画像が含まれる範囲を示している。
つまり、撮像画像1011についての顔画像範囲の特定は、楕円C1に含まれる各顔画像と楕円C0に含まれる各顔画像とに基づいて行われる。
次に、T3において、撮像画像1013が生成されると、この撮像画像1013について、偶数の縮小ID(0、2、・・・、10)を用いて、T1における撮像画像1011と同様に縮小処理及び照合処理が行われ、撮像画像1012について、T2における撮像画像1011と同様に、顔画像範囲の特定処理が行われ、特定された顔画像範囲を示す矩形の枠S2が、撮像画像1012上に描画され(表示画像1042)。T4まで表示が継続される。
この撮像画像1012についての顔画像範囲の特定は、撮像画像1012で検出された各顔画像(楕円C2に含まれる各顔画像)と撮像画像1011で検出された各顔画像(楕円C1に含まれる各顔画像)とに基づいて行われる。
以降、撮像画像1013についても同様に処理される。
このようにして表示された表示画像1041〜1043の各矩形の枠S1〜S3は、実際に表示されている顔画像の付近に表示できていることが分かる。
<従来の画像処理装置>
続いて、1つの撮像画像について、12種類の縮小率全てを用いて生成した各縮小画像と各テンプレート画像とを照合する従来の画像処理装置について説明する。
図8は、従来の画像処理装置が顔画像範囲を特定していく様子を時系列で説明するための図である。
ここで、撮像画像は、図7で説明したのと同様、33ms間隔で撮像され生成された撮像画像2011〜2015を示しており、2011〜2013については、図7の1011〜1013と全く同じ画像である。また、各撮像画像の撮像順はn〜n+4であるものとする。
また、表示画像は、33ms間隔で表示される表示画像2021〜2025を示している。
以下では、従来の画像処理装置が1つの撮像画像についての縮小処理と照合処理とを完了するためにかかる時間が、66msであるものとして説明する。
まず、T1において、撮像画像2011が生成されると、T3までの間に全縮小ID(0、2、・・・、11)を用いて各縮小画像が生成され各テンプレートとの照合処理が行われる。
次に、T2においては、まだ、撮像画像2011についての全縮小画像との照合が完了していないので、撮像画像2011だけがそのまま表示される(表示画像2021)。また、T2において、撮像画像2012が生成されるが、撮像画像2011についての全縮小画像との照合が完了していないため、ここでは、撮像画像2012についての縮小処理及び照合処理は行われないこととしている。
次に、T3においては、T1〜T3での撮像画像2011についての照合結果に基づいて、撮像画像2011について顔画像範囲の特定処理が行われ、特定された顔画像範囲を示す矩形の枠S10が撮像画像2012上に描画され(表示画像2022)、T4まで表示が継続される。なお、この従来の画像処理装置は、検出された各顔画像の座標値及び大きさそれぞれの平均値を取ることで、顔画像範囲を特定している。
また、T3において、撮像画像2013が生成されると、撮像画像2013について、全縮小ID(0、2、・・・、11)を用いて、T1における撮像画像2011と同様に、T5まで縮小処理及び照合処理が行われる。
次に、T4において、まだ、撮像画像2013についての全縮小画像との照合が完了していないので、撮像画像2011について特定された顔画像範囲を示す矩形の枠S10がそのまま撮像画像2013上に描画され(表示画像2023)、T5まで表示が継続される。
以降、同様に、撮像画像2013について特定された顔画像範囲を示す矩形の枠S11が、撮像画像2014及び撮像画像2015上にそれぞれ描画され(表示画像2024、2025)、表示画像2024はT5〜T6で、表示画像2025はT6〜T7で表示される。
このように従来の画像処理装置では、全縮小IDを用いて各縮小画像を生成して各テンプレート画像と照合する結果、この縮小処理と照合処理とにかかる時間が、撮像間隔時間(この例では33ms)より長くなってしまい、逆に顔画像の検出の精度が低下してしまっている。特に、前回特定した顔画像範囲を示す矩形の枠をそのまま表示している表示画像2023、2025において実際に表示されている顔画像の位置と矩形の枠の位置とが、大きくずれてしまうという不具合が生じている。
このように、本発明の実施の形態に係る画像処理装置100は、自装置の処理能力に応じて、12種類の縮小率のうち、6種類の偶数の縮小IDに対応する各縮小率と、6種類の奇数の縮小IDに対応する各縮小率とを、撮像画像毎に交互に用いて各縮小画像を生成するので、各撮像画像に対する縮小処理と照合処理とを、撮像間隔時間(この例では33ms)以内に行うことができ、従来の画像処理装置のような不具合が生じない。
また、各撮像画像についての顔画像範囲を、その撮像画像、及びその1つ前に撮像された撮像画像の各照合結果を用いて特定するので、誤差の影響を抑えて、精度よく顔画像範囲を特定できる。
≪変形例≫
以下では、画像処理装置が各縮小画像を生成する際に用いる各縮小率の選択方法を替えた一変形例を説明する。
変形例に係る画像処理装置(以下、「変形画像処理装置」という)は、上述の画像処理装置100のプロセッサ170の機能及び顔検出回路183の機能を若干変更したものであるため、ここでは、変更部分についてのみ説明する。
<動作>
変形画像処理装置の動作について説明する。
図9は、変形画像処理装置の動作を示すフローチャートである。
同図に示すように、変形画像処理装置の動作は、図5のステップS9の処理に替えてステップS22の処理を含む点で、画像処理装置100の場合と異なる。
ここで、ステップS22の処理は、変形例に係る顔検出回路が、照合結果を、結果メモリ181に生成した結果リストに登録するだけでなく、変形例に係るプロセッサにも送出する点で、ステップS9の処理とは異なる。
また、変形画像処理装置の動作は、図5に示す各処理に加え、ステップS20及びS21の処理を含む点で、画像処理装置100の場合と異なる。
ここで、変形例に係るプロセッサは、物体検出回路160から受領した検出結果に物体を検出した旨の情報が含まれている場合に(ステップS1:YES)、処理中の撮像画像の1つ前に撮像された撮像画像で顔画像を検出したか否かを、上述のステップS21で変形例に係る顔検出回路から送出された照合結果に基づいて判定する(ステップS20)。つまり、この照合結果に検出した旨の情報が含まれている場合にのみ肯定的な判定を行う。なお、1つ前に撮像された撮像画像について物体検出回路160から受領した検出結果に物体を検出しなかった旨の情報が含まれている場合には、否定的な判定を行う。
1つ前に撮像された撮像画像で顔画像を検出していない場合には(ステップS20:NO)、ステップS2の処理を行い、処理結果に応じて、ステップS3又はS4で縮小IDの選択を行う。
また、1つ前に撮像された撮像画像で顔画像を検出している場合には(ステップS20:YES)、検出した旨の情報を含む各照合結果に含まれている各縮小ID及びそれらの縮小IDの周辺の縮小IDのうち6つ以下の縮小IDを選択する(ステップS21)。
例えば、検出した旨の情報を含む照合結果に含まれている縮小IDが「2」である場合、その周辺の縮小IDは「1」及び「3」である。従って、この例では縮小IDとして「1」〜「3」を選択する。
なお、選択した縮小IDの数が6つ未満である場合には、選択した縮小IDの数が6つになるように、更に任意の縮小IDを選択するようにしてもよい。
このようにして、ステップS21、ステップS3、又はステップS4で選択した縮小IDと、受領した検出結果に含まれる検出対象画像の座標値とを変形例に係る顔検出装置に通知し(ステップS5)、その後は、図5について説明したのと同様に処理する。
<補足>
以上、本発明に係る画像処理装置について、実施の形態及び変形例に基づいて説明したが、以下のように変形することも可能であり、本発明は上述した実施の形態及び変形例に示した通りの画像処理装置に限られないことは勿論である。
(1)実施の形態及び変形例において説明した各構成要素のうち、全部又は一部をコンピュータプログラムで実現してもよいし、1チップ又は複数チップの集積回路で実現してもよい。
図10は、実施の形態で説明した顔検出装置180に対応する半導体集積回路を含む半導体集積回路200の構成例を示す図である。
同図に示す通り、半導体集積回路200は、顔検出装置180に対応する半導体集積回路を含み、半導体集積回路200が適用される装置の用途によって、その他、ROM210、画像符号化回路220、音声処理部230等を含む。
半導体集積回路200は、一般的にはCMOSなどのMOSトランジスタで構成され、MOSトランジスタの接続構成により、特定の論理回路を実現する。近年、半導体集積回路の集積度が進み、非常に複雑な論理回路を、一つないしは数個の半導体集積回路で実現できるため、顔検出装置180を小型化でき、また、低消費電力化することができる。
なお、半導体集積回路200は、実施の形態に係る顔検出装置180に対応する半導体集積回路を含むものとして説明したが、変形例に係る顔検出装置に対応する半導体集積回路を含むこととしてもよい。
(2)実施の形態及び変形例では、撮像画像に複数の顔画像が含まれている場合、つまり、検出対象画像が複数検出された場合について特に取り上げて説明しなかったが、複数の検出対象画像それぞれについて顔画像を検出する処理を行ってもよい。
(3)実施の形態及び変形例では、撮像画像のサイズを4VGAサイズとし、照合対象画像のサイズをQVGAサイズとし、テンプレート画像のサイズを24×24画素として説明したが、これに限定されるものではなく、それぞれ任意のサイズとしてもよい。
(4)実施の形態及び変形例においてテンプレート画像は3種類であるものとして説明したが、テンプレート画像の数はこれに限られない。即ち、正面向きのテンプレート画像のみの1種類にしてもよいし、顔の角度毎に3種類より多くのテンプレート画像を用いて照合するようにしてもよい。
(5)実施の形態及び変形例に係る顔検出装置は、縮小画像と複数のテンプレート画像それぞれを照合するものとして説明したが、結果メモリ181に格納されている1つ前の撮像画像についての結果リスト内の照合結果に基づいて、照合に用いるテンプレート画像を絞るようにしてもよい。
即ち、1つ前の撮像画像についての検出した旨の情報を含む照合結果に含まれているテンプレートIDが示すテンプレート画像と照合を行うようにしてもよい。
(6)実施の形態及び変形例では、顔画像を検出したか否かに関わらず、検出対象画像における全照合対象画像を照合するものとして説明したが、一定の基準(例えば、テンプレート画像との一致度が既定の閾値以上であること)の下、顔画像を検出したと判断した場合には、その撮像画像に対する検出処理を終了するようにしてもよい。
(7)実施の形態及び変形例では、顔画像を検出するものとして説明したが、顔画像以外の特定画像を検出するようにしてもよい。特定画像としては、例えば、人や物に付けられた識別タグなどとしてもよく、この場合、検出した識別タグの情報から個人や物の種類を識別するといった利用も考えられる。
(8)実施の形態及び変形例に係る物体検出回路160は、物体が写っていない状態の撮像画像と画像メモリ130に記憶されている撮像画像とのエッジ検出結果を比較することにより物体を検出するものとして説明したが、これは一例であり、例えば、連続して生成された撮像画像の画素値の差分を取ることにより検出することとしてもよい。
(9)実施の形態及び変形例では、図3に示すように(1/1.22)^n倍ずつ縮小率が変化する例を説明したが、これは一例であり、最も小さい縮小率で縮小した際の画像(つまり、最も縮小の程度が高い画像)のサイズがテンプレート画像のサイズより大きくなるように各縮小率を設定すればよく、例えば(1/1.25)^n倍ずつ変化させるようにしてもよい。
(10)実施の形態及び変形例では、画像処理装置の動作として、図5及び図9のステップS6〜S8に示すように、決定した1つの照合対象画像について、順番に縮小IDを変えながら縮小画像を生成する例を説明したが、1つの縮小IDについて、順番に照合対象画像の位置を変えながら縮小画像を生成するようにしてもよい。
(11)実施の形態及び変形例では、図5、図9のステップS7に示すように、解像度変換回路182は、各縮小画像を生成する際に毎回、画像メモリ130から照合対象画像を読み出すものとして説明したが、生成した縮小画像を記憶しておき、記憶してある縮小画像を用いて他の縮小率の縮小画像を生成するようにしてもよい。例えば、プロセッサ170から偶数の縮小IDが通知されている場合には、一度、照合対象画像を画像メモリ130から読み出し、縮小IDが0に対応する縮小率で縮小画像を生成し、以降は、生成した縮小画像を(1/1.22)^2倍することで縮小IDが2、4、・・・、10に対応する縮小画像を生成できる。
(12)実施の形態及び変形例では、画像処理装置の動作として、図5及び図9のステップS2〜S4に示すように、撮像画像の撮像順が偶数番目である場合には(ステップS2:YES)、偶数の縮小IDを選択し(ステップS3)、検出に係る撮像画像の撮像順が奇数番目である場合には(ステップS2:NO)、奇数の縮小IDを選択する(ステップS4)ものとして説明したが、この逆であってもよい。つまり、ステップS3とS4とを入れ替えてもよい。
(13)実施の形態及び変形例においては、物体検出回路160及びプロセッサは顔検出装置に含まれないものとして説明したが、物体検出回路160及びプロセッサの全部又は一部を顔検出装置に含めることとしてもよい。
(14)実施の形態及び変形例では、図5及び図9に示す照合対象画像の決定処理(ステップS6)を、解像度変換回路182が行うものとして説明したが、プロセッサが行い、決定した照合対象画像の座標値を解像度変換回路182に通知するようにしてもよい。
(15)実施の形態及び変形例に係るプロセッサは、全ての撮像画像について、物体検出回路160に検出処理を行わせるものとして説明したが、物体検出回路160が一旦検出した後は、一定数分の撮像画像については物体検出回路160に検出処理を行わせず、その一定数分を経過した次の撮像画像から再び検出処理を行わせるようにしてもよい。
この場合、プロセッサは、物体検出回路160に検出処理を行わせない間の各撮像画像については、物体検出回路160から直近に受領した検出結果に含まれている検出対象画像の座標値を顔検出装置に通知するようにしてもよい。
また、プロセッサは、この間、検出対象画像の座標値を顔検出装置に通知しないこととし、顔検出装置は、一旦プロセッサから通知された検出対象画像の座標値を、次にプロセッサから検出対象画像の座標値が通知されるまで記憶しておき、その座標値が示す照合対象画像の中で照合対象画像を決定するようにしてもよい。
また、顔検出回路は、顔画像を検出した際に、その検出に係る照合対象画像の撮像画像中における座標値を記憶しておき、プロセッサから検出対象画像の座標値が通知されない間、処理対象の撮像画像については、記憶している座標値が示す照合対象画像についてのみ処理することとしてもよい。
(16)また、実施の形態及び変形例に係るプロセッサは、全ての撮像画像について、物体検出回路160に検出処理を行わせるものとして説明したが、一旦検出した後は、顔検出装置から顔画像範囲を特定できなかった旨の通知を受領するまで、物体検出回路160に検出処理を行わせないようにしてもよい。この間の照合処理に係る各照合対象画像の決定方法は、上記(15)と同様のバリエーションが考えられる。
(17)実施の形態及び変形例に係る特定回路184は、特定した顔画像範囲の左上端の座標値及び大きさをプロセッサに送出するものとして説明したが、顔画像範囲を特定できれば他の情報を送出してもよく、例えば、右下端の座標値及び大きさを送出してもよいし、左上端及び右下端の座標値を送出してもよい。
また、プロセッサは、検出対象画像の左上端及び右下端の座標値を顔検出装置に通知するものとして説明したが、同様に検出対象画像を特定できれば他の情報を通知してもよく、例えば、左上端又は右下端の座標値及びその画像の大きさを通知するようにしてもよい。
また、物体検出回路160が検出結果に含めてプロセッサに送信する検出対象画像の左上端及び右下端の座標値についても同様である。
(18)実施の形態における<考察>では、図7に示すように、T1〜T2において、撮像画像1011についての縮小処理及び照合処理を行い、T2から撮像画像1011についての顔画像範囲の特定処理を開始するものとして説明したが、画像処理装置100の処理能力に余裕がある場合には、1つの撮像画像についての縮小処理及び照合処理と特定処理とを撮像間隔時間(上述の例では33ms)内に行うようにしてもよい。
また、画像処理装置100が生成する縮小画像の数を減らすことで、同様に撮像間隔時間内に縮小処理及び照合処理と特定処理とを行うようにしてもよい。なお、生成する縮小画像の数を減らせば、一般的に顔画像を検出する際の精度が低下することになるため、この変形例は、生成する縮小画像の数を減らした場合でも、この画像検出装置が許容できる精度の範囲になることが前提である。
これらの変形は、変形画像処理装置に適用してもよい。
(19)実施の形態及び変形例に係る画像処理装置は、各撮像画像について、12種類の縮小IDのうちの6種類以下の縮小IDを用いて縮小画像を生成するものとして説明したが、例えば、12種類の縮小ID全てを用いるモードと、6種類以下の縮小IDを用いるモードとのいずれかをユーザが選択できるようにし、その選択結果に応じた数の縮小画像を生成するようにしてもよい。
実施の形態及び変形例に係る画像処理装置の処理能力では、所定時間(この例では33ms)以内に12種類の縮小画像全てを生成することはできないものと想定しているが、ほぼ静止状態の被写体に関しては、この所定時間を経過した後に特定画像が検出されたとしても、特定した画像範囲と、実際に被写体が写っている範囲とが大きくずれてしまうという問題は生じない。従って、ユーザは、例えば、静止している人を撮像する場合に、12種類の縮小ID全てを用いるモードを選択することによって、より正確に顔画像範囲を特定させることができる。
(20)実施の形態及び変形例に係る特定回路184は、一の撮像画像とその1つ前の撮像画像についての2つの結果リストに含まれる各照合結果に基づいて、その一の撮像画像に含まれる顔画像範囲を特定するものとして説明したが、3つ以上の結果リストに含まれる各照合結果に基づいて、その一の撮像画像に含まれる顔画像範囲を特定することとしてもよい。例えば、更に2つ前の撮像画像についての各照合結果に基づいて特定してもよい。その場合、結果メモリ181には2つ前の撮像画像についての結果リストも記憶しておく必要がある。
また、実施の形態及び変形例では、一の撮像画像の前に入力された撮像画像として1つ前の撮像画像を用いる例を説明したが、これに限られず、例えば、一の撮像画像の2つ前の撮像画像を用いてもよい。つまり、一の撮像画像とその2つ前の撮像画像についての2つの結果リストに含まれる各照合結果に基づいて、その一の撮像画像に含まれる顔画像範囲を特定するような変形も考えられる。
(21)実施の形態及び変形例に係るプロセッサは、撮像画像毎に、12種類の縮小IDの中から縮小画像を生成するための縮小IDを選択するものとして説明したが、選択元となる縮小IDは12種類に限らないのはもちろんである。即ち、12種類より多くても少なくてもよい。
また、実施の形態に係るプロセッサは、撮像画像毎に、6種類の縮小IDを選択するものとして説明したが、選択する縮小IDの数はこれに限らないのはもちろんである。即ち、画像処理装置が所定時間以内に生成可能な縮小画像数以下の数の縮小IDを選択するようにすれば、選択する縮小IDの数はいくつでもよいし、撮像画像毎に選択する縮小IDの数を変えてもよい。
(22)変形例に係るプロセッサは、図9に示すように、撮像画像毎に、その撮像画像の1つ前の撮像画像について顔画像が検出されていないときは(ステップS20:NO)、撮像順に応じて偶数の縮小IDと奇数の縮小IDとを交互に選択する(ステップS2〜4)ものとして説明したが、任意の6種類以下の縮小IDを選択するようにしてもよい。
(23)変形例に係るプロセッサは、図9のステップS21に示すように、1つ前の撮像画像で顔画像を検出した際の縮小IDとその周辺の縮小IDとを選択するものとして説明したが、検出した際の縮小IDだけ、あるいは、その周辺の縮小IDだけを選択するようにしてもよい。このとき、選択した縮小IDの数が6つ未満の場合には、選択する縮小IDの数を6つにするために、任意の縮小IDを選択してもよいし、0〜11までの縮小IDを順番に選択するようにしてもよい。このことは、変形例のステップS21で選択した縮小IDの数が6つ未満の場合にも同様に適用できる。
(24)実施の形態及び変形例では、撮像画像毎に、12種類の縮小ID(この項では「候補ID」という)のうちの6種類以下の縮小ID(この項では「選択ID」という)で縮小画像を生成する例をそれぞれ説明したが、以下のような変形も可能である。
(a)候補IDの数Lが偶数であり、選択IDの数M(M<L)がL/2より大きい場合には、撮像画像毎に、L/2種類の偶数の縮小ID及びM−L/2種類の奇数の縮小IDと、L/2の奇数の縮小ID及びM−L/2種類の偶数の縮小IDとを交互に選択するようにしてもよい。
例えば、Lが12で、Mが7の場合に、撮像画像毎に、6種類の偶数の縮小ID及び1種類の奇数の縮小IDと、6種類の奇数の縮小ID及び1種類の偶数の縮小IDを交互に選択することになる。
また、1つの撮像画像について選択する縮小IDの数がM以下になれば、撮像画像毎に選択する偶数の縮小IDと奇数の縮小IDの数を任意に調節してよく、例えば、撮像画像毎に選択する偶数の縮小IDと奇数の縮小IDの数の内訳を変えてもよい。このとき、それぞれ選択する偶数の縮小ID、奇数の縮小IDは、全ての偶数の縮小ID、奇数の縮小IDのうちの任意のものを選択してもよいし、順番に選択してもよい。
(b)候補IDの数Lが奇数であり、選択IDの数M(M<L)がL/2より大きい場合には、撮像画像毎に、(L+1)/2種類の偶数の縮小ID及びM−(L+1)/2種類の奇数の縮小IDと、(L−1)/2の奇数の縮小ID及びM−(L−1)/2種類の偶数の縮小IDとを交互に選択するようにしてもよい。
このとき、M−(L+1)/2種類の奇数の縮小IDは、全ての奇数の縮小IDのうちの任意のものを選択してもよいし、順番に選択してもよい。また、M−(L−1)/2種類の偶数の縮小IDについても同様である。
例えば、Lが11でMが6の場合に、撮像画像毎に、6種類の偶数の縮小IDと、5種類の奇数の縮小ID及び1種類の偶数の縮小IDを交互に選択することになる。
また、1つの撮像画像について選択する縮小IDの数がM以下になれば、撮像画像毎に選択する偶数の縮小IDと奇数の縮小IDの数を任意に調節してよいのは、上記(a)の場合と同様である。
(c)選択IDの数M(M>L)が候補IDの数L/2より小さい場合には、撮像画像毎に、M種類以下の偶数の縮小IDと、M種類以下の奇数の縮小IDとを交互に選択するようにしてもよい。このM種類以下の偶数の縮小ID、M種類以下の奇数の縮小IDは、それぞれ全ての偶数の縮小ID,全ての奇数の縮小IDのうちの任意のものを選択してもよいし、順番に選択してもよい。
例えば、Lが12で、Mが5の場合に、撮像画像毎に、任意の5種類以下の偶数の縮小IDと、任意の5種類以下の奇数の縮小IDとを交互に選択することになる。
また、1つの撮像画像について選択する縮小IDの数がM以下になれば、撮像画像毎に選択する偶数の縮小IDと奇数の縮小IDの数を任意に調節してよいのは、上記(a)の場合と同様である。
(25)本発明に係る画像処理装置における縮小画像生成手段は、実施の形態及び変形例に係る解像度変換回路182に相当し、照合手段は顔検出回路に相当し、特定手段は特定回路184に相当し、制御手段はプロセッサに相当し、表示手段は、プロセッサとLCD出力回路150とLCD140とに相当する。
本発明に係る画像処理装置は、デジタルカメラ等における顔画像の検出に利用できる。
100 画像処理装置
101 プロセッサバス
102 メモリバス
110 カメラ
120 カメラ入力回路
130 画像メモリ
140 LCD
150 LCD出力回路
160 物体検出回路
170 プロセッサ
180 顔検出装置
181 結果メモリ
182 解像度変換回路
183 顔検出回路
184 特定回路
200 半導体集積回路
本発明は、画像処理技術に関し、特に、撮像画像から一定条件に合致する画像範囲を特定する技術に関する。
デジタルカメラ等において、所定時間(例えば、33ms)毎に撮像した撮像画像(フレーム画像)から、その撮像画像よりサイズが小さい特定画像(例えば顔画像)が含まれる範囲を特定し、特定した範囲に、枠を表示したり、ピントを合わせたりといった特定処理を行うものが知られている。
この特定画像が含まれる範囲を特定する方法に、特定画像を検出するためのテンプレート画像(撮像画像より小さい一定サイズのもの)と、撮像画像に基づいて段階的に縮小率を変えて生成した複数の縮小画像とを照合して特定画像を検出する方法がある。つまり、矩形である縮小画像の左上の画素から右下の画素までテンプレート画像をずらしながら照合する処理を各縮小画像に対して行うことで特定画像を検出し、この結果に基づいて特定画像が含まれる範囲を特定する。
ここで、複数の縮小画像を生成する際の各縮小率は、生成された複数の縮小画像とテンプレート画像とを照合することで、撮像画像中に含まれている様々な大きさの特定画像を検出することができるように予め設定される。
しかしながら、この縮小画像を生成する処理は、一般的に比較的長い時間を要する処理であるため、1つの撮像画像から生成する縮小画像の数が多くなる程、撮像間隔時間(この例では、33ms)内に特定画像が検出できないケースが生じることになる。
特に、移動する被写体を撮像している場合において、例えば、撮像のフレームレートと同じレートで表示するときに、ある撮像画像について、撮像間隔時間を経過した後に特定画像が検出されたとすると、特定した画像範囲と、実際に被写体が写っている範囲とが比較的大きくずれてしまうという問題が生じうる。例えば、特定処理として、特定した画像範囲に枠を表示する処理を行う場合には、実際に被写体が写っている位置とは異なる位置に枠が表示されてしまうことになる。
これに対しては、縮小画像の生成の順番をデジタルカメラの撮影モードに応じて切り替えることで、撮像間隔時間内に特定画像を検出する可能性を高める方法が知られている(例えば、特許文献1)。
特許文献1に係る撮像装置は、原画像G0を段階的に縮小した縮小画像G1〜G7(この例では、G1、G2、・・・、G7の順でサイズが小さくなる)を生成することが可能であり、人物を撮影するモード等、少人数の近景撮影が予測されるモードでは、撮像画像に含まれる顔画像のサイズが大きくなることが多いため、G7、G6、・・・、G0の順で縮小画像を生成しテンプレート画像と照合する。また、風景を撮影するモード等、遠景撮影が予定されるモードでは、撮像画像に含まれる顔画像のサイズが小さくなることが多いため、G0、G1、・・・、G7の順で縮小画像を生成しテンプレート画像と照合する。
この結果、撮像間隔時間内に全種類の縮小画像とテンプレートとの照合が完了しないまま、次の撮像画像についての処理に移らなければならない場合でも、撮像間隔時間内に特定画像を検出する可能性を高めることができる。
特開2007−135115号公報
しかしながら、近年、高フレームレート撮影に対するユーザのニーズが高まっている。このようなニーズに応えようとすれば、上述の問題、即ち、撮像間隔時間を経過した後に特定画像が検出されることによって、特定した画像範囲と、実際に被写体が写っている範囲とが比較的大きくずれてしまうという問題がより生じやすくなる。
この問題を解決するために、より短い時間で各縮小画像を生成できるような高スペックのハードウェアを用いて高速に処理する方法も考えられるが、これには、比較的大きな設計変更を伴うため、現状のハードウェア資源を用いて解決できる方が望ましい。
そこで、本発明はかかる問題に鑑みてなされたものであり、現状のハードウェア資源を用いつつ、従来とは異なる方法で、撮像間隔時間内に、特定画像を検出することが可能な画像処理装置を提供することを目的とする。
上記課題を解決するために、本発明に係る画像処理装置は、所定時間毎に撮像され順次入力される撮像画像において、特定処理の対象となる画像範囲を特定する画像処理装置であって、入力された1つの撮像画像に基づいて、K(K≧1)種の倍率の縮小画像を前記所定時間内に生成する処理能力を有し、各々異なるL(L>K)種の倍率のうち指定された倍率の縮小画像を生成する縮小画像生成手段と、前記縮小画像生成手段により生成された各縮小画像とテンプレート画像とを照合し、照合結果を送出する照合手段と、前記照合手段から送出された照合結果に基づいて、前記画像範囲を特定する特定手段と、撮像画像が入力される毎に、当該撮像画像についてのM(M≦K)種以下の倍率を、当該撮像画像の前に入力された撮像画像について指定した倍率に基づいて選択し、選択したM種以下の倍率を前記縮小画像生成手段に指定して各縮小画像を生成させて、生成された各縮小画像を前記照合手段に照合させ、少なくともその照合結果に基づいて、当該撮像画像についての前記画像範囲を前記特定手段に特定させる制御手段とを備えることを特徴とする。
上述の構成を備える本発明に係る画像処理装置は、各撮像画像について、L種の倍率のうちの、自装置の処理能力(所定時間内に生成できる縮小画像の種類数K)以下のM種以下の倍率で各縮小画像を生成し、各縮小画像とテンプレート画像とを照合するので、所定時間内にテンプレート画像に対応する画像を検出できる可能性を高めることができる。
また、前記制御手段は、撮像画像が入力される毎に、前記L種の倍率を昇順又は降順に並べた場合における先頭からの順番が奇数番目となる各倍率のうちN(N≦M)個の倍率を含むM個以下の倍率と、偶数番目となる各倍率のうちN個の倍率とを含むM個以下の倍率とを交互に、前記M種以下の倍率として前記縮小画像生成手段に指定することとしてもよい。
これにより、L種の倍率を昇順又は降順に並べた場合における先頭からの順番が奇数番目になる倍率で生成した各縮小画像と、偶数番目になる倍率で生成した各縮小画像とを交互に用いてテンプレート画像との照合を行うので、L種の倍率から任意のM種以下の倍率を選択する場合と比較し、各撮像画像に含まれる様々な大きさの、テンプレート画像に対応する画像を検出できる可能性を高めることができる。
また、前記制御手段は、一の撮像画像の前に入力された撮像画像について指定したM種以下の倍率のうちの1つ以上の倍率を、前記照合手段から送出された、当該撮像画像についての、テンプレート画像に対応する画像を検出した旨を示す照合結果に基づいて選択し、選択した倍率を、前記縮小画像生成手段に指定する、前記一の撮像画像についての前記M種以下の倍率に含ませることとしてもよい。
これにより、一の撮像画像の前に入力された撮像画像についての各縮小画像の生成に用いた各倍率のうち、テンプレート画像に対応する画像を検出した際の倍率を選択することにより、その検出に係る倍率を用いて一の撮像画像についての縮小画像を生成することになる。従って、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースにおいて、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性を更に高めることができる。
ここで、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースとは、例えば、所定時間を十分短い時間(例えば33ms)とした場合や、被写体が静止している場合が考えられる。
また、前記制御手段は、一の撮像画像の前に入力された撮像画像について指定したM種以下の倍率のうちの1つ以上の倍率を、前記照合手段から送出された、当該撮像画像についての、テンプレート画像に対応する画像を検出した旨を示す照合結果に基づいて選択し、前記L種の倍率を昇順又は降順に並べた場合における先頭からの順番が、選択した倍率についての順番の直前又は直後となる倍率を、前記一の撮像画像についての前記N個の倍率に含ませることとしてもよい。
これにより、一の撮像画像の前に入力された撮像画像についての縮小画像の生成に用いた倍率のうち、テンプレート画像に対応する画像を検出した際の倍率を選択することにより、その選択した倍率の近傍の倍率を用いて一の撮像画像についての縮小画像を生成することになる。従って、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースにおいて、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性を更に高めることができる。
一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースでは、一の撮像画像の前に入力された撮像画像において検出できた倍率の近傍の倍率で、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性が高いためである。
また、前記照合手段は、各縮小画像とテンプレート画像とを照合することにより、当該テンプレート画像に対応する画像範囲を検出した場合に、検出した各画像範囲を示す各範囲情報を前記照合結果として送出し、前記特定手段は、前記照合手段から送出された、一の撮像画像についての各範囲情報及び当該撮像画像の前に入力された撮像画像についての各範囲情報に基づいて前記特定を行うこととしてもよい。
これにより、一の撮像画像について、予め用意されているL種の倍率のうちのM種以下の倍率で生成した各縮小画像とテンプレート画像とを照合して検出した各画像範囲を示す各範囲情報だけでなく、その一の撮像画像の前に入力された撮像画像についての各範囲情報とに基づいて一の撮像画像についての画像範囲を特定するので、誤差の影響を抑えて画像範囲を特定できる可能性を高めることができる。
また、前記特定手段は、前記照合手段から送出された、前記一の撮像画像についての各範囲情報及び前記前に入力された撮像画像についての各範囲情報のうち、所定基準で定まる近接した位置関係にある各画像範囲を示す各範囲情報に基づいて、1つの画像範囲を特定することとしてもよい。
これにより、近接した位置関係にある各画像範囲を示す、一の撮像画像及びその前に入力された撮像画像についての各範囲情報に基づいて1つの画像範囲を特定するので、誤差の影響を抑えて画像範囲を特定できる。
また、前記制御手段は、前記縮小画像生成手段に指定する、一の撮像画像についての前記M種以下の倍率を、前記照合手段から送出された、当該撮像画像より前に入力された撮像画像についての照合結果に基づいて決定することとしてもよい。
これにより、一の撮像画像の前に入力された撮像画像についての縮小画像の生成に用いた倍率のうち、例えば、テンプレート画像に対応する画像を検出した際の倍率を選択した場合には、その検出に係る倍率を用いて一の撮像画像についての縮小画像を生成するので、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースにおいて、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性を更に高めることができる。
また、前記画像処理装置は、前記テンプレート画像の候補となる複数のテンプレート候補画像を保持しており、前記照合手段は、一の撮像画像の前に入力された撮像画像についての照合結果に基づいて、当該一の撮像画像についての照合に用いる前記テンプレート画像を前記テンプレート候補画像の中から選択することとしてもよい。
これにより、例えば、一の撮像画像の前に入力された撮像画像についてテンプレート画像に対応する画像を検出した場合に、そのテンプレート画像を一の撮像画像の照合に用いることによって、一の撮像画像とその前に入力された撮像画像とが類似した画像になるケースにおいて、より短時間で、一の撮像画像に含まれるテンプレート画像に対応する画像を検出できる可能性を高めることができる。
また、前記照合手段は、各縮小画像とテンプレート画像とを照合することにより、当該テンプレート画像に対応する画像範囲を検出した場合に、検出した各画像範囲を示す各範囲情報を前記照合結果として送出し、前記特定手段は、前記照合手段から送出された、一の撮像画像についての各範囲情報及び当該撮像画像の前に入力された撮像画像についての各範囲情報に基づいて前記特定を行うこととしてもよい。
これにより、一の撮像画像について、予め用意されているL種の倍率のうちのM種以下の倍率で生成した各縮小画像とテンプレート画像とを照合して検出した各画像範囲を示す各範囲情報だけでなく、その一の撮像画像の前に入力された撮像画像についての各範囲情報とに基づいて一の撮像画像についての画像範囲を特定するので、誤差の影響を抑えて画像範囲を特定できる可能性を高めることができる。
また、前記特定手段は、前記照合手段から送出された、前記一の撮像画像についての各範囲情報及び前記前に入力された撮像画像についての各範囲情報のうち、所定基準で定まる近接した位置関係にある各画像範囲を示す各範囲情報に基づいて、1つの画像範囲を特定することとしてもよい。
これにより、近接した位置関係にある各画像範囲を示す、一の撮像画像及びその前に入力された撮像画像についての各範囲情報に基づいて1つの画像範囲を特定するので、誤差の影響を抑えて画像範囲を特定できる。
また、前記画像処理装置は、更に撮像画像が入力される毎に、当該撮像画像を表示すると共に、当該撮像画像について前記特定手段が特定した画像範囲に対応する当該撮像画像上の位置に、当該画像範囲を示す枠を表示する表示手段を備えることとしてもよい。
入力された撮像画像について特定された画像範囲の位置に枠が表示されるので、ユーザは、特定処理の対象となっている画像範囲を容易に認識することができる。
画像処理装置100の機能ブロック図である。 顔検出装置180による顔検出方法を説明するための図である。 縮小IDと縮小率等の対応の一例を示す図である。 撮像画像1000の画像メモリ130上の配置を説明するための図である。 画像処理装置100の動作を示すフローチャートである。 特定回路184による顔画像範囲の特定処理を示すフローチャートである。 画像処理装置100が顔画像範囲を特定していく様子を時系列で説明するための図である。 従来の画像処理装置が顔画像範囲を特定していく様子を時系列で説明するための図である。 変形例に係る画像処理装置の動作を示すフローチャートである。 実施の形態で説明した顔検出装置180を含む半導体集積回路200の構成例を示す図である。
以下、本発明に係る画像処理装置の一実施形態を説明する。
≪実施の形態≫
<概要>
実施の形態に係る画像処理装置は、所定時間(例えば、33ms)毎に撮像され生成された各撮像画像から顔画像が含まれる画像範囲(以下、「顔画像範囲」という)を特定するものである。
各撮像画像は、4VGA(1280×960画素)サイズであり、比較的サイズが大きいことから、この画像処理装置は、その一部の領域の画像(以下、「検出対象画像」という)に絞り込んで顔画像の検出処理を行う。ここで、検出対象画像は、従来から行われているエッジ検出等の方法で、何らかの物体があると検出された領域の画像である。
この画像処理装置は、検出対象画像を既定サイズ毎に処理して顔画像を検出する。つまり、この既定サイズの画像(以下、「照合対象画像」という)を、段階的に縮小した各縮小画像を生成し、生成した各縮小画像と顔画像のテンプレート画像とを照合することで、顔画像を検出する。
各縮小画像を生成する際の縮小率として、この画像処理装置は、段階的に縮小の程度が大きくなるように設定された12種類の縮小率を用いることが可能であるが、撮像画像毎に、12種類の縮小率全てではなく、このうちの6種類の縮小率を用いて各縮小画像を生成する。
なお、本実施の形態では、この画像処理装置は、所定時間以内に、6種類の縮小率で縮小画像を生成することが可能な処理能力を有するものと想定している。
また、この画像処理装置は、連続して撮像された2つの撮像画像についてのテンプレート画像との照合結果を用いて、顔画像範囲を特定する。
このように、この画像処理装置は、12種類の縮小率のうちの6種類の縮小率で各縮小画像を生成するので、各撮像画像に対する縮小画像の生成及び照合にかかる処理量は抑えつつも、連続して撮像された2つの撮像画像についての照合結果を用いて顔画像範囲を特定するので、12種類の縮小画像を生成しそれぞれと照合する処理を行う場合と比較しても大きく精度を落とすことなく顔画像範囲を特定できる。
<構成>
まず、画像処理装置100の構成について説明する。
図1は、画像処理装置100の機能ブロック図である。
画像処理装置100は、同図に示す通り、カメラ110、カメラ入力回路120、画像メモリ130、LCD(Liquid Crystal Display)140、LCD出力回路150、物体検出回路160、プロセッサ170、顔検出装置180を備える。
プロセッサ170とその他の構成要素とのデータの授受は、プロセッサバス101を介して行われ、また、画像メモリ130への、カメラ110を除く他の構成要素からのアクセスは、メモリバス102を介して行われる。
ここで、カメラ110は、一定のフレームレート(例えば、30fps(frame per second))で撮像を行い、順次生成した4VGAサイズの撮像画像(データ)をカメラ入力回路120に送出する機能を有する。
カメラ入力回路120は、カメラ110から受領した撮像画像に対し、高画質化のための各種フィルタ処理を施し、画像メモリ130に格納する機能を有する。フィルタ処理後の撮像画像を画像メモリ130へ格納すると、カメラ入力回路120はその旨をプロセッサ170へ通知する。
画像メモリ130は、フィルタ処理後の撮像画像を記憶するためのメモリ領域である。
LCD140は、液晶ディスプレイ(LCD)を含み、LCD出力回路150の指示に応じて、画像を表示する機能を有する。
LCD出力回路150は、撮像のフレームレートと同じフレームレートで、画像メモリ130に記憶されている撮像画像を読み出してLCD140に表示させると共に、プロセッサ170からの指示に応じて特定した顔画像範囲を示す矩形の枠をLCD140に表示させる機能を有する。
物体検出回路160は、プロセッサ170からの指示に応じて、画像メモリ130に記憶されている撮像画像を読み出し、物体の検出処理を行い、検出の有無を示す情報を含む検出結果をプロセッサ170に送出する機能を有する。
この物体の検出は、例えば、物体が写っていない状態の撮像画像と画像メモリ130に記憶されている撮像画像とのエッジ検出結果を比較することにより行い、特に、物体を検出した場合には、検出した物体が含まれる矩形の検出対象画像の座標値(例えば、左上端及び右下端の座標値)を検出結果に含めてプロセッサ170に送出する。
プロセッサ170は、内部メモリ(不図示)に記憶されている制御プログラムを実行することにより、画像処理装置100全体の制御や装置内の各ブロックへの指示や通知を行う機能を有する。
特に、プロセッサ170は、物体検出回路160から検出した旨の情報を含む検出結果を受領した場合に、検出対象画像の座標値(その検出結果に含まれる座標値)及び各縮小画像を生成する際の縮小率を顔検出装置180に通知し、物体検出回路160から検出しなかった旨の情報を含む検出結果を受領した場合には、その旨を顔検出装置180に通知する。
また、プロセッサ170は、顔検出装置180から受領した、特定した顔画像範囲を示す座標値等に基づいて、LCD出力回路150に特定した顔画像範囲を示す矩形の枠を表示させる機能を有する。
顔検出装置180は、プロセッサ170から通知された座標値が示す検出対象画像を、既定サイズ(QVGAサイズ(320×240画素))単位で処理して顔画像範囲を特定する機能を有する。より詳細には、この既定サイズの画像(照合対象画像)を縮小した各縮小画像と各テンプレート画像とを照合することにより顔画像を検出し、照合結果に基づいて顔画像範囲を特定する。
ここで、各テンプレート画像は、各々顔の向きが異なるものであり、各テンプレート画像を用いて照合することで、縮小画像に含まれる様々な方向を向いた顔画像を検出することができる。
顔検出装置180は、結果メモリ181と、解像度変換回路182と、顔検出回路183と、特定回路184とを備える。
ここで、結果メモリ181は、顔検出装置180が処理中の撮像画像についての各照合結果のリスト(以下、「結果リスト」という)と、その撮像画像の1つ前に撮像された撮像画像についての結果リストとを格納するためのメモリ領域である。
解像度変換回路182は、プロセッサ170から通知された座標値が示す検出対象画像の中で、縮小画像の生成対象とする照合対象画像(QVGAサイズ)を決定し、決定した照合対象画像をプロセッサ170から通知された各縮小率で縮小した各縮小画像を生成して顔検出回路183に送出する機能を有する。
なお、照合対象画像は、例えば、PCT/JP2008/000961において開示されている、検出対象画像の中を左上から右下までオーバラップ領域を設けるように決定する方法を用いて同様に決定することができるため、ここでは詳細な説明は省略する。
また、本実施の形態での縮小率は、照合対象画像のサイズ(QVGAサイズ)を「1」とした際の、縮小後の画像のサイズの割合で示す。従って縮小率が大きい(例えば、0.82)ということは、縮小の程度が小さいということを意味し、逆に縮小率が小さい(例えば、0.11)ということは、縮小の程度が大きいということを意味する。
また、本実施の形態では、縮小率が1.0の場合、つまり、縮小画像が照合対象画像そのものである場合も含めて縮小画像と呼ぶこととする。
顔検出回路183は、解像度変換回路182から受領した縮小画像と、各テンプレート画像(それぞれ24×24画素の一定サイズ)とを照合することにより、縮小画像に含まれている顔画像を検出する回路である。
より詳細には、受領した縮小画像の中で、左上の画素から右下の画素までテンプレート画像をずらしながらこのテンプレート画像と照合する処理を各テンプレート画像について行い、各照合結果を顔検出装置180が処理中の撮像画像についての結果リストとして結果メモリ181に格納する。
上述の照合結果には、検出の有無を示す情報の他、特に、顔画像を検出した場合には、検出した矩形の顔画像の左上端の座標値(縮小画像上の座標値)を撮像画像上の座標に変換した座標値と、検出した顔画像を含む縮小画像についての縮小率を示す情報(以下、「縮小ID」という)と、検出に用いたテンプレートの顔の向きを示す情報(以下、「テンプレートID」という)とが含まれる。
以下では、顔検出回路183は、一例として、顔の向きが正面、右向き、左向きの3つのテンプレート画像を用いて照合を行うものする。また、顔の向きが正面、右向き、左向きの3つのテンプレート画像のテンプレートIDはそれぞれ「0」、「1」、「2」であるものとする。
また、上述の縮小画像上の座標値から撮像画像上の座標値への変換は、縮小画像と撮像画像とが相似の関係にあることから、両画像の水平方向サイズ及び垂直方向サイズの比率を用いて単純な比例計算を行うことで実現できるため、詳細な説明は省略する。
特定回路184は、顔検出装置180が処理中の撮像画像及びその1つ前に撮像された撮像画像についての結果メモリ181に格納されている各結果リストに含まれる各照合結果に基づいて顔画像範囲を特定し、特定した顔画像範囲を示す座標値等をプロセッサ170に送出する機能を有する。顔画像範囲の特定方法は後に詳細に説明する。
<顔検出>
次に、顔検出装置180による顔検出方法について説明する。
図2は、顔検出装置180による顔検出方法を説明するための図である。
同図において、照合対象画像1021及び照合対象画像1022は、それぞれ顔画像を含み、照合対象画像1021に含まれる顔画像の方が、照合対象画像1022に含まれる顔画像より大きいものになっている。
照合対象画像1021と、一定サイズ(例えば24×24画素)のテンプレート画像とを照合し顔画像を検出するためには、照合対象画像1021に含まれる顔画像の大きさを、テンプレート画像の顔画像の大きさと同程度にまで縮小する必要がある。縮小画像1031は、この縮小後の画像を示している。
顔検出回路183は、縮小画像1031の中で、左上の画素から右下の画素まで、テンプレート画像をずらしながら照合することで、顔画像を検出する。
照合対象画像1022から顔画像を検出する場合も同様に、顔検出回路183は、照合対象画像1022を縮小した縮小画像1032とテンプレート画像とを照合する。
ここで、縮小画像1032のサイズは、縮小画像1031のサイズより大きく、つまり、縮小画像1032は、縮小画像1031より縮小の程度が低いことが分かる。照合対象画像1022に含まれている顔画像の大きさは、照合対象画像1021に含まれているものより小さいため、より低い縮小の程度でテンプレート画像の顔画像の大きさと同程度にまで縮小できるためである。
このように、照合対象画像から顔画像を検出するためには、照合対象画像に含まれる顔画像の大きさに応じた縮小率で縮小した縮小画像とテンプレート画像と照合する必要がある。しかしながら、実際に検出を行う時点では、照合対象画像に含まれる顔画像の大きさは分からないため、顔検出回路183は、縮小率を段階的に変えた各縮小画像とテンプレート画像とを照合することにより顔画像を検出している。
各縮小画像の縮小率は、例えば、図3に示すように1/1.22倍ずつ段階的に変えるように決定することができる。
図3は、縮小IDと縮小率等の対応の一例を示す図である。
同図において、「(1/1.22)^n」の記載は、(1/1.22)のn乗であることを示している。
同図は、例えば、縮小IDが「0」である場合の縮小率は「(1/1.22)^0、つまり1.0」であり、対応する縮小率で照合対象画像を縮小した場合の縮小画像の水平方向サイズは「320画素」で、垂直方向サイズは「240画素」であることを示している。
また、縮小IDが「11」である場合の縮小率は「(1/1.22)^11倍」であり、縮小画像の水平方向サイズは「33画素」で、垂直方向サイズは「25画素」であることを示している。
なお、縮小画像のサイズが、テンプレート画像のサイズ(この実施の形態の例では24×24画素)より小さくなると、照合ができなくなることから、この例では、縮小IDが「11」である場合の縮小率が最も小さく、つまり、この場合が、縮小の程度が最も高いものとなっている。
<データ>
次に、撮像画像の画像メモリ130上の配置について説明する。
図4は、撮像画像1000の画像メモリ130上の配置を説明するための図である。
撮像画像1000は、上述したように4VGA(1280×960画素)サイズの画像データであり、撮像画像1000を構成する各画素の画素値データは、画像メモリ130上の連続領域に連続して記憶される。つまり、同図に示す画素1001、・・・、1002、1003、・・・、1004、・・・、1005の順で連続領域に記憶される。
ここで、画素1001が記憶される画像メモリ130上の領域のアドレス値をBASEと表現すると、各画素データが記憶される領域のアドレス値は、次の数式で算出される。なお、数式中の水平方向サイズとは、撮像画像1000の水平方向サイズ、つまり1280である。また、ここでは、画素1001の座標値を(0,0)とし、右方向にX軸を、下方向にY軸を取っている。また、1アドレスを、1画素分の画素データが格納される画像メモリ130上の領域を示すものとして説明する。
[数1]
アドレス値=BASE+水平方向サイズ×Y座標+X座標
例えば、座標値が(640,240)である画素1004が記憶される画像メモリ130上の領域のアドレス値は、「BASE+1280×240+640」である。
顔検出装置180の解像度変換回路182は、決定した照合対象画像の座標値から算出したアドレス値を用いて、この照合対象画像を画像メモリ130から読み出すことができる。
<動作>
次に、上記構成を備え、上記データを取り扱う画像処理装置100の動作について説明する。
図5は、画像処理装置100の動作を示すフローチャートである。
プロセッサ170は、カメラ入力回路120から撮像画像を画像メモリ130へ格納した旨の通知を受領すると、撮像回数をカウントアップすると共に、物体検出回路160に検出処理を開始させ、その物体検出回路160から検出結果を受領すると、その検出結果が物体を検出した旨の情報を含むか否かを判定する(ステップS1)。
物体を検出した旨の情報が含まれている場合には(ステップS1:YES)、プロセッサ170は、その検出に係る撮像画像の撮像順が偶数番目か否かを上述の撮像回数に基づいて判定する(ステップS2)。例えば、撮像回数が1であれば否定的な判定を行い、撮像回数が2であれば肯定的な判定を行う。
プロセッサ170は、12種類の縮小IDのうち、検出に係る撮像画像の撮像順が偶数番目である場合には(ステップS2:YES)、偶数の縮小ID(0、2、4、・・・、10)を選択し(ステップS3)、検出に係る撮像画像の撮像順が奇数番目である場合には(ステップS2:NO)、奇数の縮小ID(1、3、5、・・・、11)を選択する(ステップS4)。
プロセッサ170は、選択した各縮小IDと、受領した検出結果に含まれる検出対象画像の座標値とを顔検出装置180に通知する(ステップS5)。
顔検出装置180の解像度変換回路182は、プロセッサ170により通知された座標値が示す検出対象画像の中で1つの照合対象画像を決定し(ステップS6)、決定した照合対象画像が記憶されている画像メモリ130上のアドレス値を数1に示す数式に従って算出し、その照合対象画像を画像メモリ130から読み出す(ステップS7)。
解像度変換回路182は、ステップS5で通知された各縮小IDのうちの1つの縮小IDを選択し、選択した縮小IDに対応する縮小率で読み出した照合対象画像を縮小した縮小画像を生成し、顔検出回路183に送出する(ステップS8)。ここで、解像度変換回路182は、例えば、まだ選択していない各縮小IDのうち、最小の縮小IDを選択するものとする。
顔検出回路183は、1回目の処理で、顔検出装置180が処理中の撮像画像についての空の結果リストを結果メモリ181に生成し、各テンプレート画像について、そのテンプレート画像を、解像度変換回路182から受領した縮小画像の中で左上の画素から右下の画素までずらしながら照合し、照合結果を、生成した結果リストに登録する(ステップS9)。
解像度変換回路182は、ステップS5で通知された全ての縮小IDを選択したか否かを判定し(ステップS10)、全ての縮小IDを選択していない場合には(ステップS10:NO)、未選択の縮小IDで縮小画像を生成するために、再びステップS7から処理を行う。
一方、全ての縮小IDを選択している場合には(ステップS10:YES)、検出対象画像全体を処理したか否かを判定し(ステップS11)、検出対象画像全体を処理していない場合には(ステップS11:NO)、次の照合対象画像を処理するために、再びステップS6から処理を行う。
また、ステップS11で検出対象画像全体を処理している場合には(ステップS11:YES)、特定回路184は、結果メモリ181に格納されている2つの結果リストに含まれる各照合結果に基づいて、顔画像範囲の特定処理を行う(ステップS12)。
一方、ステップS1において、物体検出回路160から受領した検出結果に物体を検出しなかった旨の情報が含まれている場合には(ステップS1:NO)、プロセッサ170は、その旨を顔検出装置180に通知し、顔検出回路183は、顔検出装置180が処理中の撮像画像についての空の結果リストを結果メモリ181に生成し、特定回路184は、上記同様に、顔画像範囲の特定処理を行う(ステップS12)。
ステップS12の処理の結果として特定回路184から送出された特定した顔画像範囲についての情報に基づき、プロセッサ170は、撮像画像上に描画すべき顔画像範囲の座標値(左上端の座標値及び右下端の座標値)をLCD出力回路150に通知し、LCD出力回路150は、画像メモリ130から読み出した撮像画像上にプロセッサ170から通知された顔画像範囲を示す矩形を描画してLCD140に表示させ、一連の処理を終了する。なお、ステップS12の処理結果として特定回路184から顔画像範囲を特定できなかった旨の通知を受領した場合、プロセッサ170は、LCD出力回路150への上述の座標値の通知を行わないこととしてもよいし、直近に特定回路184から受領した特定した顔画像範囲についての情報に基づき上記の座標値の通知を行うようにしてもよい。
以下、ステップS12の顔画像範囲の特定処理について説明する。
図6は、特定回路184による顔画像範囲の特定処理を示すフローチャートである。
特定回路184は、結果メモリ181に格納されている2つの結果リストそれぞれに含まれる各照合結果について、その照合結果に含まれる検出した顔画像の左上端の座標値(撮像画像上の座標値)と縮小IDに基づいて、検出した顔画像の中心点を算出する(ステップS13)。
例えば、検出した顔画像の左上端の座標値が(92,48)で、縮小IDが「2」であるとした場合に、顔画像のサイズは、テンプレート画像のサイズ(24×24画素)と、縮小IDに対応する縮小率((1/1.22)^2)に基づいて「36×36画素」と求めることができる。従って、この検出した顔画像の中心点は、(92+36/2,48+36/2)、つまり(110,66)と求めることができる。
なお、物体検出回路160により物体が検出されなかった場合(ステップS1:NO)には、上述の通り、空の結果リストが生成されるだけで、その結果リストには照合結果が含まれていない。また、顔検出回路183により顔画像が全く検出されなかった場合には、結果リストに含まれる各照合結果には座標値が含まれていない。従って、結果として、1つの結果リストに含まれる各照合結果についてだけ中心点を算出する場合がある。
また、特に図示していないが、いずれの結果リストにも検出した顔画像の左上端の座標値が含まれていない場合には、特定回路184は、顔画像範囲を特定できなかった旨をプロセッサ170に通知し、特定処理を終了する。
特定回路184は、算出した各中心点のうち、グループが決定していない点があるか否かを判定し(ステップS14)、グループが決定していない中心点がある場合には(ステップS14:YES)、そのグループが決定してない中心点のうちの1つの中心点を選択する(ステップS15)。以下、この中心点を「選択点」という。なお、特定回路184は、例えば、まだグループが決定していない中心点のうち、最小の縮小IDを含む照合結果に含まれている座標値と対応する中心点を選択するものとする。
特定回路184は、選択点以外の、グループが決定していない他の中心点のうち、その選択点の縮小IDと所定範囲(例えば、±2以内)の縮小IDの中心点を、その選択点が所属するグループに所属する中心点の候補とする(ステップS16)。以下、この候補となった各中心点を「候補点」という。
例えば、選択点の縮小IDが「2」である場合には、縮小IDが「0」〜「4」の中心点が、候補点となる。
特定回路184は、選択点と各候補点との距離を算出し(ステップS17)、算出した距離が所定値(例えば、20)以内である候補点を、選択点と同一のグループに所属するものと決定する(ステップS18)。
例えば、選択点の座標値が(110,66)であり、候補点の座標値が(118,68)であるとすると、両点の距離は「8.2」であり、この候補点は、選択点と同一のグループに所属するものと決定される。
特定回路184は、同一のグループに所属する各中心点の座標値及び各顔画像の大きさに基づいて、1つの顔画像範囲を特定し、この特定した顔画像範囲の左上端の座標値及び大きさをプロセッサ170に送出する(ステップS19)。
より詳細には、例えば、上述の例で、同一のグループと決定された2つの中心点(110,66)と(118,68)とがある場合に、各中心点の座標の平均値は(114,67)である。
また、(110,66)を中心点とした顔画像の大きさは、上述の通り「36×36画素」であり、(118,68)を中心点とした顔画像の大きさを、例えば、「44×44画素」であるとすると、これらの顔画像の大きさの平均値は、「40×40画素」である。
特定回路184は、中心点が、算出した各中心点の座標の平均値(114,67)であり、大きさが、算出した顔画像の大きさの平均値「40×40画素」である画像範囲を1つの顔画像範囲と特定し、特定した顔画像範囲の左上端の座標値(114−40/2,67−40/2)、つまり(94,47)と、大きさ「40×40画素」をプロセッサ170に送出する。
ステップS19の処理が完了すると、特定回路184は、再びステップS14から処理し、グループが決定していない中心点がない場合には(ステップS14:NO)、顔検出装置180が処理中の撮像画像の1つ前の撮像画像についての結果リストを結果メモリ181から削除し、顔画像範囲の特定処理を終了する。
<考察>
以下では、画像処理装置100及び従来の画像処理装置それぞれが顔画像範囲を特定していく様子を図7、図8を用いて比較して説明する。
<画像処理装置100>
まず、画像処理装置100について説明する。
図7は、画像処理装置100が顔画像範囲を特定していく様子を時系列で説明するための図である。
ここで、撮像画像は、33ms間隔でカメラ110により撮像され生成された撮像画像1011〜1013を示している。撮像画像1011〜1013の撮像順はn〜n+2であり、nは偶数であるものとする。
また、表示画像は、33ms間隔でLCD140に表示される表示画像1041〜1043を示している。
まず、T1において、撮像画像1011が生成されると、この例では撮像画像1011の撮像順は偶数番目なので、T2までに、偶数の縮小ID(0、2、・・・、10)を用いて各縮小画像が生成され各テンプレートとの照合処理が行われる。
次に、T2において、撮像画像1012が生成されると、この撮像画像1012について、奇数の縮小ID(1、3、・・・、11)を用いて、T1における撮像画像1011と同様に縮小処理及び照合処理が行われると共に、撮像画像1011について、顔画像範囲の特定処理が行われる。
この顔画像範囲の特定は、撮像画像1011についての各照合結果と、撮像画像1011の1つ前に撮像された撮像画像についての各照合結果に基づいて行われ、特定された顔画像範囲を示す矩形の枠S1が、撮像画像1011上に描画され(表示画像1041)、T3まで表示が継続される。
なお、表示画像1041上には、点線で表す楕円C0、C1と点線で表す各矩形とが図示されているが、これらは説明のためのものであり実際には表示されない。このことは、表示画像1042、1043においても同様である。
ここで、点線で表す各矩形は検出した各顔画像を示しており、楕円C0は、撮像画像1011の1つ前に撮像された撮像画像で検出された各顔画像が含まれる範囲を示しており、楕円C1は、撮像画像1011で検出された各顔画像が含まれる範囲を示している。
つまり、撮像画像1011についての顔画像範囲の特定は、楕円C1に含まれる各顔画像と楕円C0に含まれる各顔画像とに基づいて行われる。
次に、T3において、撮像画像1013が生成されると、この撮像画像1013について、偶数の縮小ID(0、2、・・・、10)を用いて、T1における撮像画像1011と同様に縮小処理及び照合処理が行われ、撮像画像1012について、T2における撮像画像1011と同様に、顔画像範囲の特定処理が行われ、特定された顔画像範囲を示す矩形の枠S2が、撮像画像1012上に描画され(表示画像1042)、T4まで表示が継続される。
この撮像画像1012についての顔画像範囲の特定は、撮像画像1012で検出された各顔画像(楕円C2に含まれる各顔画像)と撮像画像1011で検出された各顔画像(楕円C1に含まれる各顔画像)とに基づいて行われる。
以降、撮像画像1013についても同様に処理される。
このようにして表示された表示画像1041〜1043の各矩形の枠S1〜S3は、実際に表示されている顔画像の付近に表示できていることが分かる。
<従来の画像処理装置>
続いて、1つの撮像画像について、12種類の縮小率全てを用いて生成した各縮小画像と各テンプレート画像とを照合する従来の画像処理装置について説明する。
図8は、従来の画像処理装置が顔画像範囲を特定していく様子を時系列で説明するための図である。
ここで、撮像画像は、図7で説明したのと同様、33ms間隔で撮像され生成された撮像画像2011〜2015を示しており、2011〜2013については、図7の1011〜1013と全く同じ画像である。また、各撮像画像の撮像順はn〜n+4であるものとする。
また、表示画像は、33ms間隔で表示される表示画像2021〜2025を示している。
以下では、従来の画像処理装置が1つの撮像画像についての縮小処理と照合処理とを完了するためにかかる時間が、66msであるものとして説明する。
まず、T1において、撮像画像2011が生成されると、T3までの間に全縮小ID(0、1、・・・、11)を用いて各縮小画像が生成され各テンプレートとの照合処理が行われる。
次に、T2においては、まだ、撮像画像2011についての全縮小画像との照合が完了していないので、撮像画像2011だけがそのまま表示される(表示画像2021)。また、T2において、撮像画像2012が生成されるが、撮像画像2011についての全縮小画像との照合が完了していないため、ここでは、撮像画像2012についての縮小処理及び照合処理は行われないこととしている。
次に、T3においては、T1〜T3での撮像画像2011についての照合結果に基づいて、撮像画像2011について顔画像範囲の特定処理が行われ、特定された顔画像範囲を示す矩形の枠S10が撮像画像2012上に描画され(表示画像2022)、T4まで表示が継続される。なお、この従来の画像処理装置は、検出された各顔画像の座標値及び大きさそれぞれの平均値を取ることで、顔画像範囲を特定している。
また、T3において、撮像画像2013が生成されると、撮像画像2013について、全縮小ID(0、1、・・・、11)を用いて、T1における撮像画像2011と同様に、T5まで縮小処理及び照合処理が行われる。
次に、T4において、まだ、撮像画像2013についての全縮小画像との照合が完了していないので、撮像画像2011について特定された顔画像範囲を示す矩形の枠S10がそのまま撮像画像2013上に描画され(表示画像2023)、T5まで表示が継続される。
以降、同様に、撮像画像2013について特定された顔画像範囲を示す矩形の枠S11が、撮像画像2014及び撮像画像2015上にそれぞれ描画され(表示画像2024、2025)、表示画像2024はT5〜T6で、表示画像2025はT6〜T7で表示される。
このように従来の画像処理装置では、全縮小IDを用いて各縮小画像を生成して各テンプレート画像と照合する結果、この縮小処理と照合処理とにかかる時間が、撮像間隔時間(この例では33ms)より長くなってしまい、逆に顔画像の検出の精度が低下してしまっている。特に、前回特定した顔画像範囲を示す矩形の枠をそのまま表示している表示画像2023、2025において実際に表示されている顔画像の位置と矩形の枠の位置とが、大きくずれてしまうという不具合が生じている。
このように、本発明の実施の形態に係る画像処理装置100は、自装置の処理能力に応じて、12種類の縮小率のうち、6種類の偶数の縮小IDに対応する各縮小率と、6種類の奇数の縮小IDに対応する各縮小率とを、撮像画像毎に交互に用いて各縮小画像を生成するので、各撮像画像に対する縮小処理と照合処理とを、撮像間隔時間(この例では33ms)以内に行うことができ、従来の画像処理装置のような不具合が生じない。
また、各撮像画像についての顔画像範囲を、その撮像画像、及びその1つ前に撮像された撮像画像の各照合結果を用いて特定するので、誤差の影響を抑えて、精度よく顔画像範囲を特定できる。
≪変形例≫
以下では、画像処理装置が各縮小画像を生成する際に用いる各縮小率の選択方法を替えた一変形例を説明する。
変形例に係る画像処理装置(以下、「変形画像処理装置」という)は、上述の画像処理装置100のプロセッサ170の機能及び顔検出回路183の機能を若干変更したものであるため、ここでは、変更部分についてのみ説明する。
<動作>
変形画像処理装置の動作について説明する。
図9は、変形画像処理装置の動作を示すフローチャートである。
同図に示すように、変形画像処理装置の動作は、図5のステップS9の処理に替えてステップS22の処理を含む点で、画像処理装置100の場合と異なる。
ここで、ステップS22の処理は、変形例に係る顔検出回路が、照合結果を、結果メモリ181に生成した結果リストに登録するだけでなく、変形例に係るプロセッサにも送出する点で、ステップS9の処理とは異なる。
また、変形画像処理装置の動作は、図5に示す各処理に加え、ステップS20及びS21の処理を含む点で、画像処理装置100の場合と異なる。
ここで、変形例に係るプロセッサは、物体検出回路160から受領した検出結果に物体を検出した旨の情報が含まれている場合に(ステップS1:YES)、処理中の撮像画像の1つ前に撮像された撮像画像で顔画像を検出したか否かを、上述のステップS22で変形例に係る顔検出回路から送出された照合結果に基づいて判定する(ステップS20)。つまり、この照合結果に検出した旨の情報が含まれている場合にのみ肯定的な判定を行う。なお、1つ前に撮像された撮像画像について物体検出回路160から受領した検出結果に物体を検出しなかった旨の情報が含まれている場合には、否定的な判定を行う。
1つ前に撮像された撮像画像で顔画像を検出していない場合には(ステップS20:NO)、ステップS2の処理を行い、処理結果に応じて、ステップS3又はS4で縮小IDの選択を行う。
また、1つ前に撮像された撮像画像で顔画像を検出している場合には(ステップS20:YES)、検出した旨の情報を含む各照合結果に含まれている各縮小ID及びそれらの縮小IDの周辺の縮小IDのうち6つ以下の縮小IDを選択する(ステップS21)。
例えば、検出した旨の情報を含む照合結果に含まれている縮小IDが「2」である場合、その周辺の縮小IDは「1」及び「3」である。従って、この例では縮小IDとして「1」〜「3」を選択する。
なお、選択した縮小IDの数が6つ未満である場合には、選択した縮小IDの数が6つになるように、更に任意の縮小IDを選択するようにしてもよい。
このようにして、ステップS21、ステップS3、又はステップS4で選択した縮小IDと、受領した検出結果に含まれる検出対象画像の座標値とを変形例に係る顔検出装置に通知し(ステップS5)、その後は、図5について説明したのと同様に処理する。
<補足>
以上、本発明に係る画像処理装置について、実施の形態及び変形例に基づいて説明したが、以下のように変形することも可能であり、本発明は上述した実施の形態及び変形例に示した通りの画像処理装置に限られないことは勿論である。
(1)実施の形態及び変形例において説明した各構成要素のうち、全部又は一部をコンピュータプログラムで実現してもよいし、1チップ又は複数チップの集積回路で実現してもよい。
図10は、実施の形態で説明した顔検出装置180に対応する半導体集積回路を含む半導体集積回路200の構成例を示す図である。
同図に示す通り、半導体集積回路200は、顔検出装置180に対応する半導体集積回路を含み、半導体集積回路200が適用される装置の用途によって、その他、ROM210、画像符号化回路220、音声処理部230等を含む。
半導体集積回路200は、一般的にはCMOSなどのMOSトランジスタで構成され、MOSトランジスタの接続構成により、特定の論理回路を実現する。近年、半導体集積回路の集積度が進み、非常に複雑な論理回路を、一つないしは数個の半導体集積回路で実現できるため、顔検出装置180を小型化でき、また、低消費電力化することができる。
なお、半導体集積回路200は、実施の形態に係る顔検出装置180に対応する半導体集積回路を含むものとして説明したが、変形例に係る顔検出装置に対応する半導体集積回路を含むこととしてもよい。
(2)実施の形態及び変形例では、撮像画像に複数の顔画像が含まれている場合、つまり、検出対象画像が複数検出された場合について特に取り上げて説明しなかったが、複数の検出対象画像それぞれについて顔画像を検出する処理を行ってもよい。
(3)実施の形態及び変形例では、撮像画像のサイズを4VGAサイズとし、照合対象画像のサイズをQVGAサイズとし、テンプレート画像のサイズを24×24画素として説明したが、これに限定されるものではなく、それぞれ任意のサイズとしてもよい。
(4)実施の形態及び変形例においてテンプレート画像は3種類であるものとして説明したが、テンプレート画像の数はこれに限られない。即ち、正面向きのテンプレート画像のみの1種類にしてもよいし、顔の角度毎に3種類より多くのテンプレート画像を用いて照合するようにしてもよい。
(5)実施の形態及び変形例に係る顔検出装置は、縮小画像と複数のテンプレート画像それぞれを照合するものとして説明したが、結果メモリ181に格納されている1つ前の撮像画像についての結果リスト内の照合結果に基づいて、照合に用いるテンプレート画像を絞るようにしてもよい。
即ち、1つ前の撮像画像についての検出した旨の情報を含む照合結果に含まれているテンプレートIDが示すテンプレート画像と照合を行うようにしてもよい。
(6)実施の形態及び変形例では、顔画像を検出したか否かに関わらず、検出対象画像における全照合対象画像を照合するものとして説明したが、一定の基準(例えば、テンプレート画像との一致度が既定の閾値以上であること)の下、顔画像を検出したと判断した場合には、その撮像画像に対する検出処理を終了するようにしてもよい。
(7)実施の形態及び変形例では、顔画像を検出するものとして説明したが、顔画像以外の特定画像を検出するようにしてもよい。特定画像としては、例えば、人や物に付けられた識別タグなどとしてもよく、この場合、検出した識別タグの情報から個人や物の種類を識別するといった利用も考えられる。
(8)実施の形態及び変形例に係る物体検出回路160は、物体が写っていない状態の撮像画像と画像メモリ130に記憶されている撮像画像とのエッジ検出結果を比較することにより物体を検出するものとして説明したが、これは一例であり、例えば、連続して生成された撮像画像の画素値の差分を取ることにより検出することとしてもよい。
(9)実施の形態及び変形例では、図3に示すように(1/1.22)^n倍ずつ縮小率が変化する例を説明したが、これは一例であり、最も小さい縮小率で縮小した際の画像(つまり、最も縮小の程度が高い画像)のサイズがテンプレート画像のサイズより大きくなるように各縮小率を設定すればよく、例えば(1/1.25)^n倍ずつ変化させるようにしてもよい。
(10)実施の形態及び変形例では、画像処理装置の動作として、図5及び図9のステップS6〜S8に示すように、決定した1つの照合対象画像について、順番に縮小IDを変えながら縮小画像を生成する例を説明したが、1つの縮小IDについて、順番に照合対象画像の位置を変えながら縮小画像を生成するようにしてもよい。
(11)実施の形態及び変形例では、図5、図9のステップS7に示すように、解像度変換回路182は、各縮小画像を生成する際に毎回、画像メモリ130から照合対象画像を読み出すものとして説明したが、生成した縮小画像を記憶しておき、記憶してある縮小画像を用いて他の縮小率の縮小画像を生成するようにしてもよい。例えば、プロセッサ170から偶数の縮小IDが通知されている場合には、一度、照合対象画像を画像メモリ130から読み出し、縮小IDが0に対応する縮小率で縮小画像を生成し、以降は、生成した縮小画像を(1/1.22)^2倍することで縮小IDが2、4、・・・、10に対応する縮小画像を生成できる。
(12)実施の形態及び変形例では、画像処理装置の動作として、図5及び図9のステップS2〜S4に示すように、撮像画像の撮像順が偶数番目である場合には(ステップS2:YES)、偶数の縮小IDを選択し(ステップS3)、検出に係る撮像画像の撮像順が奇数番目である場合には(ステップS2:NO)、奇数の縮小IDを選択する(ステップS4)ものとして説明したが、この逆であってもよい。つまり、ステップS3とS4とを入れ替えてもよい。
(13)実施の形態及び変形例においては、物体検出回路160及びプロセッサは顔検出装置に含まれないものとして説明したが、物体検出回路160及びプロセッサの全部又は一部を顔検出装置に含めることとしてもよい。
(14)実施の形態及び変形例では、図5及び図9に示す照合対象画像の決定処理(ステップS6)を、解像度変換回路182が行うものとして説明したが、プロセッサが行い、決定した照合対象画像の座標値を解像度変換回路182に通知するようにしてもよい。
(15)実施の形態及び変形例に係るプロセッサは、全ての撮像画像について、物体検出回路160に検出処理を行わせるものとして説明したが、物体検出回路160が一旦検出した後は、一定数分の撮像画像については物体検出回路160に検出処理を行わせず、その一定数分を経過した次の撮像画像から再び検出処理を行わせるようにしてもよい。
この場合、プロセッサは、物体検出回路160に検出処理を行わせない間の各撮像画像については、物体検出回路160から直近に受領した検出結果に含まれている検出対象画像の座標値を顔検出装置に通知するようにしてもよい。
また、プロセッサは、この間、検出対象画像の座標値を顔検出装置に通知しないこととし、顔検出装置は、一旦プロセッサから通知された検出対象画像の座標値を、次にプロセッサから検出対象画像の座標値が通知されるまで記憶しておき、その座標値が示す照合対象画像の中で照合対象画像を決定するようにしてもよい。
また、顔検出回路は、顔画像を検出した際に、その検出に係る照合対象画像の撮像画像中における座標値を記憶しておき、プロセッサから検出対象画像の座標値が通知されない間、処理対象の撮像画像については、記憶している座標値が示す照合対象画像についてのみ処理することとしてもよい。
(16)また、実施の形態及び変形例に係るプロセッサは、全ての撮像画像について、物体検出回路160に検出処理を行わせるものとして説明したが、一旦検出した後は、顔検出装置から顔画像範囲を特定できなかった旨の通知を受領するまで、物体検出回路160に検出処理を行わせないようにしてもよい。この間の照合処理に係る各照合対象画像の決定方法は、上記(15)と同様のバリエーションが考えられる。
(17)実施の形態及び変形例に係る特定回路184は、特定した顔画像範囲の左上端の座標値及び大きさをプロセッサに送出するものとして説明したが、顔画像範囲を特定できれば他の情報を送出してもよく、例えば、右下端の座標値及び大きさを送出してもよいし、左上端及び右下端の座標値を送出してもよい。
また、プロセッサは、検出対象画像の左上端及び右下端の座標値を顔検出装置に通知するものとして説明したが、同様に検出対象画像を特定できれば他の情報を通知してもよく、例えば、左上端又は右下端の座標値及びその画像の大きさを通知するようにしてもよい。
また、物体検出回路160が検出結果に含めてプロセッサに送信する検出対象画像の左上端及び右下端の座標値についても同様である。
(18)実施の形態における<考察>では、図7に示すように、T1〜T2において、撮像画像1011についての縮小処理及び照合処理を行い、T2から撮像画像1011についての顔画像範囲の特定処理を開始するものとして説明したが、画像処理装置100の処理能力に余裕がある場合には、1つの撮像画像についての縮小処理及び照合処理と特定処理とを撮像間隔時間(上述の例では33ms)内に行うようにしてもよい。
また、画像処理装置100が生成する縮小画像の数を減らすことで、同様に撮像間隔時間内に縮小処理及び照合処理と特定処理とを行うようにしてもよい。なお、生成する縮小画像の数を減らせば、一般的に顔画像を検出する際の精度が低下することになるため、この変形例は、生成する縮小画像の数を減らした場合でも、この画像検出装置が許容できる精度の範囲になることが前提である。
これらの変形は、変形画像処理装置に適用してもよい。
(19)実施の形態及び変形例に係る画像処理装置は、各撮像画像について、12種類の縮小IDのうちの6種類以下の縮小IDを用いて縮小画像を生成するものとして説明したが、例えば、12種類の縮小ID全てを用いるモードと、6種類以下の縮小IDを用いるモードとのいずれかをユーザが選択できるようにし、その選択結果に応じた数の縮小画像を生成するようにしてもよい。
実施の形態及び変形例に係る画像処理装置の処理能力では、所定時間(この例では33ms)以内に12種類の縮小画像全てを生成することはできないものと想定しているが、ほぼ静止状態の被写体に関しては、この所定時間を経過した後に特定画像が検出されたとしても、特定した画像範囲と、実際に被写体が写っている範囲とが大きくずれてしまうという問題は生じない。従って、ユーザは、例えば、静止している人を撮像する場合に、12種類の縮小ID全てを用いるモードを選択することによって、より正確に顔画像範囲を特定させることができる。
(20)実施の形態及び変形例に係る特定回路184は、一の撮像画像とその1つ前の撮像画像についての2つの結果リストに含まれる各照合結果に基づいて、その一の撮像画像に含まれる顔画像範囲を特定するものとして説明したが、3つ以上の結果リストに含まれる各照合結果に基づいて、その一の撮像画像に含まれる顔画像範囲を特定することとしてもよい。例えば、更に2つ前の撮像画像についての各照合結果に基づいて特定してもよい。その場合、結果メモリ181には2つ前の撮像画像についての結果リストも記憶しておく必要がある。
また、実施の形態及び変形例では、一の撮像画像の前に入力された撮像画像として1つ前の撮像画像を用いる例を説明したが、これに限られず、例えば、一の撮像画像の2つ前の撮像画像を用いてもよい。つまり、一の撮像画像とその2つ前の撮像画像についての2つの結果リストに含まれる各照合結果に基づいて、その一の撮像画像に含まれる顔画像範囲を特定するような変形も考えられる。
(21)実施の形態及び変形例に係るプロセッサは、撮像画像毎に、12種類の縮小IDの中から縮小画像を生成するための縮小IDを選択するものとして説明したが、選択元となる縮小IDは12種類に限らないのはもちろんである。即ち、12種類より多くても少なくてもよい。
また、実施の形態に係るプロセッサは、撮像画像毎に、6種類の縮小IDを選択するものとして説明したが、選択する縮小IDの数はこれに限らないのはもちろんである。即ち、画像処理装置が所定時間以内に生成可能な縮小画像数以下の数の縮小IDを選択するようにすれば、選択する縮小IDの数はいくつでもよいし、撮像画像毎に選択する縮小IDの数を変えてもよい。
(22)変形例に係るプロセッサは、図9に示すように、撮像画像毎に、その撮像画像の1つ前の撮像画像について顔画像が検出されていないときは(ステップS20:NO)、撮像順に応じて偶数の縮小IDと奇数の縮小IDとを交互に選択する(ステップS2〜4)ものとして説明したが、任意の6種類以下の縮小IDを選択するようにしてもよい。
(23)変形例に係るプロセッサは、図9のステップS21に示すように、1つ前の撮像画像で顔画像を検出した際の縮小IDとその周辺の縮小IDとを選択するものとして説明したが、検出した際の縮小IDだけ、あるいは、その周辺の縮小IDだけを選択するようにしてもよい。このとき、選択した縮小IDの数が6つ未満の場合には、選択する縮小IDの数を6つにするために、任意の縮小IDを選択してもよいし、0〜11までの縮小IDを順番に選択するようにしてもよい。このことは、変形例のステップS21で選択した縮小IDの数が6つ未満の場合にも同様に適用できる。
(24)実施の形態及び変形例では、撮像画像毎に、12種類の縮小ID(この項では「候補ID」という)のうちの6種類以下の縮小ID(この項では「選択ID」という)で縮小画像を生成する例をそれぞれ説明したが、以下のような変形も可能である。
(a)候補IDの数Lが偶数であり、選択IDの数M(M<L)がL/2より大きい場合には、撮像画像毎に、L/2種類の偶数の縮小ID及びM−L/2種類の奇数の縮小IDと、L/2の奇数の縮小ID及びM−L/2種類の偶数の縮小IDとを交互に選択するようにしてもよい。
例えば、Lが12で、Mが7の場合に、撮像画像毎に、6種類の偶数の縮小ID及び1種類の奇数の縮小IDと、6種類の奇数の縮小ID及び1種類の偶数の縮小IDを交互に選択することになる。
また、1つの撮像画像について選択する縮小IDの数がM以下になれば、撮像画像毎に選択する偶数の縮小IDと奇数の縮小IDの数を任意に調節してよく、例えば、撮像画像毎に選択する偶数の縮小IDと奇数の縮小IDの数の内訳を変えてもよい。このとき、それぞれ選択する偶数の縮小ID、奇数の縮小IDは、全ての偶数の縮小ID、奇数の縮小IDのうちの任意のものを選択してもよいし、順番に選択してもよい。
(b)候補IDの数Lが奇数であり、選択IDの数M(M<L)がL/2より大きい場合には、撮像画像毎に、(L+1)/2種類の偶数の縮小ID及びM−(L+1)/2種類の奇数の縮小IDと、(L−1)/2の奇数の縮小ID及びM−(L−1)/2種類の偶数の縮小IDとを交互に選択するようにしてもよい。
このとき、M−(L+1)/2種類の奇数の縮小IDは、全ての奇数の縮小IDのうちの任意のものを選択してもよいし、順番に選択してもよい。また、M−(L−1)/2種類の偶数の縮小IDについても同様である。
例えば、Lが11でMが6の場合に、撮像画像毎に、6種類の偶数の縮小IDと、5種類の奇数の縮小ID及び1種類の偶数の縮小IDを交互に選択することになる。
また、1つの撮像画像について選択する縮小IDの数がM以下になれば、撮像画像毎に選択する偶数の縮小IDと奇数の縮小IDの数を任意に調節してよいのは、上記(a)の場合と同様である。
(c)選択IDの数M(M>L)が候補IDの数L/2より小さい場合には、撮像画像毎に、M種類以下の偶数の縮小IDと、M種類以下の奇数の縮小IDとを交互に選択するようにしてもよい。このM種類以下の偶数の縮小ID、M種類以下の奇数の縮小IDは、それぞれ全ての偶数の縮小ID,全ての奇数の縮小IDのうちの任意のものを選択してもよいし、順番に選択してもよい。
例えば、Lが12で、Mが5の場合に、撮像画像毎に、任意の5種類以下の偶数の縮小IDと、任意の5種類以下の奇数の縮小IDとを交互に選択することになる。
また、1つの撮像画像について選択する縮小IDの数がM以下になれば、撮像画像毎に選択する偶数の縮小IDと奇数の縮小IDの数を任意に調節してよいのは、上記(a)の場合と同様である。
(25)本発明に係る画像処理装置における縮小画像生成手段は、実施の形態及び変形例に係る解像度変換回路182に相当し、照合手段は顔検出回路に相当し、特定手段は特定回路184に相当し、制御手段はプロセッサに相当し、表示手段は、プロセッサとLCD出力回路150とLCD140とに相当する。
本発明に係る画像処理装置は、デジタルカメラ等における顔画像の検出に利用できる。
100 画像処理装置
101 プロセッサバス
102 メモリバス
110 カメラ
120 カメラ入力回路
130 画像メモリ
140 LCD
150 LCD出力回路
160 物体検出回路
170 プロセッサ
180 顔検出装置
181 結果メモリ
182 解像度変換回路
183 顔検出回路
184 特定回路
200 半導体集積回路

Claims (13)

  1. 所定時間毎に撮像され順次入力される撮像画像において、特定処理の対象となる画像範囲を特定する画像処理装置であって、
    入力された1つの撮像画像に基づいて、K(K≧1)種の倍率の縮小画像を前記所定時間内に生成する処理能力を有し、各々異なるL(L>K)種の倍率のうち指定された倍率の縮小画像を生成する縮小画像生成手段と、
    前記縮小画像生成手段により生成された各縮小画像とテンプレート画像とを照合し、照合結果を送出する照合手段と、
    前記照合手段から送出された照合結果に基づいて、前記画像範囲を特定する特定手段と、
    撮像画像が入力される毎に、当該撮像画像についてのM(M≦K)種以下の倍率を、当該撮像画像の前に入力された撮像画像について指定した倍率に基づいて選択し、選択したM種以下の倍率を前記縮小画像生成手段に指定して各縮小画像を生成させて、生成された各縮小画像を前記照合手段に照合させ、少なくともその照合結果に基づいて、当該撮像画像についての前記画像範囲を前記特定手段に特定させる制御手段とを備える
    ことを特徴とする画像処理装置。
  2. 前記制御手段は、
    撮像画像が入力される毎に、前記L種の倍率を昇順又は降順に並べた場合における先頭からの順番が奇数番目となる各倍率のうちN(N≦M)個の倍率を含むM個以下の倍率と、偶数番目となる各倍率のうちN個の倍率とを含むM個以下の倍率とを交互に、前記M種以下の倍率として前記縮小画像生成手段に指定する
    ことを特徴とする請求項1記載の画像処理装置。
  3. 前記制御手段は、
    一の撮像画像の前に入力された撮像画像について指定したM種以下の倍率のうちの1つ以上の倍率を、前記照合手段から送出された、当該撮像画像についての、テンプレート画像に対応する画像を検出した旨を示す照合結果に基づいて選択し、選択した倍率を、前記縮小画像生成手段に指定する、前記一の撮像画像についての前記M種以下の倍率に含ませる
    ことを特徴とする請求項2記載の画像処理装置。
  4. 前記制御手段は、
    一の撮像画像の前に入力された撮像画像について指定したM種以下の倍率のうちの1つ以上の倍率を、前記照合手段から送出された、当該撮像画像についての、テンプレート画像に対応する画像を検出した旨を示す照合結果に基づいて選択し、前記L種の倍率を昇順又は降順に並べた場合における先頭からの順番が、選択した倍率についての順番の直前又は直後となる倍率を、前記一の撮像画像についての前記N個の倍率に含ませる
    ことを特徴とする請求項2記載の画像処理装置。
  5. 前記照合手段は、
    各縮小画像とテンプレート画像とを照合することにより、当該テンプレート画像に対応する画像範囲を検出した場合に、検出した各画像範囲を示す各範囲情報を前記照合結果として送出し、
    前記特定手段は、
    前記照合手段から送出された、一の撮像画像についての各範囲情報及び当該撮像画像の前に入力された撮像画像についての各範囲情報に基づいて前記特定を行う
    ことを特徴とする請求項2記載の画像処理装置。
  6. 前記特定手段は、
    前記照合手段から送出された、前記一の撮像画像についての各範囲情報及び前記前に入力された撮像画像についての各範囲情報のうち、所定基準で定まる近接した位置関係にある各画像範囲を示す各範囲情報に基づいて、1つの画像範囲を特定する
    ことを特徴とする請求項5記載の画像処理装置。
  7. 前記制御手段は、
    前記縮小画像生成手段に指定する、一の撮像画像についての前記M種以下の倍率を、前記照合手段から送出された、当該撮像画像より前に入力された撮像画像についての照合結果に基づいて決定する
    ことを特徴とする請求項1記載の画像処理装置。
  8. 前記画像処理装置は、
    前記テンプレート画像の候補となる複数のテンプレート候補画像を保持しており、
    前記照合手段は、
    一の撮像画像の前に入力された撮像画像についての照合結果に基づいて、当該一の撮像画像についての照合に用いる前記テンプレート画像を前記テンプレート候補画像の中から選択する
    ことを特徴とする請求項1記載の画像処理装置。
  9. 前記照合手段は、
    各縮小画像とテンプレート画像とを照合することにより、当該テンプレート画像に対応する画像範囲を検出した場合に、検出した各画像範囲を示す各範囲情報を前記照合結果として送出し、
    前記特定手段は、
    前記照合手段から送出された、一の撮像画像についての各範囲情報及び当該撮像画像の前に入力された撮像画像についての各範囲情報に基づいて前記特定を行う
    ことを特徴とする請求項1記載の画像処理装置。
  10. 前記特定手段は、
    前記照合手段から送出された、前記一の撮像画像についての各範囲情報及び前記前に入力された撮像画像についての各範囲情報のうち、所定基準で定まる近接した位置関係にある各画像範囲を示す各範囲情報に基づいて、1つの画像範囲を特定する
    ことを特徴とする請求項9記載の画像処理装置。
  11. 前記画像処理装置は、更に
    撮像画像が入力される毎に、当該撮像画像を表示すると共に、当該撮像画像について前記特定手段が特定した画像範囲に対応する当該撮像画像上の位置に、当該画像範囲を示す枠を表示する表示手段を備える
    ことを特徴とする請求項1記載の画像処理装置。
  12. 所定時間毎に撮像され順次入力される撮像画像において、特定処理の対象となる画像範囲を特定する画像処理装置における画像処理方法であって、
    入力された1つの撮像画像に基づいて、K(K≧1)種の倍率の縮小画像を前記所定時間内に生成する処理能力を有し、各々異なるL(L>K)種の倍率のうち指定された倍率の縮小画像を生成する縮小画像生成ステップと、
    前記縮小画像生成ステップにより生成された各縮小画像とテンプレート画像とを照合し、照合結果を送出する照合ステップと、
    前記照合ステップから送出された照合結果に基づいて、前記画像範囲を特定する特定ステップと、
    撮像画像が入力される毎に、当該撮像画像についてのM(M≦K)種以下の倍率を、当該撮像画像の前に入力された撮像画像について指定した倍率に基づいて選択し、選択したM種以下の倍率を前記縮小画像生成ステップに指定して各縮小画像を生成させて、生成された各縮小画像を前記照合ステップに照合させ、少なくともその照合結果に基づいて、当該撮像画像についての前記画像範囲を前記特定ステップに特定させる制御ステップとを含む
    ことを特徴とする画像処理方法。
  13. 所定時間毎に撮像され順次入力される撮像画像において、特定処理の対象となる画像範囲を特定する画像処理用集積回路であって、
    入力された1つの撮像画像に基づいて、K(K≧1)種の倍率の縮小画像を前記所定時間内に生成する処理能力を有し、各々異なるL(L>K)種の倍率のうち指定された倍率の縮小画像を生成する縮小画像生成手段と、
    前記縮小画像生成手段により生成された各縮小画像とテンプレート画像とを照合し、照合結果を送出する照合手段と、
    前記照合手段から送出された照合結果に基づいて、前記画像範囲を特定する特定手段と、
    撮像画像が入力される毎に、当該撮像画像についてのM(M≦K)種以下の倍率を、当該撮像画像の前に入力された撮像画像について指定した倍率に基づいて選択し、選択したM種以下の倍率を前記縮小画像生成手段に指定して各縮小画像を生成させて、生成された各縮小画像を前記照合手段に照合させ、少なくともその照合結果に基づいて、当該撮像画像についての前記画像範囲を前記特定手段に特定させる制御手段とを備える
    ことを特徴とする画像処理用集積回路。
JP2010509079A 2008-04-25 2009-04-22 画像処理装置、画像処理方法、及び画像処理用集積回路 Expired - Fee Related JP5247798B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010509079A JP5247798B2 (ja) 2008-04-25 2009-04-22 画像処理装置、画像処理方法、及び画像処理用集積回路

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008115050 2008-04-25
JP2008115050 2008-04-25
PCT/JP2009/001847 WO2009130899A1 (ja) 2008-04-25 2009-04-22 画像処理装置、画像処理方法、及び画像処理用集積回路
JP2010509079A JP5247798B2 (ja) 2008-04-25 2009-04-22 画像処理装置、画像処理方法、及び画像処理用集積回路

Publications (2)

Publication Number Publication Date
JPWO2009130899A1 true JPWO2009130899A1 (ja) 2011-08-11
JP5247798B2 JP5247798B2 (ja) 2013-07-24

Family

ID=41216640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010509079A Expired - Fee Related JP5247798B2 (ja) 2008-04-25 2009-04-22 画像処理装置、画像処理方法、及び画像処理用集積回路

Country Status (4)

Country Link
US (1) US8265339B2 (ja)
JP (1) JP5247798B2 (ja)
CN (1) CN101690168A (ja)
WO (1) WO2009130899A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103970364B (zh) * 2013-02-06 2017-04-12 原相科技股份有限公司 用于检测悬浮及点击的手势检测装置
CN103970365B (zh) * 2013-02-06 2016-12-28 原相科技股份有限公司 用于检测悬浮及点击的手势检测装置
CN103927767B (zh) * 2014-04-18 2018-05-04 北京智谷睿拓技术服务有限公司 图像处理方法及图像处理装置
US10216762B2 (en) * 2014-06-04 2019-02-26 Panasonic Corporation Control method and non-transitory computer-readable recording medium for comparing medical images
JP2021190780A (ja) * 2020-05-27 2021-12-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06325162A (ja) 1993-05-11 1994-11-25 Nikon Corp 画像処理装置
US7013021B2 (en) * 1999-03-19 2006-03-14 Digimarc Corporation Watermark detection utilizing regions with higher probability of success
US6532301B1 (en) * 1999-06-18 2003-03-11 Microsoft Corporation Object recognition with occurrence histograms
JP3564541B2 (ja) 2001-10-29 2004-09-15 独立行政法人産業技術総合研究所 亜鉛アンチモン化合物焼結体及びその製造法
JP4329398B2 (ja) 2002-05-10 2009-09-09 ソニー株式会社 顔検出装置及び方法、並びにプログラム及び記録媒体
US7409092B2 (en) * 2002-06-20 2008-08-05 Hrl Laboratories, Llc Method and apparatus for the surveillance of objects in images
US7263220B2 (en) * 2003-02-28 2007-08-28 Eastman Kodak Company Method for detecting color objects in digital images
JP2005078376A (ja) * 2003-08-29 2005-03-24 Sony Corp 対象物検出装置、対象物方法、及びロボット装置
EP1530156B1 (en) 2003-11-07 2012-03-14 Mitsubishi Electric Information Technology Centre Europe B.V. Visual object detection
JP2005173787A (ja) 2003-12-09 2005-06-30 Fujitsu Ltd 移動物体の検出・認識を行う画像処理装置
JP3977802B2 (ja) * 2003-12-16 2007-09-19 株式会社東芝 障害物検出装置、障害物検出方法および障害物検出プログラム
JP2006048322A (ja) * 2004-08-04 2006-02-16 Seiko Epson Corp オブジェクト画像検出装置、顔画像検出プログラムおよび顔画像検出方法
JP4561380B2 (ja) 2005-01-24 2010-10-13 コニカミノルタホールディングス株式会社 検出装置、検出方法及び検出プログラム
JP2006323779A (ja) 2005-05-20 2006-11-30 Canon Inc 画像処理方法、画像処理装置
JP4626493B2 (ja) * 2005-11-14 2011-02-09 ソニー株式会社 画像処理装置、画像処理方法、画像処理方法のプログラム及び画像処理方法のプログラムを記録した記録媒体
US20080002878A1 (en) * 2006-06-28 2008-01-03 Somasundaram Meiyappan Method For Fast Stereo Matching Of Images
CN101542523B (zh) 2007-04-13 2012-07-25 松下电器产业株式会社 检测装置、检测方法及检测用集成电路

Also Published As

Publication number Publication date
US8265339B2 (en) 2012-09-11
US20100183193A1 (en) 2010-07-22
CN101690168A (zh) 2010-03-31
WO2009130899A1 (ja) 2009-10-29
JP5247798B2 (ja) 2013-07-24

Similar Documents

Publication Publication Date Title
JP4814375B2 (ja) 検出装置、検出方法および検出用集積回路
US8629897B2 (en) Image processing device, image processing method, and program
JP5746937B2 (ja) オブジェクト追跡装置
JP5906028B2 (ja) 画像処理装置、画像処理方法
JP5247798B2 (ja) 画像処理装置、画像処理方法、及び画像処理用集積回路
JP5939705B2 (ja) 被写体判定装置、被写体判定方法及びプログラム
US20080002051A1 (en) Motion vector detecting apparatus, motion vector detecting method and interpolation frame creating apparatus
JP6579727B1 (ja) 動体検出装置、動体検出方法、動体検出プログラム
US20120288215A1 (en) Image processing device and processing method thereof
US8891833B2 (en) Image processing apparatus and image processing method
JP5439474B2 (ja) 画像表示制御装置、画像表示制御方法及び集積回路
JP5042251B2 (ja) 画像処理装置および画像処理方法
CN116385260B (zh) 图像处理方法、装置、芯片、电子设备及介质
JP2018097310A (ja) 表示制御プログラム、表示制御方法および表示制御装置
JP6238569B2 (ja) 画像処理装置、画像処理方法、及び、プログラム
JP2005055973A (ja) 携帯情報端末
JP2008257321A (ja) 顔検出装置
JP2016095667A (ja) 画像処理装置および電子機器
US10893205B2 (en) Image display method and image display device using the same
JP6467940B2 (ja) 画像処理装置、画像処理方法及びプログラム
WO2022001733A1 (zh) 一种拍摄对象的显示方法及装置、存储介质、终端
JP2018005389A (ja) 画像変形回路、画像処理装置、及び画像変形方法
JP2018041201A (ja) 表示制御プログラム、表示制御方法および情報処理装置
CN114567732A (zh) 数据展示方法、装置、电子设备及计算机存储介质
US20090225222A1 (en) Video signal processing apparatus, video signal processing method, and computer program product

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130409

R150 Certificate of patent or registration of utility model

Ref document number: 5247798

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees