JP2005071344A - 画像処理方法、画像処理装置及び画像処理プログラムを記録した記録媒体 - Google Patents

画像処理方法、画像処理装置及び画像処理プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2005071344A
JP2005071344A JP2004229762A JP2004229762A JP2005071344A JP 2005071344 A JP2005071344 A JP 2005071344A JP 2004229762 A JP2004229762 A JP 2004229762A JP 2004229762 A JP2004229762 A JP 2004229762A JP 2005071344 A JP2005071344 A JP 2005071344A
Authority
JP
Japan
Prior art keywords
face
template
image processing
input image
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004229762A
Other languages
English (en)
Inventor
Katsuhiro Iwasa
克博 岩佐
Kazuyuki Imagawa
和幸 今川
Tomonori Kataoka
知典 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2004229762A priority Critical patent/JP2005071344A/ja
Publication of JP2005071344A publication Critical patent/JP2005071344A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】メモリ消費量や処理量を抑え高精度の顔検出技術を提供する。
【解決手段】入力画像のエッジ画像と顔テンプレートとを用いて相関演算し、相関演算結果に基づいて、入力画像内の顔を検出する。顔テンプレートは、顔内部テンプレートと顔外部テンプレートとに分けて管理される。顔外部テンプレートは、顔内部テンプレートは、顔向きによって変化する。顔内部テンプレートを編集し、顔外部テンプレートに動的に合成した一時テンプレートを顔テンプレートして使用する。顔画像の変化に顔テンプレートを対応させ、顔向きにロバストな顔検出を行える。
【選択図】図1

Description

本発明は、入力画像内における顔の位置などを、検出する画像処理装置及びその関連技術に関するものである。
いうまでもなく、顔は、人物の思考や感情を表すために重要な意味を持つ。したがって、人物を含む入力画像(静止画、動画像、コンピュータグラフィックス等で人為的に生成した画像等)を取り扱う画像処理の分野において、人物の顔が、入力画像のどの位置に、どれくらいの大きさで存在しているかという問題を、自動的に処理できるシステムが、求められている。このため、システム上で入力画像から顔領域を抽出しようとする試みが始まっている。
まず一般に、入力画像における顔の向きは、不定である。したがって、このようなシステムで、顔を検出しようとすると、顔がどちらを向いていても、顔を検出できるようにせざるを得ない。そのために、全ての顔向きについて、顔情報を保持することが考えられる。例えば、スーパーコンピュータのように、膨大なシステム資源と処理能力を誇る装置を用いるのなら、このようにしてもよいであろう。
しかしながら、このようにすると、メモリ等のシステム資源を莫大に消費するため、例えば、携帯情報端末のように、システム資源が乏しい装置には実装しにくい。
この点を考慮し、例えば、特許文献1(特開2001−283216号公報)は、次のような技術を開示する。即ち、顔を3次元モデルで表現し、この3次元モデルを、逐次、2次元平面に透視変換し、複数の2次元テンプレートを作成する。こうすると、確かに、メモリ等の負担は軽くなる。
しかしながら、この手法によると、3次元から2次元への透視変換を膨大な回数繰り返す必要があるため、処理負担が重い。したがって、処理能力が乏しい装置に、この手法を実装することは難しい。
また、特許文献2(特開2001−16606号公報)は、次のような技術を開示する。即ち、対象物の動作を認識するため、動きのある領域と肌色領域とを抽出し、両者を統合して対象領域を定めている。
しかしながら、この技術は、現フレームと前フレームとの輝度差分によって、動き領域を検出しており、事実上、カメラを固定しておかないと、実現できない。したがって、用途がきわめて限定され、実用に供しがたい。
さらに、特許文献3(特開2001−119622号公報)は、次のような技術を開示する。即ち、カメラにおいて、顔などの被写体を検出し、自動焦点制御等を行う。そして、探索法を工夫し、処理時間の短縮を図ると共に、顔と顔以外を判別手段で判別して、誤検出(顔以外を顔とする検出や顔を見落とす検出)を減らしている。
しかしながら、顔検出自体には、特別の工夫がなく、単なるパターン相関をとっているに過ぎない。したがって、写っている人が自由に動けるようにすると、検出精度が極端に低下してしまう。逆に、検出精度を維持しようとすると、膨大な量のテンプレートを用意し、相関演算数を増やさなければならなくなる。結局、システム資源に乏しい装置では、この技術を用いても、十分な精度で顔を検出することは非常に困難であると言わざるを得ない。
特開2001−283216号公報 特開2001−16606号公報 特開2001−119622号公報
そこで本発明は、システム資源に乏しくとも、顔向きにロバストで、用途が広くかつ精度の良い顔検出を行える画像処理装置及びその関連技術を提供することを目的とする。
第1の発明に係る画像処理方法は、入力画像由来のデータと顔テンプレートとを用いて相関演算するステップと、相関演算結果に基づいて、入力画像内の顔を検出するステップとを含み、顔テンプレートは、顔内部テンプレートと顔外部テンプレートとに分けて管理される。
ここで、入力画像内において、顔向きが、右を向いたり下を向いたりするなど、変化しても、顔輪郭等からなる顔外部の形状は、さほど変化しない。顔外部を構成する頭部は、全体的に丸みを帯びているからである。
一方、顔の表面に位置する鼻、目、口等の顔部品と、顔外部との位置関係は、顔向きが変化すると、入力画像内において、かなり変化する。
この構成では、顔テンプレートを、顔向きによって変化しやすい顔内部に対応する顔内部テンプレートと、顔向きによって変化しにくい顔外部に対応する顔外部テンプレートとに分けて管理しているから、顔画像の変化の特性にあわせた顔検出を行える。
第2の発明に係る画像処理方法では、入力画像由来のデータは、少なくとも入力画像のエッジ画像を含む。
この構成において、入力画像のエッジ画像を使用することにより、照明変動などで、輝度、色相あるいは彩度が変化しても、その変化が相関演算結果に与える影響を少なくすることができる。
第3の発明に係る画像処理方法では、顔外部テンプレートは、変形させずに用いられ、入力画像中の顔の顔向き、顔傾き及び顔部品の偏りの少なくとも1つに適応可能であり、顔内部テンプレートは、変形させて用いられ入力画像中の顔の顔向き、顔傾き及び顔部品の偏りの少なくとも1つに適応可能である。
この構成により、顔画像の変化に合わせた、顔検出を行える。
第4の発明に係る画像処理方法では、相関演算するステップは、さらに、顔外部テンプレートと顔内部テンプレートとを、動的に合成して顔テンプレートとするステップと、入力画像由来のデータと顔テンプレートとを用いて相関演算するステップとを含む。
この構成において、顔外部テンプレートと顔内部テンプレートとを、動的に合成して顔テンプレートとすることにより、顔向きに合うテンプレートは、顔内部テンプレートに限って用意すれば足り、顔外部テンプレートは、例えば1種類など少量だけの用意で済ますことができる。したがって、携帯情報端末のように、メモリ容量等のシステム資源にゆとりがない装置にも、適用しやすい。
しかも、動的合成により得られる顔テンプレートは、顔向きを反映したものとなるので、顔向きにロバストで精度良い顔検出を行える。
第5の発明に係る画像処理方法では、相関演算するステップは、さらに、入力画像由来のデータと顔外部テンプレートとを用いて相関演算するステップと、入力画像由来のデータと顔内部テンプレートとを用いて相関演算するステップとを含む。
この構成において、顔外部テンプレートによる相関演算と、顔内部テンプレートによる相関演算とを、別々に実施することにより、顔が正面からはずれて斜めをむいた場合など、顔輪郭と顔内部の重心がずれた場合においても精度よく検出できる顔向きにロバストな顔検出を実現できる。
第6の発明に係る画像処理方法では、相関演算するステップは、さらに、入力画像由来のデータと顔外部テンプレートとを用いて相関演算し、相関演算結果に基づいて、探索範囲を入力画像の一部の範囲に限定するステップと、探索範囲内において、入力画像由来のデータと顔内部テンプレートとを用いて相関演算するステップとを含む。
この構成において、まず、入力画像由来のデータと顔外部テンプレートとを用いて相関演算することにより、顔向きに影響されにくい、顔外部について、いわばラフサーチを実施し、顔内部を検索する探索範囲を入力画像の一部の範囲に限定する。
そして、限定された探索範囲内において、入力画像由来のデータと顔内部テンプレートとを用いて相関演算することにより、比較的狭い探索範囲内において、高速で緻密な顔検出を実施できる。
第7の発明に係る画像処理方法では、相関演算するステップは、さらに、入力画像由来のデータと顔外部テンプレートとを用いて相関演算するステップと、入力画像について動き領域を求めるステップと、顔外部テンプレートを用いた相関演算結果と求めた動き領域とに基づいて、探索範囲を入力画像の一部の範囲に限定するステップと、探索範囲内において、入力画像由来のデータと顔内部テンプレートとを用いて相関演算するステップとを含む。
この構成において、まず、入力画像由来のデータと顔外部テンプレートとを用いて相関演算し、また、動き領域を求める。したがって、顔外部についてのいわばラフサーチ結果と顔を含む蓋然性が高い動き領域とにより、顔内部を検索する探索範囲を、入力画像の一部の範囲に合理的に限定できる。
さらに、限定された探索範囲内において、入力画像由来のデータと顔内部テンプレートとを用いて相関演算することにより、比較的狭い探索範囲内において、高速で緻密な顔検出を実施できる。
第8の発明に係る画像処理方法では、動き領域を求めるステップでは、動き補償フレーム間予測に基づいて動きベクトルが求められる。
ここで、例えば、MPEG4など、多用される方式の動画エンコード処理では、既に動き補償フレーム間予測がなされている場合が多い。従って、この構成により、多くの場合、新たな動きベクトル検出処理なしに、既存の予測結果を利用した、高速な顔検出を行える。
第9の発明に係る画像処理方法では、動き領域を求めるステップは、さらに、
入力画像を構成する複数の部分領域について動きベクトルを検出するステップと、
入力画像全体におけるグローバル動きベクトルを検出するステップと、
求めた動きベクトルと、求めたグローバル動きベクトルに基づいて、動き領域を求めるステップとを含む。
この構成において、求めた動きベクトルと、求めたグローバル動きベクトルに基づいて、動き領域を求めることにより、入力画像を出力したカメラのパーン、チルト等、入力画像全体における動きを取り除き、動き領域を、実質的に入力画像内で動いている領域(顔が含まれている蓋然性が高い領域)に限定することができる。
第10の発明に係る画像処理方法では、グローバル動きベクトルを検出するステップでは、動きベクトルの平均を、求めるグローバル動きベクトルとする。
この構成により、動きベクトルから簡易にグローバル動きベクトルを算出でき、入力画像を出力するカメラにジャイロ等が装備されていない場合でも、適用できる。
第11の発明に係る画像処理方法では、グローバル動きベクトルを検出するステップでは、ジャイロを用いてグローバル動きベクトルを求める。
この構成により、ジャイロで直接グローバル動きベクトルを検出でき、精度が高く、高速なグローバル動きベクトル検出が行える。また、グローバル動きベクトルを求めるためだけの処理を省略できるから、処理能力に乏しい装置へ適用しやすい。
第12の発明に係る画像処理方法では、顔外部テンプレートは、各種の顔向きにおける顔特徴を複数のサンプルを用いて学習させた結果を反映する。
この構成により、顔の輪郭に強く反応するテンプレートを学習により簡易に作成できる。
第13の発明に係る画像処理方法では、顔外部テンプレートは、頭部の輪郭情報、顔の輪郭の輝度分布情報及び色分布情報の少なくとも1つを含む。
この構成により、様々な情報を顔外部テンプレートに盛り込むことができ、情報量の損失を避け、精度の良い顔検出を行える。
第14の発明に係る画像処理方法では、顔内部テンプレートは、正面顔の顔部品の特徴のみを複数のサンプルを用いて学習させた結果を反映する。
この構成により、顔部品に強く反応するテンプレートを学習により簡易に作成できる。
第15の発明に係る画像処理方法では、顔内部テンプレートは、顔部品の輪郭情報を含む。
この構成により、顔内部の位置を簡潔に表現できる。
第16の発明に係る画像処理方法では、顔部品は、目、眉、口及び鼻のうち、一種又は二種以上の組み合わせから構成される。
この構成により、顔内部テンプレートは、主要な顔部品の少なくとも一つを含むことになり、精度の良い顔検出を行える。
第17の発明に係る画像処理方法では、拡大、縮小、回転及び透視投影変換のうち、一種又は二種以上の組み合わせから構成される編集により、顔内部テンプレートは、顔向きにより変化する。
この構成により、顔向きの変化に合わせた様々なバリュエーションの顔テンプレートを生成でき、顔向きにロバストな顔検出を行える。
第18の発明に係る画像処理方法では、顔外部テンプレートは、円状をなす。
この構成により、顔輪郭の幾何形状を近似し、円と仮定することで、顔向きに左右されないテンプレートを実現できる。円は、回転作用についてその形態を変えないからである。
第19の発明に係る画像処理方法では、顔外部テンプレートは、正面顔のエッジ画像を複数枚重ね、平均したものから顔部品のエッジを削除したものである。
この構成により、テンプレートが顔の輪郭形状に近いため、顔外部テンプレートと顔外部との相関値と、顔外部テンプレートと顔内部との相関値に、大きな差が生じ、顔の検出が容易になる。さらに、顔外部テンプレートは、輪郭のみになるから、顔向きにより顔内部が変化しても、それに影響されにくく、精度の良い検出を実現できる。
第20の発明に係る画像処理方法では、顔内部テンプレートは、正面顔のエッジ画像を複数枚重ね、平均したものから顔部品のエッジを抽出したものである。
この構成により、顔内部のテンプレートは、平均を取った顔画像から顔外部を除去したものである。こうすると、顔部品のエッジは、顔外部から切り離され、顔外部との位置関係に拘束されない状態となる。したがって、入力画像の顔が正面を向いていない場合であっても、顔内部のみと顔内部テンプレートとの相関演算を、支障なく実施できる。
本発明によると、顔検出テンプレートを、顔外部、顔内部で、別々に管理することにより、システム資源に乏しい場合でも、顔向きにロバストで精度の良い顔検出を行える。
以下図面を参照しながら、本発明の実施の形態を説明する。まず、本発明では、入力画像由来のデータと顔テンプレートとを用いて相関演算し、相関演算結果に基づいて、入力画像内の顔が、検出される。
そして、次に述べる実施の形態1及び実施の形態2の両方において、顔テンプレートが、顔内部テンプレートと顔外部テンプレートとに分けて管理される点にポイントがある。
(実施の形態1)
図1は、本発明の実施の形態1における画像処理装置の機能ブロック図である。
図1において、特徴量抽出部1は、入力画像に対しエッジ抽出フィルタをかけ、特徴量マップの形態で、入力画像のエッジ画像を出力する。この入力画像のエッジ画像は、入力画像由来のデータに相当する。
ここで、エッジ抽出フィルタとしては、ソーベルフィルタ等周知のものを使用できる。
一時テンプレート生成部2は、顔内部情報と顔外部情報とを分けて記憶する。
顔内部情報は、顔内部情報記憶部3に顔内部テンプレートとして記憶されている。顔外部情報は、顔外部情報記憶部4に顔外部テンプレートとして記憶されている。
一時テンプレート生成部2は、編集部5と、合成部6とを有する。
編集部5は、後述する相関演算部7から入力される生成パラメータ(生成情報)に基づいて顔内部情報を動的に編集した編集結果を出力する。
合成部6は、編集部5が出力する編集結果と顔外部情報記憶部4における該当顔外部テンプレートとを、動的に合成する。合成結果は、一時テンプレートとして出力される。この一時テンプレートは、本形態における顔テンプレートである。
次に、図4から図7を用いて、顔外部テンプレート、顔内部テンプレート及び顔テンプレートについて、説明する。
図4を用いて、顔外部テンプレートと顔内部テンプレートの作成法を説明する。はじめに、図4(a)に示すように、人物の正面顔画像を複数用意し、これらを上述のフィルタを用いてエッジ画像とする。
次に、図4(b)に示すように、これらのエッジ画像を、複数重ね合わせ、平均値を求める。
次に、図4(c)に示すように、図4(b)のようなエッジ画像から、顔部品(目、眉、口及び鼻等)のエッジのみを抽出(手作業で差し支えない)したものを、顔内部テンプレートとする。顔内部情報記憶部3には、このような顔内部テンプレートが格納される。
図4(c)に示すように、顔内部情報は、顔部品の輪郭情報を含む。さらには、顔内部情報を、適宜、簡単な幾何学形状(例えば、楕円等)で近似しても良い。
また、図4(d)に示すように、図4(b)のようなエッジ画像から、顔部品(目、眉、口及び鼻等)のエッジのみを削除(手作業で差し支えない)したものを、顔外部テンプレートとする。図1に示す顔外部情報記憶部4には、このような顔外部テンプレートが格納される。
図4(d)を見れば、明らかなように、顔外部テンプレートは、頭部の輪郭情報を含むので、ほぼ円状をなし、円形状で近似できる。また、本形態の顔外部テンプレートは、エッジ画像のみで構成されているが、顔外部情報に、顔の輪郭の輝度分布情報や色分布情報等を含めても良い。
以上のような近似を行えば、顔内部テンプレートは、図5(a)に例示するようになり、顔外部テンプレートは、図4(b)に例示するようになる。
なお、顔内部テンプレートとしては、図5(a)に示すように、正面顔のエッジ画像を使用することが望ましい。これは、編集部5による顔内部情報の編集が容易になるからである。
本形態では、顔内部情報記憶部3及び顔外部情報記憶部4には、図5(a)及び図5(b)に示すテンプレートを、最低1セット格納すれば、顔検出を行える。これも、本形態の画像処理装置が、編集部5と、合成部6とを備えているからである。
したがって、テンプレートの格納に必要となるメモリ領域を小さくすることができ、システム資源に乏しい携帯情報端末などに実装しやすい。勿論、システム資源に余裕があれば、顔内部情報記憶部3及び顔外部情報記憶部4には、図5(a)及び図5(b)に示すテンプレートを、より多数格納してもよい。
図1において、編集部5は、図5(a)に示すような顔内部テンプレートを、編集(拡大、縮小、回転及び透視投影変換等)し、顔向き毎の編集結果(顔内部の画像)を出力する。これにより、編集結果の顔向きが変化し、その結果、一時テンプレートの顔向きが変化する。
次に、図6を用いて、編集部5の編集及び合成部6の処理について説明する。ここでは、編集部5は、図5(a)に示す正面顔の顔内部テンプレートから、顔向きが「左向」の編集結果を動的に生成するものとする。
まず、編集部5は、顔内部情報記憶部3から図5(a)に示す顔内部テンプレートを読み出し、これを、図5(a)における矢印で示すように、「左向」に合うように縮小する。この縮小処理は、簡単な演算で実現できる。
次に、編集部5は、図5(a)のように縮小した画像を、図5(b)における矢印で示すように、顔向き「左向」に合うように移動する。その結果、顔内部情報のみが、顔向き「左向」に合うように変更され編集結果として出力されることになる。
次に、図1において、合成部6は、顔外部情報記憶部4から図5(a)に示すような顔外部テンプレートを読み出し、上記編集結果と重ね合わせる。その結果、図6(c)に示すような一時テンプレートが動的に生成されることになる。さらに、合成部6は、この一時テンプレートを、顔サイズに合わせて、拡大又は縮小して、相関演算部7に出力する。この拡大/縮小処理は、簡単な演算で実現できる。
一時テンプレート生成部2が、以上のような処理を、顔向きによって繰り返せば、図7(a)から図7(i)に示すように、顔向きに合わせて、複数通りの一時テンプレートを動的に生成することができる。
図7では、左上(図7(a))、上向(図7(b))、右上(図7(c))、左向(図7(d))、正面(図7(e))、右向(図7(f))、左下(図7(g))、下向(図7(h))、右下(図7(i))、合計9とおりの顔向きを示しているが、図7は好ましい例を示したにすぎない。顔向きをより少なくした場合や、多くしたりした場合も、それなりの効果は奏されるので、本発明に包含される。
上述したように、編集部5による編集としては、拡大、縮小、回転及び透視投影変換等があり得る。このうち、透視投影変換についていえば、高々、2次元の顔内部テンプレートを、2次元の平面に透視投影変換するに過ぎない。したがって、処理負担は、従来技術の項で述べた技術(3次元モデルを隠面処理した上で2次元平面に透視投影変換する場合)よりも、非常に少ない。同様に、編集部5による編集は、処理能力が高くない装置であっても、さほど負担にならず、現実的である。
さて、図1において、相関演算部7は、特徴量マップを特徴量抽出部1から入力し、一時テンプレート生成部2に、所定の生成規則(顔向きや顔サイズ等の情報)を出力する。
そして、相関演算部7は、特徴量マップと一時テンプレートとを用いて相関演算し相関値マップを生成する。その相関演算は、周知のものを使用して差し支えない。
また、相関演算部7は、所定の生成規則に従って、前フレームにおける顔向きと、この前フレームの顔向きに隣接する顔向きとにおける一時テンプレートを、一つずつ必要回数繰り返し、相関演算部7は、一時テンプレート生成部2に生成させる。
図8を用いて、この所定の生成規則の例を説明する。図8(a)から図8(i)は、前フレームの顔向きが、図7(a)から図7(i)と同じ配置になっている。すなわち、図7において「X」印を付けた矩形が前フレームの顔向きを示す。この生成規則に従うときには、一時テンプレート生成部2は、「X」印を付けた矩形の顔向きと、斜線が付された矩形の顔向きについて、一時テンプレートを生成する必要がある。
例えば、図7(a)は、前フレームの顔向きが「左上」であった時の、生成規則を示す。このとき、この所定の生成規則では、「X」印を付けた前フレームの顔向きそのもの(「左上」)と、これに隣接する「上向」、「左向」とについて、一時テンプレート生成部2が、一時テンプレートを動的に生成すべきことを示す。この場合、3つの一時テンプレートが、順次生成されることになる。なお、生成順は任意に選択できる。
また、図1に示すように、相関演算部7は、特徴量マップと一時テンプレート生成部2が生成した一時テンプレート(ここでは、3通り)とを用いて相関演算を必要回数(ここでは、3回)繰り返すことになる。
そして、相関演算部7は、繰り返した相関演算のうち、最高の相関値が得られた顔向きにおける相関値マップを、結果出力部13に出力する。
勿論、図8の生成規則は、好ましい一例に過ぎず、種々変更しても差し支えない。
また、図7のパターンを変えたり、追加したりすることで、図26(a)のような顔向き顔だけでなく、図26(b)のような顔傾き顔や、図26(c)に示すように顔部品が偏った顔についても、検出可能である。
図1に示すように、結果出力部13は、相関演算部7が出力した相関値マップに基づいて顔の検出結果を出力する。この検出結果には、顔位置、顔サイズ及び顔向きを含めることができる。なお、検出結果は、相関演算部7にも出力される。
さらに、相関演算部7は、特徴量マップを記憶する特徴量マップ記憶部8、生成規則を記憶する生成規則記憶部9、一時テンプレートを記憶する一時テンプレート記憶部10、現在における最高の相関値が得られた一時相関値マップを記憶する一時相関値マップ記憶部11、生成パラメータを記憶する生成パラメータ記憶部12と接続されている。
図2は、本発明の一実施の形態における画像処理装置のブロック図である。図2において、CPU15は、図3のフローチャートに沿った画像処理プログラムを実行し、バス16を介し、図2に示す各要素を制御する。
このプログラムは、バス16に接続される記録媒体(例えばハードディスク、CD−ROM等)19のプログラム領域20に格納されている。CPU15は、このプログラムを実行する際に、ROM17、RAM18、記録媒体19或いはインターフェイス21を介するカメラ22に対して、入出力を行う。
カメラ22には、ジャイロ23が装備されており、カメラ22の画像全体の移動(パーンやチルト等も含む)をハードウエアで直接計測できるようになっている。なお、グローバル動きベクトルを、ハードウエアで計測する必要がなければ、ジャイロ23の装備は省略できる。
なお、カメラ22は、CCD、CMOSのどちらのモジュールを用いたものであっても良く、カメラ22は、スチルカメラ/ビデオカメラのいずれでも良く、携帯電話に付属するカメラを用いることもできる。
図1における、特徴量抽出部1、編集部5、合成部6、相関演算部7、結果出力部13は、図2におけるCPU15が、RAM18等とアクセスしながら、所定の演算を実行することにより実現される。また、各記憶部3、4、8、9、10、11、12は、例えば、RAM18の一領域として確保される。
図3は、本発明の実施の形態1における画像処理装置のフローチャートである。以下図3を用いて、顔検出の各プロセスを説明する。
まず、ステップ1にて、相関演算部7は、一時相関値マップ記憶部11の相関値を最低の相関値とし、生成パラメータ記憶部12の顔向き等を無難な値(例えば、顔向きを「正面」とするなど)にセットする。また、結果出力部13の検出結果も同様に無難な値とする。
これに基づき、ステップ2にて、相関演算部7は、一時テンプレート生成部2に一時テンプレート生成を命ずる。これに対し、一時テンプレート生成部2は、無難な初期一時テンプレート(例えば、顔向き「正面」等)を生成し、相関演算部7へ出力する。
ステップ3にて、相関演算部7は、画像が入力されるのを待つ。入力されると、特徴量抽出部1は、特徴量マップを生成し、相関演算部7へ出力する。
次に、ステップ5にて、相関演算部7は、特徴量マップと一時テンプレートとを用いて相関演算を行い、結果を一時相関値マップ記憶部11に格納する。
次に、ステップ6にて、相関演算部7は、生成規則記憶部9を参照し、ステップ6にて、生成すべき一時テンプレートを全て生成したかどうかチェックする。
生成が完了していれば、ステップ16へ処理が移る。
生成が完了していなければ、ステップ8にて、相関演算部7は、一時テンプレート生成部2へ生成パラメータを出力し、このパラメータに合う一時テンプレートの生成を命ずる。これに対し、編集部5は、顔内部情報記憶部3の顔内部テンプレートを編集し編集結果が合成部6に出力される。
また、ステップ9にて、合成部6は、顔外部情報記憶部4の顔外部テンプレートと編集結果とを合成し、一時テンプレートを生成する。
さらに、ステップ10にて、合成部6は、顔サイズに合わせて、この一時テンプレートを拡大/縮小し、ステップ11にて、合成部6は、その結果を一時テンプレートとして、相関演算部7へ返す。
ステップ12にて、相関演算部7は、特徴量マップと一時テンプレートとを用いて相関演算を行い、相関値マップを求める。
そして、ステップ13にて、求めた相関値マップが、一時相関値マップ記憶部11に格納された相関値マップよりも、高い相関値を示す場合のみ、ステップ14にて、相関演算部7は、一時相関値マップ記憶部11の相関値マップを更新する。ステップ15にて、相関演算部7は、ステップ15にて、生成対象を一つすすめ、処理がステップ7へ戻る。
ステップ16では、相関演算部7は、一時相関値マップ記憶部11に格納された最高の相関値による相関値マップを、結果出力部13に出力し、一時相関値マップ記憶部11の相関値を、最低の相関値による相関値マップに戻す。
ステップ17にて、結果出力部13は、検出結果を抽出し、この画像処理装置の外部と相関演算部7とに出力する。
ステップ3からステップ17の処理は、終了に至るまで(ステップ18)繰り返される。
さて、図1において、編集部3における編集は、人の顔向きによって、顔部品がどのように移動し、どのように変形するかという点を、考慮したものに他ならない。よって、図5(a)から図5(i)のうち、特定の一時テンプレートで相関をとり、もっとも高い相関値が得られたということは、とりもなおさず、人の顔向きが、この特定の一時テンプレートが示す顔向きになっていることを示す。
編集部5と合成部6とを設けることにより、図5(a)と図5(b)とのわずか2つのテンプレートから、様々な顔向き、顔サイズの顔検出を行える。
例えば、図9(a)に示すように、人の顔が左を向いていても、図9(b)に示すように、顔検出できる。また、図9(c)に示すように、人の顔が右下を向いていても、図9(d)に示すように、顔検出できる。一般に、顔部品が顔外部テンプレート内に含まれていれば、顔向きに対してロバストに顔検出できる。
さらに、生成する顔向きを全ての顔向きとするのではなく、図8に示す生成規則によって、前フレームの顔向きから生じやすい一定の顔向きに限定している。これにより、図1に丸印で示したループ(図3のステップ7からステップ15)の発生回数を減らして、処理負担を軽減できる。
(実施の形態2)
以下、実施の形態2については、実施の形態1との相違点を中心に説明する。さて、図10は、本発明の実施の形態2における画像処理装置の機能ブロック図である。また、図2の構成は、実施の形態2にも同様に適用できる。
図10において、顔外部相関値マップ生成部30は、入力画像と顔外部テンプレートとを用いて相関演算し顔外部相関値マップを、再探索範囲決定部60へ出力する。
動き領域情報生成部40は、入力画像について動き領域を求め、動き領域情報を、再探索範囲決定部60へ出力する。
前フレーム画像記憶部50は、前フレームの画像を記憶する。
再探索範囲決定部60は、顔外部相関値マップと動き領域情報とに基づいて、入力画像における再探索範囲を求め、再探索範囲情報を顔内部相関値マップ生成部70へ出力する。
再探索範囲決定部60は、顔外部相関値マップが示す入力画像における一定範囲と、動き領域情報が示す動き領域とが、重複する範囲を再探索範囲とする。
顔内部相関値マップ生成部70は、再探索範囲情報が示す再探索範囲内において、入力画像と顔内部テンプレートとを用いて相関演算し顔内部相関値マップを、結果出力部80へ出力する。
結果出力部80は、顔内部相関値マップに基づいて入力画像内の顔を検出し、検出結果(顔位置、顔サイズ、顔向き等)を出力する。
次に、図11を用いて、顔外部相関値マップ生成部30について、説明する。
さて本形態では、簡単のため、入力画像は、明るさの表現として代表的な輝度Y0(x,y)(8ビット)を持ち、この輝度Y0(x,y)により処理を行うものとする。
ここで、輝度Y0(x,y)を、別の階調を持つようにしても良いし、輝度ではなく別の明るさの別の表現を用いても良い。また、入力画像は、グレースケールの画像であっても良いし、カラー画像から輝度Y0(x,y)を分離しても良い。
入力画像のデータ形式は、動画であり、フレーム単位で処理を行う。なお、フィールド構造を持つ動画については、奇数フィールドと偶数フィールドとを合わせた一枚の絵にしてから処理を行うと良い。
また、入力画像としては、図2のカメラ22によりリアルタイムで撮像したものを用いても良いし、過去に撮像され、かつ、RAM18又は記録媒体19等の記憶装置に格納されているものでも良い。
図11において、特徴量抽出部31は、入力画像より特徴量を抽出して評価ベクトルを生成する。直交変換部32は、評価ベクトルを直交変換する。
積和部33は、顔外部情報記憶部4の顔外部テンプレートと入力画像とのそれぞれについて得た、直交変換後の各評価ベクトルについて、対応スペクトルデータを積和計算する。
ここで、顔外部情報記憶部4の顔外部テンプレートについては、実施の形態1(図4及び図5(b)参照)と同様である。ただし、本形態の顔外部テンプレートは、単独で使用され、顔内部テンプレートと合成されない。
逆直交変換部34は、積和計算結果を、逆直交変換して相関値マップを生成する。
以上における直交変換及び逆直交変換は、いずれも線形性をもつものである。
なお本形態では、相関演算による相関値マップ出力に直交変換を用いたが、フィルタ処理による畳み込み演算によって相関演算し、相関値マップを作成してもかまわない。
フィルタ記憶部35には特徴量抽出部31が使用するフィルタが格納されている。
フィルタとして、xy方向のSobelフィルタ2枚Sx(x,y),Sy(x,y)を用いた。このフィルタを用いて特徴量抽出部31は、特徴量としてxy平面内のエッジベクトルY1x(x,y),Y1y(x,y)を出力し、エッジベクトル記憶部36に格納する。
図15(b)は現在のフレーム画像を示し、図5(a)は前フレーム画像を示す。この時、入力画像Y0(x,y)が特徴量抽出部31に入力されると、特徴量のエッジベクトルがエッジベクトル記憶部36に格納される。
エッジベクトル記憶部36のエッジベクトルY1x(x,y),Y1y(x,y)に対し二乗和を取ったものにルート計算することで算出されるエッジ強度Y1(x,y)は、図15(c)のようになる。
簡単のため、特徴量はエッジベクトルのみを説明するが、輝度値や色などの、他の特徴量においても、本発明と同様の効果がある。
次に、直交変換部32が、エッジベクトルY1x(x,y),Y1y(x,y)を用いて直交変換し、周波数スペクトルY2x(u,v),Y2y(u,v)を出力して周波数スペクトル記憶部37に格納する。
ここで、本形態において、このような直交変換として、FFT(高速離散フーリエ変換)を使用することとするが、他に、Hartley変換や数論的変換などを用いることもでき、以下の説明において、「フーリエ変換」とあるのを、これらの変換に置き換えて適用することができる。
具体的に、逆直交変換部34の出力における相関値は、次式で定義される。
Figure 2005071344
ここで、(数1)では、加算、乗算のみからなるので、類似値は、入力画像及びテンプレート画像のそれぞれの評価ベクトルについて、線形である。したがって、(数1)をフーリエ変換すると、フーリエ変換の離散相関定理(参考文献:高速フーリエ変換 宮川洋訳 科学技術出版社)により、
Figure 2005071344
となる。
また、(数2)を逆フーリエ変換すれば、(数1)の相関値が得られる。そして、(数2)から、直交変換後の変換値において、テンプレート画像と入力画像のフーリエ変換値は単純に積和すれば良いことが分かる。即ち、直交変換することにより、フィルタによる畳み込み演算を単純な積和演算で同様の結果を出力することが可能であり、処理速度を高速化できる。
この離散相関定理を利用し、直交変換部32で、評価ベクトルであるエッジベクトルY1x(x,y),Y1y(x,y)をフーリエ変換して周波数スペクトルY2x(u,v),Y2y(u,v)を周波数スペクトル記憶部37に格納する。
積和部33では、周波数スペクトル記憶部37のスペクトルY2x(u,v),Y2y(u,v)と、顔外部情報記憶部4の顔外部テンプレートT1x(u,v),T1y(u,v)を用いて(数2)の積和を実行し、積和結果R(u,v)を積和結果記憶部38に格納する。
格納されている積和結果R(u,v)を用いて逆直交変換部34が、相関値マップCrr(x、y)に変換し、相関値マップ記憶部39に格納する。
積和部33と、逆直交変換部34の処理は、顔外部テンプレートの枚数nだけ繰り返され、出力された相関値マップCrr(x,y)は、相関値マップ記憶部39に重ね合わせられる。
具体的には、相関値マップCrr(x,y)の各要素(x,y)において、相関値マップ記憶部39のデータより高い相関値である場合、相関値マップ記憶部39の要素(x,y)が更新される。最終的に、相関値マップ記憶部39に残ったデータが相関値マップとして出力される。
図16に示すように、図15(c)に示すエッジ強度分布上で、顔外部テンプレートを走査し、相関演算を行うと、図17(c)のような相関値マップCrr(x,y)が出力できる。なお、図17に表示される閉じた線は、相関値の等高線である。
また、相関演算に直交変換を用いる場合には、テンプレートを事前に周波数スペクトルに変換しておくとよい。こうすると、相関演算時にテンプレートの読み出しだけで済むから、一層高速化できる。以上で、顔外部相関値マップ生成部30の説明を終える。
さて、次に図10に示した動き領域情報生成部40について、図12を用いて説明する。図12に示すように、動き領域情報生成部40は、次の要素を有する。
動きベクトル検出部41は、入力画像を構成する複数の部分領域(本形態では、8×8画素のマクロブロック)について動きベクトルを検出する。動きベクトル検出部41は、前フレーム画像記憶部50から前フレーム画像を入力し、入力画像(現フレーム画像)と、動き補償フレーム間予測に基づいて動きベクトルを求める。
グローバル動きベクトル検出部42は、入力画像全体におけるグローバル動きベクトルを検出する。グローバル動きベクトル検出部42は、動きベクトル検出部の検出結果を平均したものをグローバル動きベクトルとするようにしてもよい。
また、図2に示すように、カメラ22にジャイロ23が一体的に装備されているときには、グローバル動きベクトル検出部42を、ジャイロ23により構成し、グローバル動きベクトルをハードウエアで直接検出するようにしてもよい。
図12において、動き領域抽出部43は、動きベクトル検出部41の検出結果(動きベクトル情報)と、グローバル動きベクトル検出部42の検出結果(グローバル動きベクトル情報)とに基づいて、動き領域を求める。
次に、図12の動きベクトル検出部41、グローバル動きベクトル検出部42、動き領域抽出部43について、図18を用いて説明する。
動きベクトル検出部41は、ブロックマッチングにより画像の各マクロブロック(8x8画素)における動きベクトルを算出する。具体的には、図18(a)に示すように、現フレーム画像をマクロブロックに分割し、各ブロックごとに、そのブロックが前フレームの何処からきたかを検出する。検出した時の現フレームのマクロブロックが動いた方向と距離を動きベクトル(図18(a)の実線矢印)として表す。
より具体的には、現フレーム画像のマクロブロックに対し、
Figure 2005071344
となるようなマクロブロックを検出し、動きベクトルを検出する。
動きベクトル検出部41は、動きベクトルを検出する手法であれば、ブロックマッチングのほか、勾配法や、他手法を用いてもかまわない。
また、図12において、動きベクトル検出部41は、MPEGなどの動画圧縮の際に検出する動きベクトルを取り出して動きベクトル記憶部10に記憶するなど、動き補償フレーム間予測に基づく動きベクトルを再利用してもよい。この場合、MPEGと顔検出で重複して動きベクトルを検出することがなく、高速化できる。
グローバル動きベクトル検出部42は、動きベクトル記憶部10の動きベクトルを用いて、カメラのフレーム移動による画像全体の動きベクトルを検出し、グローバル動きベクトル記憶部11に格納する。
演算により、グローバル動きベクトルを検出するには、グローバル動きベクトルを、動きベクトルの平均とすればよい。すなわちグローバル動きベクトル(Gx,Gy)は、
Figure 2005071344
により、算出する。図18(a)における破線矢印は、グローバル動きベクトルである。
グローバル動きベクトルの算出については、マクロブロックの中で、もっとも頻度の高い動きベクトルをグローバル動きベクトルをするなど、他手法を用いてもかまわない。
上述したように、グローバル動きベクトルは、ジャイロ23により直接計測してもよい。この場合、ハードウェアによる計測のため、プログラムの負荷が低減し、高速化が可能であり、さらにグローバル動きベクトルの精度も高く、ひいては顔検出精度の向上につながる。
動き領域抽出部43は、グローバル動きベクトル(Lxij,Lyij)とグローバル動きベクトル(Gx,Gy)との差分、すなわち、
Figure 2005071344
がゼロベクトルでないマクロブロックを求め、このマクロブロックから構成される領域を、動き領域とする。図18(a)の例では、図18(b)に斜線で示した領域が、動き領域とされる。この動き領域には、顔画像が存在する蓋然性が高い。
さて図19は、顔外部テンプレートによる相関値マップCrr(x,y)と、動き領域とを、重ね合わせたものである。再探索範囲決定部60は、動き領域内で、相関値が高い点とその周辺を、再探索範囲(太枠内)61とする。
再探索範囲61は、顔内部相関値マップ生成部70が、顔内部テンプレートを走査する範囲である。
次に、図13及び図14を用いて、顔内部相関値マップ生成部70について説明する。図13に示すように、顔内部相関値マップ生成部70は、入力画像(現フレーム)と再探索範囲情報とを入力する相関演算部71と、顔内部テンプレートを記憶する顔内部情報記憶部72とを備える。
ここで、顔内部情報記憶部72が記憶する顔内部テンプレートは、実施の形態1と異なり、図14(a)から図14(i)に示すように、顔向きごとに用意されているものとする。勿論、実施の形態1と同様に、動的に生成してもよい。
ただし、上述したように、顔外部テンプレートが、既に再探索範囲を限定するために使用済みであるから、実施の形態2では、顔外部テンプレートと顔内部テンプレートとを合成しない。しかしこれは、これらのテンプレートの合成を禁止する趣旨ではない。
図13に示す相関演算部71は、再探索範囲61内で、顔内部テンプレートを用いて第2の相関演算を行い、顔内部相関値マップを出力する。
相関演算の出力の中で最大の相関値を示した、顔内部テンプレートの中心位置が、求める顔位置とされ、その顔内部テンプレートのサイズが、顔サイズとされる。
図21に顔検出結果を例示している。図示しているように、再探索範囲内において、最も相関値が高い点(i,j)を顔位置となり、この時の顔内部テンプレートのサイズが、検出された顔の大きさを示す。
次に、図10及び図22を参照しながら、実施の形態2における画像処理の各過程を説明する。まず、ステップ21にて、新たなフレームの画像が入力される。
すると、ステップ22にて、顔外部相関値マップ生成部30が、入力画像に対して顔外部テンプレートによる相関演算を行って、顔外部相関値マップを生成する。
また、ステップ23にて、動き領域情報生成部40が、動きベクトル及びグローバル動きベクトルに基づいて、動き領域情報を生成する。
なお、ステップ22とステップ23の順序は、逆でも良いし、並行させても良い。
次に、ステップ24にて、再探索範囲決定部60は、顔外部相関値マップと動き領域情報とに基づいて、再探索範囲を求める。
次に、ステップ25にて、顔内部相関値マップ生成部70は、顔内部テンプレートを用いて、再探索範囲内において、相関演算を行い、顔内部相関値マップを生成する。
次に、ステップ26にて、結果出力部80は、顔内部相関値マップに基づいて、顔の位置、サイズ、向きを求め、検出結果として出力する。
そして、ステップ27にて、動き領域情報生成部40は、現フレームの入力画像を前フレーム画像記憶部50に格納し、終了しない限り(ステップ28)、次のフレーム画像の入力を待ち、ステップ21からステップ28までの処理が繰り返される。
余の点は、実施の形態1と同様である。
(実施の形態3)
以下、実施の形態3について、実施の形態1、2との相違点を中心に説明する。図23は、本発明の実施の形態3における画像処理装置の機能ブロック図である。また、図2の構成は、実施の形態3にも同様に適用できる。
図23において、顔外部評価値マップ算出部80の各学習部81は、顔外部情報と顔以外の背景情報を、複数のサンプルを用いて学習し、顔外部か背景かを判別し、顔外部評価値(入力画像の各位置における顔外部らしさを表す)を出力する。この処理が、入力画像上をラスタスキャンしつつ行われ、第1評価値合算部82は、顔外部評価値マップを作成し、このマップを再探索範囲決定部83と結果出力部87とへ出力する。
最探索範囲決定部83は、顔外部評価値マップに基いて再探索範囲を決定し、その情報を顔内部評価値マップ算出部84へ出力する。なお、最探索範囲決定部83は、顔外部評価値マップにおいて、特定閾値以上の評価値を示す領域を再探索範囲とする。
顔内部評価値マップ算出部84の各学習部85は、顔内部情報と顔以外の背景情報を、複数のサンプルを用いて学習し、顔内部か背景かを判別し、顔内部評価値(入力画像の各位置における顔内部らしさを表す)を出力する。第2評価値合算部86は、再探索範囲情報が示す最探索範囲内において、顔内部評価値マップを作成し、そのマップを結果出力部87へ出力する。
結果出力部87は、顔外部評価値マップと顔内部評価値マップとに基き、顔位置、顔サイズ、顔向きを特定する。
次に、各学習部81、85において用いられる学習データの作成について説明する。
顔と顔以外(非顔)を識別する学習部を設計する場合、顔/非顔の特徴ベクトルそれぞれに教師データTi(1≦i≦L)を割り当てる。この教師データTiは、顔の特徴ベクトルのとき「Ti=+1」と設定され、非顔の特徴量ベクトルのとき「Ti=−1」と設定される。
顔外部評価値マップ算出部80の各学習部81には、顔外部情報を顔とする教師データを与え、顔内部評価値マップ算出部84の各学習部85には、顔内部情報を顔とする教師データを与える。
顔/非顔データベースの生成には、特徴量ベクトルと教師ベクトルを用いたアンサンブル学習法(例えば、Boosting手法等)による学習が行われる。入力画像の特徴量ベクトルをSi(1≦i≦L)とし、アンサンブル学習で生成された学習部の数をM、その値をhj(Si)、その重み(重要度)をαjとする(ただし、1≦i≦L、1≦j≦M)。ここで、各学習部81は、顔のとき「1」を出力し、非顔のとき「−1」を出力するように正規化されているものとする。
次に、顔外部評価値マップ算出部80と顔内部評価値マップ算出部84について詳しく説明する。
顔外部評価値マップ算出部80と顔内部評価値マップ算出部84の構成は同じであり、学習に用いる学習画像が異なるのみである。顔外部評価値マップ算出部80は、顔の特徴データ作成のため、図24(a)に示すように、多くの人の各種顔向き画像(上下左右)を、学習画像として入力し、顔外部情報の学習データとする。顔内部評価値マップ算出部84は、顔の特徴データ作成のため、図24(b)に示すように、多くの人の正面顔画像の顔部品を学習画像として入力し、これを顔内部情報の学習データとする。
顔外部評価値マップ算出器80は、M個の学習部81(O1、O2、…、OM)と第1評価値合算部82とから構成される。
各学習部81は、値hj(Si)、重みαjを持つ。評価する入力画像の輝度値を特徴とし、この特徴ベクトルをXn(0<=n<L:L次元)とすると、i番目の学習部の評価値Hi(Xn)は
Figure 2005071344
となり、第1評価値合算部82は、評価値Hiを
Figure 2005071344
により合算する。評価値Hiが閾値th以上のとき顔外部であることが識別でき、評価値Hiが閾値th未満のとき顔外部以外(非顔)であることが識別できる。
各学習部81の値hi(Xn)は、入力された特徴ベクトルXnが顔であれば「1」となり、非顔であれば「−1」となる。
顔内部評価値マップ算出部84は、学習に用いる学習画像が異なる点を除けば、顔外部評価値マップ算出部80と同様である。
次に、結果出力部87による顔検出結果出力の詳細について説明する。顔内部評価値マップは、再探索範囲決定部83により決定された再探索範囲(顔外部情報に近しい領域)に限定した顔内部評価の結果を示す。顔内部評価値マップのピークが、図25(a)における×印の位置にあるとき、結果出力部87は、この位置から一定距離dist以内の範囲に、顔外部評価値マップのピークが存在するかを調査する。
図25(b)における+印の位置に、顔外部評価値マップのピークが存在し、このピークが顔内部評価値マップのピークと重なった場合、顔は、図25(c)に示す、位置及び顔サイズで存在することが分かるし、さらに、その顔は、正面を向いていることが分かる。
顔内部評価値マップのピークが、図25(d)における×印の位置に存在し、この位置から一定距離dist以内の範囲において、顔外部評価値マップのピークが、図25(e)における+印の位置に存在する場合、図25(f)に示すように、顔外部のピークに対し顔内部のピークが左にずれており、顔は、左向きであることが分かる。
ここで、本明細書にいう「プログラムをコンピュータ読み取り可能に記録した記録媒体」には、複数の記録媒体にプログラムを分散して配布する場合を含む。また、このプログラムが、オペレーティングシステムの一部であるか否かを問わず、種々のプロセスないしスレッド(DLL、OCX、ActiveX等(マイクロソフト社の商標を含む))に機能の一部を肩代わりさせている場合には、肩代わりさせた機能に係る部分が、記録媒体に格納されていない場合も含む。
図1又は図10には、スタンドアロン形式のシステムを例示したが、サーバ/クライアント形式にしても良い。つまり、1つの端末機のみに、本明細書に出現する全ての要素が含まれている場合の他、1つの端末機がクライアントであり、これが接続可能なサーバないしネットワーク上に、全部又は一部の要素が実存していても差し支えない。
さらには、図1又は図10のほとんどの要素をサーバ側で持ち、クライアント側では、例えば、WWWブラウザだけにしても良い。この場合、各種の情報は、通常サーバ上にあり、基本的にネットワークを経由してクライアントに配布されているものだが、必要な情報が、サーバ上にある時は、そのサーバの記憶装置が、ここにいう「記録媒体」となり、クライアント上にある時は、そのクライアントの記録装置が、ここにいう「記録媒体」となる。
さらに、この「プログラム」には、コンパイルされて機械語になったアプリケーションの他、上述のプロセスないしスレッドにより解釈される中間コードとして実存する場合や、少なくともリソースとソースコードとが「記録媒体」上に格納され、これらから中間コードのアプリケーションを生成できるインタープリタが「記録媒体」にある場合なども含む。この記録媒体には、由来のデータと顔テンプレートとを用いて相関演算するステップと、相関演算結果に基づいて、入力画像内の顔を検出するステップとを含み、顔テンプレートは、顔内部テンプレートと顔外部テンプレートとに分けて管理される、画像処理プログラムがコンピュータ読み取り可能に記録される。
本発明に係る画像処理装置は、例えば、画像における顔検出等あるいはその応用技術分野において有用である。
本発明の実施の形態1における画像処理装置の機能ブロック図 同画像処理装置のブロック図 同画像処理装置のフローチャート (a)同顔外部・顔内部テンプレートの作成過程説明図 (b)同顔外部・顔内部テンプレートの作成過程説明図 (c)同顔内部テンプレートの作成過程説明図 (d)同顔外部テンプレートの作成過程説明図 (a)同顔内部テンプレートの例示図 (b)同顔外部テンプレートの例示図 (a)同一時テンプレートの例示図 (b)同一時テンプレートの例示図 (c)同一時テンプレートの例示図 (d)同一時テンプレートの例示図 (e)同一時テンプレートの例示図 (g)同一時テンプレートの例示図 (h)同一時テンプレートの例示図 (i)同一時テンプレートの例示図 (a)同顔内部テンプレートの編集過程説明図 (b)同顔内部テンプレートの編集過程説明図 (c)同一時テンプレートの例示図 (a)同入力画像の例示図 (b)同顔検出結果の例示図 (c)同入力画像の例示図 (d)同顔検出結果の例示図 (a)同生成規則の例示図 (b)同生成規則の例示図 (c)同生成規則の例示図 (d)同生成規則の例示図 (e)同生成規則の例示図 (f)同生成規則の例示図 (g)同生成規則の例示図 (h)同生成規則の例示図 (i)同生成規則の例示図 本発明の実施の形態2における画像処理装置の機能ブロック図 同顔外部相関値マップ生成部の詳細図 同動き領域情報生成部の詳細図 同顔内部相関値マップ生成部の詳細図 (a)同顔内部テンプレートの例示図 (b)同顔内部テンプレートの例示図 (c)同顔内部テンプレートの例示図 (d)同顔内部テンプレートの例示図 (e)同顔内部テンプレートの例示図 (g)同顔内部テンプレートの例示図 (h)同顔内部テンプレートの例示図 (i)同顔内部テンプレートの例示図 (a)同前フレームの入力画像例示図 (b)同現フレームの入力画像例示図 (c)同エッジ強度分布の例示図 同顔外部テンプレートによる相関演算説明図 同顔外部相関値マップの例示図 (a)同動き領域の抽出過程説明図 (b)同動き領域の抽出過程説明図 同再探索範囲の例示図 同顔内部相関演算の説明図 同顔検出結果の例示図 同画像処理装置のフローチャート 本発明の実施の形態3における画像処理装置の機能ブロック図 (a)同特徴データの説明図 (b)同特徴データの説明図 (a)同結果出力部の処理説明図 (b)同結果出力部の処理説明図 (c)同結果出力部の処理説明図 (d)同結果出力部の処理説明図 (e)同結果出力部の処理説明図 (f)同結果出力部の処理説明図 (a)本発明の実施の形態1における顔検出の態様説明図 (b)同顔検出の態様説明図
符号の説明
1 特徴量抽出部
2 一時テンプレート生成部
3 顔内部情報記憶部
4 顔外部情報記憶部
5 編集部
6 合成部
7 相関演算部
8 特徴量マップ記憶部
9 生成規則記憶部
10 一時テンプレート記憶部
11 一時相関値マップ記憶部
12 生成パラメータ記憶部
13、80 結果出力部
15 CPU
16 バス
17 ROM
18 RAM
19 記録媒体
20 プログラム領域
21 インターフェイス
22 カメラ
23 ジャイロ
30 顔外部相関値マップ生成部
40 動き領域情報生成部
41 動きベクトル生成部
42 グローバル動きベクトル生成部
43 動き領域抽出部
50 前フレーム画像記憶部
60 再探索範囲決定部
61 再探索範囲
70 顔内部相関値マップ生成部
71 相関演算部
72 顔内部情報記憶部
80 顔外部評価マップ算出部
81、85 学習部
82 第1評価値合算部
83 再探索範囲決定部
84 顔内部評価値マップ算出部
86 第2評価値算出部
87 結果出力部

Claims (31)

  1. 入力画像由来のデータと顔テンプレートとを用いて相関演算するステップと、
    相関演算結果に基づいて、前記入力画像内の顔を検出するステップとを含み、
    前記顔テンプレートは、顔内部テンプレートと顔外部テンプレートとに分けて管理される、画像処理方法。
  2. 前記入力画像由来のデータは、少なくとも入力画像のエッジ画像を含む、請求項1記載の画像処理方法。
  3. 前記顔外部テンプレートは、変形させずに用いられ、入力画像中の顔の顔向き、顔傾き及び顔部品の偏りの少なくとも1つに適応可能であり、前記顔内部テンプレートは、変形させて用いられ入力画像中の顔の顔向き、顔傾き及び顔部品の偏りの少なくとも1つに適応可能である、請求項1または2記載の画像処理方法。
  4. 前記相関演算するステップは、さらに
    前記顔外部テンプレートと前記顔内部テンプレートとを、動的に合成して前記顔テンプレートとするステップと、
    前記入力画像由来のデータと前記顔テンプレートとを用いて相関演算するステップとを含む、請求項1、2または3記載の画像処理方法。
  5. 前記相関演算するステップは、さらに
    前記入力画像由来のデータと前記顔外部テンプレートとを用いて相関演算するステップと、
    前記入力画像由来のデータと前記顔内部テンプレートとを用いて相関演算するステップとを含む、請求項1、2または3記載の画像処理方法。
  6. 前記相関演算するステップは、さらに
    前記入力画像由来のデータと前記顔外部テンプレートとを用いて相関演算し、前記相関演算結果に基づいて、探索範囲を前記入力画像の一部の範囲に限定するステップと、
    前記探索範囲内において、前記入力画像由来のデータと前記顔内部テンプレートとを用いて相関演算するステップとを含む、請求項1、2または3記載の画像処理方法。
  7. 前記相関演算するステップは、さらに
    前記入力画像由来のデータと前記顔外部テンプレートとを用いて相関演算するステップと、
    前記入力画像について動き領域を求めるステップと、
    前記顔外部テンプレートを用いた相関演算結果と求めた動き領域とに基づいて、探索範囲を前記入力画像の一部の範囲に限定するステップと、
    前記探索範囲内において、前記入力画像由来のデータと前記顔内部テンプレートとを用いて相関演算するステップとを含む、請求項1または2記載の画像処理方法。
  8. 前記動き領域を求めるステップでは、動き補償フレーム間予測に基づいて動きベクトルが求められる、請求項7記載の画像処理方法。
  9. 前記動き領域を求めるステップは、さらに、
    前記入力画像を構成する複数の部分領域について動きベクトルを検出するステップと、
    前記入力画像全体におけるグローバル動きベクトルを検出するステップと、
    求めた動きベクトルと、求めたグローバル動きベクトルに基づいて、前記動き領域を求めるステップとを含む、請求項7または8記載の画像処理方法。
  10. 前記グローバル動きベクトルを検出するステップでは、動きベクトルの平均を、求めるグローバル動きベクトルとする、請求項9記載の画像処理方法。
  11. 前記グローバル動きベクトルを検出するステップでは、ジャイロを用いてグローバル動きベクトルを求める、請求項9記載の画像処理方法。
  12. 前記顔外部テンプレートは、各種の顔向きにおける顔特徴を複数のサンプルを用いて学習させた結果を反映する、請求項1から11の何れかに記載の画像処理方法。
  13. 前記顔外部テンプレートは、頭部の輪郭情報、顔の輪郭の輝度分布情報及び色分布情報の少なくとも1つを含む、請求項1から11の何れかに記載の画像処理方法。
  14. 前記顔内部テンプレートは、正面顔の顔部品の特徴のみを複数のサンプルを用いて学習させた結果を反映する、請求項1から11の何れかに記載の画像処理方法。
  15. 前記顔内部テンプレートは、顔部品の輪郭情報を含む、請求項1から14の何れかに記載の画像処理方法。
  16. 前記顔部品は、目、眉、口及び鼻のうち、一種又は二種以上の組み合わせから構成される、請求項14または15記載の画像処理方法。
  17. 拡大、縮小、回転及び透視投影変換のうち、一種又は二種以上の組み合わせから構成される編集により、前記顔内部テンプレートは、顔向きにより変化する、請求項15記載の画像処理方法。
  18. 前記顔外部テンプレートは、円状をなす、請求項1から17の何れかに記載の画像処理方法。
  19. 前記顔外部テンプレートは、正面顔のエッジ画像を複数枚重ね、平均したものから顔部品のエッジを削除したものである、請求項1から18の何れかに記載の画像処理方法。
  20. 前記顔内部テンプレートは、正面顔のエッジ画像を複数枚重ね、平均したものから顔部品のエッジを抽出したものである、請求項1から19の何れかに記載の画像処理方法。
  21. 入力画像由来のデータと顔テンプレートとを用いて相関演算し相関値マップを出力する相関演算部と、
    出力された相関値マップに基づいて顔の検出結果を出力する結果出力部と、
    顔内部情報と顔外部情報とを分けて記憶し、生成情報に基づいて、顔内部情報と顔外部情報とを動的に合成した一時テンプレートを生成し、前記相関演算部に生成した一時テンプレートを顔テンプレートとして出力する一時テンプレート生成部とを備える画像処理装置。
  22. 前記一時テンプレート生成部は、さらに
    前記生成情報に基づいて顔内部情報を動的に編集した編集結果を出力する編集部と、
    前記編集結果と顔外部情報とを動的に合成したものを前記一時テンプレートとする合成部とを備える、請求項21記載の画像処理装置。
  23. 前記相関演算部は、所定の生成規則に従って、前フレームにおける顔向きと、この前フレームの顔向きに隣接する顔向きとにおける一時テンプレートを、一つずつ必要回数繰り返して、前記一時テンプレート生成部に生成させ、前記入力画像由来のデータと前記一時テンプレート生成部が生成した一時テンプレートとを用いて相関演算を必要回数繰り返す、請求項21または22記載の画像処理装置。
  24. 前記相関演算部は、繰り返した相関演算のうち、最高の相関値が得られた顔向きにおける相関値マップを、前記結果出力部に出力する、請求項23記載の画像処理装置。
  25. 入力画像と顔外部テンプレートとを用いて相関演算し顔外部相関値マップを出力する顔外部相関値マップ生成部と、
    前記入力画像について動き領域を求め、動き領域情報を出力する動き領域情報生成部と、
    前記顔外部相関値マップと前記動き領域情報とに基づいて、前記入力画像における再探索範囲を求め再探索範囲情報を出力する再探索範囲決定部と、
    前記再探索範囲情報が示す再探索範囲内において、前記入力画像と顔内部テンプレートとを用いて相関演算し顔内部相関値マップを出力する顔内部相関値マップ生成部と、
    前記顔内部相関値マップに基づいて前記入力画像内の顔を検出する結果出力部とを備える画像処理装置。
  26. 前記再探索範囲決定部は、前記顔外部相関値マップが示す前記入力画像における一定範囲と、前記動き領域情報が示す動き領域とが、重複する範囲を前記再探索範囲とする、請求項25記載の画像処理装置。
  27. 前記動き領域情報生成部は、さらに、
    前記入力画像を構成する複数の部分領域について動きベクトルを検出する動きベクトル検出部と、
    前記入力画像全体におけるグローバル動きベクトルを検出するグローバル動きベクトル検出部と、
    前記動きベクトル検出部の検出結果と、前記グローバル動きベクトル検出部の検出結果とに基づいて、前記動き領域を求める動き領域抽出部とを備える、請求項25または26記載の画像処理装置。
  28. 前記動きベクトル検出部は、動き補償フレーム間予測に基づいて動きベクトルを求める、請求項27記載の画像処理方法。
  29. 前記グローバル動きベクトル検出部は、前記動きベクトル検出部の検出結果を平均したものをグローバル動きベクトルとする、請求項27または28記載の画像処理装置。
  30. 前記グローバル動きベクトル検出部は、ジャイロにより、グローバル動きベクトルを検出する、請求項27または28記載の画像処理装置。
  31. 入力画像由来のデータと顔テンプレートとを用いて相関演算するステップと、
    相関演算結果に基づいて、前記入力画像内の顔を検出するステップとを含み、
    前記顔テンプレートは、顔内部テンプレートと顔外部テンプレートとに分けて管理される、画像処理プログラムをコンピュータ読み取り可能に記録した記録媒体。
JP2004229762A 2003-08-07 2004-08-05 画像処理方法、画像処理装置及び画像処理プログラムを記録した記録媒体 Pending JP2005071344A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004229762A JP2005071344A (ja) 2003-08-07 2004-08-05 画像処理方法、画像処理装置及び画像処理プログラムを記録した記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003288824 2003-08-07
JP2004229762A JP2005071344A (ja) 2003-08-07 2004-08-05 画像処理方法、画像処理装置及び画像処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2005071344A true JP2005071344A (ja) 2005-03-17

Family

ID=34425256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004229762A Pending JP2005071344A (ja) 2003-08-07 2004-08-05 画像処理方法、画像処理装置及び画像処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2005071344A (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007156939A (ja) * 2005-12-07 2007-06-21 Honda Motor Co Ltd 人物検出装置、人物検出方法及び人物検出プログラム
JP2008109315A (ja) * 2006-10-24 2008-05-08 Canon Inc 撮像装置及びその制御方法及びプログラム及び記憶媒体
WO2008102473A1 (ja) * 2007-02-20 2008-08-28 Kabushiki Kaisha Toshiba 顔認証装置および顔認証方法
JP2008538623A (ja) * 2005-04-20 2008-10-30 フェデラシオン イタリアーナ ジョッコ カルチオ 運動行為中のイベントを検出及び分類するための方法及びシステム
WO2008142740A1 (ja) * 2007-04-16 2008-11-27 Fujitsu Limited 画像処理方法、画像処理装置、画像処理システム及びコンピュータプログラム
JP2009064123A (ja) * 2007-09-05 2009-03-26 Casio Comput Co Ltd 画像処理装置、撮像装置、画像処理方法、および、プログラム
JP2009237619A (ja) * 2008-03-25 2009-10-15 Seiko Epson Corp 画像における顔領域および器官領域の検出
JP2009237857A (ja) * 2008-03-27 2009-10-15 Seiko Epson Corp 画像における顔の器官の画像に対応する器官領域の設定
JP2010203999A (ja) * 2009-03-05 2010-09-16 Shimadzu Corp 特定部位検出方法、及び該方法を用いた試料分析装置
JP2012073997A (ja) * 2010-09-01 2012-04-12 Ricoh Co Ltd 物体追尾装置、物体追尾方法およびそのプログラム
JP2012123668A (ja) * 2010-12-09 2012-06-28 Panasonic Corp 人検出装置および人検出方法
JP2013535047A (ja) * 2010-05-28 2013-09-09 クゥアルコム・インコーポレイテッド 動的に変化する部分を有するターゲットをトラッキングするためのデータセットの作成
CN106228555A (zh) * 2016-07-22 2016-12-14 湖南文理学院 基于Masi熵测度的灰度图像阈值分割方法
CN106327497A (zh) * 2016-08-29 2017-01-11 湖南文理学院 基于超广延熵的灰度图像阈值分割方法
CN106408586A (zh) * 2016-08-30 2017-02-15 湖南文理学院 基于非广延高斯熵测度的灰度图像分割方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008538623A (ja) * 2005-04-20 2008-10-30 フェデラシオン イタリアーナ ジョッコ カルチオ 運動行為中のイベントを検出及び分類するための方法及びシステム
JP4516516B2 (ja) * 2005-12-07 2010-08-04 本田技研工業株式会社 人物検出装置、人物検出方法及び人物検出プログラム
JP2007156939A (ja) * 2005-12-07 2007-06-21 Honda Motor Co Ltd 人物検出装置、人物検出方法及び人物検出プログラム
US7840036B2 (en) 2005-12-07 2010-11-23 Honda Motor Co., Ltd. Human being detection apparatus, method of detecting human being, and human being detecting program
JP2008109315A (ja) * 2006-10-24 2008-05-08 Canon Inc 撮像装置及びその制御方法及びプログラム及び記憶媒体
WO2008102473A1 (ja) * 2007-02-20 2008-08-28 Kabushiki Kaisha Toshiba 顔認証装置および顔認証方法
US8571322B2 (en) 2007-04-16 2013-10-29 Fujitsu Limited Image processing method, image processing apparatus, image processing system and computer for recognizing shape change of a facial part
JP4781467B2 (ja) * 2007-04-16 2011-09-28 富士通株式会社 画像処理方法、画像処理装置、画像処理システム及びコンピュータプログラム
WO2008142740A1 (ja) * 2007-04-16 2008-11-27 Fujitsu Limited 画像処理方法、画像処理装置、画像処理システム及びコンピュータプログラム
JP2009064123A (ja) * 2007-09-05 2009-03-26 Casio Comput Co Ltd 画像処理装置、撮像装置、画像処理方法、および、プログラム
JP2009237619A (ja) * 2008-03-25 2009-10-15 Seiko Epson Corp 画像における顔領域および器官領域の検出
JP2009237857A (ja) * 2008-03-27 2009-10-15 Seiko Epson Corp 画像における顔の器官の画像に対応する器官領域の設定
JP2010203999A (ja) * 2009-03-05 2010-09-16 Shimadzu Corp 特定部位検出方法、及び該方法を用いた試料分析装置
US9256956B2 (en) 2010-05-28 2016-02-09 Qualcomm Incorporated Dataset creation for tracking targets with dynamically changing portions
JP2013535047A (ja) * 2010-05-28 2013-09-09 クゥアルコム・インコーポレイテッド 動的に変化する部分を有するターゲットをトラッキングするためのデータセットの作成
US9785836B2 (en) 2010-05-28 2017-10-10 Qualcomm Incorporated Dataset creation for tracking targets with dynamically changing portions
JP2012073997A (ja) * 2010-09-01 2012-04-12 Ricoh Co Ltd 物体追尾装置、物体追尾方法およびそのプログラム
JP2012123668A (ja) * 2010-12-09 2012-06-28 Panasonic Corp 人検出装置および人検出方法
US8934674B2 (en) 2010-12-09 2015-01-13 Panasonic Corporation Person detection device and person detection method
CN106228555A (zh) * 2016-07-22 2016-12-14 湖南文理学院 基于Masi熵测度的灰度图像阈值分割方法
CN106327497A (zh) * 2016-08-29 2017-01-11 湖南文理学院 基于超广延熵的灰度图像阈值分割方法
CN106408586A (zh) * 2016-08-30 2017-02-15 湖南文理学院 基于非广延高斯熵测度的灰度图像分割方法

Similar Documents

Publication Publication Date Title
Li et al. PDR-Net: Perception-inspired single image dehazing network with refinement
US8331619B2 (en) Image processing apparatus and image processing method
US7091988B2 (en) Object region data describing method and object region data creating apparatus
JP4642757B2 (ja) 画像処理装置および画像処理方法
US7941002B2 (en) Apparatus and methods of producing photorealistic image thumbnails
JP5432714B2 (ja) 構図解析方法、構図解析機能を備えた画像装置、構図解析プログラム及びコンピュータ読み取り可能な記録媒体
US7860340B2 (en) Three-dimensional shape estimation system and image generation system
JP4880091B2 (ja) 3dテクスチャの超解像のための画像生成装置及び方法
JP2005071344A (ja) 画像処理方法、画像処理装置及び画像処理プログラムを記録した記録媒体
CN103443826B (zh) 网格动画
JPWO2004095374A1 (ja) 映像オブジェクト認識装置および認識方法、映像アノテーション付与装置および付与方法ならびにプログラム
US10412374B2 (en) Image processing apparatus and image processing method for imaging an image by utilization of a pseudo image
JP2018055199A (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP2016212784A (ja) 画像処理装置、画像処理方法
JP5463269B2 (ja) 特徴図形付加方法、特徴図形検出方法、特徴図形付加装置、特徴図形検出装置、およびプログラム
JP2002245455A (ja) 多変量空間処理方法および装置
JP2001143088A (ja) 対象物の表面動き測定方法および装置、ならびに当該方法を実現するようコンピュータを動作させるためのプログラムを記憶したコンピュータ読取可能な記録媒体
JP2002259979A (ja) 画像補間方法と装置、および画像処理方法と装置
JP2007316693A (ja) 画像符号化方法および画像符号化装置
CN113544701A (zh) 关联对象的检测方法及装置
JP2017207960A (ja) 画像解析装置、画像解析方法およびプログラム
JP4171354B2 (ja) カラー画像処理装置及び方法
JP4942197B2 (ja) テンプレート作成装置及び表情認識装置並びにその方法、プログラム及び記録媒体
Shukla et al. Unsteady camera zoom stabilization using slope estimation over interest warping vectors
JP2011086245A (ja) テンプレート作成装置、表情認識装置、テンプレート作成方法、表情認識方法、及びプログラム