JP2009087253A

JP2009087253A - 物体検出装置、物体検出方法及びプログラム

Info

Publication number: JP2009087253A
Application number: JP2007259061A
Authority: JP
Inventors: Yuji Kaneda; 雄司金田; Katsuhiko Mori; 克彦森; Hiroshi Torii; 寛鳥居; Hiroshi Sato; 博佐藤; Takashi Suzuki; 崇士鈴木
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2007-10-02
Filing date: 2007-10-02
Publication date: 2009-04-23

Abstract

【課題】画像から検出対象の物体の検出処理を確実に、かつ、より高速に行えるようにする。
【解決手段】画像取得手段１００１により取得された画像に対して注目領域決定手段１００３で注目領域を決定し、注目領域決定手段１００３で決定された注目領域に検出対象の物体が存在するか否かを物体判別手段１００４で判別し、物体判別手段１００４による検出対象の物体の判別結果に基づいて、当該注目領域から次の注目領域までの移動量及び移動方向を移動情報設定手段１００２で設定する。そして、この際、注目領域決定手段１００３は、移動情報設定手段１００２で設定された内容に基づいて、次の注目領域を設定する。
【選択図】図３

Description

本発明は、画像から検出対象の物体を検出する物体検出装置及び物体検出方法、並びに、物体検出方法をコンピュータに実行させるためのプログラムに関するものである。

画像の中から所定の物体を検出する従来の第１の技術として、例えば、非特許文献１に記載の技術がある。この技術は、例えば、図２７に示すように、カスケード状に組み合わされた弱判別器（弱識別器ともいう）Ｓ、Ｓ＋１、・・・、Ｓ＋Ｎのうちのある弱判別器が画像中の注目領域を所定クラスと判定した場合に、次の弱判別器の処理を実行する。そして、全ての弱判別器を通過したものを所定クラス、例えば、人間の顔と判定する物体検出方法である。

図２７に示す各弱判別器は、例えば、図２８の１０１及び１０２のように、Ｈａｒｒ−ｌｉｋｅ特徴の組み合わせからなる複数の矩形フィルタ群で構成されている。ここで、図２８の１００は、画像中の注目領域である。そして、これらの矩形フィルタ群は、ａｄａＢｏｏｓｔの学習により自動的に選択される。また、入力画像に対してｉｎｔｅｇｒａｌ＿ｉｍａｇｅを作成し、このｉｎｔｅｇｒａｌ＿ｉｍａｇｅを用いて処理を行うことで、高速な物体の検出処理を実現している。

また、画像の中から所定の物体を検出する従来の第２の技術として、例えば、非特許文献２に記載の技術がある。この技術は、濃度平均を用いてテンプレートマッチングの演算処理をカットする手法と、テンプレートマッチングした時の類似度を移動量（＝最大移動量×（１−類似度））にフィードバックするステップ制御の手法を組み合わせるものである。これにより、非特許文献２では、高速テンプレートマッチングを実現している。

また、画像の中から所定の物体を検出する従来の第３の技術として、例えば、非特許文献３に記載の技術がある。この技術は、サポートベクターマシーン（ＳＶＭ）を用いて検出対象物体が現在の領域からどの方向に存在するかを推定することによって、対象物体の追跡を行う技術である。

P. Viola and M. Jones,"Rapid object detection using a boosted cascade of simple features,"In Proc. IEEE CS Conf. Computer Vision and Pattern Recognition, vol.1, pp.511-518, Dec. 2001 安部啓之, "高速テンプレートマッチング", 画像センシングシンポジウム, June. 2004 O. Williams, A. Blake, R. Cipolla,"A Sparse Probabilistic Learning Algorithm for Real-Time Tracking", Proc. Int. Conf. on Computer Vision（ICCV）, 353−360, Oct. 2003

しかしながら、非特許文献１の技術では、注目領域１００である矩形窓を単純に１画像おきの固定量で移動させていたため、背景などの明らかに検出対象の物体（人間の顔）でない領域についても演算処理を行うため、処理の無駄があった。特に、画像中に検出対象の物体が少数しか存在しない場合には、ほとんどの演算処理が無駄になっていた。また、逆に、処理速度を向上させるために、注目領域１００の移動量を大きくすると、検出対象の物体（人間の顔）が検出されない可能性があった。

さらに、非特許文献２及び非特許文献３の技術も、上述した問題点を解決するものではなかった。

本発明は上述した問題点に鑑みてなされたものであり、画像から検出対象の物体の検出処理を確実に、かつ、より高速に行えるようにすることを目的とする。

本発明の物体検出装置は、画像を取得する画像取得手段と、前記画像取得手段により取得された画像に対して注目領域を決定する注目領域決定手段と、前記注目領域決定手段で決定された注目領域に検出対象の物体が存在するか否かを判別する物体判別手段と、前記物体判別手段による検出対象の物体の判別結果に基づいて、当該注目領域から次の注目領域までの移動量及び移動方向のうちの少なくとも一方を設定する設定手段とを有し、前記注目領域決定手段は、前記設定手段で設定された内容に基づいて、前記次の注目領域を設定する。

本発明の物体検出方法は、画像を取得する画像取得ステップと、前記画像取得ステップにより取得された画像に対して注目領域を決定する注目領域決定ステップと、前記注目領域決定ステップで決定された注目領域に検出対象の物体が存在するか否かを判別する物体判別ステップと、前記物体判別ステップによる検出対象の物体の判別結果に基づいて、当該注目領域から次の注目領域までの移動量及び移動方向のうちの少なくとも一方を設定する設定ステップとを有し、前記注目領域決定ステップでは、前記設定ステップで設定された内容に基づいて、前記次の注目領域を設定する。

本発明のプログラムは、画像を取得する画像取得ステップと、前記画像取得ステップにより取得された画像に対して注目領域を決定する注目領域決定ステップと、前記注目領域決定ステップで決定された注目領域に検出対象の物体が存在するか否かを判別する物体判別ステップと、前記物体判別ステップによる検出対象の物体の判別結果に基づいて、当該注目領域から次の注目領域までの移動量及び移動方向のうちの少なくとも一方を設定する設定ステップとをコンピュータに実行させ、前記注目領域決定ステップでは、前記設定ステップで設定された内容に基づいて、前記次の注目領域を設定する。

本発明によれば、画像から検出対象の物体の検出処理を確実に、かつ、より高速に行うことができる。

検出対象の物体の検出処理における処理負荷を軽減するための１つの手法として、いかにして検出対象の物体以外の処理を減らすかということが挙げられる。例えば、検出対象の目的の物体付近の領域では細かく探索し、それ以外の領域では荒く探索を行う方法である。以下に示す実施形態では、現在の注目領域の判別結果に基づいて、検出対象の物体の付近であるか否かを判定することにより、次の注目領域までの移動量を動的に変化させる方法について説明する。

なお、第１の実施形態では、図１に示すように、検出対象の物体が存在しない背景領域での注目領域の移動量はＭｘ２に設定し、検出対象の物体（人間の顔）が存在する顔周辺領域での注目領域の移動量はＭｘ１に設定する物体の検出処理方法について説明する。この際、第１の実施形態では、図１に示すように、注目領域を走査移動する方向は、画像に対して水平方向とする。

また、第２の実施形態では、図２に示すように、検出対象の物体が存在しない背景領域での注目領域の移動方向は水平方向とし、その移動量はＭｘ３に設定する。一方、検出対象の物体（人間の顔）が存在する顔周辺領域での注目領域の移動方向は各弱判別器の出力を用いて全方向のうちの１つの方向を選択して設定され、また、その移動量はＭｘ４、Ｍｙ４等に設定する物体の検出処理方法について説明する。

また、第３の実施形態では、検出対象の物体（人間の顔）が存在しないと判定されるまでの弱判別器の数が所定数以上である場合の物体の検出処理方法について説明する。具体的に、第３の実施形態では、検出対象の物体（人間の顔）が存在しないと判定した弱判別器を構成する各矩形フィルタの出力結果を用いて、検出対象の物体の位置までの移動量を算出する方法について説明する。また、第４の実施形態は、第３の実施形態の変形例であり、検出対象の物体の位置までの移動量に加え、移動方向を決定する方法について説明する。

以下、添付図面を参照しながら、本発明の各実施形態を説明する。

（第１の実施形態）
本発明の第１の実施形態として、取得した画像データが、ある特定のカテゴリーであるかどうか、例えば、人間の顔であるかどうかを高速に演算する物体検出装置及びその方法について説明する。具体的に、本実施形態では、特定のカテゴリーとして、顔と非顔の２クラスを判定する方法について説明する。

図３は、本発明の第１の実施形態に係る物体検出装置の概略構成の一例を示すブロック図である。
図３に示すように、本実施形態の物体検出装置１０００は、画像取得手段１００１と、移動情報設定手段１００２と、注目領域決定手段１００３と、物体判別手段１００４とを有して構成されている。

画像取得手段１００１は、まず、撮像レンズ群、絞り装置及びシャッタ装置を備えた光量調節装置から得られる光束を、ＣＣＤやＣＭＯＳ等の撮像素子により電気信号に変換する。次に、画像取得手段１００１は、撮像素子により得られるアナログの電気信号をデジタル信号に変換するアナログ／デジタル（以下、「Ａ／Ｄ」とする）変換器を通すことにより、デジタル画像を取得する。そして、画像取得手段１００１は、取得したデジタル画像を、メモリなどの内部の記憶媒体に一時的に保持する。更に、画像取得手段１００１は、内部の記憶媒体に保持しているデジタル画像に対して、インテグラルイメージを生成し取得する。なお、インテグラルイメージの詳細に関しては、後述するが、非特許文献１でも記載されている。

移動情報設定手段１００２は、本実施形態においては、移動情報として移動量を設定する。具体的に、本実施形態の移動情報設定手段１００２は、前の注目領域における検出対象の物体の検出結果（判別結果）に基づいて、次の注目領域までのＸ方向（水平方向）の移動量Ｍｘを設定する。

注目領域決定手段１００３は、画像取得手段１００１により取得された画像に対して、検出対象の物体の検出処理（判別処理）を行う注目領域を決定する。具体的に、注目領域決定手段１００３は、移動情報設定手段１００２で設定された移動情報（本実施形態では、Ｘ方向の移動量Ｍｘ）の内容に基づいて、注目領域の決定を行う。なお、注目領域とは、図２８に示す領域１００のことであり、本実施形態では固定サイズとする。

物体判別手段１００４は、注目領域決定手段１００３で決定された注目領域に検出対象の物体が存在するか否かを判別する。具体的に、本実施形態の物体判別手段１００４は、検出対象の物体として人間の顔の判別を行う。そして、物体判別手段１００４は、注目領域決定手段１００３で決定された注目領域と、画像取得手段１００１で取得したインテグラルイメージ（画像）を用いることにより顔判別を行う。

図４は、本発明の第１の実施形態に係る物体検出装置の処理手順の一例を示すフローチャートである。このフローチャートを用いて、第１の実施形態に係る物体検出装置１０００による物体検出方法を、以下に詳細に説明する。

まず、図４のステップＳ１１０１において、画像取得手段１００１は、デジタル画像を取得し保持する。

続いて、ステップＳ１１０２において、画像取得手段１００１は、ステップＳ１１０１で取得したデジタル画像に基づいて、インテグラルイメージを生成し取得する。

図５は、インテグラルイメージを生成する際の処理を説明するための模式図である。
具体的に、画像取得手段１００１は、インテグラルイメージを生成し取得する際、まず、カラーデジタル画像をグレースケール、つまり各画素値が輝度値として表現されるように変換した後、解像度変換によりピラミッド画像を生成する。次に、画像取得手段１００１は、各ピラミッド画像に対して画像始点（図５の画像の左上画素Ａ）から注目画素（図５の画像の左上画素Ｂ）までを対角線とする矩形領域１２００内の画素値の総和を注目画素の画素値として表現するインテグラルイメージを生成する。このインテグラルイメージを利用すると、高速に、任意の矩形領域内の画素値の総和を求めることができる。

続いて、ステップＳ１１０３において、移動情報設定手段１００２は、現在の注目領域から次の注目領域までの移動量Ｍを設定する。

具体的に、本実施形態の移動情報設定手段１００２は、Ｘ方向（水平方向）の移動量Ｍｘとして、図１に示すように、検出対象の物体（人間の顔）が存在する顔周辺領域での注目領域のＸ方向の移動量をＭｘ１と設定する。また、移動情報設定手段１００２は、Ｘ方向（水平方向）の移動量Ｍｘとして、図１に示すように、検出対象の物体が存在しない背景領域での注目領域のＸ方向の移動量をＭｘ２（Ｍｘ２＞Ｍｘ１）として設定し、Ｘ方向については２つの移動量を設定する。つまり、本実施形態の移動情報設定手段１００２は、背景領域ではＸ方向の移動量を大きくし、顔周辺領域ではＸ方向の移動量を小さくする設定を行う。

また、本実施形態では、図１に示すように、注目領域の設定の開始位置を画像内の左端とし、また、注目領域を移動量Ｍｘで右方向に移動させるものとする。また、本実施形態の移動情報設定手段１００２は、Ｙ方向（垂直方向）の移動量Ｍｙとして、所定画素おきの固定値Ｍｙ１と設定する。ここで、Ｘ方向の移動量ＭｘとＹ方向の移動量Ｍｙの設定方法は後述する。

続いて、ステップＳ１１０４において、注目領域決定手段１００３は、ステップＳ１１０３で設定された移動量Ｍに基づいて、検出対象の物体の検出処理（判別処理）を行う注目領域を決定する。

図６は、現在の注目領域の一例を示す模式図である。
ステップＳ１１０４では、注目領域決定手段１００３により、例えば、図６に示す注目領域１３００の決定がなされる。なお、前の注目領域が存在しない場合、つまり、最初の注目領域の決定を行う場合、注目領域決定手段１００３は、当該注目領域の左上座標を（０，０）とする注目領域の決定を行う。ここで、移動量の算出方法と注目領域の決定方法については後述する。

続いて、ステップＳ１１０５において、物体判別手段１００４は、例えば、非特許文献１に記載されているａｄａＢｏｏｓｔアルゴリズムの学習により選択された図２８に示す矩形フィルタ群を構成する弱判別器Ｓ（Ｓ＞０）を用いた判別処理を行う。なお、この弱判別器Ｓは、物体判別手段１００４内に備えられているものとする。

本実施形態においては、矩形フィルタ群の種類や弱判別器Ｓの数などは、設計者が予め設定するものとする。弱判別器による判別処理の方法としては、まず、例えば、インテグラルイメージを用いることにより、図２８の矩形フィルタ１０１の黒領域の輝度総和値Ｓｂ１及び白領域の輝度総和値Ｓｗ１を算出し、これらの値の差Ｓｕｂ１（＝Ｓｗ１−Ｓｂ１）を計算する。ここで、図２８に示す矩形フィルタ（１０１、１０２）は、注目領域決定手段１００３で決定された注目領域内の少なくとも１つ以上の所定領域に対してフィルタ処理を行うものである。そして、差Ｓｕｂ１（＝Ｓｗ１−Ｓｂ１）が所定の閾値Ｔｈ１よりも大きいか否かの判定を、当該弱判別器を構成する矩形フィルタの数だけ実行することによって行われる。

ここで、本実施形態の物体判別手段１００４は、矩形フィルタの白領域の輝度総和値Ｓｗ１と黒領域の輝度総和値Ｓｂ１との差Ｓｕｂ１と所定の閾値Ｔｈ１とを比較し、差Ｓｕｂ１が所定の閾値Ｔｈ１以下と判定された時点で処理を終了するようにしている。しかしながら、例えば、差Ｓｕｂ１（＝Ｓｗ１−Ｓｂ１）を得点化して弱判別器毎に得点の総和値を算出して当該得点の総和値を用いることにより、判別処理を行うようにしても良い。

続いて、ステップＳ１１０６において、物体判別手段１００４は、ステップＳ１１０５の弱判別器Ｓによる判別処理の結果に基づいて、顔候補と判定されるか否かを判断する。この判断の結果、顔候補でないと判定された場合（具体的には、差Ｓｕｂ１が所定の閾値Ｔｈ１以下と判定された場合）には、ステップＳ１１０３に戻る。そして、ステップＳ１１０３において、次の注目領域までのＸ方向の移動量Ｍｘが設定される。一方、ステップＳ１１０６の判断の結果、顔候補と判定された場合（具体的には、差Ｓｕｂ１が所定の閾値Ｔｈ１よりも大きいと判定された場合）には、ステップＳ１１０７へ進む。

ステップＳ１１０７に進むと、物体判別手段１００４は、全ての弱判別器による判別処理を実行したか否かを判断する。この判断の結果、全ての弱判別器による判別処理の実行は行われていない場合には、ステップＳ１１０８に進む。ステップＳ１１０８に進むと、物体判別手段１００４は、次の弱判別器（Ｓ←Ｓ＋１）の選択を行う。その後、ステップＳ１１０５に戻り、ステップＳ１１０８で選択した弱判別器を、弱判別器Ｓとして処理を行う。

ステップＳ１１０７の判断の結果、全ての弱判別器による判別処理を実行した場合には、ステップＳ１１０９に進む。ステップＳ１１０９に進むと、物体判別手段１００４は、当該注目領域が全ての弱判別器で顔候補と判定されたことから、当該注目領域を顔領域と判定する。

続いて、ステップＳ１１１０において、物体判別手段１００４は、全ての注目領域に対して判別処理を実行したか否かを判断する。この判断の結果、全ての注目領域に対しては判別処理を実行していない場合には、ステップＳ１１０３に戻る。一方、ステップＳ１１１０の判断の結果、全ての注目領域に対して判別処理を実行した場合には、当該フローチャートにおける処理を終了する。

次いで、次の注目領域までのＸ方向及びＹ方向の移動量Ｍｘ及びＭｙを算出する方法、並びに、Ｘ方向の移動量Ｍｘを切り替えるタイミングについて、以下にその詳細を説明する。

最初に、Ｘ方向の移動量ＭｘとＹ方向の移動量Ｍｙを算出する方法について説明する。
まず、背景領域と顔周辺領域での夫々のＸ方向の移動量Ｍｘを決定するための統計データを採取する。ここで、統計データを採取する方法は、ａｄａＢｏｏｓｔアルゴリズムにより構築した図２７に示すような弱判別器に対して、図７（ａ）〜（ｆ）に示す顔が含まれる顔付近の注目領域を複数設定し、この注目領域に対して顔判別処理を行う。

次に、これらの顔が含まれる注目領域の顔判別処理の結果から、顔と判定された注目領域と顔ではないと判定された注目領域との２つの領域に分ける。これにより、注目領域の中心が顔の正解中心位置からどの範囲内で顔と判定されるかという統計データと、どの範囲外で顔でないと判定されるかという統計データを得ることができる。具体的には、図８のフローチャートを繰り返し行う。

図８は、本発明の第１の実施形態に係る物体検出装置の処理手順を示し、統計データの採取するための処理手順の一例を示すフローチャートである。

まず、図８のステップＳ１４０１において、物体検出装置１０００は、画像中のどこに顔の正解中心位置が存在するかの情報が示されている正解データ（顔位置正解データ）と当該画像を読み込む。ここで、正解データには、顔の正解中心位置の情報、正解左右眼の位置の情報が示されている。また、この際に用いる画像は、顔がほぼ正面を向いている画像だけを選択する。

続いて、ステップＳ１４０２において、物体検出装置１０００は、まず、正解左右眼の位置の情報を用いて、左右眼の間の距離が所定の距離になるように当該画像の解像度変換及び正解データの座標変換を行う。その後、物体検出装置１０００は、正解データに示されている顔の正解中心位置の情報を基準として、顔周辺領域の複数の注目領域を選択する。このステップＳ１４０２では、例えば、図７に示すように、顔の正解中心位置（Ｘ１，Ｙ１）から（Ｘ２，Ｙ２）まで１画素おきに複数の注目領域を選択する。

続いて、ステップＳ１４０３において、例えば、物体検出装置１０００の物体判別手段１００４は、ステップＳ１４０２で選択された注目領域に対して、弱判別器Ｓを用いて顔判別処理を行う。

続いて、ステップＳ１４０４において、例えば、物体判別手段１００４は、ステップＳ１４０３の弱判別器Ｓによる判別処理の結果に基づいて、顔候補と判定されるか否かを判断する。この判断の結果、顔候補でないと判定された場合には、ステップＳ１４０５に進む。

ステップＳ１４０５に進むと、例えば、物体判別手段１００４は、注目領域中に顔が含まれているにもかかわらず顔候補と判定されなかった注目領域について、その判定をした弱判別器Ｓの番号の情報と、顔の正解中心位置からの距離の情報を記録する。具体的に、顔の正解中心位置からの距離の情報としては、例えば、図９に示すように顔の正解中心位置から当該注目領域の中心位置までの相対座標を個人ＩＤなどのラベルを付加して記録される。

一方、ステップＳ１４０４の判断の結果、顔候補と判定された場合には、ステップＳ１４０６に進む。ステップＳ１４０６に進むと、例えば、物体判別手段１００４は、全ての弱判別器による判別処理を実行したか否かを判断する。この判断の結果、全ての弱判別器による判別処理の実行は行われていない場合には、ステップＳ１４０７に進む。ステップＳ１４０７に進むと、例えば、物体判別手段１００４は、判別処理を行う弱判別器Ｓを、Ｓ←Ｓ＋１として、次の弱判別器の選択を行う。その後、ステップＳ１４０３に戻り、ステップＳ１４０７で選択した弱判別器を、弱判別器Ｓとして処理を行う。

一方、ステップＳ１４０６の判断の結果、全ての弱判別器による判別処理を実行した場合には、ステップＳ１４０８に進む。ステップＳ１４０８に進むと、例えば、物体判別手段１００４は、顔候補と判定をした弱判別器Ｓの番号の情報と、顔の正解中心位置からの距離の情報を記録する。具体的に、顔の正解中心位置からの距離の情報としては、ステップＳ１４０５と同様に、例えば、図９に示すように顔の正解中心位置から当該注目領域の中心領域までの相対座標を個人ＩＤなどのラベルを付加して記録される。

ステップＳ１４０５又はＳ１４０８の処理が終了すると、ステップＳ１４０９に進む。ステップＳ１４０９に進むと、例えば、物体判別手段１００４は、ステップＳ１４０２で選択された全ての注目領域に対して判別処理を実行したか否かを判断する。この判断の結果、全ての注目領域に対しては判別処理を実行していない場合には、次の注目領域が選択された後、ステップＳ１４０３に戻る。一方、ステップＳ１４０９の判断の結果、全ての注目領域に対して判別処理を実行した場合には、当該フローチャートにおける処理を終了する。

図８に示すような処理を大量の画像データに対して繰り返し行うことで、注目領域の中心位置が顔の正解中心位置からどの範囲内で顔と判定されるかという統計データと、どの範囲外で顔でないと判定されるかという統計データを得ることができる。この統計データを用いることにより、例えば、１つの顔当たりの検出回数を最小にするような移動量を決定することができる。

そして、以下に、顔周辺領域のＸ方向の移動量Ｍｘ１と顔周辺領域以外のＸ方向の移動量Ｍｘ２を算出する方法を説明する。

本実施形態の移動情報設定手段１００２は、すでに説明をしているが、Ｘ方向の移動量Ｍｘについて、顔周辺領域での注目領域のＸ方向の移動量Ｍｘ１と、背景領域での注目領域のＸ方向の移動量Ｍｘ２（Ｍｘ２＞Ｍｘ１）の２通りの移動量を設定する。

したがって、検出対象の物体である顔が検出されるパターンとして、以下に示す２通りのパターンが存在することになる。
１通り目のパターンは、図１０（ａ）に示すように、まず、前々の背景領域の注目領域１５００から前の注目領域１５０１へＸ方向の移動量Ｍｘ２だけ移動し、当該注目領域１５０１が顔周辺領域であると判別される。その後、当該注目領域１５０１から現在の注目領域１５０２へＸ方向の移動量Ｍｘ１だけ移動し、当該注目領域１５０２が顔領域であると判別される場合である。
２通り目のパターンは、図１０（ｂ）に示すように、顔周辺領域であると判別されずに、前の背景領域の注目領域１５０３から現在の注目領域１５０４へＸ方向の移動量Ｍｘ２だけ移動し、当該注目領域１５０４が顔領域であると判別される場合である。

いずれのパターンにおいても、画像中の全ての顔を検出するためには、顔を飛び越えないようなＸ方向の移動量Ｍｘ１及びＭｘ２を設定する必要がある。

そこで、まず、Ｘ方向の移動量Ｍｘ１の算出方法について説明する。
まず、移動情報設定手段１００２は、図９に示す統計データから個人ＩＤ毎に、顔と判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘの最大値を算出する。例えば、ＩＤ：Ｎｏ１の人物の顔と判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘの最大値＝３［pixel］と算出する等である。

続いて、移動情報設定手段１００２は、顔と判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘの最大値に対するヒストグラムを生成する。図１１は、顔と判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘの最大値におけるヒストグラムの一例を示す図である。

そして、移動情報設定手段１００２は、例えば、図１１に示すヒストグラムを用いて、注目領域が顔周辺領域である場合のＸ方向の移動量Ｍｘ１を設定する。ここで、移動情報設定手段１００２は、例えば、図１１に示すヒストグラムの頻度が０の時の相対距離Ｘが最大となる最大値Ｍｘ１'に対して、その２倍の値をＸ方向の移動量Ｍｘ１とする。なお、この最大値Ｍｘ１'は、顔の正解中心位置を基準とした相対距離であり、必ず顔として判定される領域は、顔の正解中心位置から左右Ｍｘ１'分の距離、つまり２Ｍｘ１'となる。このように移動量Ｍｘ１を設定すると、当該移動量Ｍｘ１は、図１２に示す、正解と判定される（即ち、必ず顔として判定される）注目領域１６００を飛び越えない最大の値に設定される。

また、移動量Ｍｘ１の設定における他の態様として、例えば、移動情報設定手段１００２は、物体判別手段１００４が重複して所定の顔（検出対象の物体）と判定する注目領域の重複幅を算出し、当該重複幅を用いて移動量Ｍｘ１の設定を行うようにしても良い。

次に、Ｘ方向の移動量Ｍｘ２の算出方法について説明する。
Ｘ方向の移動量Ｍｘ１と同様に、まず、移動情報設定手段１００２は、図９に示す統計データから個人ＩＤ毎に、顔ではないと判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘの最大値を算出する。

続いて、移動情報設定手段１００２は、顔ではないと判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘに対するヒストグラムを生成する。図１３は、顔ではないと判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘの最大値におけるヒストグラムの一例を示す図である。

そして、移動情報設定手段１００２は、例えば、図１３に示すヒストグラムを用いて、注目領域が背景領域である場合のＸ方向の移動量Ｍｘ２を設定する。ここで、移動情報設定手段１００２は、例えば、図１３に示すヒストグラムの頻度が０の時の相対距離Ｘが最大となる最大値Ｍｘ２'に対してＸ方向の移動量Ｍｘ１'を加えた値を、顔周辺領域以外の背景領域におけるＸ方向の移動量Ｍｘ２とする。このように移動量Ｍｘ２を設定すると、当該移動量Ｍｘ２は、図１２に示す、顔の周辺領域で不正解と判定される領域１６０１を飛び越えない最大の値に設定される。

以上のようにして、移動情報設定手段１００２は、Ｘ方向の移動量Ｍｘ１とＸ方向の移動量Ｍｘ２を設定する。

図１４は、第１の実施形態の移動情報設定手段において、Ｘ方向の移動量Ｍｘを設定する際の処理手順の一例を示すフローチャートである。

まず、図１４のステップＳ１７０１において、移動情報設定手段１００２は、物体判別手段１００４による顔判別処理の結果、現在の注目領域が顔領域と判定されたか否かを判断する。この判断の結果、現在の注目領域が顔領域と判定された場合には、ステップＳ１７０２に進む。

ステップＳ１７０２に進むと、移動情報設定手段１００２は、現在の注目領域から次の注目領域までのＸ方向の移動量ＭｘをＭｘ１に設定する。

一方、ステップＳ１７０１の判断の結果、現在の注目領域が顔領域でないと判定された場合には、ステップＳ１７０３へ進む。ステップＳ１７０３に進むと、移動情報設定手段１００２は、物体判別手段１００４による顔判別処理の結果、現在の注目領域が顔周辺領域と判定されたか否かを判断する。この判断の結果、現在の注目領域が顔周辺領域と判定された場合には、ステップＳ１７０４に進む。

ステップＳ１７０４に進むと、移動情報設定手段１００２は、現在の注目領域から次の注目領域までのＸ方向の移動量ＭｘをＭｘ１に設定する。

一方、ステップＳ１７０３の判断の結果、現在の注目領域が顔周辺領域でないと判定された場合には、ステップＳ１７０５へ進む。ステップＳ１７０５に進むと、現在の注目領域が背景領域であるため、移動情報設定手段１００２は、現在の注目領域から次の注目領域までのＸ方向の移動量ＭｘをＭｘ２に設定する。

ステップＳ１７０２、Ｓ１７０４又はＳ１７０５の処理が終了すると、ステップＳ１７０６に進む。ステップＳ１７０６に進むと、移動情報設定手段１００２は、次の注目領域が画像外となるか否かを判断する。この判断の結果、次の注目領域が画像外となる場合には、ステップＳ１７０７に進む。

ステップＳ１７０７に進むと、移動情報設定手段１００２は、現在の注目領域から次の注目領域までのＸ方向の移動量ＭｘをＭｘ１に設定する。

ステップＳ１７０６で次の注目領域が画像外にならないと判断された場合、又は、ステップＳ１７０７の処理が終了した場合には、当該フローチャートにおける処理を終了する。

次に、Ｙ方向の固定移動量Ｍｙ１の算出方法について説明する。
まず、移動情報設定手段１００２は、上述したＸ方向の移動量Ｍｘ１及びＭｘ２と同様に、図９の統計データから個人ＩＤ毎に、顔と判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｙの最大値を算出する。

続いて、移動情報設定手段１００２は、Ｘ方向の移動量Ｍｘを設定した場合と同様に、顔と判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｙの最大値に対するヒストグラムを生成する。そして、移動情報設定手段１００２は、例えば、ヒストグラムの頻度が０の時の相対距離Ｙが最大となる最大値を、Ｙ方向の固定移動量Ｍｙ１として設定する。このようにして、Ｙ方向の固定移動量Ｍｙ１に関しても、正解と判定される注目領域１６００を飛び越えない最大の値に設定される。

なお、ヒストグラムの頻度が０の時の相対距離Ｙの最大値をＹ方向の固定移動量Ｍｙ１として設定した場合には、図１５（ａ）に示すように、顔の検出位置が、顔の正解中心位置から多少ずれる可能性がある。よって、このような場合には、図１５（ｂ）に示すように、Ｙ方向の固定移動量をＹ方向の固定移動量Ｍｙ１よりも小さい値Ｍｙ１'にし、また、注目領域の開始位置をＸ方向に数画素ずらすようにする。このように、顔が検出された複数の注目領域の重心を顔の検出位置にすることにより、そのズレ量を小さくすることができる。

次に、例えば、図１２に示す、顔の周辺領域で不正解と判定される領域１６０１における顔判別処理及びそのＸ方向の移動量について説明する。
まず、例えば、物体判別手段１００４は、図９の統計データを用いて、当該注目領域がどの弱判別器で顔ではないと判定されたかを示すヒストグラムを生成する。図１６は、注目領域が顔ではないと判定された弱判別器の番号におけるヒストグラムの一例を示す図である。図１６のヒストグラムより、当該注目領域は、弱判別器Ｓ１〜Ｓ６によって顔ではないと判定されるので、物体判別手段１００４は、当該注目領域を顔周辺領域でない領域と判定する。そして、移動情報設定手段１００２は、弱判別器Ｓ１〜Ｓ６で顔ではないと判定された場合（当該注目領域が顔周辺領域でないと判定された場合）には、Ｘ方向の移動量をＭｘ１では無くＭｘ２に設定する。

なお、上述した顔ではないと判定された弱判別器の種類ではなく、弱判別器を構成する矩形フィルタ毎の出力から得点を算出した後、それらを加算して弱判別器毎の得点を算出し、顔ではないと判定された弱判別器までの総得点を用いても良い。図１７は、注目領域が顔ではないと弱判別器で判定された時の総得点のヒストグラムの一例を示す図である。この際にも、注目領域が顔ではないと判定された弱判別器までの得点総和の統計データを採取し、この統計データを用いてＸ方向の移動量Ｍｘ１及びＭｘ２が設定される。

また、上述した各弱判別器を構成する矩形フィルタは、ａｄａＢｏｏｓｔの学習により選択されるため、カスケード状に組み合わされた弱判別器群の前半では明らかに検出目的ではない注目領域が排除される可能性が高い。よって、顔ではないと判定されるまでに使用した弱判別器の数が所定数未満である場合にはＸ方向の移動量Ｍｘ２とし、所定数以上である場合にはＸ方向の移動量Ｍｘ１を設定するようにしても良い。

第１の実施形態に係る物体検出装置では、背景領域と顔周辺領域とで次の注目領域における移動量を変更するようにしている。即ち、画像中の注目領域を設定する際に、所定間隔で注目領域を設定するのでは無く、前の注目領域における検出対象の物体の判別結果に基づいて移動量を変更するようにしている。これにより、明らかに検出対象の物体が存在しない背景領域では検出処理を簡略化し、検出対象の物体周辺領域では検出処理を詳細に行うことが可能となり、画像から検出対象の物体である顔の検出処理を確実に、かつ、より高速に行うことができる。

（第２の実施形態）
第１の実施形態では、現在の注目領域が顔周辺領域である場合の次の注目領域における移動方向は、図１８に示す方向ａだけとしていたが、第２の実施形態では、当該移動方向を図１８に示す全方向（方向ａ、方向ｂ、方向ｃ、方向ｄ）とする形態である。以下に、第２の実施形態における物体検出装置の詳細を説明する。

第２の実施形態に係る物体検出装置の概略構成は、図３に示す第１の実施形態に係る物体検出装置の概略構成と同様である。第２の実施形態における物体検出装置では、例えば、図１８に示す方向ａ〜方向ｄのいずれかの方向に移動することにより、顔を検出する。

図１９は、本発明の第２の実施形態に係る物体検出装置の処理手順の一例を示すフローチャートである。このフローチャートを用いて、第１の実施形態に係る物体検出装置１０００による物体検出方法を、以下に詳細に説明する。

まず、図１９に示すステップＳ２００１及びＳ２００２の各処理は、それぞれ、図４に示すステップＳ１１０１及びＳ１１０２と同様の処理であるため、その説明を省略する。

続いて、ステップＳ２００３において、移動情報設定手段１００２は、現在の注目領域から次の注目領域までの移動量Ｍと移動方向を設定する。

まず、移動量Ｍの設定について説明する。
具体的に、本実施形態の移動情報設定手段１００２は、移動量Ｍとして、図２に示すように、背景領域におけるＸ方向の移動量をＭｘ３、Ｙ方向の移動量をＭｙ３とし、顔周辺領域におけるＸ方向の移動量をＭｘ４、Ｙ方向の移動量をＭｙ４と設定する。なお、注目領域の開始位置は、注目領域の左上座標（０，０）とする。

背景領域でのＸ方向の移動量Ｍｘ３は、例えば、第１の実施形態で説明したように、顔でないと判定される領域と顔であると判定される顔領域の双方の領域を飛び越えない最大の移動量Ｍｘ２とする。また、Ｙ方向の移動量Ｍｙ３は、同様に、顔でないと判定される領域と顔であると判定される顔領域を飛び越えない最大の移動量Ｍｙ２とする。

顔周辺領域でのＸ方向の移動量Ｍｘ４は、顔であると判定される顔領域を飛び越えない最大の移動量をＭｘ１とすると、例えば、（Ｍｘ１）／４とする。顔周辺領域のＹ方向の移動量Ｍｙ４は、顔であると判定される顔領域を飛び越えない最大の移動量をＭｙ１とすると、例えば、（Ｍｙ１）／６とする。

次に、移動方向の設定について説明する。
具体的に、本実施形態の移動情報設定手段１００２は、移動方向として、現在の注目領域が背景領域である場合には、図１８に示す方向ａだけに移動方向を設定するが、現在の注目領域が顔周辺領域である場合には、図１８に示す全方向に移動方向を設定する。なお、検出対象の物体である顔を効率良く検出するためには、現在の注目領域が顔周辺領域に存在する場合に、顔の正解中心位置より左右上下のどの位置にあるかという情報が必要となる。即ち、本実施形態では、注目領域が顔周辺領域である場合に、例えば、当該注目領域が顔の正解中心位置に対して左右上下のどの位置にあるかの情報に基づいて、当該正解中心位置に近づくように移動方向の設定が行われる。この現在の注目領域が顔の正解中心位置より左右上下のどの位置にあるかを判定する方法については後述する。

続いて、ステップＳ２００４において、注目領域決定手段１００３は、ステップＳ２００３で設定された移動量Ｍと移動方向に基づいて、検出対象の物体の検出処理（判別処理）を行う注目領域を決定する。

続いて、ステップＳ２００５において、物体判別手段１００４は、弱判別器Ｓを構成する矩形フィルタの各出力結果から各閾値分を引いた値を得点として、矩形フィルタ分だけ得点を加算した得点Ｓｉの算出を行う。

続いて、ステップＳ２００６において、物体判別手段１００４は、ステップＳ２００５で算出した弱判別器Ｓの得点Ｓｉが弱判別器Ｓの閾値（所定の閾値）Ｔｈｉよりも大きいか否かを判断する。

ステップＳ２００６の判断の結果、弱判別器Ｓの得点Ｓｉが弱判別器Ｓの閾値Ｔｈｉよりも大きい場合には、ステップＳ２００７に進み、物体判別手段１００４は、顔候補と判定する。

続いて、ステップＳ２００８において、物体判別手段１００４は、全ての弱判別器による判別処理を実行したか否かを判断する。この判断の結果、全ての弱判別器による判別処理の実行は行われていない場合には、ステップＳ２００９に進む。ステップＳ２００９に進むと、物体判別手段１００４は、次の弱判別器（Ｓ←Ｓ＋１）の選択を行う。その後、ステップＳ２００５に戻り、ステップＳ２００９で選択した弱判別器を、弱判別器Ｓとして処理を行う。

一方、ステップＳ２００８の判断の結果、全ての弱判別器による判別処理を実行した場合には、ステップＳ２０１０に進み、物体判別手段１００４は、当該注目領域が全ての弱判別器で顔候補と判定されたことから、当該注目領域を顔領域と判定する。

続いて、ステップＳ２０１１において、物体判別手段１００４は、全ての注目領域に対して判別処理を実行したか否かを判断する。この判断の結果、全ての注目領域に対しては判別処理を実行していない場合には、ステップＳ２００３に戻る。一方、ステップＳ２０１１の判断の結果、全ての注目領域に対して判別処理を実行した場合には、当該フローチャートにおける処理を終了する。

また、ステップＳ２００６の判断の結果、弱判別器Ｓの得点Ｓｉが弱判別器Ｓの閾値Ｔｈｉ以下である場合には、ステップＳ２０１２に進む。ステップＳ２０１２に進むと、物体判別手段１００４は、当該注目領域が顔周辺領域であるか否かの判定をする。この際の判定方法としては、例えば、図２０に示すパターン１〜パターン４のような注目領域の各パターンの平均ベクトルを算出し、算出された平均ベクトルと弱判別器Ｓの得点Ｓｉと比較することによって行われる。ここで、図２０は、顔の周辺のどの位置に注目領域が存在するかの判定に供するベクトルを算出する際に用いられる画像パターンの一例を示す模式図である。このステップＳ２０１２の処理が終了すると、ステップＳ２００３に戻る。

図２１は、注目領域が顔周辺領域であるか否かを判定する際に用いられる平均ベクトルを算出する処理手順の一例を示すフローチャートである。

まず、ステップＳ２１０１において、物体判別手段１００４は、図２２に示すような弱判別器により顔でないと判定される図２０に示すような複数の注目領域パターン（１〜４）の中から、図２２に示す構築された弱判別器に投入するパターンを選択する。

続いて、ステップＳ２１０２において、物体判別手段１００４は、ステップＳ２１０１で選択された注目領域パターンの中から、１つの注目領域を選択する。

続いて、ステップＳ２１０３において、物体判別手段１００４は、ステップＳ２１０２で選択された注目領域に対して、図２２に示すようなＮ個の弱判別器から構成される判別器による判定処理を行う。

続いて、ステップＳ２１０４において、物体判別手段１００４は、ステップＳ２１０３の判定処理によりＮ個の弱判別器から出力される得点を各成分とするＮ次元ベクトルを生成する。例えば、図２０のパターン１の１つの注目領域を図２２に示す判別器に投入した際にＳ＋５番目で顔でないと判定された場合、この注目領域のＮ次元ベクトルＶは、Ｖ＝（得点１、得点２、得点３、得点４、得点５、０、………０）となる。

続いて、ステップＳ２１０５において、物体判別手段１００４は、ステップＳ２１０１で選択された注目領域パターン内の全ての注目領域に対してベクトルの生成を行ったか否かを判断する。この判断の結果、ステップＳ２１０１で選択された注目領域パターン内の全ての注目領域に対してはベクトルの生成を行っていない場合には、ステップＳ２１０２に戻り、ベクトルの生成を行っていない次の注目領域が選択される。

一方、ステップＳ２１０５の判断の結果、ステップＳ２１０１で選択された注目領域パターン内の全ての注目領域に対してベクトルの生成を行った場合には、ステップＳ２１０６に進む。ステップＳ２１０６に進むと、物体判別手段１００４は、ステップＳ２１０１で選択された注目領域パターンの全ての注目領域に対して生成されたベクトルの平均ベクトルを算出する。なお、他の注目領域パターン（例えば、図２０のパターン１の処理を行なった場合には、パターン２〜４）に関しても同様の処理を行い、Ｎ次元平均ベクトルを算出する。

第２の実施形態に係る物体検出装置では、背景領域では次の注目領域における移動方向を一方向でその移動量を大きくし、顔周辺領域では次の注目領域における移動方向を全方向（図１８の方向ａ〜方向ｄ）でその移動量を小さくするようにしている。即ち、画像中の注目領域を設定する際に、所定間隔で所定方向に注目領域を設定するのでは無く、前の注目領域における検出対象の物体の判別結果に基づいて移動量及び移動方向を変更するようにしている。これにより、明らかに検出対象の物体が存在しない背景領域では検出処理を簡略化し、検出対象の物体周辺領域では検出処理を詳細に行うことが可能となり、画像から検出対象の物体である顔の検出処理を確実に、かつ、より高速に行うことができる。

（第３の実施形態）
第３の実施形態に係る物体検出装置の概略構成は、図３に示す第１の実施形態に係る物体検出装置の概略構成と同様である。

図２３は、本発明の第３の実施形態に係る物体検出装置の処理手順の一例を示すフローチャートである。このフローチャートを用いて、第３の実施形態に係る物体検出装置１０００による物体検出方法を、以下に詳細に説明する。

まず、図２３に示すステップＳ２２０１及びＳ２２０２の各処理は、それぞれ、図４に示すステップＳ１１０１及びＳ１１０２と同様の処理であるため、その説明を省略する。

続いて、ステップＳ２２０３において、移動情報設定手段１００２は、現在の注目領域から次の注目領域までの移動情報を設定する。具体的に、本実施形態では、移動情報設定手段１００２は、第１の実施形態と同様に、移動情報として、現在の注目領域から次の注目領域までの移動量Ｍを設定する。

続いて、ステップＳ２２０４において、注目領域決定手段１００３は、ステップＳ２２０３で設定された移動量Ｍに基づいて、検出対象の物体の検出処理（判別処理）を行う注目領域を決定する。

続いて、ステップＳ２２０５において、物体判別手段１００４は、第１の実施形態と同様に、矩形フィルタ群を構成する弱判別器Ｓ（Ｓ＞０）を用いた判別処理を行う。

続いて、ステップＳ２２０６において、物体判別手段１００４は、当該弱判別器Ｓの全ての矩形フィルタを通過したか否かを判断する。ここで、矩形フィルタを通過したとは、例えば、第１の実施形態で説明した、矩形フィルタの白領域の輝度総和値Ｓｗ１と黒領域の輝度総和値Ｓｂ１との差Ｓｕｂ１（＝Ｓｗ１−Ｓｂ１）が所定の閾値Ｔｈ１よりも大きいと判定された場合のことである。

ステップＳ２２０６の判断の結果、全ての矩形フィルタを通過した場合には、ステップＳ２２０７に進み、物体判別手段１００４は、顔候補と判定する。

続いて、ステップＳ２２０８において、物体判別手段１００４は、全ての弱判別器による判別処理を実行したか否かを判断する。この判断の結果、全ての弱判別器による判別処理の実行は行われていない場合には、ステップＳ２２０９に進む。ステップＳ２２０９に進むと、物体判別手段１００４は、次の弱判別器（Ｓ←Ｓ＋１）の選択を行う。その後、ステップＳ２２０５に戻り、ステップＳ２２０９で選択した弱判別器を、弱判別器Ｓとして処理を行う。

ステップＳ２２０８の判断の結果、全ての弱判別器による判別処理を実行した場合には、ステップＳ２２１０に進む。ステップＳ２２１０に進むと、物体判別手段１００４は、当該注目領域が全ての弱判別器で顔候補と判定されたことから、当該注目領域を顔領域と判定する。

続いて、ステップＳ２２１１において、物体判別手段１００４は、全ての注目領域に対して判別処理を実行したか否かを判断する。この判断の結果、全ての注目領域に対しては判別処理を実行していない場合には、ステップＳ２２０３に戻る。一方、ステップＳ１１１０の判断の結果、全ての注目領域に対して判別処理を実行した場合には、当該フローチャートにおける処理を終了する。

また、ステップＳ２２０６の判断の結果、全ての矩形フィルタは通過していない場合には、ステップＳ２２１２に進む。ステップＳ２２１２に進むと、物体判別手段１００４は、所定の弱判別器以上が実行されたか否かを判断する。この判断の結果、所定の弱判別器以上が実行されなかった場合には、物体判別手段１００４は、現在の注目領域が背景領域であると判定し、その後、ステップＳ２２０３に戻る。

一方、ステップＳ２２１２の判断の結果、所定の弱判別器以上が実行された場合には、物体判別手段１００４は、現在の注目領域の周辺に顔が存在する可能性があると判定し（即ち、現在の注目領域が顔周辺領域であると判定し）、ステップＳ２２１３に進む。ステップＳ２２１３に進むと、物体判別手段１００４は、顔ではないと判定した弱判別器を構成する矩形フィルタの出力結果を用いて顔が存在する可能性がある領域までの移動量Ｍを計算する。そして、ステップＳ２２１３で移動量Ｍが算出されると、ステップＳ２２０３に戻り、この場合、算出された移動量Ｍに基づいて、移動量Ｍの設定が行なわれる。

以下に、このステップＳ２２１３における移動量Ｍの計算方法について説明する。
図２４は、注目領域がΔＷだけＸ方向に移動した場合を示す模式図である。
まず、図２４に示すように、現在の注目領域がＹ方向の移動量は０として、Ｘ方向にΔＷだけ移動した場合を考える。この場合、当然、図２４に示す総和領域１もＸ方向にΔＷだけ移動して総和領域２となる。

ここで、総和領域１がＸ方向にΔＷだけ移動した場合の総和領域２のＳｕｍＡ'及びＳｕｍＢ'の変動域を考えると、それぞれ、以下の（１）式及び（２）式となる。
ＳｕｍＡ−Ｈ＊ΔＷ＜ＳｕｍＡ'＜ＳｕｍＡ＋Ｈ＊ΔＷ・・・（１）
ＳｕｍＢ−Ｈ＊ΔＷ＜ＳｕｍＢ'＜ＳｕｍＢ＋Ｈ＊ΔＷ・・・（２）
なお、この（１）式及び（２）式のＨは、注目領域のＹ方向の高さである。

よって、上記の（１）式及び（２）式と閾値Ｔｈを用いると、現在の注目領域から最低何画素以上移動しなければ、閾値Ｔｈを超えないかという移動量ΔＷを計算することができる。

つまり、ＳｕｍＡ'＝ＳｕｍＡ＋Ｈ＊ΔＷ、ＳｕｍＢ'＝ＳｕｍＢ−Ｈ＊ΔＷとして、ＳｕｍＡ'−ＳｕｍＢ'＝Ｔｈとなる時のΔＷを計算すれば良い。このようにして計算されるΔＷをΔＷ１とすると、以下の（３）式となる。
ΔＷ１＝［Ｔｈ−（ＳｕｍＡ−ＳｕｍＢ）］／２Ｈ・・・（３）

図２４に示す矩形フィルタでは、現在の注目領域から最低でもΔＷ１だけ移動しなければ、差ＳｕｍＡ−ＳｕｍＢが閾値Ｔｈを超えないことが分かる。

そして、顔ではないと判定した弱判別器を構成する他の矩形フィルタに関しても同様の計算を行い、例えば、弱判別器を構成する矩形フィルタから算出された夫々の移動量ΔＷ１の中で最大の移動量ΔＷ２をＸ方向の移動量Ｍとして計算する。なお、Ｙ方向に関しても同様の処理を行い、Ｙ方向の移動量ΔＷ３を計算し、次の注目領域を（ｘ＋ΔＷ２，ｙ）、（ｘ，ｙ＋ΔＷ３）の２領域として検出対象の物体である顔の判別処理を行う。

なお、上記では、Ｘ方向とＹ方向の移動量ΔＷ２及びΔＷ３を算出したが、フィルタの種類によってはＸ方向だけの移動量を計算するなど移動方向を限定させるようにしても良い。

第３の実施形態に係る物体検出装置では、このようにして、現在の注目領域から次の注目領域までの移動量Ｍを矩形フィルタの種類と出力結果を用いて計算することにより、更に、検出対象の物体である顔の検出処理の負荷を軽減することができる。

（第４の実施形態）
第４の実施形態に係る物体検出装置の概略構成は、図３に示す第１の実施形態に係る物体検出装置の概略構成と同様である。

図２５は、本発明の第４の実施形態に係る物体検出装置の処理手順の一例を示すフローチャートである。このフローチャートを用いて、第４の実施形態に係る物体検出装置１０００による物体検出方法を、以下に詳細に説明する。なお、図２５において、図２３の第３の実施形態に係るフローチャートと同様の処理ステップについては、同じ符号を付している。

図２５のフローチャートにおいて、ステップＳ２２０１〜ステップＳ２２１２までの処理については、図２３に示す第３の実施形態における処理と同様であるため、説明を省略する。なお、本実施形態のステップＳ２２０３の移動情報の設定に関しては、移動情報として、現在の注目領域から次の注目領域までの移動方向及び移動量Ｍが設定される。

ステップＳ２２１２の判断の結果、所定の弱判別器以上が実行された場合には、ステップＳ２３１３に進む。ステップＳ２３１３に進むと、物体判別手段１００４は、各矩形フィルタの種類と出力結果を用いて、移動方向と移動量Ｍを決定する。そして、ステップＳ２３１３で移動方向及び移動量Ｍが決定されると、ステップＳ２２０３に戻り、この場合、決定された移動方向及び移動量Ｍに基づいて、移動方向及び移動量Ｍの設定が行なわれる。

以下に、このステップＳ２３１３における移動方向及び移動量Ｍの決定方法について説明する。
移動方向の決定については、まず、顔でないと判定した弱判別器から通過できなかった矩形フィルタを選択する。そして、選択された矩形フィルタに応じて移動方向を決定する。なお、各矩形フィルタ毎の移動方向は、大量のデータを分析することにより予め決定されているものとする。

また、移動量Ｍの決定については、第３の実施形態で説明したような方法を用いて移動量Ｍを決定する。図２６は、現在の注目領域２４００から移動量Ｖだけ移動させた際の注目領域２４０１を示す模式図である。
例えば、顔でないと判定した弱判別器から通過できなかった矩形フィルタとして、図２６に示すような矩形フィルタが選択された場合には、現在の注目領域２４００からＸ方向に移動量Ｖだけ移動させた注目領域２４０１を次の注目領域とする。即ち、この場合、移動量Ｍとして、図２６に示す移動量Ｖを決定する。

第４の実施形態に係る物体検出装置では、このようにして、現在の注目領域から次の注目領域までの移動方向及び移動量Ｍを矩形フィルタの種類と出力結果を用いて決定することにより、更に、検出対象の物体である顔の検出処理の負荷を軽減することができる。

前述した各実施形態に係る物体検出装置を構成する図３の各手段は、コンピュータのＲＡＭやＲＯＭなどに記憶されたプログラムが動作することによって実現できる。また、前述した各実施形態に係る物体検出装置による物体検出方法を示す図４、図８、図１４、図１９、図２１、図２３及び図２５の各ステップは、コンピュータのＲＡＭやＲＯＭなどに記憶されたプログラムが動作することによって実現できる。これらのプログラム及び当該プログラムを記録したコンピュータ読み取り可能な記憶媒体は本発明に含まれる。

具体的に、前記プログラムは、例えばＣＤ−ＲＯＭのような記憶媒体に記録し、或いは各種伝送媒体を介し、コンピュータに提供される。前記プログラムを記録する記憶媒体としては、ＣＤ−ＲＯＭ以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。他方、前記プログラムの伝送媒体としては、プログラム情報を搬送波として伝搬させて供給するためのコンピュータネットワーク（ＬＡＮ、インターネットの等のＷＡＮ、無線通信ネットワーク等）システムにおける通信媒体を用いることができる。また、この際の通信媒体としては、光ファイバ等の有線回線や無線回線などが挙げられる。

また、本発明は、コンピュータが供給されたプログラムを実行することにより各実施形態に係る物体検出装置の機能が実現される態様に限られない。そのプログラムがコンピュータにおいて稼働しているＯＳ（オペレーティングシステム）或いは他のアプリケーションソフト等と共同して各実施形態に係る物体検出装置の機能が実現される場合も、かかるプログラムは本発明に含まれる。また、供給されたプログラムの処理の全て、或いは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて各実施形態に係る物体検出装置の機能が実現される場合も、かかるプログラムは本発明に含まれる。

また、前述した本実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。

本発明の第１の実施形態を示し、現在の注目領域から次の注目領域に移動させる際の移動方向と移動量を示す模式図である。本発明の第２の実施形態を示し、現在の注目領域から次の注目領域に移動させる際の移動方向と移動量を示す模式図である。本発明の第１の実施形態に係る物体検出装置の概略構成の一例を示すブロック図である。本発明の第１の実施形態に係る物体検出装置の処理手順の一例を示すフローチャートである。インテグラルイメージを生成する際の処理を説明するための模式図である。現在の注目領域の一例を示す模式図である。顔周辺領域と背景領域とを区別するための統計データの採取の際に用いた画像群を示す模式図である。本発明の第１の実施形態に係る物体検出装置の処理手順を示し、統計データの採取するための処理手順の一例を示すフローチャートである。統計データとして記録される統計データ表を示す模式図である。検出対象の物体である顔が検出される場合の２つのパターンを示す模式図である。顔と判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘの最大値におけるヒストグラムの一例を示す図である。背景領域でのＸ方向の移動量Ｍｘ２と顔周辺領域でのＸ方向の移動量Ｍｘ１を示す模式図である。顔ではないと判定された注目領域の中心位置から顔の正解中心位置までの相対距離Ｘの最大値におけるヒストグラムの一例を示す図である。本発明の第１の実施形態の移動情報設定手段において、Ｘ方向の移動量Ｍｘを設定する際の処理手順の一例を示すフローチャートである。Ｙ方向の移動量ＭｙをＭｙ１とＭｙ１'（Ｍｙ１'＜Ｍｙ１）とした場合の顔の検出結果を示す模式図である。注目領域が顔ではないと判定された弱判別器の番号におけるヒストグラムの一例を示す図である。注目領域が顔ではないと弱判別器で判定された時の総得点のヒストグラムの一例を示す図である。本発明の第２の実施形態を示し、現在の注目領域から次の注目領域に移動させる際の移動方向を示す模式図である。本発明の第２の実施形態に係る物体検出装置の処理手順の一例を示すフローチャートである。顔の周辺のどの位置に注目領域が存在するかの判定に供するベクトルを算出する際に用いられる画像パターンの一例を示す模式図である。注目領域が顔周辺領域であるか否かを判定する際に用いられる平均ベクトルを算出する処理手順の一例を示すフローチャートである。本発明の第２の実施形態で用いられる弱判別器を示す模式図である。本発明の第３の実施形態に係る物体検出装置の処理手順の一例を示すフローチャートである。注目領域がΔＷだけＸ方向に移動した場合を示す模式図である。本発明の第４の実施形態に係る物体検出装置の処理手順の一例を示すフローチャートである。現在の注目領域から移動量Ｖだけ移動させた際の注目領域を示す模式図である。非特許文献１に示されている物体検出器（弱判別器）を示す模式図である。弱判別器を構成する矩形フィルタの一例を示す模式図である。

符号の説明

１０００物体検出装置
１００１画像取得手段
１００２移動情報設定手段
１００３注目領域決定手段
１００４物体判別手段

Claims

画像を取得する画像取得手段と、
前記画像取得手段により取得された画像に対して注目領域を決定する注目領域決定手段と、
前記注目領域決定手段で決定された注目領域に検出対象の物体が存在するか否かを判別する物体判別手段と、
前記物体判別手段による検出対象の物体の判別結果に基づいて、当該注目領域から次の注目領域までの移動量及び移動方向のうちの少なくとも一方を設定する設定手段と
を有し、
前記注目領域決定手段は、前記設定手段で設定された内容に基づいて、前記次の注目領域を設定することを特徴とする物体検出装置。
前記物体判別手段は、前記注目領域決定手段で決定された注目領域に検出対象の物体が存在するか否かを判別処理する複数の判別器を備えており、前記複数の判別器の判別結果に基づいて、当該注目領域に検出対象の物体が存在するか否かを判別することを特徴とする請求項１に記載の物体検出装置。
前記判別器は、前記注目領域決定手段で決定された注目領域内の少なくとも１つ以上の所定領域に対してフィルタを用いた総和値を算出し、当該総和値を用いることによって前記判別処理を行うことを特徴とする請求項２に記載の物体検出装置。
前記設定手段は、前記注目領域に前記検出対象の物体が存在すると判定した前記判別器の数、前記フィルタの種類及びその出力結果のうちの少なくとも１つに基づいて、前記移動量及び前記移動方向を設定することを特徴とする請求項３に記載の物体検出装置。
前記検出対象の物体は顔であり、
前記物体判別手段が前記注目領域に顔が存在すると判定する場合は当該注目領域が顔領域及び顔を含む顔周辺領域であり、前記物体判別手段が前記注目領域に顔が存在しないと判定する場合は当該注目領域が背景領域であることを特徴とする請求項１乃至４のいずれか１項に記載の物体検出装置。
前記設定手段は、前記物体判別手段が重複して前記検出対象の物体であると判定する注目領域の重複幅を算出し、当該重複幅を用いて前記移動量を設定することを特徴とする請求項１に記載の物体検出装置。
画像を取得する画像取得ステップと、
前記画像取得ステップにより取得された画像に対して注目領域を決定する注目領域決定ステップと、
前記注目領域決定ステップで決定された注目領域に検出対象の物体が存在するか否かを判別する物体判別ステップと、
前記物体判別ステップによる検出対象の物体の判別結果に基づいて、当該注目領域から次の注目領域までの移動量及び移動方向のうちの少なくとも一方を設定する設定ステップとを有し、
前記注目領域決定ステップでは、前記設定ステップで設定された内容に基づいて、前記次の注目領域を設定することを特徴とする物体検出方法。
画像を取得する画像取得ステップと、
前記画像取得ステップにより取得された画像に対して注目領域を決定する注目領域決定ステップと、
前記注目領域決定ステップで決定された注目領域に検出対象の物体が存在するか否かを判別する物体判別ステップと、
前記物体判別ステップによる検出対象の物体の判別結果に基づいて、当該注目領域から次の注目領域までの移動量及び移動方向のうちの少なくとも一方を設定する設定ステップとをコンピュータに実行させ、
前記注目領域決定ステップでは、前記設定ステップで設定された内容に基づいて、前記次の注目領域を設定することを特徴とするプログラム。