JP2008234653A - 目標画像検出方法及び画像検出装置 - Google Patents

目標画像検出方法及び画像検出装置 Download PDF

Info

Publication number
JP2008234653A
JP2008234653A JP2008072441A JP2008072441A JP2008234653A JP 2008234653 A JP2008234653 A JP 2008234653A JP 2008072441 A JP2008072441 A JP 2008072441A JP 2008072441 A JP2008072441 A JP 2008072441A JP 2008234653 A JP2008234653 A JP 2008234653A
Authority
JP
Japan
Prior art keywords
image
target image
target
angle
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008072441A
Other languages
English (en)
Other versions
JP5256806B2 (ja
Inventor
Tao Li
タオ リ
Haike Guan
海克 関
Gane Wang
ガン ワン
Zhongchao Shi
ジョォンチャオ シ
Cheng Du
ドゥ チョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2008234653A publication Critical patent/JP2008234653A/ja
Application granted granted Critical
Publication of JP5256806B2 publication Critical patent/JP5256806B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/446Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

【課題】少ない計算量で迅速に所定向きの目標画像を検出する目標画像検出方法及び装置を提供する
【解決手段】 本発明の目標画像検出装置は、所定向きの画像に目標画像が含まれているか否かを判別する目標画像識別手段と、入力画像の向きを判別する画像方向判別手段と、判別された前記入力画像の向きに応じて、前記目標画像識別手段を回転する回転手段とを有し、前記回転された目標画像識別手段により、前記入力画像から、前記目標画像が検出される。
【選択図】図3

Description

本発明は画像処理に関し、特に、入力画像における向きの異なる目標画像を検出する目標画像検出方法及び装置に関する。
近年、目標検出技術は各分野において広く応用されている。目標検出技術とは、1つの画像(写真、静止画像、ビデオ画像など)において、目標となる対象(例えば、顔、車など)を検出する技術である。例えば、顔検出技術は、ディジタルカメラや、セキュリティなどの分野で広く応用されている。顔検出技術において、入力画像から顔の位置、サイズなどの情報を検出する。ディジタルカメラの場合は、これら顔の情報は、顔の焦点合わせ、露光、白色のバランスなどの調整に用いられる。
非特許文献1はViola法と呼ばれる顔検出方法を開示している。
例えば、ディジタルカメラの場合、状況に応じて、利用者はディジタルカメラを正常の姿勢以外の姿勢で持ち写真を撮り、カメラのモニターに水平、正常の姿勢の場合の画像と異なる向きの写真は撮影される。
図1A−1Cは、カメラの複数の姿勢を例示する図である。
図1Aは、カメラの正常の姿勢を示し、図1Bは、カメラを正常の姿勢より逆時計回り方向に90度回転した場合を示し、図1Cは、時計回りでカメラを90度回転した場合を示す。
一方、ディジタルカメラに搭載された画像検出装置による画像処理において、座標系の原点は、モニター上に所定の位置(例えば、左上のコーナー)に固定されているため、カメラの姿勢を変えて撮影する際に、カメラに搭載された画像検出装置は、正常の向きと異なる向きの顔画像を受信する。
図2A−2Cは、向きの異なる顔画像を例示する図である。
図2A−2Cに示された向きの異なる顔画像は、それぞれ、図1A−1Cに示された向きのカメラで撮影されたものである。
特許文献1、特許文献2、及び非特許文献1に、向きの異なる顔画像を検出する技術が開示されている。
US特許出願11/299504 US特許出願11/285172 P.Viola,M.J.Jones,"Robust Real−Time Face Detection"、International Journal of Computer Vision,vol.57,pp.137−154,May 2004.
しかしながら、特許文献1、特許文献2に開示された顔画像検出技術は計算量が多い。一方、ディジタルカメラなどの携帯用ディジタル機器は、処理部のクロック周波数が低く、メモリが少なく、計算能力が高くないため、従来の顔画像検出技術をそのまま適用することができない。
本発明は、以上の問題点に鑑みてなされ、その目的は、少ない計算量で迅速に所定向きの目標画像を検出する目標画像検出方法及び装置を提供することにある。
本発明の目標画像検出装置は、所定向きの画像に目標画像が含まれているか否かを判別する目標画像識別手段と、入力画像の向きを判別する画像方向判別手段と、判別された前記入力画像の向きに応じて、前記目標画像識別手段を回転する回転手段とを有し、前記回転された目標画像識別手段により、前記入力画像から、前記目標画像が検出される。
本発明によれば、画像方向判別手段は入力画像の向きを判別し、回転手段は判別された入力画像の向きに応じて目標画像識別手段を回転し、回転された目標画像識別手段は上記向きの入力画像から目標画像を検出するので、少ない計算量で迅速に上記向きの目標画像を検出することができる。
次に、添付した図面を参照しながら、本発明の実施形態を説明する。
図3は本発明の一実施形態に係る目標画像検出装置の構成を例示するブロック図である。
例えば、本実施形態に係る画像検出装置は、ディジタルカメラなどの携帯用ディジタル機器に搭載され、写真を撮影する際に、被写体となる人物の顔や、風景における特徴部などを検出し、焦点合わせやその他の調整に用いられる。以下、主に顔の検出を例として説明する。
なお、本実施形態に係る画像検出装置はこのような応用に限定されない。
図3に示すように、本実施形態に係る画像検出装置10は、画像ブロック生成手段105、角度識別手段110、参照画像識別手段120、角度対応画像識別部生成手段130、目標画像検出手段140、及び画像出力手段150を有する。
例えば、カメラの撮像部により、被写体の画像信号101が得られ、画像検出装置10に入力される。
図4は入力画像101を例示する図である。
図4に示すように、入力画像信号101において、位置やサイズの異なる顔画像102、103がある。
画像ブロック生成手段105は、入力画像に含まれる目標画像(例えば、顔画像)を検出するために、入力画像を複数の画像ブロックに分けて、画像ブロック集合を生成し、各画像ブロックに目標画像の有無の判断に供する。
画像ブロックの生成方法として、例えば、所定大きさの矩形ウィンドウを画像101に掛けて、そのウィンドウに覆われた画像の部分を一画像ブロックとする。そして、そのウィンドウを所定の距離ずつ(Step Size)連続的に移動させ、入力画像101全体をスキャンし、異なる位置でのウィンドウに覆われた画像の部分から、複数の画像ブロックを得る。これにより、入力画像の異なる位置にある顔画像を含む画像ブロックが生成され、検出に供される。よって、異なる位置にある顔画像を検出することができる。
また、入力画像101に対して拡大又は縮小処理をして、これら拡大又は縮小された入力画像から画像ピラミッド構造を生成してもよい。この場合は、画像ブロック生成手段105は、入力画像の代わりに、画像ピラミッドの各階層の画像の画像ブロック集合を生成する。画像ピラミッドの各階層の画像は大きさが異なるので、画像ブロック生成手段105において、所定大きさの矩形ウィンドウを用いても、入力画像101における異なるサイズの顔画像を検出することができる。
入力画像101は所定の向きを有することがある。例えば、図1A―1C及び図2A―2Cを用いて説明したように、カメラの向きにより、画像検出装置10において入力された画像も様々な向きがある。図2A―2Cに示す3つの向きの他に、例えば、撮影の際に、頭部の仰向きや下向き、左右の回りなどにより、顔画像は所定の向きを有する場合もある。以下、必要に応じて画像の向きを「画像の角度」と称する。
角度識別手段110は、入力画像101における顔画像の角度を判別する。
通常の応用において、顔画像の角度は既知の幾つかの角度のうちの一つである場合は少なくない。以下、検出対象である顔画像の角度は既知のn個の角度のうちの一つであると仮定する。よって、角度識別手段110は、既知のn個の角度から入力画像101における顔画像の角度を判別する。
例えば、n=2の場合、角度識別手段110は2つの角度を区別できればよい。以下、2つの角度を区別する手段は、一つの角度分類器と呼ぶ。
n>2の場合は、従来技術において、一般的に、角度識別手段は、n個の角度のうち任意2つの角度を区別できるように構成されていた。n個の角度のうち、任意2つの角度の組合せの数はn(n−1)/2であるので、従来の角度識別手段はn(n−1)/2個の角度分類器を有する。このような構成の角度識別手段により、角度判別のため多い演算量と高いメモリ容量は必要である。
本実施形態には、角度識別手段110は、n−1個の角度分類器を利用してn個の既知の角度から顔画像の角度を判別する。以下に述べるように、角度識別手段110において、上記既知のn個の角度のうちの一つを参照角度Rとし、角度識別手段110により判別された顔画像の角度をθとする。
角度識別手段110の具体的な構成は後程説明する。
参照画像識別手段120は、参照角度Rに対応する画像識別手段である、即ち、角度が参照角度Rである顔画像が存在するか否かを判断するための画像識別手段である。参照画像識別手段120は、幾つかのパラメータを用いて判断を行う。例えば、顔特徴パラメータ、顔特徴の重み付け、閾値などがある。これらのパラメータは角度に依存するものからなるグループと角度に依存しないものからなるグループとに分けられる。
参照画像識別手段120の具体的な構成は後程説明する。
角度対応画像識別部生成手段130は、参照画像識別手段120に用いられている各種パラメータ及び角度識別手段110から出力される入力画像101における顔画像の角度θを読み込み、さらに、角度θに基づいて参照画像識別手段120におけるパラメータを回転処理し、角度θに対応する画像識別手段、即ち、角度が角度θである顔画像が存在するか否かを判断するための画像識別手段を生成する。
目標画像検出手段140は、角度θに対応する画像識別手段を用い、入力画像101において、顔画像が存在するか否かを判断し、その顔画像の特性(例えば、位置、サイズなど)を検出する。
目標画像検出手段140の具体的な構成は後程説明する。
画像出力手段150は、目標画像検出手段140により検出された顔画像を出力して表示する。
次に、角度識別手段110の具体的な構成を説明する。
図5は本実施形態に係る角度識別手段110の構成を例示するブロック図である。
図5に示すように、角度識別手段110は、n―1個の角度分類器121,122,123からなる角度分類器グループ111と、角度分類器121,122,123の出力を統合する統合部112とを有する。
n―1個の角度分類器121,122,123は、それぞれ参照角度R以外のn―1個の候補角度θi(i=1,2,…,n―1)と参照角度Rとを識別し、それぞれ一の角度θiを決定し、また、当該決定の信頼度Biを計算する。角度分類器121,122,123により決定されたn―1個の角度θi(i=1,2,…,n―1)及び信頼度Biは統合部112に入力される。
角度分類器121,122,123が決定したn―1個の角度θi(i=1,2,…,n―1)は、互いに矛盾する場合がある。統合部112は、n―1個の角度θi(i=1,2,…,n―1)の間の矛盾を解消し、一つの角度θを得る。この角度θは検出対象である入力画像101又は顔画像の角度となる。例えば、信頼度Biの最も大きい角度分類器により得られた角度θiを最終的な角度θとする。
角度分類器は幾つかの方法により実現できる。本実施形態において、例えば、角度分類器121はBoosting識別器及び非特許文献1に開示のViola方法を用いて顔画像を識別する。即ち、Haarウェーブレットを顔識別の特徴とする。
具体的に、角度分類器121は、顔画像上の特徴部を用いて顔画像の角度を識別する。各顔特徴(Haar特徴と呼ぶ)は、顔画像上の1つの矩形ウィンドウに覆われた顔の特徴部分に対応する。角度分類器121,122,123は、それぞれ所定の一組の顔特徴(Haar特徴)を用い、それぞれn―1個の候補角度θi(i=1,2,…,n―1)と参照角度Rとを識別する。
各角度分類器に用いられる各顔特徴(Haar特徴)は、一つのサブ角度分類器になる。当該顔特徴の値f(j=1,…,m、mは当該角度分類器における顔特徴の数である)(例えば、矩形ウィンドウの位置、即ち、顔特徴部の位置)は当該サブ角度分類器の閾値μ以上である場合は、当該サブ角度分類器の識別結果(出力)hを1とし、そうでない場合は、当該サブ角度分類器の識別結果(出力)hを0とする。各顔特徴、即ち、各サブ角度分類器に所定のウエイトαを与えられており、各サブ角度分類器の出力hの重い付け和Si=Σαをi番目の角度分類器の特徴量とする。
n―1個の角度分類器121,122,123の各々に所定の閾値Ti(i=1,2,…,n―1)を与えられる。角度分類器の特徴量Siは閾値Ti以上である場合は、顔画像の角度は参照角度Rであると判断する。一方、角度分類器の特徴量Siは閾値Tiより小さい場合は、顔画像の角度は角度θiであると判断する。また、角度分類器の特徴量Siと閾値Tiとの差の絶対値は、当該角度分類器の識別結果の信頼度Biとして出力される。Biは大きければ大きいほど、識別結果の信頼度が高い。
Boosting法において、以上の各角度分類器のパラメータf、μ、α、Tの値は学習サンプルにより決められる。例えば、所定数の顔画像の角度が参照角度Rであるサンプルと顔画像の角度が参照角度R以外の角度であるサンプルを集め、学習サンプルを構成する。このように、n―1個の角度分類器121,122,123を構成する。
図6は角度識別手段110の動作を示すフローチャートである。
図6に示すように、ステップS21において、入力画像101は角度識別手段110に入力される。
ステップS22において、角度分類器121,122,123の特徴量Si(i=1,2,…,n―1)を計算する。
ステップS23において、角度分類器121,122,123が角度θiを決定し、信頼度Biを計算する。
ステップS24において、信頼度Biの最も大きい角度分類器により得られた角度θiを角度識別手段110の識別結果として出力する。
次に、参照画像識別手段120の具体的な構成を説明する。
図7は本実施形態に係る参照画像識別手段120の構成を例示するブロック図である。
図7に示すように、参照画像識別手段120はカスケード型Boosting識別器からなり、即ち、参照画像識別手段120は、複数段のBoosting画像識別器からなる。
各段のBoosting画像識別器は、顔画像上の特徴部を用いて顔画像を識別する。本実施形態において、非特許文献1に開示のViola法を用いて、Haarウェーブレットを顔検出の特徴として目標画像を識別する。
図8は、顔検出用識別器に用いるHaarウェーブレット顔特徴を示す図である。
図8に示すように、各顔特徴(Haar特徴)は、顔画像上の1つの矩形ウィンドウ(以下、顔特徴ウィンドウという)に覆われた顔の特徴部分に対応する(図9も参照されたい)。各段のBoosting画像識別器は、所定の顔特徴(Haar特徴)を用い、顔画像を識別する。
各段のBoosting画像識別器は、各顔特徴の値f(例えば、矩形ウィンドウの位置、即ち、顔特徴部の位置)、各顔特徴の閾値μ、各顔特徴のウエイトα、当該Boosting画像識別器の閾値Tなどのパラメータを用いる。これらのパラメータの中に、顔特徴の値fは角度に依存し、その他のパラメータは角度に依存しない。
図9は、画像識別器の特徴パラメータの回転処理を示す図である。
図9は、画像検出装置10に入力された画像は3つの向きを有する場合を示す。即ち、0度(正常時)、90度(右回転)、―90度(左回転)である。0度(正常時)を参照方向として参照画像識別手段120を構築すれば、90度、―90度回転した画像の場合、参照画像識別手段120におけるHaar特徴の値fをそれぞれ90度、―90度回転すれば、90度、―90度に対応する画像識別器をそれぞれ生成することができる。回転角度は他の値の場合は同様である。
図10は本実施形態に係る目標画像検出手段140の構成を例示するブロック図である。
本実施例では、目標画像検出手段140もカスケード型Boosting識別器を用いる。
図10に示すように、目標画像検出手段140はN段のBoosting目標画像識別器からなる。所定の段のBoosting目標画像識別器に入力された画像ブロックについて、そのBoosting目標画像識別器の出力は当該目標画像識別器の閾値より小さい場合、当該画像ブロックに目標画像(例えば、顔)が含まれないと判断し(図10の「F」)、目標画像検出手段140の処理が終了する。一方、そのBoosting目標画像識別器の出力は閾値以上である場合、当該画像ブロックに顔が含まれている可能性があると判断し(図10の「T」)、次段のBoosting目標画像識別器に進み、更に当該画像ブロックに顔が含まれているか否かを判断する。このように、全ての段のBoosting目標画像識別器が当該画像ブロックに顔が含まれている可能性があると判断した場合は、目標画像検出手段140は、当該画像ブロックに顔が含まれていると判断し、当該当該画像ブロックは顔画像候補とする。
次に、画像検出装置10の動作を説明する。
図11は画像検出装置10の動作を示すフローチャートである。
図11に示すように、ステップS1において、例えばカメラの撮像部により、被写体の画像信号101が得られ、画像検出装置10に入力される。
ステップS2において、角度識別手段110は入力画像101における顔画像の角度を判別する。
ステップS3において、角度識別手段110から出力される入力画像101における顔画像の角度θに基づき、参照画像識別手段120におけるパラメータを回転処理し、角度θに対応する画像識別手段を生成する。
ステップS4において、目標画像検出手段140は、角度θに対応する画像識別手段を用い、入力画像101において顔画像が存在するか否かを判断し、その顔画像の特性(例えば、位置、サイズなど)を検出する。画像出力手段150は、検出された顔画像を表示する。
本実施形態によれば、参照角度Rに対応する参照画像識別手段120を設け、また、画像識別手段に用いるパラメータを角度に依存するグループと角度に依存しないグループとに分ける。角度識別手段110により入力画像101における顔画像の角度が判別されると、角度に依存するパラメータのみを回転処理して顔画像の角度に合わせ、顔画像の角度に対応する画像識別手段を生成する。従って、一つの画像識別手段をメモリに保存すればよく、全ての候補角度についてそれぞれに対応する画像識別手段を記憶しておく必要がない。これにより、使用するメモリの容量が大幅に低減され、また、従来のように画像を回転するなどの処理は計算量が非常に多い。本実施形態では、画像の回転を行わずに、画像識別手段を回転するので、計算量は大幅に低減される。
また、構成が簡単である角度識別手段110を用いて入力画像101における顔画像の角度を判別し、そして、一つの画像識別手段により目標画像を識別する構成を有するので、計算効率はより高い。例えば、顔画像の角度の候補が既知で、かつ数が限られている場合は、簡単な構成の画像識別手段で、複数向きの顔画像の角度を識別することができ、従来より効率が高い。
以上、本発明の好ましい実施形態を説明したが、本発明はこれらの実施形態に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の範囲に属する。
例えば、以上は、顔を目標画像として検出する例を挙げて説明したが、本発明は車や道路など他の目標画像の検出にも適用できる。
また、参照画像識別手段120は以上に説明した構成に限定されない。所定方向の目標画像に対応し、パラメータの調整により他の方向の目標画像識別に適応することができれば、如何なる構成の画像識別器でもよい。
また、目標画像検出手段140はカスケード型Boosting目標画像識別器に限定されない。画像ブロック自身の情報に基づき、すなわち、目標画像自身に基づき目標画像であるか否かを判定できれば、如何なる方法でもよい。例えば、顔検出の場合、テンプレートマッチングに基づく顔検出方法や、肌色に基づく顔検出方法を用いることができる。
カメラの複数の姿勢を例示する図である。 カメラの複数の姿勢を例示する図である。 カメラの複数の姿勢を例示する図である。 向きの異なる顔画像を例示する図である。 向きの異なる顔画像を例示する図である。 向きの異なる顔画像を例示する図である。 本発明の一実施形態に係る目標画像検出装置の構成を例示するブロック図である。 入力画像101を例示する図である。 本実施形態に係る角度識別手段110の構成を例示するブロック図である。 角度識別手段110の動作を示すフローチャートである。 本実施形態に係る参照画像識別手段120の構成を例示するブロック図である。 顔検出用識別器に用いるHaarウェーブレット顔特徴を示す図である。 画像識別器の特徴パラメータの回転処理を示す図である。 本実施形態に係る目標画像検出手段140の構成を例示するブロック図である。 画像検出装置10の動作を示すフローチャートである。
符号の説明
10 画像検出装置
101 入力画像信号
105 画像ブロック生成手段
110 角度識別手段
111 角度分類器グループ
112 統合部
120 参照画像識別手段
121,122,123 角度分類器
130 角度対応画像識別部生成手段
140 目標画像検出手段
150 画像出力手段

Claims (16)

  1. 所定向きの画像に目標画像が含まれているか否かを判別する目標画像識別手段と、
    入力画像の向きを判別する画像方向判別手段と、
    判別された前記入力画像の向きに応じて、前記目標画像識別手段を回転する回転手段と
    を有し、
    前記回転された目標画像識別手段により、前記入力画像から、前記目標画像が検出される
    目標画像検出装置。
  2. 前記画像方向判別手段は、前記目標画像における複数の特徴部を用い、前記入力画像の向きを判別する
    請求項1に記載の目標画像検出装置。
  3. 前記目標画像識別手段、段階的に配置された複数の画像識別部を含み、
    前記回転手段は、判別された前記入力画像の向きに応じて、前記目標画像識別手段における少なくとも一部の画像識別部を回転する
    請求項1に記載の目標画像検出装置。
  4. 前記画像方向判別手段は、各々2つの角度を区別する方向判別部を複数有し、前記入力画像の複数の向きを判別する
    請求項1〜3の何れかに記載の目標画像検出装置。
  5. 前記画像方向判別手段は、さらに、前記複数の方向判別部の出力を統合する統合部を有する
    請求項4に記載の目標画像検出装置。
  6. 前記回転手段は、前記判別された前記入力画像の向きに応じて、前記目標画像識別手段におけるパラメータのうち、方向に依存するパラメータのみを調整し、前記目標画像識別手段を回転する
    請求項1に記載の目標画像検出装置。
  7. 前記方向に依存するパラメータは、前記目標画像における複数の特徴部の位置を含む
    請求項6に記載の目標画像検出装置。
  8. 入力画像の向きを判別する画像方向判別ステップと、
    判別された前記入力画像の向きに応じて、目標画像識別に用いられるパラメータを回転処理する回転ステップと、
    前記回転されたパラメータを用い、前記入力画像から、前記目標画像を検出する目標画像識別ステップと
    を有する
    目標画像検出方法。
  9. 前記画像方向判別ステップにおいて、前記目標画像における複数の特徴部を用い、前記入力画像の向きを判別する
    請求項8に記載の目標画像検出方法。
  10. 前記目標画像識別ステップにおいて、段階的に配置された複数の画像識別部を用い、前記目標画像を検出し、
    前記回転ステップにおいて、判別された前記入力画像の向きに応じて、少なくとも一部の画像識別部を回転する
    請求項8に記載の目標画像検出方法。
  11. 前記画像方向判別ステップにおいて、各々2つの角度を区別する方向判別部を複数用い、前記入力画像の複数の向きを判別する
    請求項8〜10の何れかに記載の目標画像検出方法。
  12. 前記画像方向判別ステップにおいては、さらに、前記複数の方向判別ステップの出力が統合される
    請求項11に記載の目標画像検出方法。
  13. 前記回転ステップにおいて、前記判別された前記入力画像の向きに応じて、前記目標画像識別ステップにおけるパラメータのうち、方向に依存するパラメータのみを調整し、前記回転処理を行う
    請求項8に記載の目標画像検出方法。
  14. 前記方向に依存するパラメータは、前記目標画像における複数の特徴部の位置を含む
    請求項13に記載の目標画像検出方法。
  15. コンピュータに
    入力画像の向きを判別する画像方向判別ステップと、
    判別された前記入力画像の向きに応じて、目標画像識別に用いられるパラメータを回転処理する回転ステップと、
    前記回転されたパラメータを用い、前記入力画像から、前記目標画像を検出する目標画像識別ステップと
    を実行させる
    目標画像検出プログラム。
  16. コンピュータに
    入力画像の向きを判別する画像方向判別ステップと、
    判別された前記入力画像の向きに応じて、目標画像識別に用いられるパラメータを回転処理する回転ステップと、
    前記回転されたパラメータを用い、前記入力画像から、前記目標画像を検出する目標画像識別ステップと
    を実行させる
    目標画像検出プログラムを記録した記憶媒体。
JP2008072441A 2007-03-21 2008-03-19 目標画像検出方法及び画像検出装置 Expired - Fee Related JP5256806B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200710087885.3 2007-03-21
CN200710087885.3A CN101271515B (zh) 2007-03-21 2007-03-21 能识别多角度目标的图像检测装置

Publications (2)

Publication Number Publication Date
JP2008234653A true JP2008234653A (ja) 2008-10-02
JP5256806B2 JP5256806B2 (ja) 2013-08-07

Family

ID=39666190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008072441A Expired - Fee Related JP5256806B2 (ja) 2007-03-21 2008-03-19 目標画像検出方法及び画像検出装置

Country Status (4)

Country Link
US (1) US8660317B2 (ja)
EP (1) EP1973064A3 (ja)
JP (1) JP5256806B2 (ja)
CN (1) CN101271515B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011165188A (ja) * 2010-02-08 2011-08-25 Ricoh Co Ltd 多角度の特定物体の判断装置及び多角度の特定物体の判断方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4478093B2 (ja) * 2005-10-17 2010-06-09 富士フイルム株式会社 対象画像検索装置およびディジタル・カメラならびにそれらの制御方法
US8634638B2 (en) * 2008-06-20 2014-01-21 Sri International Real-time action detection and classification
CN101458560B (zh) * 2008-12-25 2011-06-29 南京壹进制信息技术有限公司 一种计算机智能节能方法
JP2010182150A (ja) * 2009-02-06 2010-08-19 Seiko Epson Corp 顔の特徴部位の座標位置を検出する画像処理装置
CN101872476A (zh) * 2009-04-24 2010-10-27 索尼株式会社 估计图像中对象姿势视角的方法、设备
CN102208009A (zh) * 2010-03-31 2011-10-05 索尼公司 分类器及分类方法
CN101917548A (zh) * 2010-08-11 2010-12-15 无锡中星微电子有限公司 自适应调整画面的摄像装置及方法
WO2012085330A1 (en) * 2010-12-20 2012-06-28 Nokia Corporation Picture rotation based on object detection
CN102129572B (zh) * 2011-02-25 2013-05-15 杭州海康威视数字技术股份有限公司 采用级联分类器的人脸检测方法及其装置
EP2691915A4 (en) * 2011-03-31 2015-04-29 Intel Corp METHOD FOR DETECTING FACE POINTS
TWI501195B (zh) * 2011-05-23 2015-09-21 Asustek Comp Inc 物件偵測方法及其裝置
US9183447B1 (en) * 2011-06-09 2015-11-10 Mobileye Vision Technologies Ltd. Object detection using candidate object alignment
JP5848551B2 (ja) * 2011-08-26 2016-01-27 キヤノン株式会社 学習装置、学習装置の制御方法、検出装置、検出装置の制御方法、およびプログラム
CN102426646B (zh) * 2011-10-24 2014-02-12 西安电子科技大学 多角度人脸检测装置与方法
US9129177B2 (en) * 2012-01-09 2015-09-08 Qualcomm Incorporated Image cache
CN102622604B (zh) * 2012-02-14 2014-01-15 西安电子科技大学 一种基于可变形部件加权的多角度人脸检测方法
CN102708383B (zh) * 2012-05-21 2014-11-26 广州像素数据技术开发有限公司 一种多模态比对功能的活体人脸检测系统与方法
CN102799901B (zh) * 2012-07-10 2015-07-15 陈遇春 一种多角度人脸检测方法
JP6344638B2 (ja) 2013-03-06 2018-06-20 株式会社リコー 物体検出装置、移動体機器制御システム及び物体検出用プログラム
CN104219488B (zh) * 2013-05-31 2019-01-11 索尼公司 目标图像的生成方法和装置、以及视频监控系统
CN104281569B (zh) * 2013-07-01 2017-08-01 富士通株式会社 构建装置和方法、分类装置和方法以及电子设备
CN103543817A (zh) * 2013-08-14 2014-01-29 南通腾启电子商务有限公司 一种新型计算机节能系统
CN103729649B (zh) * 2014-01-14 2017-03-01 三星电子(中国)研发中心 一种图像旋转角度检测方法和装置
CN104794733B (zh) 2014-01-20 2018-05-08 株式会社理光 对象跟踪方法和装置
CN105163103B (zh) 2014-06-13 2017-10-27 株式会社理光 用层叠结构来表示立体图像以分析图像中的目标的技术
CN104091149B (zh) * 2014-06-20 2018-01-26 中国船舶重工集团公司第七二六研究所 人脸的采集建模训练系统及其采集建模训练方法
CN105335955B (zh) 2014-07-17 2018-04-10 株式会社理光 对象检测方法和对象检测装置
CN105335748B (zh) 2014-08-07 2018-10-12 株式会社理光 图像特征提取方法和系统
US9589351B2 (en) * 2014-09-10 2017-03-07 VISAGE The Global Pet Recognition Company Inc. System and method for pet face detection
CN104482883A (zh) * 2014-12-26 2015-04-01 大族激光科技产业集团股份有限公司 一种标志安装孔的轮廓度和位置度的自动测量设备
US10114127B2 (en) * 2015-05-11 2018-10-30 The United States Of America, As Represented By The Secretary Of The Navy Augmented reality visualization system
CN105740792B (zh) * 2016-01-25 2019-03-12 浙江生辉照明有限公司 目标检测方法和装置
US9864931B2 (en) 2016-04-13 2018-01-09 Conduent Business Services, Llc Target domain characterization for data augmentation
US10347218B2 (en) * 2016-07-12 2019-07-09 Qualcomm Incorporated Multiple orientation detection
CN106203383B (zh) * 2016-07-21 2019-06-11 成都之达科技有限公司 基于图像的车辆安全预警方法
CN106384087A (zh) * 2016-09-05 2017-02-08 大连理工大学 一种基于多层网络人体特征的身份识别方法
JP6604314B2 (ja) * 2016-11-15 2019-11-13 京セラドキュメントソリューションズ株式会社 画像読取装置、画像形成装置、画像読取方法
CN106874845B (zh) * 2016-12-30 2021-03-26 东软集团股份有限公司 图像识别的方法和装置
CN107798228A (zh) * 2017-09-27 2018-03-13 维沃移动通信有限公司 一种人脸识别方法及移动终端
CN108121986B (zh) * 2017-12-29 2019-12-17 深圳云天励飞技术有限公司 目标检测方法及装置、计算机装置和计算机可读存储介质
US10977548B2 (en) 2018-12-05 2021-04-13 Bank Of America Corporation Generation of capsule neural networks for enhancing image processing platforms
CN109657603B (zh) * 2018-12-17 2021-05-11 深圳云天励飞技术有限公司 人脸检测的方法及装置
CN111415520A (zh) * 2018-12-18 2020-07-14 北京航迹科技有限公司 处理交通目标的系统和方法
CN110796029B (zh) * 2019-10-11 2022-11-11 北京达佳互联信息技术有限公司 人脸校正及模型训练方法、装置、电子设备及存储介质
CN111582027B (zh) * 2020-04-01 2024-03-22 广州亚美智造科技有限公司 身份认证方法、装置、计算机设备和存储介质
CN112801070B (zh) * 2021-04-14 2021-09-21 浙江啄云智能科技有限公司 一种目标检测方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115973A (ja) * 1997-06-23 1999-01-22 Mitsubishi Electric Corp 画像認識装置
JP2005044330A (ja) * 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549646B1 (en) * 2000-02-15 2003-04-15 Deus Technologies, Llc Divide-and-conquer method and system for the detection of lung nodule in radiological images
JP4665355B2 (ja) 2001-07-23 2011-04-06 コニカミノルタホールディングス株式会社 画像抽出装置、画像抽出方法および画像抽出プログラム
US6915025B2 (en) * 2001-11-27 2005-07-05 Microsoft Corporation Automatic image orientation detection based on classification of low-level image features
US7024033B2 (en) 2001-12-08 2006-04-04 Microsoft Corp. Method for boosting the performance of machine-learning classifiers
US7050607B2 (en) 2001-12-08 2006-05-23 Microsoft Corp. System and method for multi-view face detection
US7233692B2 (en) * 2002-11-14 2007-06-19 Lockheed Martin Corporation Method and computer program product for identifying output classes with multi-modal dispersion in feature space and incorporating multi-modal structure into a pattern recognition system
US7565030B2 (en) * 2003-06-26 2009-07-21 Fotonation Vision Limited Detecting orientation of digital images using face detection information
JP4692773B2 (ja) * 2004-03-03 2011-06-01 日本電気株式会社 物体の姿勢推定及び照合システム、物体の姿勢推定及び照合方法、並びにそのためのプログラム
KR100643303B1 (ko) 2004-12-07 2006-11-10 삼성전자주식회사 다면 얼굴을 검출하는 방법 및 장치
JP2006331266A (ja) 2005-05-30 2006-12-07 Konica Minolta Holdings Inc オブジェクト検出方法及びオブジェクト検出装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115973A (ja) * 1997-06-23 1999-01-22 Mitsubishi Electric Corp 画像認識装置
JP2005044330A (ja) * 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6012033538; Yong Ma: 'Real-time rotation invariant face detection based on cost-sensitive AdaBoost' Image Processing,2003.ICIP 2003.Proceeding.2003 International Conference Vol.3, 200309, III-921-924 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011165188A (ja) * 2010-02-08 2011-08-25 Ricoh Co Ltd 多角度の特定物体の判断装置及び多角度の特定物体の判断方法

Also Published As

Publication number Publication date
CN101271515A (zh) 2008-09-24
CN101271515B (zh) 2014-03-19
US20080253664A1 (en) 2008-10-16
EP1973064A2 (en) 2008-09-24
US8660317B2 (en) 2014-02-25
JP5256806B2 (ja) 2013-08-07
EP1973064A3 (en) 2011-01-12

Similar Documents

Publication Publication Date Title
JP5256806B2 (ja) 目標画像検出方法及び画像検出装置
JP4619927B2 (ja) 顔検出方法および装置並びにプログラム
JP4642128B2 (ja) 画像処理方法、画像処理装置及びシステム
US8861806B2 (en) Real-time face tracking with reference images
US8391645B2 (en) Detecting orientation of digital images using face detection information
US8081844B2 (en) Detecting orientation of digital images using face detection information
US8605955B2 (en) Methods and apparatuses for half-face detection
US9230184B2 (en) Image display control apparatus and method, and program for controlling image display control apparatus
EP3168810A1 (en) Image generating method and apparatus
CN110348270B (zh) 影像物件辨识方法与影像物件辨识系统
US20050190963A1 (en) Target object detecting method, apparatus, and program
JP2008234654A (ja) 目標画像検出方法及び画像検出装置
JP2011165008A (ja) 画像認識装置および方法
KR101235791B1 (ko) 방위 독립적인 얼굴 검출기를 제공하는 방법, 장치 및 컴퓨터 프로그램 제품
JP2008152530A (ja) 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム
JP2008102611A (ja) 画像処理装置
JP2007272685A (ja) 自動トリミング方法および装置ならびにプログラム
JP2007065844A (ja) 顔検出方法および装置並びにプログラム
WO2014074959A1 (en) Real-time face detection using pixel pairs
JP4647289B2 (ja) 画像処理方法および装置並びにプログラム
JP4708835B2 (ja) 顔検出装置、顔検出方法、及び顔検出プログラム
JP2007074142A (ja) 撮像装置及びその制御方法、及び画像処理装置及び方法
JPWO2020213166A1 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP2008181439A (ja) 顔検出装置及び方法並びに撮像装置
JP2008211534A (ja) 顔検知装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160502

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5256806

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees