JP2008234654A - 目標画像検出方法及び画像検出装置 - Google Patents

目標画像検出方法及び画像検出装置 Download PDF

Info

Publication number
JP2008234654A
JP2008234654A JP2008072442A JP2008072442A JP2008234654A JP 2008234654 A JP2008234654 A JP 2008234654A JP 2008072442 A JP2008072442 A JP 2008072442A JP 2008072442 A JP2008072442 A JP 2008072442A JP 2008234654 A JP2008234654 A JP 2008234654A
Authority
JP
Japan
Prior art keywords
image
target image
target
block
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008072442A
Other languages
English (en)
Inventor
Zhongchao Shi
ジョォンチャオ シ
Haike Guan
海克 関
Gane Wang
ガン ワン
Tao Li
タオ リ
Cheng Du
ドゥ チョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2008234654A publication Critical patent/JP2008234654A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Abstract

【課題】入力画像における目標画像を高速に検出する目標画像検出方法及び装置を提供する
【解決手段】 本発明の目標画像検出装置は、入力画像から目標画像を検出する目標画像検出装置であって、前記入力画像から、前記目標画像を検出するための複数の画像ブロックを生成する画像ブロック生成手段と、前記目標画像における複数の特徴部を用い、前記画像ブロックの各々に前記目標画像が含まれているか否かを判断し、目標画像候補となる前記画像ブロックを取得する照合手段と、前記取得した複数の目標画像候補から、前記目標画像を順次検出する検出手段とを備え、前記照合手段は、各々の前記画像ブロックと既に取得した目標画像候補との相対位置関係に基づいて、前記目標画像候補となる画像ブロックを取得する。
【選択図】図1

Description

本発明は画像処理に関し、特に、入力画像における目標画像を高速に検出する目標画像検出方法及び装置に関する。
近年、目標検出技術は各分野において広く応用されている。目標検出技術とは、1つの画像(写真、静止画像、ビデオ画像など)において、目標となる対象(例えば、顔、車など)を検出する技術である。
例えば、特許文献1、特許文献2は目標画像検出技術を開示する。
US7099510 US7020337 P.Viola,M.J.Jones,"Robust Real−Time Face Detection"、International Journal of Computer Vision,vol.57,pp.137−154,May 2004.
従来の目標画像検出技術をデジタルカメラなどの携帯用デジタル機器に応用する場合に以下の問題がある。これらの機器は、処理部のクロック周波数が低く、メモリが少ないなどのことにより、高い計算力を持っていないため、高い計算力を要求する従来の目標画像検出技術をそのまま適用することができない。また、上記特許文献1、特許文献2は所定の画像領域から抽出した複数の画像ブロックにより、その所定の画像領域が目標画像であるか否かを判定し、すべての目標画像を取得したら出力する技術を開示しているものの、画像検出処理を如何に速く行って出力することを開示していない。一般的に、ユーザは目標検出機能を具備するカメラを使用する際に、できるだけ速くモニターで検出結果を見たい心理がある。従って、高い計算力を持っていない場合であっても、高速に目標画像を検出し、ユーザに表示することが要求される。
本発明は、以上の問題点に鑑みてなされ、その目的は、入力画像における目標画像を高速に検出する目標画像検出方法及び装置を提供することにある。
本発明の目標画像検出装置は、入力画像から目標画像を検出する目標画像検出装置であって、前記入力画像から、前記目標画像を検出するための複数の画像ブロックを生成する画像ブロック生成手段と、前記目標画像における複数の特徴部を用い、前記画像ブロックの各々に前記目標画像が含まれているか否かを判断し、目標画像候補となる前記画像ブロックを取得する照合手段と、前記取得した複数の目標画像候補から、前記目標画像を順次検出する検出手段とを備え、前記照合手段は、各々の前記画像ブロックと既に取得した目標画像候補との相対位置関係に基づいて、前記目標画像候補となる画像ブロックを取得する。
本発明によれば、照合手段は、画像ブロックと既に取得した目標画像候補との相対位置関係を考慮し、また、目標画像の特徴部を用いて画像ブロックにおいて目標画像の有無を判断し、目標画像候補を取得して検出する。これにより、不必要な判断をせずに、高速に入力画像における目標画像を検出することができる。
次に、添付した図面を参照しながら、本発明の実施形態を説明する。
図1は本発明の一実施形態に係る目標画像検出装置の構成例を示すブロック図である。
例えば、本実施形態に係る画像検出装置は、デジタルカメラなどの携帯用デジタル機器に搭載され、写真を撮影する際に、被写体となる人物の顔や、風景における特徴部などを検出し、焦点合わせやその他の調整に用いられる。以下、主に顔の検出を例として説明する。
なお、本実施形態に係る画像検出装置はこのような応用に限定されない。
図1に示すように、本実施形態に係る画像検出装置10は、画像ピラミッド生成手段120と画像処理部100とを備える。画像処理部100は、画像ブロック生成手段130、画像ブロック処理手段140、目標画像検出手段150、ポスト処理手段160、及び画像出力手段170を有する。
例えば、カメラの撮像部により、被写体の画像信号101が得られ、画像検出装置10に入力される。
図2は入力画像101を例示する図である。
図2に示すように、入力画像信号101において、位置やサイズの異なる顔画像102、103がある。
画像ピラミッド生成手段120は入力画像101のピラミッド構造を生成する。この「画像のピラミッド構造」は、本願における「階層状画像構造」に対応する。
図3は画像ピラミッド生成手段120により生成された入力画像ピラミッド構造を例示する図である。
図3に示すように、画像ピラミッド生成手段120は、入力画像101に対して拡大又は縮小処理をして、これら拡大又は縮小された入力画像から画像ピラミッド構造20を生成する。即ち、画像ピラミッド20の各階層に大きさの異なる入力画像が含まれる。
例えば、画像ピラミッド生成手段120は、Voila積分画像法や、ガウシアン・ピラミッド、或はラプラシアン・ピラミッドなどの方法を用いて画像ピラミッドを生成する。
なお、画像ピラミッド生成手段120は、所定のダウンサンプリングのパラメーターで入力画像信号をダウンサンプリングし、画像ピラミッドを生成しても良い。勿論、その他の方法で画像ピラミッドを生成しても良い。
図3において、一例として、画像ピラミッド構造はn階層を有し、最も小さいサイズの画像121からなる第1の階層、画像122からなる第j―1階層、画像123からなる第j階層、最もサイズが大きい元の入力画像101からなる第Nの階層である。
画像ピラミッドを生成することにより、目標画像の検出は高速にできる。また、後述するように、各階層の画像のサイズが異なる画像ピラミッド構造を生成することにより、画像ブロック生成手段130において、所定大きさの矩形ウィンドウを用いて、入力画像101における異なるサイズの顔画像を検出することができる。
画像ブロック生成手段130は、入力画像に含まれる目標画像(例えば、顔画像)を検出するために、画像ピラミッド構造における各々の階層の画像を複数の画像ブロックに分けて、各階層の画像の画像ブロックを生成し、各画像ブロックに目標画像の有無の判断に供する。
画像ブロックの生成方法として、例えば、所定大きさの矩形ウィンドウを各階層の画像に掛けて、そのウィンドウに覆われた画像の部分を一画像ブロックとする。そして、そのウィンドウを所定の距離ずつ(Step Size)連続的に移動させ、入力画像101全体をスキャンし、異なる位置でのウィンドウに覆われた画像の部分から、複数の画像ブロックを得る。これにより、入力画像の異なる位置にある顔画像を含む画像ブロックが生成され、検出に供される。よって、異なる位置にある顔画像を検出することができる。
また、画像ピラミッドの各階層の画像は大きさが異なるので、画像ブロック生成手段130において、所定大きさの矩形ウィンドウを用いても、元々の入力画像101において異なるサイズの顔画像を検出することができる。
一例として、入力画像101の画像サイズは320×240画素であり、画像ブロックのサイズは20×20画素であり、水平・垂直方向のステップサイズは3画素である。
画像ブロック処理手段140は、現在の階層の画像ブロックのうち、他の階層で既に検出された目標画像(例えば、顔画像)と重複する画像ブロックがあるか否かを判断し、重複する画像ブロックがあると判断された場合は、その画像ブロックを除去し、残りの画像ブロックを現在階層の有効画像ブロックとする。
図4は、画像ブロックと目標画像との重複の判定条件を示す図である。
図4において、画像ブロック107の左上の角の座標をX1,Y1、右下の角の座標をX2,Y2とし、目標画像106の左上の角の座標をXs,Ys、右下の角の座標をXe,Yeとする。
画像ブロック107が目標画像106と重複するか否かを判定する判定条件として、例えば、下記の式を用いる。

Xs < X2 < Xe、かつ、Ys < Y2 < Ye

或いは、

Xs < X1 < Xe、かつ、Ys < Y1 < Ye

画像ブロック107と目標画像106の座標は上記式を満たす場合は、画像ブロック107と目標画像106とは重複していると判定される。
勿論、画像ブロックが目標画像との重複を判定する条件を、ユーザが要求する目標画像を検出する精度及びスピードに応じて決めても良い。
例えば、(a)画像ブロック107は完全に目標画像106域内にある、(b)画像ブロック107は目標画像106と一部重なり、かつ、重なる部分の面積は一定の割合以上である、(c)画像ブロック107は目標画像106と互いに重なり、かつ、少なくとも1つの画素が重複することを条件として、(a)、(b)、(c)の内の1つ或は複数に基づいて判定しても良い。
このように、他の階層で既に検出された目標画像(例えば、顔画像)と重複する画像ブロックを除去し、残りの有効画像ブロックのみについて目標画像の検出を行うことにより、不必要な計算を省き、計算量を抑え、目標画像を高速に検出することができる。
目標画像検出手段150は、入力される各有効画像ブロックにおいて、目標画像(例えば、顔画像)が存在するか否かを判断する。
図5は本実施形態に係る目標画像検出手段150の構成例を示すブロック図である。
図5に示すように、本実施例では、目標画像検出手段150はカスケード型Boosting目標画像識別器を用い、また、非特許文献1に開示のViolaの方法を用いて目標画像を検出する。即ち、Haarウェーブレットを顔検出の特徴とする。
図6は、顔検出用識別器に用いるHaarウェーブレット顔検出特徴を示す図である。
図5に示すように、目標画像検出手段150を構成する目標画像識別器は、N段のBoosting目標画像識別器からなる。所定の段のBoosting目標画像識別器に入力された画像ブロックについて、そのBoosting目標画像識別器の出力は関連する閾値より小さい場合、当該画像ブロックに顔が含まれないと判断し(図5の「F」)、目標画像検出手段150の処理が終了する。一方、そのBoosting目標画像識別器の出力は関連する閾値以上である場合、当該画像ブロックに顔が含まれている可能性があると判断し(図5の「T」)、次のBoosting目標画像識別器に進み、更に当該画像ブロックに顔が含まれているか否かを判断する。このように、全ての段のBoosting目標画像識別器が当該画像ブロックに顔が含まれている可能性があると判断した場合は、目標画像検出手段150は、当該画像ブロックに顔が含まれていると判断し、当該当該画像ブロックは顔画像候補とする。
ポスト処理手段160は、入力された所定の階層の画像におけるすべての顔画像候補となる画像ブロックを処理し、当該階層の画像における顔画像データ及び顔画像の個数を特定する。
なお、ポスト処理手段160は、第1階層から現在の階層までのすべての顔画像データ及び顔画像の個数を特定するとしても良い。
画像出力手段170は、例えば、検出された顔画像をデジタルカメラのモニター画面に出力して表示する。
次に、画像検出装置10の動作を説明する。
図7は画像検出装置10の動作を示すフローチャートである。
図7に示すように、ステップS11において、例えばカメラの撮像部により、被写体の画像信号101(図2)が得られ、画像検出装置10に入力される。
ステップS12において、画像ピラミッド生成手段120は、各階層に大きさの異なる入力画像が含まれる入力画像101のピラミッド構造(図3)を生成する。この画像ピラミッド構造はn階層を有し、最も画像サイズの小さい階層121から最も画像サイズの大きい階層101からなる。
画像ピラミッド生成手段120は、この画像ピラミッド構造を画像ブロック生成手段130に入力する。
ステップS13において、画像ブロック生成手段130は、画像ピラミッド構造における第1の階層(m=1)の画像121に対して処理を行う。全ての階層の画像に対する処理が完了すると(ステップS14)、画像検出処理が終了する(ステップS22)。
ステップS15において、画像ブロック生成手段130は、第1の階層(m=1)の画像121の画像ブロックを生成する。具体的に、画像ブロック生成手段130は、大きさが20×20画素のウィンドウを用い、画像121の左上の角から、水平及び垂直方向に3画素ずつ(即ち、ステップサイズが3画素である)画像121をスキャンし、大きさが20×20画素の複数の画像ブロックを順次抽出する。画像121全体をスキャンした後に、大きさ20×20画素の画像ブロックからなる画像集合I1が得られる。当該画像集合I1は、画像ブロック処理手段140に入力される。
ステップS16において、画像ブロック処理手段140は、入力された画像ブロックの集合I1から有効画像ブロックを決定する。画像121は最初の階層(m=1)であるので、入力された全ての画像ブロックI1は画像121の有効画像ブロック集合I1vとなる。得られた有効画像ブロック集合I1vは目標画像検出手段150に入力される。
ステップS17において、図5に示す構造を有する目標画像検出手段150は、入力された第1階層の有効画像ブロック集合I1vにおける各画像ブロックに対して目標画像(例えば、顔画像)の検出を行い、顔画像である可能性のある画像ブロック(以下、顔画像ブロック候補顔画像ブロック候補)の集合S1が得られる。
図8は、本実施形態による目標画像検出の様子を示す図である。
図8に示すように、画像121において顔画像102は検出される。
この顔画像ブロック候補の集合S1がポスト処理手段160に入力される。
ステップS18において、ポスト処理手段160は、顔画像ブロック候補の集合S1における全ての顔画像ブロック候補を処理し、画像121における顔画像及び顔画像の個数を得る。具体的に、画像121に、一つの顔画像102が検出され、顔画像の数R1=1である。もし顔画像が検出されない場合、即ち、顔画像の数R1=0である場合(ステップS19にNo)、ステップS14に戻り、次の階層に進む(ステップS20)。
ステップS21において、画像出力手段170は、画像121において検出された顔画像102を、例えば、デジタルカメラのモニター画面に出力して表示する。
図9は、本実施形態による目標画像検出の結果を表示する様子を示す図である。
図9に示すように、画像121において検出された顔画像102は四角枠に囲まれて表示されている。
なお、便宜上、図8と比較しやすいために、サイズの異なる画像101〜121は一列に示されているが、実際に、カメラーのモニタ上に、一つの入力画像101上に顔画像102,103、104,105が順次表示される。
そして、ステップS14に戻り、ステップS14からステップS21を繰り返して、次の階層(m=m+1)の処理を行う(ステップS20)。
次に、第j−1階層(m=j−1)の画像122から顔画像を検出する処理を説明する。
ステップS15において、画像ブロック生成手段130は、画像122全体をスキャンし、20×20画素の画像ブロックからなる画像集合Ij−1を得る。
ステップS16において、画像ブロック処理手段140は、入力された画像122の画像ブロックの集合Ij−1から有効画像ブロックを決定する。
具体的に、入力された画像ブロックの集合Ij−1に、第1階層(m=1)の画像121で既に検出された顔画像102と重複する画像ブロックがあるので、画像ブロック処理手段140はその画像ブロックを除去し、残りの画像ブロックを第j−1階層の有効画像ブロック集合Ij−1vとする。
図8に示すように、第1階層の画像121において既に検出された顔画像102と重複する画像ブロックは、画像122から除去される。
ステップS17において、目標画像検出手段150は、入力された第j−1階層の有効画像ブロック集合Ij−1vにおける各画像ブロックに対して目標画像(例えば、顔画像)の検出を行い、顔画像ブロック候補の集合Sj−1が得られる。この顔画像ブロック候補の集合Sj−1がポスト処理手段160に入力される。
ステップS18において、ポスト処理手段160は、顔画像ブロック候補の集合Sj−1における全ての顔画像ブロック候補を処理し、画像122における顔画像及び顔画像の個数を得る。具体的に、画像122に、一つの顔画像103が検出され、顔画像の数Rj−1=1である。
図8に示すように、画像122において、顔画像103は検出される。
ステップS21において、画像出力手段170は、画像122において検出された顔画像103を表示する。
図9に示すように、画像122において検出された顔画像103、並びに画像121において既に検出された顔画像102は四角枠に囲まれて表示されている。
第j−1階層の画像122から顔画像の検出が終了した後に、第j階層の画像123に対する処理が行われる。
ステップS15において、画像ブロック生成手段130は、画像123全体をスキャンし、20×20画素の画像ブロックからなる画像集合Ijを得る。
ステップS16において、画像ブロック処理手段140は、入力された画像123の画像ブロックの集合Ijから有効画像ブロックを決定する。
具体的に、入力された画像ブロックの集合Ijに、第1階層から第j−1階層まで既に検出された顔画像と重複する画像ブロックを除去し、残りの画像ブロックを第j階層の有効画像ブロック集合Ijvとする。
図8に示すように、画像ブロックの集合Ijにおいて、第1階層に検出された顔画像102、並びに第j−1階層に検出された顔画像103と重複する画像ブロックがあるので、画像ブロック処理手段140はそれらの画像ブロックを除去し、残りの画像ブロックを第j階層の有効画像ブロック集合Ijvとする。
ステップS17において、目標画像検出手段150は、入力された第j階層の有効画像ブロック集合Ijvにおける各画像ブロックに対して目標画像(例えば、顔画像)の検出を行い、顔画像ブロック候補の集合Sjが得られる。この顔画像ブロック候補の集合Sj−1がポスト処理手段160に入力される。
ステップS18において、ポスト処理手段160は、顔画像ブロック候補の集合Sj−1における全ての顔画像ブロック候補を処理し、画像123における顔画像及び顔画像の個数を得る。具体的に、画像123に一つの顔画像104が検出され、顔画像の数Rj=1である。
図8に示すように、画像123において、顔画像104は検出される。
ステップS21において、画像出力手段170は、画像123において検出された顔画像104を表示する。
図9に示すように、画像123において検出された顔画像104、画像122において検出された顔画像103、並びに画像121において既に検出された顔画像102は四角枠に囲まれて表示されている。
同様に、最後の階層である第n階層の画像101に対して同じように処理をし、ステップS16において、入力された画像101の画像ブロックの集合Inに、第1階層から第n−1階層まで既に検出された顔画像と重複する画像ブロックを除去し、第n階層の有効画像ブロック集合Inを得る。図8に示すように、画像101から既に検出された顔画像102、顔画像103、顔画像104と重複する画像ブロックは除去される。この有効画像ブロック集合Inにおける各画像ブロックに対して目標画像(例えば、顔画像)の検出を行い、顔画像ブロック候補の集合Snが得られる。ポスト処理手段160は、顔画像ブロック候補の集合Snにおける顔画像ブロック候補を処理し、画像123における顔画像及び顔画像の個数を得る。具体的に、画像101に一つの顔画像105が検出され、顔画像の数Rn=1である。
図8に示すように、画像101において顔画像105は検出される。
図9に示すように、画像101において検出された顔画像105、画像123において検出された顔画像104、画像122において検出された顔画像103、並びに画像121において既に検出された顔画像102は四角枠に囲まれて表示されている。
なお、個人認証、画像形成、目標追跡など様々な処理に使うために、検出された顔画像105、顔画像104、顔画像103、及び顔画像102を記憶装置に記憶してもよい。
ステップS22において、最後の階層である第n階層の画像101を処理した後に、目標画像検出が終了する。
本発明によれば、各階層の画像に対して目標画像を検出する際に、既に検出された他の階層における目標画像と重複する画像ブロックを除去するので、画像検出の際に演算量が少なく、検出スピードが向上され、速いスピードで目標画像を検出することができる。
また、本発明によれば、全ての目標画像を検出した後に検出結果を表示するのではなく、個々の目標画像を検出した後に随時表示するので、ユーザは速く検出結果を見ることができる。
以上、本発明の好ましい実施形態を説明したが、本発明はこれらの実施形態に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の範囲に属する。
例えば、以上の実施例では、顔を目標画像として検出する例を挙げて説明したが、本発明は車や道路など他の目標画像の検出にも適用できる。
また、以上は、画像ピラミッド構造を用いる例を説明したが、本発明は画像ピラミッド構造に限定されない。
また、以上の本実施例では、目標画像検出手段150はカスケード型Boosting目標画像識別器を用いる例を説明したが、本発明はこれに限定されない。画像ブロック自身の情報に基づき、すなわち、目標画像自身に基づき目標画像であるか否かを判定できれば、如何なる方法でもよい。例えば、顔検出の場合、テンプレートマッチングに基づく顔検出方法や、肌色に基づく顔検出方法を用いることができる。
本発明の一実施形態に係る目標画像検出装置の構成例を示すブロック図である。 入力画像101を例示する図である。 画像ピラミッド生成手段120により生成された入力画像ピラミッド構造を例示する図である。 画像ブロックと目標画像との重複の判定条件を示す図である。 本実施形態に係る目標画像検出手段150の構成例を示すブロック図である。 顔検出用識別器に用いるHaarウェーブレット顔検出特徴を示す図である。 画像検出装置10の動作を示すフローチャートである。 本実施形態による目標画像検出の様子を示す図である。 本実施形態による目標画像検出の結果を表示する様子を示す図である。
符号の説明
10 画像検出装置
20 画像ピラミッド
100 画像処理部
101 入力画像信号
102、103、104、105 顔画像
121、122、123 画像ピラミッドの各階層の画像
120 画像ピラミッド生成手段
130 画像ブロック生成手段
140 画像ブロック処理手段
150 目標画像検出手段
160 ポスト処理手段
170 画像出力手段

Claims (14)

  1. 入力画像から目標画像を検出する目標画像検出装置であって、
    前記入力画像から、前記目標画像を検出するための複数の画像ブロックを生成する画像ブロック生成手段と、
    前記目標画像における複数の特徴部を用い、前記画像ブロックの各々に前記目標画像が含まれているか否かを判断し、目標画像候補となる前記画像ブロックを取得する照合手段と、
    前記取得した複数の目標画像候補から、前記目標画像を順次検出する検出手段と、
    を備え、
    前記照合手段は、前記各々の画像ブロックと前記既に取得した目標画像候補との相対位置関係に基づいて、前記目標画像候補となる画像ブロックを取得する
    目標画像検出装置。
  2. 前記照合手段は、前記画像ブロックのうち、前記既に取得した目標画像候補と少なくとも一部重複する画像ブロックを除き、残りの複数の画像ブロックから、前記目標画像候補を取得する
    請求項1に記載の目標画像検出装置。
  3. 前記入力画像を階層状に配置し、階層状構造を生成する階層状画像構造生成手段をさらに有し、
    前記画像ブロック生成手段は、前記階層状構造の各層ごとに、前記複数の画像ブロックを順次生成し、
    前記照合手段は、前記階層状構造の各層ごとに、前記画像ブロック生成手段により生成された前記画像ブロックから、前記目標画像候補を取得する
    請求項1又は2に記載の目標画像検出装置。
  4. 前記照合手段は、前記他の層において既に取得した目標画像候補と少なくとも一部重複する現在層の画像ブロックを除き、前記現在の層における前記目標画像候補を取得する
    請求項3に記載の目標画像検出装置。
  5. 前記照合手段は、複数の段階を経て前記複数の特徴部を用いて判断を行い、
    前記照合手段は、前記各段階において、所定の特徴部を用い前記各画像ブロックに前記目標画像が含まれているか否かを判断し、前記目標画像が含まれていないと判断されたとき、前記照合手段は判断を終了し、前記目標画像が含まれていると判断された場合、次の段階に進み、所定の他の特徴部を用いさらに前記各画像ブロックに前記目標画像が含まれているか否かを判断する
    請求項1乃至4の何れかに記載の目標画像検出装置。
  6. 前記検出された目標画像を順次出力する出力手段をさらに有する
    請求項1乃至5のいずれかに記載の目標画像検出装置。
  7. 入力画像から目標画像を検出する目標画像検出方法であって、
    前記入力画像から、前記目標画像を検出するための複数の画像ブロックを生成する画像ブロック生成ステップと、
    前記目標画像における複数の特徴部を用い、前記画像ブロックの各々に前記目標画像が含まれているか否かを判断し、目標画像候補となる前記画像ブロックを取得する照合ステップと、
    前記取得した複数の目標画像候補から、前記目標画像を順次検出する検出ステップと、
    を備え、
    前記照合ステップにおいて、前記各々の画像ブロックと前記既に取得した目標画像候補との相対位置関係に基づいて、前記目標画像候補となる画像ブロックが取得される
    目標画像検出方法。
  8. 前記照合ステップにおいて、前記画像ブロックのうち、前記既に取得した目標画像候補と少なくとも一部重複する画像ブロックを除き、残りの複数の画像ブロックから、前記目標画像候補を取得する
    請求項7に記載の目標画像検出方法。
  9. 前記入力画像を階層状に配置し、階層状構造を生成する階層状画像構造生成ステップさらに有し、
    前記画像ブロック生成ステップにおいて、前記階層状構造の各層ごとに、前記複数の画像ブロックを順次生成し、
    前記照合ステップは、前記階層状構造の各層ごとに、前記画像ブロック生成手段により生成された前記画像ブロックから、前記目標画像候補を順次取得する
    請求項7又は8に記載の目標画像検出方法。
  10. 前記照合ステップにおいて、前記他の層において既に取得した目標画像候補と少なくとも一部重複する現在層の画像ブロックを除き、前記現在の層における前記目標画像候補を取得する
    請求項9に記載の目標画像検出方法。
  11. 前記照合ステップにおいて、複数の段階を経て前記複数の特徴部を用い判断を行い、
    前記各段階において、所定の特徴部を用い前記各画像ブロックに前記目標画像が含まれているか否かを判断し、前記目標画像が含まれていないと判断されたときに、前記照合ステップが終了し、前記目標画像が含まれていると判断されたときに、次の段階に進み、所定の他の特徴部を用いさらに前記各画像ブロックに前記目標画像が含まれているか否かを判断する
    請求項7乃至10の何れかに記載の目標画像検出方法。
  12. 前記検出された目標画像を順次出力する出力ステップをさらに有する
    請求項7乃至11のいずれかに記載の目標画像検出方法。
  13. 入力画像から目標画像を検出する目標画像検出プログラムであって、
    前記プログラムは、コンピュータに
    前記入力画像から、前記目標画像を検出するための複数の画像ブロックを生成する画像ブロック生成ステップと、
    前記目標画像における複数の特徴部を用い、前記画像ブロックの各々に前記目標画像が含まれているか否かを判断し、目標画像候補となる前記画像ブロックを取得する照合ステップと、
    前記取得した複数の目標画像候補から、前記目標画像を順次検出する検出ステップと、
    を実行させ、
    前記照合ステップにおいて、前記各々の画像ブロックと前記既に取得した目標画像候補との相対位置関係に基づいて、前記目標画像候補となる画像ブロックが取得される
    目標画像検出プログラム。
  14. 入力画像から目標画像を検出する目標画像検出プログラムを記憶したコンピュータ読み出し可能な記憶媒体であって、
    前記プログラムは、コンピュータに
    前記入力画像から、前記目標画像を検出するための複数の画像ブロックを生成する画像ブロック生成ステップと、
    前記目標画像における複数の特徴部を用い、前記画像ブロックの各々に前記目標画像が含まれているか否かを判断し、目標画像候補となる前記画像ブロックを取得する照合ステップと、
    前記取得した複数の目標画像候補から、前記目標画像を順次検出する検出ステップと、
    を実行させ、
    前記照合ステップにおいて、前記各々の画像ブロックと前記既に取得した目標画像候補との相対位置関係に基づいて、前記目標画像候補となる画像ブロックが取得される
    記憶媒体。
JP2008072442A 2007-03-21 2008-03-19 目標画像検出方法及び画像検出装置 Pending JP2008234654A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710087879A CN101271514B (zh) 2007-03-21 2007-03-21 一种快速目标检测和目标输出的图像检测方法及装置

Publications (1)

Publication Number Publication Date
JP2008234654A true JP2008234654A (ja) 2008-10-02

Family

ID=39580120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008072442A Pending JP2008234654A (ja) 2007-03-21 2008-03-19 目標画像検出方法及び画像検出装置

Country Status (4)

Country Link
US (1) US8254643B2 (ja)
EP (1) EP1973060A3 (ja)
JP (1) JP2008234654A (ja)
CN (1) CN101271514B (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200022B2 (en) * 2008-03-24 2012-06-12 Verint Systems Ltd. Method and system for edge detection
US8433106B2 (en) * 2008-07-08 2013-04-30 Hewlett-Packard Development Company, L.P. Increasing face detection speed
JP2010108475A (ja) * 2008-10-03 2010-05-13 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
US8442327B2 (en) * 2008-11-21 2013-05-14 Nvidia Corporation Application of classifiers to sub-sampled integral images for detecting faces in images
JP2011053915A (ja) * 2009-09-02 2011-03-17 Sony Corp 画像処理装置、画像処理方法、プログラム及び電子機器
JP5617233B2 (ja) * 2009-11-30 2014-11-05 ソニー株式会社 情報処理装置、情報処理方法及びそのプログラム
JP4930607B2 (ja) * 2010-02-04 2012-05-16 カシオ計算機株式会社 画像処理装置、及び、画像処理プログラム
CN102236883A (zh) * 2010-04-27 2011-11-09 株式会社理光 图像增强方法和装置、物体检测方法和装置
US8693750B2 (en) * 2011-01-14 2014-04-08 Siemens Aktiengesellschaft Method and system for automatic detection of spinal bone lesions in 3D medical image data
JP5895624B2 (ja) * 2012-03-14 2016-03-30 オムロン株式会社 画像処理装置、画像処理方法、制御プログラムおよび記録媒体
JP6344638B2 (ja) 2013-03-06 2018-06-20 株式会社リコー 物体検出装置、移動体機器制御システム及び物体検出用プログラム
US9536137B2 (en) * 2013-03-26 2017-01-03 Megachips Corporation Object detection apparatus
US9652695B2 (en) 2013-12-20 2017-05-16 Google Inc. Label consistency for image analysis
CN104751440A (zh) * 2013-12-31 2015-07-01 西门子医疗保健诊断公司 一种基于图像处理的方法和装置
CN104794733B (zh) 2014-01-20 2018-05-08 株式会社理光 对象跟踪方法和装置
CN103793716B (zh) * 2014-03-11 2017-01-25 山东大学 一种基于分流级联的多类别交通标示牌的检测方法
CN105163103B (zh) 2014-06-13 2017-10-27 株式会社理光 用层叠结构来表示立体图像以分析图像中的目标的技术
CN105335955B (zh) 2014-07-17 2018-04-10 株式会社理光 对象检测方法和对象检测装置
CN105335748B (zh) 2014-08-07 2018-10-12 株式会社理光 图像特征提取方法和系统
US9646389B2 (en) * 2014-08-26 2017-05-09 Qualcomm Incorporated Systems and methods for image scanning
CN104361357B (zh) * 2014-11-07 2018-02-06 北京途迹科技有限公司 基于图片内容分析的相片集分类系统及分类方法
CN105891765B (zh) * 2015-03-08 2018-11-13 怀化智信能源科技有限公司 电表缺陷智能化检测设备
US9704056B2 (en) 2015-04-02 2017-07-11 Qualcomm Incorporated Computing hierarchical computations for computer vision calculations
CN105022990B (zh) * 2015-06-29 2018-09-21 华中科技大学 一种基于无人艇应用的水面目标快速检测方法
EP3391290A4 (en) 2015-12-16 2019-08-07 Intel Corporation PYRAMIDAL NETWORKS FULLY CONVOLVED FOR PEDESTRIAN DETECTION
US9875548B2 (en) * 2015-12-18 2018-01-23 Ricoh Co., Ltd. Candidate list generation
CN105719292B (zh) * 2016-01-20 2018-05-15 华东师范大学 利用两层级联的Boosting分类算法实现视频目标跟踪的方法
US10592729B2 (en) 2016-01-21 2020-03-17 Samsung Electronics Co., Ltd. Face detection method and apparatus
CN106650615B (zh) * 2016-11-07 2018-03-27 深圳云天励飞技术有限公司 一种图像处理方法及终端
CN109614841B (zh) * 2018-04-26 2023-04-18 杭州智诺科技股份有限公司 嵌入式系统中的快速人脸检测方法
CN110717575B (zh) * 2018-07-13 2022-07-26 奇景光电股份有限公司 无帧缓冲器的卷积神经网络系统与方法
CN109272509B (zh) * 2018-09-06 2021-10-29 郑州云海信息技术有限公司 一种连续图像的目标检测方法、装置、设备及存储介质
WO2020097837A1 (en) 2018-11-15 2020-05-22 Lingdong Technology (Beijing) Co.Ltd System and method for real-time supervised machine learning in on-site environment
CN111415520A (zh) * 2018-12-18 2020-07-14 北京航迹科技有限公司 处理交通目标的系统和方法
CN109801279B (zh) * 2019-01-21 2021-02-02 京东方科技集团股份有限公司 图像中的目标检测方法及装置、电子设备、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036439A (ja) * 2001-07-23 2003-02-07 Minolta Co Ltd 画像抽出装置、画像抽出方法および画像抽出プログラム
JP2006331266A (ja) * 2005-05-30 2006-12-07 Konica Minolta Holdings Inc オブジェクト検出方法及びオブジェクト検出装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671391B1 (en) * 2000-05-26 2003-12-30 Microsoft Corp. Pose-adaptive face detection system and process
US7099510B2 (en) 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
US7024033B2 (en) 2001-12-08 2006-04-04 Microsoft Corp. Method for boosting the performance of machine-learning classifiers
US7050607B2 (en) * 2001-12-08 2006-05-23 Microsoft Corp. System and method for multi-view face detection
US7020337B2 (en) 2002-07-22 2006-03-28 Mitsubishi Electric Research Laboratories, Inc. System and method for detecting objects in images
US7689033B2 (en) * 2003-07-16 2010-03-30 Microsoft Corporation Robust multi-view face detection methods and apparatuses
KR100682889B1 (ko) * 2003-08-29 2007-02-15 삼성전자주식회사 영상에 기반한 사실감 있는 3차원 얼굴 모델링 방법 및 장치
EP1615160A3 (en) * 2004-07-07 2009-10-07 Samsung Electronics Co., Ltd. Apparatus for and method of feature extraction for image recognition
KR100643303B1 (ko) 2004-12-07 2006-11-10 삼성전자주식회사 다면 얼굴을 검출하는 방법 및 장치
JP4429241B2 (ja) * 2005-09-05 2010-03-10 キヤノン株式会社 画像処理装置及び方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036439A (ja) * 2001-07-23 2003-02-07 Minolta Co Ltd 画像抽出装置、画像抽出方法および画像抽出プログラム
JP2006331266A (ja) * 2005-05-30 2006-12-07 Konica Minolta Holdings Inc オブジェクト検出方法及びオブジェクト検出装置

Also Published As

Publication number Publication date
CN101271514B (zh) 2012-10-10
EP1973060A3 (en) 2011-01-19
US8254643B2 (en) 2012-08-28
US20080232698A1 (en) 2008-09-25
EP1973060A2 (en) 2008-09-24
CN101271514A (zh) 2008-09-24

Similar Documents

Publication Publication Date Title
JP2008234654A (ja) 目標画像検出方法及び画像検出装置
CN107886074B (zh) 一种人脸检测方法以及人脸检测系统
US9262684B2 (en) Methods of image fusion for image stabilization
JP6688277B2 (ja) プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置
JP4541316B2 (ja) 映像監視検索システム
JP5385752B2 (ja) 画像認識装置、その処理方法及びプログラム
JP4933186B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
US9020210B2 (en) Image processing system, image processing apparatus, image processing method, and program
JP2008234653A (ja) 目標画像検出方法及び画像検出装置
EP3168810A1 (en) Image generating method and apparatus
JP2006285989A (ja) 画像内のオブジェクトの抽出及び倍率変更表示
JP2009059060A (ja) 動体画像抽出装置及びプログラム
JP2009015614A (ja) 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム
JP2010262601A (ja) パターン認識システム及びパターン認識方法
JP2010165052A (ja) 画像処理装置及び画像処理方法
JP5294798B2 (ja) 画像処理装置及び画像処理方法
JP2007025902A (ja) 画像処理装置、画像処理方法
JP2011002882A (ja) 撮像装置、画像処理プログラム、および撮像方法
JP2007198912A (ja) 画像検査装置、画像検査方法、コンピュータを画像検査装置として機能させるためのプログラムおよび記録媒体
JP2010271792A (ja) 画像処理装置及び画像処理方法
JP5020920B2 (ja) 歩行者検出装置及びプログラム
Ghosh et al. GSD-Net: compact network for pixel-level graphical symbol detection
JP2017049686A (ja) 画像処理装置
CN114445864A (zh) 一种手势识别方法及装置、存储介质
JP2007108965A (ja) 変化領域計算方法、変化領域計算装置、変化領域計算プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120410