JP4515724B2 - 画像内のオブジェクトを検出するシステムおよび方法 - Google Patents

画像内のオブジェクトを検出するシステムおよび方法 Download PDF

Info

Publication number
JP4515724B2
JP4515724B2 JP2003193851A JP2003193851A JP4515724B2 JP 4515724 B2 JP4515724 B2 JP 4515724B2 JP 2003193851 A JP2003193851 A JP 2003193851A JP 2003193851 A JP2003193851 A JP 2003193851A JP 4515724 B2 JP4515724 B2 JP 4515724B2
Authority
JP
Japan
Prior art keywords
image
threshold
patch
rejection
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003193851A
Other languages
English (en)
Other versions
JP2004252940A (ja
Inventor
ポール・エイ・ヴィオラ
マイケル・ジェイ・ジョーンズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2004252940A publication Critical patent/JP2004252940A/ja
Application granted granted Critical
Publication of JP4515724B2 publication Critical patent/JP4515724B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般的にはコンピュータビジョンおよびパターン認識の分野に関するものであり、より具体的には、画像内の顔などのオブジェクトの検出に関するものである。
【0002】
【従来の技術】
コンピュータビジョンが使用される用途のすべてについて、顔の検出は、極めて難しい課題を提起する。例えば、監視カメラによって得られた画像では、シーンの照明は通常、粗末で、制御不可能であり、またカメラは低品質であり、通常シーンの重要となり得る部分から遠く離れている。重大な出来事は予測不可能である。多くの場合、重大な出来事はシーンに登場する人物である。人物は通常その顔によって識別される。シーンにおける顔の位置および向きは、通常、制御されていない。換言すると、解析されるはずの画像は、実質的に拘束を受けていない。
【0003】
多数の画像が解析される用途、または解析をリアルタイムで行う必要がある用途において、実際に顔を含む画像の枚数は、通常、非常に少ない。さらに、顔を含むほとんどの画像では、顔である画像の量も、非常に少ない。したがって、顔を含まない画像または顔を含まない画像の部分を高速に除去することが望まれている。これにより、より多くの処理を、顔を含んでいる可能性のある画像の部分に向けることができる。
【0004】
顔の検出は、長く豊富な歴史を有する。中には、ニューラルネットワークシステムを使用する技法もある。Rowley他著「Neural network-based face detection」IEEE Patt. Anal. Mach. Intell., Vol. 20, pages 22-38, 1998を参照されたい。他の技法として、ベイズ統計モデルを使用するものがある。Schneiderman他著「A statistical method for 3D object detection applied to faces and cars」Computer Vision and Pattern Recognition, 2000を参照されたい。ニューラルネットワークシステムは高速で、功を奏する一方、ベイズシステムは処理時間が長くなることと引き換えに良好な検出率を有する。
【0005】
1998年1月20日にMoghaddam他に交付済みの「Detection, recognition and coding of complex objects using probabilistic eigenspace analysis」という米国特許第5,710,833号は、ディジタル表現されたシーンの選択されたオブジェクトまたはオブジェクトの特徴といったインスタンス、例えば顔を検出するシステムを記載している。彼らの方法は、確率密度の解析を利用して、入力画像またはその一部がこのようなインスタンスを表しているかどうかを判断する。
【0006】
2002年1月8日にElad他に交付済みの「Approximated invariant method for pattern detection」という米国特許第6,337,927号は、ターゲットクラス(顔)および非ターゲットクラス(顔でない)という2つのクラスの1つに、入力された特徴ベクトルを分類するシステムおよび方法を記載している。このシステムは、反復実行される拒否ステージを利用して、最初に、非ターゲットクラスに属する入力ベクトルにラベル付けを行って、残りのラベル付けされていない入力ベクトルをターゲットクラスに属するものと識別するようにする。彼らのシステムの操作は、オフライン(トレーニング)手順とオンライン(実際の分類)手順とに分けられる。
【0007】
オフライン手順の間、オンライン手順中に使用される投影ベクトルおよびそれらに対応する閾値が、非ターゲットのサンプルおよびターゲットのサンプルのトレーニング用の組を使用して計算される。それぞれの投影ベクトルにより、与えられたターゲットのサンプルおよび非ターゲットのサンプルの組について、非ターゲットのサンプルの大部分を非ターゲットクラスに属するものと識別することが容易になる。
【0008】
オンライン手順の間、入力ベクトルが、それぞれの計算された投影ベクトルに逐次投影され、一対の対応する閾値と比較されて、入力ベクトルが非ターゲットであるかどうかが判断される。入力ベクトルが、逐次的な投影および閾値比較を行っている間に非ターゲットでないと判断されると、その入力ベクトルはターゲットとして分類される。
【0009】
不利な点として、彼らの方法によって使用される特徴は、線形投影ならびに上限閾値および下限閾値に限定される。したがって、初期の特徴の結果は、後のテストの結果に影響しない。換言すると、彼らのテストは、最終的な結果に何の影響もなく整理され得る。さらに、分類器は、後に閾値が続く線形投影の結合であるので、その結果、分類関数は、入力空間の凸領域に制限される。これは、彼らのシステムを貧弱な分類器にする強い制限である。
【0010】
特徴検出のための新しい枠組みが、Viola他によって、「Rapid Object Detection using a Boosted Cascade of Simple Features」Proceedings IEEE Conf. on Computer Vision and Pattern Recognition, 2001に記載されている。彼らは、顔の解析に極めて効率的かつ効果的な画像の特徴の組、アダブーストに基づく特徴選択プロセス、ならびに学習および検出用のカスケード式アーキテクチャの3つの新しい見識を提示している。アダブーストは、効果的な学習アルゴリズムを提供し、一般化された実行において強い制限を提供する。Freund他著「A decision-theoretic generalization of on-line learning and an application to boosting」Computational Learning Theory, Eurocolt '95, pp. 23-37, Springer-Verlag, 1995、Schapire他著「Boosting the margin: A new explanation for the effectiveness of voting methods」Proceedings of the Fourteenth International Conference on Machine Learning, 1997、Tieu他著「Boosting image retrieval」International Conference on Computer Vision, 2000を参照されたい。
【0011】
しかしながら、彼らのカスケード式アプローチには、いくつかの問題がある。最も単純な問題は、カスケードが、拒否閾値のみを考慮し、受け入れ閾値を持たないことである。これは、受け入れ可能な例および拒否される例の分布がほぼ等しい場合には、性能を低下させる。
【0012】
彼らの方法の別の不利な点は、カスケードの後のステージが、カスケードの初期ステージの期間に利用可能であった詳細な情報を無視することである。カスケードの初期ステージが、閾値にわずかに近い特徴のみを受け入れる場合には、この有益な情報は、この特徴を拒否するあるいは受け入れる、後の決定において役割を果たさない。例えば、複数のステージは、特徴が拒否閾値を大きく上回るので、与えられたパッチを受け入れ、続いて、特徴が後のステージで拒否閾値を下回ると直ちに、そのパッチを拒否する可能性がある。この場合には、与えられたパッチを受け入れる方が良いことが多い。
【0013】
別の不利な点は、拒否閾値を設定する彼らのメカニズムである。彼らの拒否閾値は、第1ステージから開始するカスケードのそれぞれのステージに対して設定される。任意の与えられたタスクに対して、彼らの目標は、ある特定のクラスのすべてのオブジェクトを検出することは不可能であるとはいえ、オブジェクトのほとんどを検出することである。顔の検出の場合には、おそらく顔の90%から95%が検出される。拒否閾値は、非常に高い割合の例が検出されるように設定される。したがって、初期ステージでは、非常に控えめでなければならず、かつ正しい可能性のあるパッチを廃棄してはならない。有用なパッチが廃棄されないことを確実にするために、カスケードの初期ステージに対しては、オブジェクトの99%以上が検出されなければならない。
【0014】
彼らのプロセスは、分類が容易で、かつ最終的には正しく分類されるパッチ例と、分類が非常に困難で、かつ最終的には分類を誤るパッチ例とを区別しない。カスケード全体の終了後、どのパッチ例が最終的には分類を誤るかを判断することができるとするならば、それらのパッチ例は、プロセス全体の正確さに対する損失なしに初めに削除され得る。拒否閾値設定プロセスは、カスケードの初期ステージで開始するので、これら「困難な」例は識別することができないので、拒否閾値はすべての肯定的な例に対して設定される。この結果、拒否閾値は、より低くなり、処理時間の削減効果の少ないものとなる。
【0015】
【発明が解決しようとする課題】
したがって、本発明の目的は、従来技術を改良したオブジェクト検出システムを提供することである。
【0016】
【課題を解決するための手段】
画像内の顔などのオブジェクトを検出する方法が提供される。画像は、まず、積分画像(integral image)またはガウシアンピラミッドのいずれかを用いて、さまざまなサイズのパッチに分割される。
【0017】
それぞれのパッチの特徴は、評価され、累積得点が求められる。この評価は、累積得点が受け入れ閾値と拒否閾値との範囲内にある間、繰り返される。
【0018】
当該範囲内にない場合には、累積得点が拒否閾値より小さいときは、画像は拒否され、累積得点が受け入れ閾値より大きいときは、画像はオブジェクトを含むものとして受け入れられる。
【0019】
【発明の実施の形態】
システム構造および動作の概要
図1は、本発明による画像内のオブジェクトを検出するシステムおよび方法100を示す。ある用途においては、画像内に検出されるオブジェクトは顔である。しかしながら、他のオブジェクトも検出できることは理解されるであろう。システム100は、トレーニングフェーズ110、検証フェーズ120、および分類フェーズ130の3つの基本フェーズを備えている。
【0020】
トレーニングフェーズ110は、ラベル付けされた画像111の第1の組を入力として受け取る。画像111内でラベル付けされるものの性質は、どのオブジェクトが検出されるかを決定する。ラベル付けされた画像111は、分類器231を生成するために処理される。以下でさらに詳述するように、この処理は、機械学習プロセスを用いて、分類器231のパラメータ112の最適な組を見つけ出す。
【0021】
パラメータ112は、特徴の総体を含んでいる。1つの特徴は、画像パッiに適用されるフィルタνiの関数fi()であり、受け入れ得点αiまたは拒否得点βiのいずれかを生成するために比較閾値θiと比較される。パラメータ112は、線形関数または非線形関数とすることができる関数fi()、フィルタνi、比較閾値θiならびに受け入れ得点αiおよび拒否得点βiを含んでいる。フィルタは、ベクトルとして表される入力パッチのベクトルνiへの線形投影として評価される。分類器231を特定するこれらのパラメータfi、νi、αi、βi、およびθiのすべては、ラベル付けされたトレーニング画像111に関して最も低いエラーを与えるように、学習プロセスによって求められる。
【0022】
検証フェーズ120は、分類器231を用いて、ラベル付けされた画像121の第2の組を処理し、分類器231の受け入れ閾値Tおよび拒否閾値T122を生成する。
【0023】
分類フェーズ130は、そのパラメータ112および閾値122がトレーニングフェーズ110および検証フェーズ120で学習された分類器231を入力画像に適用して、画像内のオブジェクト(顔)のすべてのインスタンスを見つけ出す。パラメータ112および閾値122を使用して、分類フェーズ130は、テスト画像131を所定のクラスに属するものとして受け入れるか、または拒否する(260)。例えば、テスト画像は、顔を含むならば受け入れられ、そうでなければ拒否される。これらフェーズ、パラメータおよび閾値の詳細については、以下でさらに詳述する。しかしながら、3つのフェーズのそれぞれの処理の基本的な比較動作は、図2に示すように、同一であることに留意されたい。
【0024】
前処理
画像内で検出されるオブジェクトは、任意のサイズであり得、かつ任意の位置に存在し得るので、図2に示すように、それぞれの入力画像I201は、まず、さまざまなサイズに倍率変更される「パッチ」(Ii)220に分割される。したがって、詳細には、図1について説明したような画像に対する処理は、実際にはパッチ220に対して行われる。パッチ220の形状は、正方形、長方形、または他の形状とすることができ、パッチの位置は、重複するようにすることもできるし、または重複しないようにすることもできる。例えば、第1のパッチサイズは画像全体とすることができ、次の小さなパッチはそれぞれ75%に縮小され、例えば24×24ピクセルの所定の最小パッチサイズにされる。
【0025】
パッチの倍率変更は、多くの方法で行うことができる。ある方法では、積分画像211を用いて、それぞれの画像201の倍率変更が実行される(上記で引用したViola他を参照)。別の方法では、多重解像度の画像212、例えばガウシアンピラミッドまたはラプラシアンピラミッドを用いて、倍率変更が実行される(Burt他著「The Laplacian Pyramid as a Compact Image Code」IEEE Trans. on Communications, 31(4), pp. 532-540, April 1983を参照)。別の方法では、倍率変更が投影を介して提供される。好ましい実施の形態では、パッチは、ラスタ走査を用いて大小順で処理(比較)される。
【0026】
特徴評価および分類
画像処理中、ラベル付けされているか、またはラベル付けされていないそれぞれのパッチは、分類器231によって評価される(230)。分類器231は、パッチ220と一致する形およびサイズに成形される特徴の総体を含んでいる。例えば、ハール基底関数(Haar basis functions)と同様に、長方形の特徴を使用することができる(Papageorgiou他著「A general framework for object detection」International Conference on Computer Vision, 1998および上記Viola他を参照、またWebb 他著「Shape and correspondence」Computer Vision, Graphics, and Image Processing, 21:145-160, 1983も参照)。本発明は、これらのタイプの特徴に限定されるものではないことに留意されたい。好ましい実施の形態では、特徴の個数が、数十万を超え得る。
【0027】
パッチの1つに対するそれぞれの特徴のそれぞれの評価230によって、受け入れ得点αまたは拒否得点βのいずれかの得点221が生成される。得点は累積される。入力画像201に対して、累積得点221は、最初ゼロに設定される。累積得点221が、受け入れ閾値と拒否閾値122との範囲内にある間、評価230は繰り返され(250)、当該範囲内にない場合には、画像は受け入れられるか、または拒否される(260)。
【0028】
ステップ230のこの評価は、次のように表すことができる。
【0029】
f(νi,Ii)>θならば、h(i)=αであり、そうでなければ、h(i)=β
ここで、f()は、パラメータνiおよび画像パッチIiの線形関数または非線形関数のいずれかであり、比較閾値はθiであり、αおよびβはそれぞれ受け入れ重みおよび拒否重みである。関数f()は、ベクトルとして表されるIiとνの内積とすることもできる。内積の値は、絶対値などの非線形関数によって変更することができる。
【0030】
ステップ240のプロセスは、次のように表すことができる。
【0031】
(N)<Σi =1・・・Nh(i)<T(N)ならば、繰り返し処理を行い、そうでなければ、画像の受け入れまたは拒否260を行う。
【0032】
図3は、検証フェーズ120の期間中に学習され、分類フェーズの期間中に使用される受け入れおよび拒否の「エンベロープ」300を示す。x軸301は、比較の繰り返し回数を示し、y軸302は、累積拒否レベル(0)および累積受け入れレベル(1)を示す。累積得点221が、いつ何時、エンベロープ330より下になっても、そのパッチが受け入れられる可能性は非常に低いので、さらに別のパッチについて比較を継続する意味はない。同様に、累積得点221が、エンベロープ300より上に上昇すると、拒否の可能性も無視することができる。ここで留意すべきは、この累積統計アプローチは、拒否閾値に達することにのみ基づく従来技術の厳密な2値分類器と対照的であることである。
【0033】
トレーニング
トレーニング画像111は、肯定的および否定的なラベルが付されたパッチを含む。トレーニングプロセスは、ラウンドで進む。それぞれのトレーニングパッチには、初期得点が割り当てられる。この得点は、すべてのパッチに対して等しくすることもできるし、または異なるクラスには、異なる得点を割り当てることもできる。分類器231に包含するために選択される最初の特徴は、トレーニングデータ上で最も低い重みエラーを有する特徴である。次のラウンドでは、最初の特徴がラベルを付け間違えたパッチの得点は増加され、正しいパッチの得点は減少される。包含するために選択される次の特徴は、新しい得点が与えられたトレーニングデータで最も低い重みエラーを有する特徴である。この例の組は、所定の値より小さい得点を有する例を削除することにより低減することができる。これにより、分類全体の質を低減させることなく、性能を向上させることができる。
【0034】
検証
エンベロープ300を形成する拒否閾値および受け入れ閾値は、処理時間を最小にしつつ分類エラーの確率を最小にするように選択される。例えば、第k番目の拒否閾値は、付加的な処理を行うことなく、所定の割合のパッチを拒否するように作用する。拒否閾値が高くなると、後のステージが評価されないので、拒否の比率が大きくなり、計算時間が短くなる。パッチが誤って拒否されるという危険はある。拒否閾値が低くなると、拒否の比率は低くなり、計算時間は長くなる。
【0035】
拒否閾値を低くした場合の利点は、パッチが、より多くの分類器によって解析されるので、分類の信頼性が高くなることである。
【0036】
拒否/受け入れ閾値の選択プロセスは、トレーニングフェーズ100の期間中、N個の特徴が選択された後に開始する。最後(第N番目)の受け入れ閾値および拒否閾値がまず決定される。これら閾値は、所望の性能目標に基づいて設定される。この目標は、検出率または誤った肯定率のいずれかとすることができる。性能目標を達成する拒否/受け入れ閾値は、第N番目の閾値として選択される。図3に示すように、最後の受け入れ閾値および拒否閾値が、同じであり、この最終閾値310と等しいことに留意されたい。これは、受け入れおよび拒否閾値の双方を上回るすべての例は受け入れられ、下回る例はすべて拒否されるからである。
【0037】
他の閾値を設定するには、トレーニング画像111のパッチと同一であり得るラベル付けされた検証パッチの組が必要とされる。すべての他の拒否閾値は、拒否される肯定的な例に対して設定され、最終拒否閾値によって拒絶される。第k番目の拒否閾値は、最終閾値によって拒否される肯定的な例に対してのみ拒否を行うように、最高値とされる。第k番目の受け入れ閾値は、最終閾値によって受け入れられる否定的な例に対してのみ受け入れを行うように最も低い値とされる。
【0038】
好ましい実施の形態を例にして本発明を説明してきたが、本発明の精神および範囲内で他のさまざまな適合および変更を行い得ることは理解されるであろう。したがって、添付された特許請求の範囲の目的は、本発明の真の精神および範囲内に入るこのようなすべての変形および変更を網羅することである。
【図面の簡単な説明】
【図1】 本発明によるオブジェクト検出システムおよび方法のブロック図である。
【図2】 本発明による比較プロセスのブロック図である。
【図3】 本発明によって使用される受け入れ/拒否エンベロープのグラフである。

Claims (10)

  1. 検出対象となる画像を複数の画像パッチに分割し、それぞれの画像パッチ内に含まれる特徴の評価を前記複数の画像パッチごとに規定された比較閾値に基づいて順次行うことで画像内のオブジェクトを検出する方法であって、
    f(ν,I)をi番目に評価処理を行う画像パッチIと前記画像パッチIの投影として求められるフィルタνとの関数であり、ベクトルとして表されるνおよびIの内積であるとし、θを比較閾値とし、αおよびβをそれぞれ受け入れ得点および拒否得点とした場合に、f(ν,I)>θのときは、αだけ増加させ、f(ν ,I )≦θ ときはβだけ増加させて累積得点を求めることで、それぞれの画像内の複数の特徴を評価することと、
    前記複数の特徴を評価することを画像パッチごとに順次行う際に、前記累積得点が受け入れ閾値と拒否閾値との範囲内にある間は、次の画像パッチについて前記評価することを繰り返すことと、
    該範囲内にない場合に、前記累積得点が前記拒否閾値より小さいときは、検出対象となる前記画像を拒否し、前記累積得点が前記受け入れ閾値より大きいときは、前記オブジェクトを含むものとして検出対象となる前記画像を受け入れ、その後の画像パッチについて前記評価処理を繰り返さないことと、
    を備えた方法。
  2. 前記複数の特徴を評価することは、分割した前記複数の画像パッチを複数のサイズに倍率変更することをさらに含む請求項1に記載の方法。
  3. 前記倍率変更することは多重解像度の画像を使用する、請求項2に記載の方法。
  4. 前記多重解像度の画像はガウシアンピラミッドである、請求項3に記載の方法。
  5. 前記関数f()は非線形である、請求項1に記載の方法。
  6. 前記非線形関数は絶対値である、請求項5に記載の方法。
  7. 前記パラメータν、θ、αおよびβは、Adaboost学習アルゴリズムに従うトレーニングフェーズで、ラベル付けされた複数の画像からなる第1の組を用いて求められ、
    前記複数の特徴を評価することは、求められた前記パラメータν、θ、αおよびβを用いて検出対象となる前記画像の評価処理を行う請求項1に記載の方法。
  8. 前記ラベル付けされた複数の画像からなる第1の組は、肯定的および否定的なラベルが付されたパッチを含む、請求項7に記載の方法。
  9. 前記受け入れ閾値および前記拒否閾値は、検証フェーズの期間中に、ラベル付けされた複数の画像からなる第2の組を用いて求められる、請求項1に記載の方法。
  10. 前記オブジェクトは顔である、請求項1に記載の方法。
JP2003193851A 2002-07-22 2003-07-08 画像内のオブジェクトを検出するシステムおよび方法 Expired - Fee Related JP4515724B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/200,464 US7020337B2 (en) 2002-07-22 2002-07-22 System and method for detecting objects in images

Publications (2)

Publication Number Publication Date
JP2004252940A JP2004252940A (ja) 2004-09-09
JP4515724B2 true JP4515724B2 (ja) 2010-08-04

Family

ID=30443526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003193851A Expired - Fee Related JP4515724B2 (ja) 2002-07-22 2003-07-08 画像内のオブジェクトを検出するシステムおよび方法

Country Status (2)

Country Link
US (1) US7020337B2 (ja)
JP (1) JP4515724B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9199910B2 (en) 2012-06-04 2015-12-01 Rohm And Haas Company Process for production of methacrylic acid esters

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7259784B2 (en) 2002-06-21 2007-08-21 Microsoft Corporation System and method for camera color calibration and image stitching
US20050046703A1 (en) * 2002-06-21 2005-03-03 Cutler Ross G. Color calibration in photographic devices
US7110575B2 (en) * 2002-08-02 2006-09-19 Eastman Kodak Company Method for locating faces in digital color images
GB2395264A (en) * 2002-11-29 2004-05-19 Sony Uk Ltd Face detection in images
US7120279B2 (en) * 2003-01-30 2006-10-10 Eastman Kodak Company Method for face orientation determination in digital color images
US7495694B2 (en) 2004-07-28 2009-02-24 Microsoft Corp. Omni-directional camera with calibration and up look angle improvements
US9129381B2 (en) * 2003-06-26 2015-09-08 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US8896725B2 (en) 2007-06-21 2014-11-25 Fotonation Limited Image capture device with contemporaneous reference image capture mechanism
US7574016B2 (en) 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US7792335B2 (en) * 2006-02-24 2010-09-07 Fotonation Vision Limited Method and apparatus for selective disqualification of digital images
US7620218B2 (en) * 2006-08-11 2009-11-17 Fotonation Ireland Limited Real-time face tracking with reference images
US7565030B2 (en) 2003-06-26 2009-07-21 Fotonation Vision Limited Detecting orientation of digital images using face detection information
US8989453B2 (en) 2003-06-26 2015-03-24 Fotonation Limited Digital image processing using face detection information
US8498452B2 (en) 2003-06-26 2013-07-30 DigitalOptics Corporation Europe Limited Digital image processing using face detection information
US8948468B2 (en) 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US7792970B2 (en) 2005-06-17 2010-09-07 Fotonation Vision Limited Method for establishing a paired connection between media devices
US8363951B2 (en) * 2007-03-05 2013-01-29 DigitalOptics Corporation Europe Limited Face recognition training method and apparatus
US8189927B2 (en) 2007-03-05 2012-05-29 DigitalOptics Corporation Europe Limited Face categorization and annotation of a mobile phone contact list
US8330831B2 (en) 2003-08-05 2012-12-11 DigitalOptics Corporation Europe Limited Method of gathering visual meta data using a reference image
US7680342B2 (en) 2004-08-16 2010-03-16 Fotonation Vision Limited Indoor/outdoor classification in digital images
US7440593B1 (en) * 2003-06-26 2008-10-21 Fotonation Vision Limited Method of improving orientation and color balance of digital images using face detection information
US7269292B2 (en) * 2003-06-26 2007-09-11 Fotonation Vision Limited Digital image adjustable compression and resolution using face detection information
US8682097B2 (en) * 2006-02-14 2014-03-25 DigitalOptics Corporation Europe Limited Digital image enhancement with reference images
US7362368B2 (en) * 2003-06-26 2008-04-22 Fotonation Vision Limited Perfecting the optics within a digital image acquisition device using face detection
US8494286B2 (en) 2008-02-05 2013-07-23 DigitalOptics Corporation Europe Limited Face detection in mid-shot digital images
US9692964B2 (en) 2003-06-26 2017-06-27 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US8553949B2 (en) * 2004-01-22 2013-10-08 DigitalOptics Corporation Europe Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US7844076B2 (en) 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US7471846B2 (en) * 2003-06-26 2008-12-30 Fotonation Vision Limited Perfecting the effect of flash within an image acquisition devices using face detection
US8593542B2 (en) * 2005-12-27 2013-11-26 DigitalOptics Corporation Europe Limited Foreground/background separation using reference images
US8155397B2 (en) * 2007-09-26 2012-04-10 DigitalOptics Corporation Europe Limited Face tracking in a camera processor
US7508979B2 (en) * 2003-11-21 2009-03-24 Siemens Corporate Research, Inc. System and method for detecting an occupant and head pose using stereo detectors
US7564994B1 (en) 2004-01-22 2009-07-21 Fotonation Vision Limited Classification system for consumer digital images using automatic workflow and face detection and recognition
US7440930B1 (en) 2004-07-22 2008-10-21 Adobe Systems Incorporated Training an attentional cascade
US7593057B2 (en) * 2004-07-28 2009-09-22 Microsoft Corp. Multi-view integrated camera system with housing
US7450766B2 (en) * 2004-10-26 2008-11-11 Hewlett-Packard Development Company, L.P. Classifier performance
US8320641B2 (en) 2004-10-28 2012-11-27 DigitalOptics Corporation Europe Limited Method and apparatus for red-eye detection using preview or other reference images
US7876934B2 (en) * 2004-11-08 2011-01-25 Siemens Medical Solutions Usa, Inc. Method of database-guided segmentation of anatomical structures having complex appearances
US7715597B2 (en) 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
US8488023B2 (en) * 2009-05-20 2013-07-16 DigitalOptics Corporation Europe Limited Identifying facial expressions in acquired digital images
US8503800B2 (en) 2007-03-05 2013-08-06 DigitalOptics Corporation Europe Limited Illumination detection using classifier chains
US7315631B1 (en) 2006-08-11 2008-01-01 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US7768544B2 (en) * 2005-01-21 2010-08-03 Cutler Ross G Embedding a panoramic image in a video stream
US7634142B1 (en) 2005-01-24 2009-12-15 Adobe Systems Incorporated Detecting objects in images using a soft cascade
US7576766B2 (en) * 2005-06-30 2009-08-18 Microsoft Corporation Normalized images for cameras
US7630571B2 (en) * 2005-09-15 2009-12-08 Microsoft Corporation Automatic detection of panoramic camera position and orientation table parameters
US7519567B2 (en) * 2005-10-31 2009-04-14 Hewlett-Packard Development Company, L.P. Enhanced classification of marginal instances
JP2007193692A (ja) * 2006-01-20 2007-08-02 Mitsubishi Electric Corp 判別器構築装置及び物体検出装置
US7804983B2 (en) 2006-02-24 2010-09-28 Fotonation Vision Limited Digital image acquisition control and correction method and apparatus
US20070282682A1 (en) * 2006-06-02 2007-12-06 Paul Dietz Method for metered advertising based on face time
DE602007012246D1 (de) 2006-06-12 2011-03-10 Tessera Tech Ireland Ltd Fortschritte bei der erweiterung der aam-techniken aus grauskalen- zu farbbildern
US8024189B2 (en) * 2006-06-22 2011-09-20 Microsoft Corporation Identification of people using multiple types of input
US7697839B2 (en) * 2006-06-30 2010-04-13 Microsoft Corporation Parametric calibration for panoramic camera systems
WO2008015586A2 (en) * 2006-08-02 2008-02-07 Fotonation Vision Limited Face recognition with combined pca-based datasets
US7916897B2 (en) 2006-08-11 2011-03-29 Tessera Technologies Ireland Limited Face tracking for controlling imaging parameters
US7403643B2 (en) * 2006-08-11 2008-07-22 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
KR100795570B1 (ko) 2006-09-01 2008-01-21 전자부품연구원 영상의 특징점 추출방법
US20080126275A1 (en) * 2006-09-27 2008-05-29 Crnojevic Vladimir S Method of developing a classifier using adaboost-over-genetic programming
US7610250B2 (en) * 2006-09-27 2009-10-27 Delphi Technologies, Inc. Real-time method of determining eye closure state using off-line adaboost-over-genetic programming
US20080147488A1 (en) * 2006-10-20 2008-06-19 Tunick James A System and method for monitoring viewer attention with respect to a display and determining associated charges
US8055067B2 (en) 2007-01-18 2011-11-08 DigitalOptics Corporation Europe Limited Color segmentation
EP2115662B1 (en) * 2007-02-28 2010-06-23 Fotonation Vision Limited Separating directional lighting variability in statistical face modelling based on texture space decomposition
WO2008107002A1 (en) 2007-03-05 2008-09-12 Fotonation Vision Limited Face searching and detection in a digital image acquisition device
CN101271514B (zh) * 2007-03-21 2012-10-10 株式会社理光 一种快速目标检测和目标输出的图像检测方法及装置
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
US7983480B2 (en) * 2007-05-17 2011-07-19 Seiko Epson Corporation Two-level scanning for memory saving in image detection systems
US7916971B2 (en) * 2007-05-24 2011-03-29 Tessera Technologies Ireland Limited Image processing method and apparatus
FI20075453A0 (sv) * 2007-06-15 2007-06-15 Virtual Air Guitar Company Oy Bildsampling i en stokastisk modellbaserad datorvision
US8245043B2 (en) * 2007-06-15 2012-08-14 Microsoft Corporation Audio start service for Ad-hoc meetings
US8526632B2 (en) * 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8165416B2 (en) * 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
US8300080B2 (en) 2007-06-29 2012-10-30 Microsoft Corporation Techniques for detecting a display device
US8330787B2 (en) * 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US7949621B2 (en) * 2007-10-12 2011-05-24 Microsoft Corporation Object detection and recognition with bayesian boosting
KR101362768B1 (ko) * 2007-11-23 2014-02-14 삼성전자주식회사 객체 검출 방법 및 장치
US8433061B2 (en) * 2007-12-10 2013-04-30 Microsoft Corporation Reducing echo
US8744069B2 (en) * 2007-12-10 2014-06-03 Microsoft Corporation Removing near-end frequencies from far-end sound
US8219387B2 (en) * 2007-12-10 2012-07-10 Microsoft Corporation Identifying far-end sound
US7961908B2 (en) * 2007-12-21 2011-06-14 Zoran Corporation Detecting objects in an image being acquired by a digital camera or other electronic image acquisition device
US8750578B2 (en) 2008-01-29 2014-06-10 DigitalOptics Corporation Europe Limited Detecting facial expressions in digital images
TWI534719B (zh) 2008-03-03 2016-05-21 艾威吉隆專利第2控股公司 動態物件分類
US7855737B2 (en) * 2008-03-26 2010-12-21 Fotonation Ireland Limited Method of making a digital camera image of a scene including the camera user
US8331730B2 (en) * 2008-04-01 2012-12-11 Hewlett-Packard Development Company, L.P. Systems and methods to increase speed of object detection in a digital image
JP4513898B2 (ja) * 2008-06-09 2010-07-28 株式会社デンソー 画像識別装置
JP5127583B2 (ja) * 2008-06-20 2013-01-23 株式会社豊田中央研究所 対象物判定装置及びプログラム
CN106919911A (zh) 2008-07-30 2017-07-04 快图有限公司 使用脸部检测的自动脸部和皮肤修饰
US8314829B2 (en) 2008-08-12 2012-11-20 Microsoft Corporation Satellite microphones for improved speaker detection and zoom
WO2010063463A2 (en) * 2008-12-05 2010-06-10 Fotonation Ireland Limited Face recognition using face tracker classifier data
US20100189368A1 (en) * 2009-01-23 2010-07-29 Affine Systems, Inc. Determining video ownership without the use of fingerprinting or watermarks
JP5238573B2 (ja) * 2009-03-25 2013-07-17 株式会社東芝 学習装置、方法及びプログラム
WO2010141005A1 (en) 2009-06-01 2010-12-09 Hewlett-Packard Development Company, L.P. Determining detection certainty in a cascade classifier
US8379917B2 (en) * 2009-10-02 2013-02-19 DigitalOptics Corporation Europe Limited Face recognition performance using additional image features
US8121618B2 (en) 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
AU2009233627B2 (en) * 2009-10-30 2012-03-29 Canon Kabushiki Kaisha Compression method selection for digital images
US8233789B2 (en) 2010-04-07 2012-07-31 Apple Inc. Dynamic exposure metering based on face detection
US8588309B2 (en) 2010-04-07 2013-11-19 Apple Inc. Skin tone and feature detection for video conferencing compression
US8249361B1 (en) 2010-04-22 2012-08-21 Google Inc. Interdependent learning of template map and similarity metric for object identification
EP2385484A1 (en) * 2010-05-06 2011-11-09 STMicroelectronics (Grenoble 2) SAS Object detection in an image
JP2011257805A (ja) 2010-06-04 2011-12-22 Sony Corp 情報処理装置および方法、並びにプログラム
TWI420440B (zh) * 2010-08-16 2013-12-21 Hon Hai Prec Ind Co Ltd 物品展示系統及方法
US8565482B2 (en) * 2011-02-28 2013-10-22 Seiko Epson Corporation Local difference pattern based local background modeling for object detection
JP5907593B2 (ja) 2011-09-13 2016-04-26 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
JP5895624B2 (ja) * 2012-03-14 2016-03-30 オムロン株式会社 画像処理装置、画像処理方法、制御プログラムおよび記録媒体
US9715723B2 (en) * 2012-04-19 2017-07-25 Applied Materials Israel Ltd Optimization of unknown defect rejection for automatic defect classification
US10043264B2 (en) 2012-04-19 2018-08-07 Applied Materials Israel Ltd. Integration of automatic and manual defect classification
US9607233B2 (en) 2012-04-20 2017-03-28 Applied Materials Israel Ltd. Classifier readiness and maintenance in automatic defect classification
FR2990038A1 (fr) * 2012-04-25 2013-11-01 St Microelectronics Grenoble 2 Procede et dispositif de detection d'un objet dans une image
KR20140013142A (ko) * 2012-07-18 2014-02-05 삼성전자주식회사 이미지에서 목표를 검출하는 목표 검출 방법 및 이미지 처리 장치
US9311640B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods and arrangements for smartphone payments and transactions
US10114368B2 (en) 2013-07-22 2018-10-30 Applied Materials Israel Ltd. Closed-loop automatic defect inspection and classification
GB2516512B (en) * 2013-10-23 2015-10-14 Imagination Tech Ltd Face detection
JP6098498B2 (ja) 2013-12-19 2017-03-22 ソニー株式会社 情報処理装置、情報処理方法、並びにプログラム
US10552675B2 (en) 2014-03-12 2020-02-04 Seeing Machines Limited Method and apparatus for eye detection from glints
US10095944B2 (en) 2015-08-28 2018-10-09 Tata Consultancy Services Limited Methods and systems for shape based image analysis for detecting linear objects
CN105426916A (zh) * 2015-11-23 2016-03-23 浙江大学 图像相似度计算方法
CN107944437B (zh) * 2017-12-31 2018-12-14 广州二元科技有限公司 一种基于神经网络和积分图像的人脸定位方法
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
KR102131273B1 (ko) * 2018-07-25 2020-08-05 금오공과대학교 산학협력단 영상분할을 위한 신경망 학습장치 및 방법
US11315352B2 (en) 2019-05-08 2022-04-26 Raytheon Company Calculating the precision of image annotations
CN113252007B (zh) * 2021-06-28 2021-09-24 常州微亿智造科技有限公司 用于工件质检的飞拍控制参数确定方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02166570A (ja) * 1988-12-21 1990-06-27 Toshiba Corp パターン認識装置
JPH1055433A (ja) * 1996-05-06 1998-02-24 Nec Corp 画像検索方法及び画像検索装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6356649B2 (en) * 1997-04-11 2002-03-12 Arete Associate, Inc. “Systems and methods with identity verification by streamlined comparison and interpretation of fingerprints and the like”
US6198839B1 (en) * 1997-09-05 2001-03-06 Tripath Imaging, Inc. Dynamic control and decision making method and apparatus
US6574596B2 (en) * 1999-02-08 2003-06-03 Qualcomm Incorporated Voice recognition rejection scheme
US6337927B1 (en) 1999-06-04 2002-01-08 Hewlett-Packard Company Approximated invariant method for pattern detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02166570A (ja) * 1988-12-21 1990-06-27 Toshiba Corp パターン認識装置
JPH1055433A (ja) * 1996-05-06 1998-02-24 Nec Corp 画像検索方法及び画像検索装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9199910B2 (en) 2012-06-04 2015-12-01 Rohm And Haas Company Process for production of methacrylic acid esters

Also Published As

Publication number Publication date
US20040013304A1 (en) 2004-01-22
JP2004252940A (ja) 2004-09-09
US7020337B2 (en) 2006-03-28

Similar Documents

Publication Publication Date Title
JP4515724B2 (ja) 画像内のオブジェクトを検出するシステムおよび方法
Viola et al. Fast and robust classification using asymmetric adaboost and a detector cascade
US7430315B2 (en) Face recognition system
Froba et al. Face detection with the modified census transform
Xiao et al. Dynamic cascades for face detection
US8885943B2 (en) Face detection method and apparatus
US20050013479A1 (en) Robust multi-view face detection methods and apparatuses
US20040013286A1 (en) Object recognition system
Heisele et al. Feature reduction and hierarchy of classifiers for fast object detection in video images
JP2008102611A (ja) 画像処理装置
Ramirez et al. Multi-pose face detection with asymmetric haar features
Mccullagh Face detection by using haar cascade classifier
Nazeer et al. Face detecting using artificial neural network approach
Navabifar et al. A Fusion Approach Based on HOG and Adaboost Algorithm for Face Detection under Low-Resolution Images.
Le et al. Feature selection by AdaBoost for SVM-based face detection
Heidemann et al. A system for various visual classification tasks based on neural networks
Rohrer et al. GAN pretraining for deep convolutional autoencoders applied to software-based fingerprint presentation attack detection
Lebedev et al. Face detection algorithm based on a cascade of ensembles of decision trees
Chen et al. Resampling for face detection by self-adaptive genetic algorithm
Nesvadba et al. Towards a real-time and distributed system for face detection, pose estimation and face-related features
Ali Texture Descriptor Extraction for Iris Classification using Fuzzy Logic Local Binary Pattern
Rajgarhia Face Detection using Independent Component Analysis
Ferri et al. Comparison of several editing and condensing techniques for colour image segmentation and object location
Pailus et al. Performance Evaluation of MadBoost on Face Detection
Beroual et al. A review and Comparing different of the most commonly Criteria for human age estimation techniques

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090317

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090617

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090622

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090717

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100127

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100513

R150 Certificate of patent or registration of utility model

Ref document number: 4515724

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees