JP4724125B2 - 顔認識システム - Google Patents

顔認識システム Download PDF

Info

Publication number
JP4724125B2
JP4724125B2 JP2006553176A JP2006553176A JP4724125B2 JP 4724125 B2 JP4724125 B2 JP 4724125B2 JP 2006553176 A JP2006553176 A JP 2006553176A JP 2006553176 A JP2006553176 A JP 2006553176A JP 4724125 B2 JP4724125 B2 JP 4724125B2
Authority
JP
Japan
Prior art keywords
input data
support vectors
classification
face
svm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006553176A
Other languages
English (en)
Other versions
JP2007535024A5 (ja
JP2007535024A (ja
Inventor
ヤン,ミンシュエン
リン,ジョンウ
ロス,デイビッド,エー.
孝裕 大橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Publication of JP2007535024A publication Critical patent/JP2007535024A/ja
Publication of JP2007535024A5 publication Critical patent/JP2007535024A5/ja
Application granted granted Critical
Publication of JP4724125B2 publication Critical patent/JP4724125B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Description

関連出願
本出願は、2004年2月13日に出願された米国特許仮出願第60/544,576号、ならびに2004年6月1日に出願された米国特許出願第10/858,930号、「顔認識システム(Face Recognition System)」の特典を請求するものである。
発明の背景
1.発明の分野
本発明は、一般に、画像認識に関するものであり、より詳細には、顔検出および顔認識のためのサポートベクターマシン分類器の利用に関する。
2.発明の背景
顔検出および顔認識システムには、インテリジェントヒューマンコンピューターインターフェース、監視システム、および顔を使用するコンテンツに基づく画像検索など多様な応用例がある。しかしながら、従来の顔検出システムおよび顔認識システムで使用されたコンピュータおよびアルゴリズムでは、顔認識システムに本来伴う膨大な量のデータおよび複雑な計算を効率よく処理することができなかったため、効率のよい顔検出システムおよび顔認識システムの開発を試みても、今まで成功しなかった。
顔認識の最初の重要なステップは、任意の画像における顔を定義し顔の位置を決定することであるから、顔検出は、顔認識システムに直接関係する。顔検出問題には、いくつかの異なる技術が適用されてきた。これらの技術には、ニューラルネットワーク、幾何学的制約を使用する顔の特徴検出、トレーニングデータの密度予測、ラベル付きグラフおよびクラスタリング、ならびに分布に基づくモデルなどがある。一般に、顔検出技術および顔認識技術では、2つの主な方法、すなわち、特徴に基づく方法およびテンプレートに基づく方法をベースにしている。特徴に基づく方法では、目、鼻、口角などの顔の特徴の検出に基づいて認識を行う。認識において、これらの特徴に関する画像分析やこれらの特徴間の幾何学的性質を使用する。しかしながら、現在の顔特徴抽出方法では、顔認識アプリケーションに必要なロバスト性や正確性を十分に満たすことができない場合が多い。
テンプレートに基づく方法では、一般に、直接グレーレベルの画像特徴によって、またはその変換形式によって顔を表現する。認識方法は、最小距離分類法またはフィッシャー判別分析法などの類似基準に基づく場合がある。近年、テンプレートに基づく方法において、サポートベクターマシン(SVM)技術が使用されている。
より効率的で必要な計算量がより少ない実用的顔検出および顔認識システムが必要である。
発明の要約
本明細書に記載されている特徴と利点は、すべてを包括するものではなく、特に、多数の付加的な機能および利点が、図面、明細書、および請求の範囲を考察することによって、当業者にとって明白になるであろう。また、本明細書で使用する用語は、主に読みやすくしたり理解しやすくしたりするために選んだものであって、本発明の主題を制限したり限定したりするために選んだものでないことに留意すべきである。
本発明では、顔検出のため、カスケード式SVM分類器を使用する。顔画像および非顔画像を使用して、3次元多項式カーネルによってSVM分類器をトレーニングする。最初に、前記顔検出システムおよび顔検出方法は、SVMのテスト時の性能を高速化するため、各部分画像に対して実行するカーネル評価の数を減らす。一実施形態において、いくつかのサポートベクトルを破棄する。これによって、高速化するが、精度がいくらか落ちる。各サポートベクトルは、それに対応する係数、すなわちアルファ(α)値を有する。非常に小さいアルファ値を有するサポートベクトルは、テスト画像の分類にわずかな影響しか与えない。したがって、顔検出システムおよび顔検出方法は、ある閾値より小さいアルファを有するサポートベクトルをすべて破棄する。この閾値は、個別のテスト画像セットにおける性能低下が無視することができる程度になるよう選定される。
また、顔検出システムおよび顔検出方法は、カーネル評価をすべて実行する前にテスト画像の分類を試みる。大多数の部分画像は、顔でない。したがって、SVM分類器は、カスケード式SVM分類法を使用することによって、できる限り少数のカーネル評価によって非顔画像を破棄するよう試みる。第1ステージでは、最初の2つのサポートベクトルに対するスコアを計算し、このスコアと閾値とを比較する。スコアが閾値より小さい場合、部分画像は非顔として分類される。スコアが閾値より大きい場合、カスケード式SVM分類関数は、カーネル評価の数を毎回倍に増やすことによって、より複雑な決定則を適用し続け、テスト画像が決定則の中の1つを満たさなければすぐに画像を非顔として分類(この結果、処理を終了)する。
最後に、部分画像がすべての中間決定則を満たし、すべてのサポートベクトルについて考察すべき時点に到達したとき、元の決定関数を適用する。この最終規則およびすべての中間規則を満たす場合のみ、テスト画像は、肯定(顔)として分類される。
一旦、顔領域が検出されると、システムは、顔認識を実行する。一実施形態では、顔画像をグレースケールに変換してから、平均顔画像を減じたりデータベース中の顔から計算された標準偏差で各ピクセルを除したりすることによって、顔画像を正規化する。テスト画像に関してフィッシャー座標を計算する。初期化において、データベース中の各顔画像に対するフィッシャー座標を計算する。各人物について、その人物の全画像からフィッシャー座標の平均値を決定する。次に、テスト画像のフィッシャー座標とデータベース中の各人物に対する平均フィッシャー座標とを比較する。テスト画像は、平均フィッシャー座標がテスト画像に(ユークリッド距離で)最も近い人物に属すると分類される。
本発明には、他にも利点や特徴があり、これらは、添付図面を伴う以下の発明の詳細な説明とその後に続く請求項とによってすぐに明白になるであろう。
好ましい実施形態の詳細な説明
次に、本発明の好ましい実施形態について図面を参照しながら説明する。これらの図面において同様の参照番号は、同一または機能的に類似する要素を示す。またこれらの図面において、各参照番号の最も左の桁は、通常、この参照番号が最初に使用された図面に対応する。以下の説明では、本発明を完全に理解することができるよう説明するため、具体的な詳細事項について数多く述べている。しかしながら、これらの具体的な詳細事項を伴わなくても本発明を実施することができることは、当業者にとって明白になるであろう。他の実施例においては、本発明を曖昧にしないよう構成および装置をブロック図形式で示す。
顔認識システム
図1は、本発明の一実施形態による顔認識システム100を示す機能ブロック図である。顔認識システム100は、画像ソース102と、顔候補領域検出部104と、顔検出部106と、顔認識部108とを備える。画像ソース102は、1つまたは複数の画像を顔候補領域検出部104に提供する。顔候補領域検出部104は、発見的手法と深さマップとを使用して、顔を含む可能性が最も高い領域を見つける。顔候補領域検出部104は、顔を含む可能性が最も高い「ブロブ」(すなわち、隣接領域)から成る長方形領域を出力する。顔検出部106は、このブロブ上で顔検出を行う。顔が検出された場合、顔認識部108は、データベース中に格納された顔からこの顔のアイデンティティを決定する。
画像ソース
一実施形態において、画像ソース102は、2つ以上のビデオ画像を備える。これらのビデオ画像は、顔の候補領域を決定するためのオブジェクト画像を取得するため、ビデオカメラによって撮影される。2台のビデオカメラを使用することによって、2つの取得画像で特定される(カメラの焦点面から)すべてのオブジェクトまでの距離を決定することができる。
顔候補領域検出
画像ソース102は、顔候補領域検出部104と連結している。顔候補領域検出部104は、発見的手法と、距離を決定するための2つのカメラを備える画像ソース102から取得した深さマップとを使用して、最も顔を含む可能性が高い領域を見つける。顔認識システム100は、顔候補領域検出部104を使用して顔を含む可能性の高い領域を見つけることによって、探索空間を縮小し、この結果、顔検出処理で必要とされる計算を簡略化し、リアルタイムで顔検出処理を実行することができるようにする。
図2は、本発明の一実施形態による顔候補領域を見つける方法を示すフローチャートである。顔候補領域検出部104は、ブロブ領域の位置を決定することによって顔候補領域を見つける。まず、ステップ202で、顔候補領域検出部104は、画像ソースから取得した深さ画像にガウスフィルタを適用することによって画像をスムージングする。次に、ステップ204で、顔候補領域検出部104は、例えば、0.5mから3mまでの間の20区分で構成される深さ値のヒストグラムを構築する。そして、ピクセルを最も多く含む区分を選択する。各ピクセルが選択された区分に属するか否かに基づいて、2値画像を作成する。この2値深さマップ画像において、「ブロブ」(すなわち、隣接領域)を検出する。ステップ206で、複数のブロブが見つかった場合、単一のブロブにマージする。ステップ208で、ブロブを囲む長方形を計算する。この長方形の上部を顔検出のための探索領域として使用する。
上記は、顔候補領域検出部104を実施するための記載であり、本発明が動作する好ましい状況について説明している。上記の記載は、機能および構成の一実施例の概要である。オブジェクト領域の検出に関しては、2004年6月1日に出願され同時係属中である米国特許出願第10/858,930号、「オブジェクト検出方法、オブジェクト検出装置、およびオブジェクト検出プログラム」により詳細に記載されており、この内容をすべて参照することによって本明細書中に組み込むものとする。
顔検出
顔検出は、顔画像セットおよび非顔画像セット上でトレーニングされたサポートベクターマシン(SVM)分類器を使用して行う。顔検出では、デジタル化したビデオ信号やスキャンした写真などの任意の画像を取り込み、その画像中に人物の顔が存在するか否かを決定する。顔が見つかった場合、顔検出部106は、それらの位置のエンコードを返す。顔検出部106において、SVM分類器は、顔領域と非顔領域とを分類するために使用される。
分類タスクとして、様々なアルゴリズムを使用することができる。これらの分類アルゴリズムには、ニューラルネットワーク、隠れマルコフ分類器、フィッシャー線形判別分析法、およびサポートベクターマシンが含まれる。これらのアルゴリズムうちのいずれを適用しても、顔領域と非顔領域とを分類することができる。本発明の好ましい実施形態では、SVM分類器を適用する。SVM分類器は、統計的学習理論に基づいており、唯一解を有する二次計画問題へと軽減することができるため、実用的な技術である。
SVM分類器は、最も重要な特徴に集中することによって特徴空間の分割を改善するため、最適な特徴を特定しながら動作する。SVMは、決定超平面によって、特徴空間を2つの異なったクラス(ここでは、顔クラスと非顔クラス)に分割するよう試みる。超平面とは、多様な次元を有する幾何学面である。
SVM分類器は、2クラス間の最適識別超平面を見つけることを目的とする。最適超平面とは、最適マージンを有するものとして説明する。すなわち、クラス間の距離が、マージンがクラス間で最大に分離されるようにするものであることを意味する。ベクトルは、必ずマージン上、または、マージンの外に位置し、丁度マージン上にあるベクトルがサポートベクトルである。特定のクラスに属するベクトルを判別する関数として、超平面の数学的記述を使用してもよい。判別関数は、超平面の片側のマージン上またはマージンを超えた位置にあるベクトルに対して−1または−1より小さい値を返す。一方、超平面の反対側のマージンに関して、関数は、+1または+1より大きい値を返す。
SVMの基本的な考え方は、トレーニングデータセットが与えられた場合、トレーニングデータをより高次元の特徴空間に非線形写像し、この特徴空間において最大マージンを有する分離超平面を構築することである。したがって、SVMが与えられた特徴ベクトルxをより高次元の空間の新しいベクトルΦ(x)に陰に変換することによって、xを分離する超平面が、より高次元の空間におけるΦ(x)の超平面になるようにする。高次元ベクトルΦ(x)自体を計算するよりむしろ数式K(x,x)=Φ(xΦ(x)の内積のみ計算すればよく、xからΦ(x)への写像は、陰に使用されるにすぎない。これらのいわゆるカーネルにおいて、添字ijはトレーニングセットの各ベクトルを示す。分類処理において、カーネルを計算するとき考察しなければならないのは、分離超平面のごく近傍にあるベクトルのみである。これらのベクトルをサポートベクトル(SV)と呼ぶ。トレーニングセットのベクトルxに対して、特定のタイプのクラスであれば(例えば、顔であれば)ラベルy=1、特定のタイプのクラスでなければ(例えば、非顔であれば)ラベルy=−1となるラベルyが与えられると仮定する。すると、最適分類器は、以下の数式を有する。
Figure 0004724125
サポートベクトルセットに関して総和を計算し、定数αおよびiは、分類器学習アルゴリズムによって計算する。係数αおよびbの計算は、トレーニングセット上で行われる比較的計算量の多い処理であるが、1回だけ実行すればよい。
SVMについては、ヴイ.エヌ.ヴァプニク(V. N. Vapnik)著、「統計的学習理論(Statistical Learning Theory)」ニューヨーク、ジョンワイリーアンドサンズ(John Wiley & Sons)出版(1998年)に記載されており、これを参照することによって本明細書中に組み込むものとする。
図3は、本発明の一実施形態による顔検出部106の構成要素を示す。顔検出部106は、データ記憶部302と、Findface部304と、Isface部306と、ヒストグラム等化部308と、SVM分類器部310とを備える。
図4は、顔検出部106を使用して顔を検出するステップを示すフローチャートである。顔検出部106は、顔画像セットおよび非顔画像セット上でトレーニングされたサポートベクターマシン分類器を使用して顔検出を行う。SVM分類器のトレーニングについては、後で詳細に説明する。
顔検出部106が画像を受け取ると、Findface部304は、顔検出を開始する。好ましい実施形態では、顔検出部106は、顔候補領域検出部104から渡される画像を受け取る。この画像は、顔を含む可能性が最も高いブロブ領域を含む長方形領域を備える。この長方形領域とは、顔検出部106が顔を探索するための画像領域を示す。顔候補領域検出部104が提供する長方形領域によって、顔を探索する区域が減少するため、計算量が減少するという利点がもたらされる。また、代替の実施形態では、画像領域全体を顔検出部106に渡してもよい。この場合、顔検出部106は、画像全体から顔を探す。
ステップ404において、Findface部304は、画像の一部分(部分画像)を取り込んで探索処理を開始する。好ましい実施形態では、Findface部304は、画像中の19×19ピクセルウィンドウをスキャンする。次に、ステップ406で、ヒストグラム等化部308は、19×19部分画像上でヒストグラム等化を行い、照明の光度における差異、異なるカメラの応答カーブなどを補正する。ステップ408において、SVM分類器部310は、カスケード式SVM分類器決定関数を19×19部分画像ウィンドウに適用する。部分画像のスコアが正の場合、顔を見つけたことになる。部分画像のスコアが負の場合、部分画像は、非顔領域を表現している。SVM分類器部310は、与えられた19×19部分画像ウィンドウと選択済みのトレーニング画像(サポートベクトル)とを比較することによって、スコアを計算する。スコア>0は顔であることを表し、スコア<0は非顔であることを表す。この計算は、明らかに顔でないウィンドウを早く排除するよう設計されている。ウィンドウが顔を含むか、または非常に顔に類似している場合のみ、スコアを計算する。カスケード式SVM分類器310については、後で詳細に説明する。
ステップ412において、Isface部306は、19×19部分画像のSVM分類の結果を結合する。Isface部306は、分類結果に基づいて顔領域および非顔領域を結合することによって、顔位置領域414を有する画像を生成することができる。
ステップ410で、画像中の19×19ピクセルウィンドウから成るすべての部分画像領域について処理するまで、顔検出部106は続行する。
カスケードSVM分類器
新しい部分画像を分類するのにSVMを使用する場合、カーネル評価において部分画像と各サポートベクトルとを比較しなければならない。サポートベクトルは、通常、数百個存在するので、計算量が膨大になりうる。SVMのテスト時間性能を高速化するため、顔検出部106は、まず、各部分画像に対して実行されるカーネル評価の数を減らす。これを実施するための簡易な方法として、いくつかのサポートベクトルを破棄する。これによって速度は上がるが、精度は低下する。各サポートベクトルは、対応する係数、すなわちアルファ(α)値を有する。非常に小さいアルファ値を持つサポートベクトルは、テスト画像の分類にわずかな影響しか与えない。したがって、顔検出部106は、ある閾値より小さいアルファを有するすべてのサポートベクトルを破棄することができる。この閾値は、独立テスト画像セット上の性能低下が無視できる程度になるよう選定する。
第二の方法では、カーネル評価のすべてを実行する前に、テスト画像の分類を試みる。図6は、SVM分類器部310がカスケード式SVM分類法において実行するステップを示すフローチャートである。この考え方は、多数の部分画像が顔でなく、多数の部分画像が比較的簡単に顔でないと判別することができるはずであるというものである。したがって、SVM分類器部310において、できる限り少ないカーネル評価によって非顔画像を破棄しようとするものである。各ステージに関して、アルファ値、評価すべきカーネル、および閾値が、トレーニングステージ(後で説明)中に決定される。これらの値は、データの記憶部302中のデータファイルに格納され、SVM分類器310は、このデータファイルにアクセスすることができる。
新しい部分画像が与えられ602、k、k、…kをこの部分画像とN個の各サポートベクトルとの間のカーネル関数の評価結果、α、α、…αを各サポートベクトルに対応する係数とする。標準的なSVM分類関数では、bが閾値である場合、
Figure 0004724125

であれば、顔を見つけたことを示す。ステップ604では、
Figure 0004724125

のみを調べることによって、カスケードSVMを開始する。この規則は、(1)に比べてかなり簡易であり、精度が同じになることを期待することはできない。代わりに、十分小さい閾値bを選定する(検出漏れを最小にする)ことによって、(2)は、明らかな非顔画像を早く排除するための簡易規則になる。テスト画像が(2)を満たす(すなわち、上記の閾値1より大きい)場合、ステップ606において、トレーニング部302は、より複雑な決定関数
Figure 0004724125

を適用する。ここでも、SVM分類器310は、多くの誤検出を次のステージに進ませることを代償にして、非顔画像だけを排除するようbを最適化する。SVM分類器310は、例えば、規則に含まれるカーネル評価の数を倍増する(例えば、ステップ608)など、より複雑な決定則を適用し続け、テスト画像が決定則の1つを満たさなければすぐに画像を非顔として分類(その結果、処理を終了)する614。
当業者であれば、図6に示すSVM分類処理におけるステップ604において、SVMスコアの計算のために使用するサポートベクトルの数は何個(例えば、最初の3個のサポートベクトル)でもよく、同様に、それに続くステップにおいても、異なる個数のサポートベクトル(例えば、ステップ606において最初の6個のサポートベクトル)を使用してもよいことを了承するであろう。
最後に、ステップ612において、部分画像がすべての中間決定則を満たし、すべてのサポートベクトルについて次に考察しなければならない時点に達したとき、SVM分類器310では、テスト画像をできる限り正確に分類することができるよう元の決定関数(1)を適用する。この最終規則およびすべての中間規則を満たした場合のみ、テスト画像が肯定(顔)として分類されることに留意されたい。
上記の方法において、最悪の場合でも、少数の比較処理(比較の数は、サポートベクトルの数において対数関数的である)しか追加しなくてよい。一方、大多数の非顔画像は、多数のカスケード式処理の中で最も簡易な規則(2)をテストしただけで、比較的早く分類することができる。大部分の画像は顔を含まないため、この結果、分類に必要な計算を全体としてかなり減らすことができる。
顔検出トレーニング
顔領域および非顔領域を分類するため、最初に、肯定例(すなわち、顔画像)セットと否定例(すなわち、非顔画像)セットとを使用して、SVM分類器310のための決定面をトレーニングする必要がある。風景、木、建物などの画像によって、誤検出をもたらすよい例が提供される。
SVMベースの分類器に伴う一つの問題は、サポートベクトルの数が非常に多い場合があるため、各画像についてスコアを計算するのに時間が費やされるという点である。トレーニングフェーズにおいて、検出部106では、サポートベクトルをそれらの係数(α値)に基づいてソートする。より大きい係数を有するサポートベクトルは、テスト画像が顔であるか否かを決定する際に重大な影響を与える。このソート処理は、テスト画像が顔であるか否かを評価する際に有用である。大きい係数を有するサポートベクトルを使用して計算する場合、テスト画像が実際に顔でなければ、SVMスコアは低くなるはずである。他方、テスト画像が実際に顔であれば、SVMスコアは閾値を超えるはずである。さらに、顔検出部106は、残りのサポートベクトルを使用することによって、このテスト画像を評価し続けてもよい。すべてのSVMスコアが閾値より大きい場合、検出部106は、テスト画像を顔として分類する。
図4は、トレーニング処理を示す。上記のように、顔検出部106をトレーニングするとき、顔画像および非顔画像を使用してSVMをトレーニングする。トレーニングが完了した後、データファイルが作成される(図示せず)。このファイルは、顔検出部106において、顔と非顔を分類するため使用するSVM分類器として使用される。検出手段の性能が不十分であれば、再トレーニングすることも可能だが、トレーニングは、1度だけ実行されればよい。
この好ましい実施形態において、1セットの肯定例(顔画像)および否定例(非顔画像)が与えられた場合402、顔検出部106では、3次元多項式カーネルを使用してSVM分類器をトレーニングする。他の実施形態では、他の次元の多項式カーネル関数(例えば、2次元多項式カーネル関数)を使用してもよい。顔領域セットがクラス+1に割り当てられ、非顔領域セットがクラス−1に割り当てられる。
好ましい実施形態では、顔検出部106において、顔領域および非顔領域の19×19ピクセル部分画像セットを使用してSVMをトレーニングする。顔検出部106では、ステップ504において、顔領域および非顔領域を含む部分画像を使用して、カスケード式SVM分類器をトレーニングする。このカスケード分類器のトレーニングでは、段階的に複雑化する決定則にサポートベクトルを追加していく順番を選定し、カスケードの各ステージにおける閾値を選定する。最初の4つのサポートベクトル(最初の2つのステージ)の順番は、力ずくで選定する。ステップ506では、すべての組のサポートベクトルについて考察し、定数個の検出漏れ(たとえば、0%または0.1%)を許容しながら、トレーニングセットから最も多くの非顔画像を排除することができるものを選択する。最小の係数を有するサポートベクトルは、テスト画像が顔であるか否かの決定にあまり重大な影響を与えない。したがって、ステップ508で、これらのサポートベクトルを破棄する。カスケードの後方のレベルでは、力ずくで計算することは不可能である。したがって、ステップ510では、代わりに、多数(例えば、1000)のサポートベクトルをランダムに選択して考察し、最良のものを選定する。ステップ514で、一旦サポートベクトルの順番が選定されると、トレーニングセットと検出漏れの許容率に基づいて、閾値bの選定が行われる。すべてのサポートベクトルを選択し終わったとき512、ステップ516で、最終的な閾値としてSVMをトレーニングした時に決定された値を設定する。
SVM分類器に関しては、イー.オスーナ(E. Osuna)、アール.フロインド(R. Freund)、およびエフ.ジロシ(F. Girosi)著、「サポートベクターマシンのトレーニング(Training support vector machines):顔検出への応用(an application to face detection)」、IEEEコンピュータ協会会議のコンピュータビジョンとパターン認識(CVPR)についての議事録(Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR))(1997年)により詳細に記載されており、これを参照することによって本明細書中に組み込むものとする。
顔認識
本発明において、顔検出部の結果、顔が検出されると、次に顔認識部108を利用して顔を認識することができる。代替の実施形態によれば、顔認識部は、顔検出部の結果と関係なく動作する。好ましい実施形態において、顔認識部108は、トレーニング部とテスト部とを含む。トレーニング部は、非リアルタイム(オフライン)モードで実行される一方、テスト部は、実行時モードで実行される。
図7は、本発明の一実施形態による顔認識のトレーニング処理を示すフローチャートである。本発明では、データベースに登録された様々な被写体の顔画像を取得する702。本発明によれば、次に、顔検出アルゴリズムを使用して704、顔画像を検出する。顔検出アルゴリズムは上記のアルゴリズムでもよい。本発明には、人間が顔検出器によって識別された画像を目視によって検査し706、パネルまたはウィンドウに顔があるか否かを決定するステップ707がオプションとして含まれる。本発明では、顔がある場合、ヒストグラム等化処理を実行し708、仮想例を作成する709。ヒストグラム等化処理708とは、異なるユーザ間の照明の変分を調整するものであり、仮想画像が作成される前または後に行うことができる。一実施形態において、ヒストグラム等化処理708では、画像をグレースケールに変換し、例えば、顔画像の平均グレースケール値を減じたり、データベース中の複数の画像の標準偏差で各ピクセルを除したりすることによって、画像を正規化する。
一実施形態では、仮想例は、1つまたは複数の拡大縮小比率で1つまたは複数のピクセルだけ移動させた顔画像であり、データベース中の各顔に対して複数の仮想例を作成する709。また、顔画像を回転させて、配置の違いを調整する仮想画像を作成してもよい709。これらの仮想例によって、部分空間アルゴリズム、例えば、フィッシャー線形判別法における配置エラーを軽減することができる。複数の仮想画像を作成する一つの技術によれば、(1)最初の大きさ、例えば、64ピクセル×64ピクセルの切り取り画像を使用し、(2)中央、左上、右上、左下、右下の5箇所の各々に位置する5つの60×60ピクセルウィンドウをサンプリングし、(3)これらの5箇所の各々において56×56ピクセルウィンドウをサンプリングし、(4)ヒストグラム等化を実行し、(5)これら11個の画像すべてを19×19ピクセル画像に正規化する。
本発明では、部分空間アルゴリズムを使用して、射影行列を決定する710。本発明の一実施形態によれば、フィッシャー線形判別法(FLD)を使用する。FLD法については、ピーエヌベルミュール(P. N. Belhumeur)、ジェーピーエスパーナ(J. P. Hespanha)、およびデージェークリーグマン(D. J. Kriegman)著、「固有顔対フィッシャー顔(Eigenfaces vs. Fisherfaces):クラス固有の線形射影による認識(Recognition Using Class Specific Linear Projection)」、IEEE会報、パターン解析およびマシンインテリジェンス(IEEE Trans. Pattern Analysis and Machine Intelligence)、(19)7:711−720(1997年)にさらに詳細に記載されており、この内容をすべて参照することによって本明細書中に組み込むものとする。本発明の代替の実施形態によれば、カーネルフィッシャー線形判別法(KFLD)アルゴリズムを使用してもよい。KFLDおよびFLDに関しては、2002年7月22日に出願された米国特許出願第10/201,429号にさらに詳細に記載されており、この内容をすべて参照することによって本明細書中に組み込むものとする。
本発明の一実施形態によれば、パターン分類においてよく起きるクラス内変動行列Sの特異性問題に対処するため、単位行列の定数倍をクラス内変動行列に加えてもよい。すなわち、S+εI(ここでεは小さい数)としてもよい。また、これによって、固有値問題は、数的により安定する。この結果、ピーエヌベルミュール(P. N. Belhumeur)他著、「固有顔対フィッシャー顔(Eigenfaces vs. Fisherfaces):クラス固有の線形射影による認識(Recognition Using Class Specific Linear Projection)」、パターン解析およびマシンインテリジェンスに関するIEEE会報、(IEEE Transactions on Pattern Analysis and Machine Intelligence)、第19巻、第7号(1997年)の数式5におけるWpca項が削除される。この文献の内容は、すべてを参照することによって本明細書中に組み込むものとする。さらに詳細が、上記で参照した米国特許出願第10/621,872号に記載されている。
図8は、本発明の一実施形態による顔認識方法を示すフローチャートである。例えば、ビデオカメラによって取得された画像を受け取る802。次に上記の顔検出処理を実行し、画像内の顔の位置を特定する804。画像を切り取って、テスト画像を作成する805。そして、上記のように、テスト画像をグレースケールに変換してから、平均顔画像を減じ、標準偏差で各ピクセルを除することによって、顔画像を正規化する805。その後、上記のトレーニング処理で識別された学習済み射影行列を使用して、テスト画像をより低次元の空間に射影する806。次に、本発明では、クラスタの中心から射影されたサンプルへの距離が最小となるクラスタを識別する808。これらのステップに関しては、上記のベルミュール(Belhumeur)他の著書、および米国特許出願第10/621,872号に、さらに詳細に記載されている。一実施形態においては、テスト画像に対するフィッシャー座標を計算し、データベース中の各人物に対する平均フィッシャー座標と比較する。データベース中の各顔画像に対するフィッシャー座標を予め決定する。各人物について、その人物の全画像からフィッシャー座標の平均を決定する。その後、テスト画像のフィッシャー座標と、データベース中の各人物に対する平均フィッシャー座標とを比較する。テスト画像は、平均フィッシャー座標がユークリッド距離においてテスト画像に最も近い人物に属していると分類される。
別の方法として、本発明では、前のフレームに対して決定されたアイデンティティを利用する時系列集計技術を利用することができる。一実施例によれば、現テスト画像のアイデンティティを決定するとき、最後の5枚のビデオフレームで決定されたアイデンティティを使用する。一実施形態では、多数決方式を使用して、時系列集計を実行する。すなわち、最後の5枚のビデオフレームで決定された最多のアイデンティティに基づいて決定する。
当業者であれば、本開示を読むことによって、開示した本発明の原理による実動作速度ビット障害マッピングに関し、他の代替のシステムおよび方法を高く評価するであろう。以上、本発明の特定の実施例と適用例について図解し説明してきたが、本発明が本明細書で開示された厳密な構成および構成要素に限定されるものではなく、また、本明細書に記載された本発明の方法および装置の配置、処理、および詳細において、後述の請求の範囲において定義される本発明の趣旨と範囲を逸脱しない限り、当業者にとって明白な改変、変更、および変形を多様に行うことができることを理解するであろう。
図1は、本発明の一実施形態による顔認識システムを示すブロック図である。 図2は、本発明の一実施形態による顔領域候補を見つける方法を示すフローチャートである。 図3は、本発明の一実施形態による顔検出システムの機能ブロック図である。 図4は、本発明の一実施形態による顔を検出するステップを示すフローチャートである。 図5は、本発明の一実施形態によるSVM分類器をトレーニングするステップを示すフローチャートである。 図6は、本発明の一実施形態によるカスケード式SVM分類器で顔を分類するステップを示すフローチャートである。 図7は、本発明の一実施形態による顔認識のトレーニング処理を示すフローチャートである。 図8は、本発明の一実施形態による顔認識方法を示すフローチャートである。

Claims (34)

  1. 最初の複数のサポートベクトルと、前記最初の複数のサポートベクトルに関する最初の閾値と、前記最初の複数のサポートベクトル及び少なくとも一つの追加的なサポートベクトルを備える二番目の複数のサポートベクトルと、前記二番目の複数のサポートベクトルに関する二番目の閾値と、を含む、カスケード式SVMベースの分類器に関するトレーニングデータを受け取るステップと、
    入力データを受け取るステップと、
    前記入力データに関して、前記最初の複数のサポートベクトルを使用して、最初のSVMスコアを生成するステップと、
    前記最初のSVMスコアと前記最初の閾値とを比較することによって、前記入力データの最初の分類を決定するステップと、
    前記入力データの前記最初の分類が肯定分類である場合に、前記二番目の複数のサポートベクトルを使用して、前記入力データに関する二番目のSVMスコアを生成するステップと、
    前記入力データの前記最初の分類が否定分類である場合には、前記入力データを非顔画像として分類して、処理を終了するステップと、
    前記二番目のSVMスコアと前記二番目の閾値とを比較することによって、前記入力データの二番目の分類を決定するステップと、
    前記入力データの前記二番目の分類が肯定分類である場合には、前記入力データを顔画像として分類し、前記入力データの前記二番目の分類が否定分類である場合には、前記入力データを非顔画像として分類して、処理を終了するステップと、
    を含むことを特徴とする顔認識を実行する方法。
  2. 出力データを生成するステップをさらに含み、
    前記入力データは、画像を含み、前記出力データは、前記二番目の分類に基づいて、前記入力データが顔画像であるか非顔画像であるかを示すことを特徴とする請求項1に記載の方法。
  3. 前記出力データが前記入力データは顔画像であることを示す場合に、顔検出を使用して前記入力データにおける顔を識別するステップをさらに含むことを特徴とする請求項1に記載の方法。
  4. 前記顔を識別するステップは、
    学習済み射影行列を使用して、前記入力データを低次元空間に射影するステップと、
    前記射影された入力データまでの距離が最小であるクラスタの中心を決定するステップと、
    前記クラスタの中心のアイデンティティを返すステップと、を含むことを特徴とする請求項に記載の方法。
  5. 前記学習済み射影行列は、フィッシャー線形判別法を使用して計算することを特徴とする請求項に記載の方法。
  6. 前記最初の複数のサポートベクトルは、最初の2つのサポートベクトルを備え、
    前記最初のSVMスコアは、前記最初の2つのサポートベクトルから生成されることを特徴とする請求項1に記載の方法。
  7. 前記最初のSVMスコアが前記最初の閾値より大きい場合、前記入力データの前記最初の分類は、前記肯定分類を含むことを特徴とする請求項1に記載の方法。
  8. 前記最初の複数のサポートベクトルは、最初の4つのサポートベクトルを備え、
    前記最初のSVMスコアは、前記最初の4つのサポートベクトルから生成されることを特徴とする請求項1に記載の方法。
  9. 前記最初の複数のサポートベクトルは、最初の8つのサポートベクトルを備え、
    前記最初のSVMスコアは、前記最初の8つのサポートベクトルから生成されることを特徴とする請求項1に記載の方法。
  10. 前記二番目の複数のサポートベクトルは、すべてのサポートベクトルを備え、
    前記二番目のSVMスコアは、前記すべてのサポートベクトルから生成されることを特徴とする請求項1に記載の方法。
  11. 前記最初のSVMスコアが前記最初の閾値より小さい場合、前記最初の分類は、否定分類を含むことを特徴とする請求項1に記載の方法。
  12. 前記トレーニングデータは、
    肯定例セットと否定例セットとを備えるトレーニングセットを受け取るステップと、
    前記トレーニングセットから、複数のサポートベクトルと複数のサポートベクトル係数とを生成するステップと、
    前記複数のサポートベクトルから否定例を排除するこができるサポートベクトルを備えるサポートベクトルのサブセットを選択するステップと、
    前記サポートベクトルのサブセットに関する閾値を決定するステップと、
    を含むステップによって生成されることを特徴とする請求項1に記載の方法。
  13. 閾値よりも小さい係数を有するサポートベクトルを破棄するステップをさらに含むことを特徴とする請求項12に記載の方法。
  14. 前記入力データはデジタル画像であることを特徴とする請求項1に記載の方法。
  15. 前記SVMは顔検出のために使用されることを特徴とする請求項1に記載の方法。
  16. 前記入力データは、19×19ピクセル部分画像を備えることを特徴とする請求項1に記載の方法。
  17. 前記入力データにヒストグラム等化を適用するステップをさらに含むことを特徴とする請求項1に記載の方法。
  18. 最初の複数のサポートベクトルと、前記最初の複数のサポートベクトルに関する最初の閾値と、前記最初の複数のサポートベクトル及び少なくとも一つの追加的なサポートベクトルを備える二番目の複数のサポートベクトルと、前記二番目の複数のサポートベクトルに関する二番目の閾値と、を含む、カスケード式SVMベースの分類器に関するトレーニングデータを受け取るトレーニングデータ受け取り手段と、
    入力データを受け取る入力データ受け取り手段と、
    前記入力データに関して、前記最初の複数のサポートベクトルを使用して、最初のSVMスコアを生成する第一のSVMスコア化手段と、
    前記最初のSVMスコアと前記最初の閾値とを比較することによって、前記入力データの最初の分類を決定する第一の比較手段と、
    前記入力データの前記最初の分類が肯定分類である場合に、前記二番目の複数のサポートベクトルを使用して、前記入力データに関する二番目のSVMスコアを生成する第二のSVMスコア化手段と
    記二番目のSVMスコアと前記二番目の閾値とを比較することによって、前記入力データの二番目の分類を決定する第二の比較手段と、
    前記入力データの前記最初の分類が否定分類である場合、または、前記入力データの前記二番目の分類が否定分類である場合には、前記入力データを非顔画像として分類して処理を終了する、処理を終了する処理終了手段と、
    前記入力データの前記一番目および前記二番目の分類が肯定分類である場合には、前記入力データを顔画像として分類する分類手段と、
    備えることを特徴とする顔認識を実行するシステム。
  19. 出力データを生成する出力手段をさらに備え、
    前記入力データは、画像を含み、前記出力データは、前記二番目の分類に基づいて、前記入力データが顔画像を含むか非顔画像データを含むかを示すことを特徴とする請求項18に記載のシステム。
  20. 前記出力データが前記入力データは顔画像であることを示す場合に、顔検出を使用して前記入力データにおける顔を識別する顔検出手段をさらに備えることを特徴とする請求項19に記載のシステム。
  21. 前記顔検出手段は、
    学習済み射影行列を使用して、前記入力データを低次元空間に射影する射影手段と、
    前記射影された入力データまでの距離が最小であるクラスタの中心を決定するクラスタ中心手段と、を備えることを特徴とする請求項20に記載のシステム。
  22. 前記学習済み射影行列は、フィッシャー線形判別法を使用して計算することを特徴とする請求項21に記載のシステム。
  23. 前記最初の複数のサポートベクトルは、最初の2つのサポートベクトルを備え、
    前記最初のSVMスコアは、前記最初の2つのサポートベクトルから生成されることを特徴とする請求項18に記載のシステム。
  24. 前記最初のSVMスコアが前記最初の閾値より大きい場合、前記入力データの前記最初の分類は、前記肯定分類を含むことを特徴とする請求項18に記載のシステム。
  25. 前記最初の複数のサポートベクトルは、最初の4つのサポートベクトルを備え、
    前記最初のSVMスコアは、前記最初の4つのサポートベクトルから生成されることを特徴とする請求項18に記載のシステム。
  26. 前記最初の複数のサポートベクトルは、最初の8つのサポートベクトルを備え、
    前記最初のSVMスコアは、前記最初の8つのサポートベクトルから生成されることを特徴とする請求項18に記載のシステム。
  27. 前記二番目の複数のサポートベクトルは、すべてのサポートベクトルを備え、
    前記二番目のSVMスコアは、前記すべてのサポートベクトルから生成されることを特徴とする請求項18に記載のシステム。
  28. 前記最初のSVMスコアが前記最初の閾値より小さい場合、前記最初の分類は、否定分類を含むことを特徴とする請求項18に記載のシステム。
  29. 前記トレーニングデータは、
    肯定例セットと否定例セットとを備えるトレーニングセットを受け取るトレーニングセット受け取り手段と、
    前記トレーニングセットから、複数のサポートベクトルと複数のサポートベクトル係数とを生成するSVトレーニング手段と、
    前記複数のサポートベクトルから否定例を排除するこができるサポートベクトルを備えるサポートベクトルのサブセットを選択するサブセット選択手段と、
    前記サポートベクトルのサブセットに関する閾値を決定する閾値決定手段と、
    を備えるトレーニング手段によって生成されることを特徴とする請求項18に記載のシステム。
  30. 小さい係数を有するサポートベクトルを破棄する破棄手段をさらに備えることを特徴とする請求項29に記載のシステム。
  31. 前記入力データはデジタル画像であることを特徴とする請求項18に記載のシステム。
  32. 前記SVMは顔検出のために使用されることを特徴とする請求項18に記載のシステム。
  33. 前記入力データは、19×19ピクセル部分画像を備えることを特徴とする請求項18に記載のシステム。
  34. 前記入力データにヒストグラム等化を適用するヒストグラム等化手段をさらに備えることを特徴とする請求項18に記載のシステム。
JP2006553176A 2004-02-13 2005-02-07 顔認識システム Expired - Fee Related JP4724125B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US54457604P 2004-02-13 2004-02-13
US60/544,576 2004-02-13
US10/858,930 US7430315B2 (en) 2004-02-13 2004-06-01 Face recognition system
US10/858,930 2004-06-01
PCT/US2005/003818 WO2005079237A2 (en) 2004-02-13 2005-02-07 Face recognition system

Publications (3)

Publication Number Publication Date
JP2007535024A JP2007535024A (ja) 2007-11-29
JP2007535024A5 JP2007535024A5 (ja) 2008-03-27
JP4724125B2 true JP4724125B2 (ja) 2011-07-13

Family

ID=34841182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006553176A Expired - Fee Related JP4724125B2 (ja) 2004-02-13 2005-02-07 顔認識システム

Country Status (4)

Country Link
US (1) US7430315B2 (ja)
EP (1) EP1716519A4 (ja)
JP (1) JP4724125B2 (ja)
WO (1) WO2005079237A2 (ja)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8135652B2 (en) * 2004-10-29 2012-03-13 Nec Laboratories America, Inc. Parallel support vector method and apparatus
US20070112701A1 (en) * 2005-08-15 2007-05-17 Microsoft Corporation Optimization of cascaded classifiers
CN1332347C (zh) * 2005-09-23 2007-08-15 上海交通大学 基于迭代特征选择的快速人脸识别方法
US20080071711A1 (en) * 2006-09-20 2008-03-20 Siemens Corporate Research, Inc. Method and System for Object Detection Using Probabilistic Boosting Cascade Tree
US7962428B2 (en) * 2006-11-30 2011-06-14 Siemens Medical Solutions Usa, Inc. System and method for joint optimization of cascaded classifiers for computer aided detection
US7949154B2 (en) 2006-12-18 2011-05-24 Cryovac, Inc. Method and system for associating source information for a source unit with a product converted therefrom
JP2008234627A (ja) * 2007-02-19 2008-10-02 Seiko Epson Corp カテゴリー識別装置、及び、カテゴリー識別方法
GB2449412B (en) * 2007-03-29 2012-04-25 Hewlett Packard Development Co Integrating object detectors
US7983480B2 (en) * 2007-05-17 2011-07-19 Seiko Epson Corporation Two-level scanning for memory saving in image detection systems
US7693806B2 (en) * 2007-06-21 2010-04-06 Microsoft Corporation Classification using a cascade approach
CN101414348A (zh) * 2007-10-19 2009-04-22 三星电子株式会社 多角度人脸识别方法和系统
US8433669B2 (en) * 2007-11-14 2013-04-30 International Business Machines Corporation Configuring individual classifiers with multiple operating points for cascaded classifier topologies under resource constraints
KR101362768B1 (ko) * 2007-11-23 2014-02-14 삼성전자주식회사 객체 검출 방법 및 장치
CN104866553A (zh) 2007-12-31 2015-08-26 应用识别公司 利用脸部签名来标识和共享数字图像的方法、系统和计算机程序
US9639740B2 (en) 2007-12-31 2017-05-02 Applied Recognition Inc. Face detection and recognition
US9721148B2 (en) 2007-12-31 2017-08-01 Applied Recognition Inc. Face detection and recognition
KR100957716B1 (ko) 2008-10-07 2010-05-12 한국 한의학 연구원 가변 피부색 모델을 이용한 피부색 영역 검출 방법
US8539359B2 (en) 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
US8224693B2 (en) * 2009-05-14 2012-07-17 Hewlett-Packard Development Company, L.P. Advertisement selection based on key words
CN102449661A (zh) * 2009-06-01 2012-05-09 惠普发展公司,有限责任合伙企业 确定级联分类器的检测确定性
CN101739555B (zh) * 2009-12-01 2014-11-26 北京中星微电子有限公司 假脸检测方法及系统、假脸模型训练方法及系统
EP2507742A2 (en) * 2009-12-02 2012-10-10 Tata Consultancy Services Limited A cost effective and robust system and method for eye tracking and driver drowsiness identification
TWI424359B (zh) * 2009-12-03 2014-01-21 Chunghwa Telecom Co Ltd Two - stage Face Recognition System and Method
RU2427911C1 (ru) * 2010-02-05 2011-08-27 Фирма "С1 Ко., Лтд." Способ обнаружения лиц на изображении с применением каскада классификаторов
EP2548147B1 (en) * 2010-03-13 2020-09-16 Carnegie Mellon University Method to recognize and classify a bare-root plant
EP3582177A1 (en) * 2010-04-02 2019-12-18 Nokia Technologies Oy Methods and apparatuses for face detection
EP2385484A1 (en) 2010-05-06 2011-11-09 STMicroelectronics (Grenoble 2) SAS Object detection in an image
US20120042263A1 (en) 2010-08-10 2012-02-16 Seymour Rapaport Social-topical adaptive networking (stan) system allowing for cooperative inter-coupling with external social networking systems and other content sources
US8812519B1 (en) 2010-09-06 2014-08-19 Jonathan Binnings Bent Face photograph-based dating recommendation system
AU2011301774B2 (en) * 2010-09-14 2016-02-18 Dynamic Digital Depth Research Pty Ltd A method for enhancing depth maps
CN101980250B (zh) * 2010-10-15 2014-06-18 北京航空航天大学 基于降维局部特征描述子和隐条件随机场的目标识别方法
US8873840B2 (en) * 2010-12-03 2014-10-28 Microsoft Corporation Reducing false detection rate using local pattern based post-filter
US20120249468A1 (en) * 2011-04-04 2012-10-04 Microsoft Corporation Virtual Touchpad Using a Depth Camera
WO2012139269A1 (en) * 2011-04-11 2012-10-18 Intel Corporation Tracking and recognition of faces using selected region classification
US8676937B2 (en) 2011-05-12 2014-03-18 Jeffrey Alan Rapaport Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging
US9552376B2 (en) 2011-06-09 2017-01-24 MemoryWeb, LLC Method and apparatus for managing digital files
US9691395B1 (en) * 2011-12-31 2017-06-27 Reality Analytics, Inc. System and method for taxonomically distinguishing unconstrained signal data segments
US8548207B2 (en) 2011-08-15 2013-10-01 Daon Holdings Limited Method of host-directed illumination and system for conducting host-directed illumination
US8489585B2 (en) * 2011-12-20 2013-07-16 Xerox Corporation Efficient document processing system and method
KR101877981B1 (ko) * 2011-12-21 2018-07-12 한국전자통신연구원 가버 특징과 svm 분류기를 이용하여 위변조 얼굴을 인식하기 위한 시스템 및 그 방법
US9202105B1 (en) 2012-01-13 2015-12-01 Amazon Technologies, Inc. Image analysis for user authentication
US8917910B2 (en) * 2012-01-16 2014-12-23 Xerox Corporation Image segmentation based on approximation of segmentation similarity
CN102903010A (zh) * 2012-09-25 2013-01-30 浙江图讯科技有限公司 一种用于面向工矿企业的安全生产云服务平台的基于支持向量机的异常判断方法
RU2536677C2 (ru) * 2013-04-09 2014-12-27 ООО "НеоБИТ" Способ распознавания образов на цифровом изображении
US20140363097A1 (en) * 2013-06-06 2014-12-11 Etron Technology, Inc. Image capture system and operation method thereof
CN104239906B (zh) * 2013-06-24 2017-07-07 富士通株式会社 构建装置和方法、图像分类装置和方法以及电子设备
CN103605711B (zh) * 2013-11-12 2017-02-15 中国石油大学(北京) 支持向量机分类器的构造方法及装置、分类方法及装置
US9489598B2 (en) * 2014-08-26 2016-11-08 Qualcomm Incorporated Systems and methods for object classification, object detection and memory management
CA3186147A1 (en) 2014-08-28 2016-02-28 Kevin Alan Tussy Facial recognition authentication system including path parameters
US10915618B2 (en) 2014-08-28 2021-02-09 Facetec, Inc. Method to add remotely collected biometric images / templates to a database record of personal information
US10803160B2 (en) 2014-08-28 2020-10-13 Facetec, Inc. Method to verify and identify blockchain with user question data
US10698995B2 (en) 2014-08-28 2020-06-30 Facetec, Inc. Method to verify identity using a previously collected biometric image/data
US10614204B2 (en) 2014-08-28 2020-04-07 Facetec, Inc. Facial recognition authentication system including path parameters
US11256792B2 (en) 2014-08-28 2022-02-22 Facetec, Inc. Method and apparatus for creation and use of digital identification
US9639951B2 (en) * 2014-10-23 2017-05-02 Khalifa University of Science, Technology & Research Object detection and tracking using depth data
WO2017015390A1 (en) * 2015-07-20 2017-01-26 University Of Maryland, College Park Deep multi-task learning framework for face detection, landmark localization, pose estimation, and gender recognition
USD987653S1 (en) 2016-04-26 2023-05-30 Facetec, Inc. Display screen or portion thereof with graphical user interface
CN107886032B (zh) 2016-09-30 2021-12-14 阿里巴巴集团控股有限公司 终端设备、智能手机、基于脸部识别的认证方法和系统
CN107194411A (zh) * 2017-04-13 2017-09-22 哈尔滨工程大学 一种改进的分层级联的支持向量机并行化方法
CN108874657A (zh) * 2017-07-18 2018-11-23 北京旷视科技有限公司 对人脸识别主机进行测试的方法、装置及计算机存储介质
KR102113591B1 (ko) * 2017-09-12 2020-05-22 선전 구딕스 테크놀로지 컴퍼니, 리미티드 얼굴 검출 활성화 방법, 얼굴 검출 활성화 장치 및 전자 장치
CN109034052B (zh) * 2018-07-24 2021-04-02 深圳市科脉技术股份有限公司 人脸检测方法及装置
CN109472292A (zh) * 2018-10-11 2019-03-15 平安科技(深圳)有限公司 一种图像的情感分类方法、存储介质和服务器
CN111382592B (zh) * 2018-12-27 2023-09-29 杭州海康威视数字技术股份有限公司 活体检测方法和设备
US10936178B2 (en) 2019-01-07 2021-03-02 MemoryWeb, LLC Systems and methods for analyzing and organizing digital photos and videos
CN110348418B (zh) * 2019-07-17 2022-03-11 上海商汤智能科技有限公司 目标跟踪方法及装置、智能移动设备和存储介质
US11594074B2 (en) 2019-09-10 2023-02-28 Amarjot Singh Continuously evolving and interactive Disguised Face Identification (DFI) with facial key points using ScatterNet Hybrid Deep Learning (SHDL) network

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002261848A (ja) * 2001-03-06 2002-09-13 Sumitomo Electric Ind Ltd 前置型非線形歪補償器
JP2003044853A (ja) * 2001-05-22 2003-02-14 Matsushita Electric Ind Co Ltd 顔検出装置、顔向き検出装置、部分画像抽出装置及びそれらの方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5710833A (en) 1995-04-20 1998-01-20 Massachusetts Institute Of Technology Detection, recognition and coding of complex objects using probabilistic eigenspace analysis
US6609093B1 (en) 2000-06-01 2003-08-19 International Business Machines Corporation Methods and apparatus for performing heteroscedastic discriminant analysis in pattern recognition systems
US7472063B2 (en) * 2002-12-19 2008-12-30 Intel Corporation Audio-visual feature fusion and support vector machine useful for continuous speech recognition
US7689033B2 (en) * 2003-07-16 2010-03-30 Microsoft Corporation Robust multi-view face detection methods and apparatuses

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002261848A (ja) * 2001-03-06 2002-09-13 Sumitomo Electric Ind Ltd 前置型非線形歪補償器
JP2003044853A (ja) * 2001-05-22 2003-02-14 Matsushita Electric Ind Co Ltd 顔検出装置、顔向き検出装置、部分画像抽出装置及びそれらの方法

Also Published As

Publication number Publication date
EP1716519A4 (en) 2008-12-10
US20050180627A1 (en) 2005-08-18
JP2007535024A (ja) 2007-11-29
EP1716519A2 (en) 2006-11-02
WO2005079237A2 (en) 2005-09-01
WO2005079237A3 (en) 2007-12-27
US7430315B2 (en) 2008-09-30

Similar Documents

Publication Publication Date Title
JP4724125B2 (ja) 顔認識システム
US7324671B2 (en) System and method for multi-view face detection
Kollreider et al. Real-time face detection and motion analysis with application in “liveness” assessment
Hadid et al. A discriminative feature space for detecting and recognizing faces
US7099505B2 (en) Method for boosting the performance of machine-learning classifiers
US7912246B1 (en) Method and system for determining the age category of people based on facial images
US7440586B2 (en) Object classification using image segmentation
US7929771B2 (en) Apparatus and method for detecting a face
Zhang et al. A survey of recent advances in face detection
JP4801557B2 (ja) 特定被写体検出装置及び方法
JP5121506B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
US20050013479A1 (en) Robust multi-view face detection methods and apparatuses
Yang Recent advances in face detection
Romdhani et al. Efficient face detection by a cascaded support–vector machine expansion
Zhang et al. Boosting-based face detection and adaptation
Irhebhude et al. A gender recognition system using facial images with high dimensional data
Pham et al. Face detection by aggregated bayesian network classifiers
Navabifar et al. A Fusion Approach Based on HOG and Adaboost Algorithm for Face Detection under Low-Resolution Images.
Xu et al. A novel multi-view face detection method based on improved real adaboost algorithm
Suma Dense feature based face recognition from surveillance video using convolutional neural network
Huang et al. Detecting faces from color video by using paired wavelet features
Huang et al. Real-time face detection in color video
Le et al. Fusion of local and global features for efficient object detection
Grieben et al. Cue integration by similarity rank list coding-application to invariant object recognition
Stojmenovic Algorithms for Real‐Time Object Detection in Images

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080207

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140415

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees