JP2014021896A - 顔画像認識装置及び顔画像認識プログラム - Google Patents

顔画像認識装置及び顔画像認識プログラム Download PDF

Info

Publication number
JP2014021896A
JP2014021896A JP2012162475A JP2012162475A JP2014021896A JP 2014021896 A JP2014021896 A JP 2014021896A JP 2012162475 A JP2012162475 A JP 2012162475A JP 2012162475 A JP2012162475 A JP 2012162475A JP 2014021896 A JP2014021896 A JP 2014021896A
Authority
JP
Japan
Prior art keywords
face
person
template
face area
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012162475A
Other languages
English (en)
Inventor
Clippingdale Simon
クリピングデル サイモン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2012162475A priority Critical patent/JP2014021896A/ja
Publication of JP2014021896A publication Critical patent/JP2014021896A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)
  • Image Analysis (AREA)

Abstract

【課題】顔画像認識の処理の計算量を削減できる顔画像認識装置及び顔画像認識プログラムを提供することを課題とする。
【解決手段】映像中の人物の顔を認識する顔画像認識装置10であって、認識対象となる人物の顔画像の人物特定テンプレート及び多数の人物の平均的な顔画像の人物不特定テンプレートが向きごとに登録されたテンプレート格納手段13と、映像から人物の顔が写っている顔領域を抽出する顔領域抽出手段11と、抽出された顔領域と前記テンプレート格納手段に登録された前記人物不特定テンプレートとを照合して、前記顔領域の特徴を抽出すると共に、抽出された前記顔領域の特徴を前記テンプレート格納手段に登録された前記人物特定テンプレートと比較して、前記顔領域に写っている人物の顔を認識する顔認識手段12とを有することにより上記課題を解決する。
【選択図】図3

Description

本発明は顔画像認識装置及び顔画像認識プログラムに係り、特に映像中の人物の顔を認識する顔画像認識装置及び顔画像認識プログラムに関する。
従来の顔画像認識手法では、認識対象となる人物の顔が複数の向きで映った画像を集めて、各顔画像から可変テンプレートを構築してデータベース(DB)に登録する。そして従来の顔画像認識手法では、入力映像中の人物の顔が映る顔領域を検出し、その顔領域と各可変テンプレートとを照合して類似度を算出することにより、誰の顔であるかを認識していた(例えば非特許文献1及び2参照)。
図1は従来の顔画像認識システムの一例の構成図である。図1の顔画像認識システム100は顔領域検出部101、顔部品追跡部102、可変テンプレートDB103を有する構成である。顔領域検出部101は入力映像中の人物の顔が写る顔領域を検出する。入力映像から顔領域を検出する技術はOpenCVライブラリーが提供するViola−Jones系の顔検出器など、既存の技術を利用できる(例えば非特許文献3参照)。
顔部品追跡部102は、顔領域検出部101によって検出された顔領域と可変テンプレートとの照合(可変テンプレートマッチング)を行うことにより、誰の顔であるかを認識する。可変テンプレートDB103は認識対象となる人物の顔が複数の向きで写った画像を集めて、各顔画像から可変テンプレートを構築して登録している。
このように、図1の顔画像認識システム100は入力映像中の人物の顔が写る顔領域を検出し、左右等の複数の向きについて、認識対象となる人物の人数分の可変テンプレートマッチングを行っていた。
Simon CLIPPINGDALE,伊藤崇之,"動画像の顔検出・追跡・認識への統一されたアプローチ",電子情報通信学会 PRMU 98−200,1999年1月. S.Clippingdale,M.Fujii,M.Shibata,Multimedia Databases for Video Indexing: Toward Automatic Face Image Registration,Proc.IEEE International Symposium on Multimedia 2009, pp. 639-644,2009. S. Clippingdale,"顔部品の実時間追跡システムの開発",映像情報メディア学会冬季大会,2010.
従来の顔画像認識システム100では、入力映像の各フレームに顔領域検出の処理を行い、検出された顔領域において可変テンプレートマッチングを初期化して人物を認識する。
従来の顔画像認識システム100では、顔の向きが正面から離れて顔領域の検出が出来なくなっても、前フレームでの可変テンプレートマッチング結果に基づいて、正面以外の向きでの可変テンプレートと照合して、人物の追跡と認識を続ける。従来の顔画像認識システム100では正面以外の向きでも、認識対象となる人物の人数分の可変テンプレートが必要であった。
したがって、従来の顔画像認識システム100では複数の向きごとに認識対象となる人物の人数分の可変テンプレートが必要なため、認識対象となる人物の人数が多くなるほど、可変テンプレートマッチングの回数が多くなる。なお、可変テンプレートマッチングは一般的に計算量が多い。このように従来の顔画像認識システム100では、認識対象となる人物の人数が多くなるほど、計算量の増加が問題となる。
本発明の一実施形態は、上記の点に鑑みなされたものであり、顔画像認識の処理の計算量を削減できる顔画像認識装置及び顔画像認識プログラムを提供することを目的とする。
上記課題を解決するため、本発明は、映像中の人物の顔を認識する顔画像認識装置であって、認識対象となる人物の顔画像の人物特定テンプレート及び多数の人物の平均的な顔画像の人物不特定テンプレートが向きごとに登録されたテンプレート格納手段と、映像から人物の顔が写っている顔領域を抽出する顔領域抽出手段と、抽出された顔領域と前記テンプレート格納手段に登録された前記人物不特定テンプレートとを照合して、前記顔領域の特徴を抽出すると共に、抽出された前記顔領域の特徴を前記テンプレート格納手段に登録された前記人物特定テンプレートと比較して、前記顔領域に写っている人物の顔を認識する顔認識手段とを有することを特徴とする。
なお、本発明の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。
本発明の一実施形態によれば、顔画像認識の処理の計算量を削減できる顔画像認識装置及び顔画像認識プログラムを提供可能である。
従来の顔画像認識システムの一例の構成図である。 PCの一例のハードウェア構成図である。 本実施例の顔画像認識装置の一例の機能構成図である。 可変テンプレートの内容を示す一例の説明図である。 可変テンプレートマッチングのアルゴリズムを示す一例の説明図である。 ある向きにおける人物不特定可変テンプレートの構築方法を示す一例の説明図である。 従来の可変テンプレートマッチングの処理を表した一例のイメージ図である。 本発明の可変テンプレートマッチングの処理を表した一例のイメージ図である。 本実施例の顔画像認識装置の他の例の機能構成図である。 肌色領域抽出の概要を示す一例の説明図である。 顔部品追跡部の一例の機能構成図である。 本発明による計算量の軽減の倍率を示したグラフ図である。
次に、本発明を実施するための形態を、以下の実施例に基づき図面を参照しつつ説明していく。
<本発明の概要>
本発明はコンピュータによる顔画像認識において、入力映像に映る人物の顔領域を、認識対象となる人物の人数分の可変テンプレートと照合する代わりに特別に用意した顔テンプレート(人物不特定可変テンプレート)と照合し、照合により抽出された顔領域の特徴を、認識対象となる人物の人数分の可変テンプレートと比較することにより、入力映像に映る人物が誰であるかを認識する。
人物不特定可変テンプレートの詳細については後述するが、認識対象となる人物の人数によらず、向きごとに一つの人物不特定可変テンプレートを使用すればよい。顔領域と可変テンプレートとの照合(可変テンプレートマッチング)は計算量が多いため、向きごとに一つの人物不特定可変テンプレートを使用することにより、照合対象となる可変テンプレートの数を少なくすることができ、計算量を削減できる。
なお、人物不特定可変テンプレートとの照合により抽出された顔領域の特徴を認識対象となる人物の人数分の可変テンプレートと比較する処理は、可変テンプレートマッチングの処理と比べて圧倒的に計算量が少ない。このように、本発明は可変テンプレートマッチングの計算量と、顔領域の特徴を認識対象となる人物の人数分の可変テンプレートと比較する処理の計算量との合計を大幅に軽減することができるため、顔画像認識の処理の計算量を削減できる。結果として、本発明は顔領域と可変テンプレートとの照合の処理を高速化することで、高速な顔画像認識の処理を実現できる。
<ハードウェア構成>
本実施例の顔画像認識装置は、PCやワークステーション等により実現することができる。ここでは、本実施例の顔画像認識装置をPCにより実現する例について説明する。なお、顔画像認識装置は必ずしも一つの筐体で構成されることを示すものではない。また、本実施例の顔画像認識装置は顔画像認識システムのように複数の装置に機能を分散させる構成とすることもできる。
本実施例の顔画像認識装置は例えば図2に示すようなハードウェア構成のPCにより実現される。図2はPCの一例のハードウェア構成図である。PC50はバス59で相互に接続されている入力装置51、出力装置52、記録媒体読取装置53、補助記憶装置54、主記憶装置55、演算処理装置56、インタフェース装置57を含む。
入力装置51はキーボードやマウス等である。入力装置51は各種信号を入力するために用いられる。出力装置52はディスプレイ装置等である。出力装置52は各種ウィンドウやデータ等を表示するために用いられる。インタフェース装置57は、モデム,LANカード等である。インタフェース装置57は、ネットワークに接続するために用いられる。
顔画像認識装置に搭載される顔画像認識プログラムは、PC50を制御する各種プログラムの少なくとも一部である。顔画像認識プログラムは例えば記録媒体58の配布やネットワーク等からのダウンロードなどによって提供される。
記録媒体58はCD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
顔画像認識プログラムを記録した記録媒体58が記録媒体読取装置53にセットされると、顔画像認識プログラムは記録媒体58から記録媒体読取装置53を介して補助記憶装置54にインストールされる。ネットワーク等からダウンロードされた顔画像認識プログラムはインタフェース装置57を介して補助記憶装置54にインストールされる。
補助記憶装置54は、インストールされた顔画像認識プログラム、必要なファイル、データ等を格納する。主記憶装置55は顔画像認識プログラムの起動時に、補助記憶装置54から顔画像認識プログラムを読み出して格納する。そして、演算処理装置56は主記憶装置55に格納された顔画像認識プログラムに従って、後述するような各種処理を実現している。
<機能構成>
図3は本実施例の顔画像認識装置の一例の機能構成図である。図3の顔画像認識装置10は顔領域検出部11、顔部品追跡部12、可変テンプレートDB13を有する構成である。
顔領域検出部11は入力映像中の人物の顔が写る顔領域を検出する。入力映像から顔領域を検出する技術は上記した既存の技術を利用すればよい。顔部品追跡部12は、顔領域検出部11によって検出された顔領域を、可変テンプレートDB13に登録されている人物不特定可変テンプレートと照合し、照合により抽出された顔領域の特徴を、可変テンプレートDB13に登録されている認識対象となる人物の人数分の可変テンプレートと比較することにより、誰の顔が映っているかを認識する。顔部品追跡部12の処理の詳細は後述する。
なお、本実施例で利用する可変テンプレートDB13は以下のように従来の可変テンプレート103と異なっている。可変テンプレートDB13は複数の向きごとに認識対象となる人物の人数分の人物特定可変テンプレートと一つの人物不特定可変テンプレートとを登録している。
人物特定可変テンプレートは認識対象となる人物の複数の向きの顔画像の可変テンプレートである。人物不特定可変テンプレートは必ずしも認識対象とはならない多数の人物の目標とする向きの顔画像を集めて構築した平均的な顔画像の可変テンプレートである。
このように、可変テンプレートDB13は従来の可変テンプレートDB103の複数の向きに対して、人物不特定可変テンプレートをそれぞれ追加して登録したものである。なお、可変テンプレートDB13の詳細は後述する。
<可変テンプレートの構成>
顔画像認識装置10で用いる可変テンプレートは例えば図4に示すような成分を有する。図4は可変テンプレートの内容を示す一例の説明図である。顔画像認識装置10で用いる可変テンプレートは顔画像において、顔の向きによって見えている最大9点の特徴点の座標と各特徴点で計測されたガボールウェーブレット特徴とを成分として有する。
なお、図4では特徴点の数をNFP=9点としているが、その他の数を採用することもできる。特徴点は目頭、目尻など顔の部品に対して指定されるので顔画像の二次元的な形状を反映する。
また、図4ではガボールウェーブレット特徴を5つの解像度×8つの方位を持つガボールウェーブレットと、特徴点の近傍での画像とのベクトル同士の内積としているが、5つの解像度×8つの方位に限らない。ガボールウェーブレット特徴は各解像度と各方位において、特徴点の近傍に、どの程度の信号エネルギーがあるかを表現するものであるため、画像の輝度パターンを反映する。
<可変テンプレートマッチング>
顔画像認識装置10では例えば図5に示すような可変テンプレートマッチングが行われる。図5は可変テンプレートマッチングのアルゴリズムを示す一例の説明図である。なお、可変テンプレートマッチングのアルゴリズムは非特許文献1及び2にも記載されている。
顔画像認識装置10は入力映像の各フレームから検出された顔領域の各特徴点の位置を初期化し、そこで複数(今回の実施例では8つ)の方位でのガボールウェーブレット特徴ベクトル(以下、ガボールウェーブレット特徴と呼ぶ)を計測する。顔領域の各特徴点のガボールウェーブレット特徴と可変テンプレートのガボールウェーブレット特徴との位相の差分から、顔画像認識装置10は顔領域の各特徴点と可変テンプレートとの特徴点が最も類似するための位置ずれを推定できる。
顔画像認識装置10は推定した位置ずれで顔領域の各特徴点をずらし、ガボールウェーブレット特徴を計測する処理を、顔領域の各特徴点の位置ずれが収束するまで繰り返す。全特徴点が収束したら、顔画像認識装置10は顔領域の各特徴点と可変テンプレートの各特徴点とのマッチスコアを以下の式(1)により算出する。
Figure 2014021896
式(1)において、Aは各フレームから検出された顔領域である。A'は可変テンプレートである。cはガボールウェーブレット特徴である。Eは空間的な可変テンプレート全体の歪み(ペナルティ)である。
<人物不特定可変テンプレートの構築>
顔画像認識装置10の可変テンプレートDB13は認識対象となる人物の複数の向きに対して、人物不特定可変テンプレートをそれぞれ追加して登録したものである。人物不特定可変テンプレートは例えば図6に示すように構築される。
図6は、ある向きにおける人物不特定可変テンプレートの構築方法を示す一例の説明図である。まず、ある向きにおける人物不特定可変テンプレートの構築方法では、必ずしも認識対象の人物を含まない多数の人物k,0≦k<Kの、目標とする各向きの顔画像I(x),0≦k<Kを集めて、特徴点
Figure 2014021896
の位置(座標)を手動で指定する。各特徴点の平均位置
Figure 2014021896
と各特徴点のガボールウェーブレット特徴
Figure 2014021896
を計測する。次に、ある向きにおける人物不特定可変テンプレートの構築方法では各特徴点n,0≦n<NFPについて、各画像でその特徴点nを平均位置にずらしてアラインした平均画像A(x)を算出する。
Figure 2014021896
次に、ある向きにおける人物不特定可変テンプレートの構築方法ではガボールウェーブレット特徴cnを、平均画像A(x)での各平均特徴点位置
Figure 2014021896
で計測する。次に、ある向きにおける人物不特定可変テンプレートの構築方法では人物kの顔画像Iと各特徴点nとで、ガボールウェーブレット特徴cnを平均画像A(x)において、各平均特徴点位置
Figure 2014021896
で計測する。次に、ある向きにおける人物不特定可変テンプレートの構築方法では顔画像Iと各特徴点nとで、ガボールウェーブレット特徴
Figure 2014021896
とcとの位相の差分より、顔画像Iの特徴点nが平均画像A(x)での平均特徴点
Figure 2014021896
から、どれだけずれているか、その位置ずれ
Figure 2014021896
を推定する。次に、ある向きにおける人物不特定可変テンプレートの構築方法では推定した位置ずれを新たに顔画像I(x)に適用して特徴点ごとに、更にずらされた平均画像を算出する。
Figure 2014021896
次に、ある向きにおける人物不特定可変テンプレートの構築方法では、新たに
Figure 2014021896
において、平均特徴点位置
Figure 2014021896
でガボールウェーブレット特徴
Figure 2014021896
を計測する。人物不特定可変テンプレートは各平均特徴点位置
Figure 2014021896
とガボールウェーブレット特徴
Figure 2014021896
を有する。
次に、ある向きにおける人物不特定可変テンプレートの構築方法では、認識対象となる人物の複数の向きに対して、人物不特定可変テンプレートをそれぞれ追加して登録する。なお、人物特定可変テンプレートは複数の向きに対して、認識対象となる人物の人数分、登録されている。
<本発明における可変テンプレートマッチング>
図7は従来の可変テンプレートマッチングの処理を表した一例のイメージ図である。従来の可変テンプレートマッチングでは、入力映像の各フレームから検出された顔領域200と、可変テンプレートDB103に登録されている認識対象となる人物の人物特定可変テンプレート201とを照合する。
具体的に、従来の顔画像認識装置100の顔部品追跡部102は人物特定可変テンプレート201を顔領域200上で変形させ、ガボールウェーブレット特徴に基づき、顔領域200及び人物特定可変テンプレート201の各特徴点近傍の類似度が最大になる特徴点の位置を見つけて、式(1)により各人物特定可変テンプレート201のマッチスコア(類似度)を算出する。そして、顔部品追跡部102は各人物特定可変テンプレート201の類似度が最大になる特徴点の位置FPと類似度Sとを含むマッチ結果202により、類似度に基いての競争を行うことで、顔領域200に映る人物が誰であるかを認識する。
図8は本発明の可変テンプレートマッチングの処理を表した一例のイメージ図である。本発明の可変テンプレートマッチングでは人物不特定可変テンプレートを顔画像認識の処理に利用する。本発明の可変テンプレートマッチングでは入力映像の各フレームから検出された顔領域200と、可変テンプレートDB103に登録されている人物不特定可変テンプレート203とを照合する。
具体的に、本発明の顔画像認識装置10の顔部品追跡部12は一つの人物不特定可変テンプレート203を顔領域200上で変形させ、ガボールウェーブレット特徴に基づき、顔領域200及び人物不特定可変テンプレート203の各特徴点近傍の類似度が最大になる特徴点の位置を見つける。
そして、顔部品追跡部12は各特徴点近傍の類似度が最大になる特徴点の位置FPを含むマッチ結果204のガボールウェーブレット特徴を計測する。マッチ結果204のガボールウェーブレット特徴は顔領域200の特徴を表す。
顔部品追跡部12は、計測した人物不特定可変テンプレート203のガボールウェーブレット特徴と比較することにより、顔領域200と各人物特定可変テンプレート201とのマッチスコア(類似度)を式(1)で算出する。なお、各人物特定可変テンプレート201のマッチスコア(類似度)を式(1)で算出する処理は顔領域200と人物特定可変テンプレート201とを照合する処理に比べて計算量が少ない。
そして、顔部品追跡部12は算出した各人物特定可変テンプレート201の類似度に基づいての競争を行うことで、顔領域200に映る人物が誰であるかを認識する。このように、本願発明は顔領域と人物特定可変テンプレート201との照合を減らすことにより、顔画像認識の処理の計算量を削減できる。
<本発明の概要>
本発明はコンピュータによる顔画像認識において、映像中の人物の顔を追跡しながら、顔画像のデータベースに登録してある人物の顔と照合して、誰の顔であるかを認識する。実施例2は複数の人物と複数の顔の向きとに対応することに伴う計算量の増加及び登録作業の複雑化に対応するため、人物の顔が正面に近い向きで映ったときに顔画像のデータベースに登録してある人物の顔と照合して、誰の顔であるかを認識する。
また、実施例2は人物の顔が正面から離れた向きで映ったときに、人物不特定可変テンプレートを使用し、顔領域を追跡して認識結果を保持する。実施例2は認識対象となる人物の人数によらず、向きごとに一つの人物不特定可変テンプレートを使用すればよいため、顔領域を追跡する為の計算量を大幅に削減することができる。
このように、実施例2は顔領域を追跡する為の追跡技術の計算量が、複数の人物の様々な向きの顔を認識する計算量に比べて少ないため、図3の顔画像認識装置10による顔画像認識の処理を更に高速化すると共に、可変テンプレートの登録作業を簡単化できる。
なお、ハードウェア構成は実施例1と同様であるため、説明を省略する。以下の説明においても、実施例1と同様な部分については適宜説明を省略する。
<機能構成>
図9は本実施例の顔画像認識装置の他の例の機能構成図である。図9の顔画像認識装置20は肌色領域抽出部21、顔領域検出部22、顔部品追跡部23、可変テンプレートDB24を有する構成である。
肌色領域抽出部21は入力映像中から肌色の領域を抽出する。入力映像中から肌色の領域を抽出する処理の詳細は後述する。顔領域検出部22は肌色領域抽出部21によって抽出された肌色の領域から、人物の顔が写っている顔領域を抽出する。顔領域を抽出する技術は上記した既存の技術を利用すればよい。
顔部品追跡部23は、顔領域検出部22によって検出された顔領域を、可変テンプレートDB24に登録されている人物不特定可変テンプレートと照合し、照合により抽出された顔領域の特徴を、可変テンプレートDB24に登録されている認識対象となる人物の人数分の可変テンプレートと比較することにより、誰の顔が映っているかを認識する。
なお、本実施例で利用する可変テンプレートDB24は以下のように従来の可変テンプレートDB103と異なっている。可変テンプレートDB24は正面の向きについて、認識対象となる人物の人数分の人物特定可変テンプレートと一つの人物不特定可変テンプレートとを登録している。また、可変テンプレートDB24は正面以外の向きについて、一つの人物不特定可変テンプレートを登録している。このように、可変テンプレートDB24は正面の向きについて、一つの人物不特定可変テンプレートを追加して登録したものである。
また、従来の顔画像認識システム100では各向きに対して認識対象となる人物の人数分の人物特定可変テンプレートを準備する必要があった。本発明は正面以外の向きの登録人数分の人物特定可変テンプレートを一つの人物不特定可変テンプレートに置き換えて登録したものである。
顔部品追跡部23は、正面に近い向きで顔が写っている顔領域と人物特定可変テンプレートとの照合により人物の認識を行い、その後、顔が正面の向きから回転して離れても、正面以外の向きで顔が写っている顔領域と人物不特定可変テンプレートとの照合により顔を追跡することで、顔領域と対応付けて人物の認識結果を保持することができる。
なお、実施例1で説明した可変テンプレートの構成、可変テンプレートマッチング、人物不特定可変テンプレートの構築、本発明における可変テンプレートマッチングは実施例2でも同様であるため、説明を省略する。
<肌色領域抽出>
肌色領域抽出部21は正規化CbCr手法により入力フレームの各画素のRGB値が肌色に相当するか否かを判定する(例えば非特許文献3参照)。肌色領域抽出部21はRGB値をYCbCr空間に変換し、CbとCrとの値を式(2)により正規化する。
Figure 2014021896
なお、Yは輝度信号である。CbはB信号から輝度信号Yを差し引いた色差信号B−Yに特定の定数を掛けた値である。また、CrはR信号から輝度信号Yを差し引いた色差信号R−Yに特定の定数を掛けた値である。
肌色領域抽出部21は、ある画素xに対応する(Cb′,Cr,′)(x)の位置が肌色代表点から一定の距離以内にあれば、式(3)に示すように、その画素xを肌色と判定する。
Figure 2014021896
肌色領域抽出部21は一般化されたメディアンフィルタにより、肌色または肌色ではないと判定され孤立した画素を除去する。以下の式(4)ではa=0.5の場合に、メディアンフィルタとなる。以下の式(4)では、aの値により少なめ又は多めに画素がON(q(x)=1)になる。
Figure 2014021896
肌色領域抽出部21は連接領域抽出(connected component labeling)の処理と連接領域の外周ボックスに条件(閾値)をかけることにより、安定した肌色領域を抽出する。
図10は肌色領域抽出の概要を示す一例の説明図である。肌色領域抽出部21は各画素のRGB値をYCbCr空間に変換し、CbとCrとの値を式(2)により正規化して、Y=128平面に射影している。肌色領域抽出部21は、肌色代表点に近ければ画素を肌色と判定する。
肌色領域抽出部21は一般化されたメディアンフィルタにより独立画素を取り除いた領域を出力する。また、肌色領域抽出部21は連接領域抽出の処理により肌色領域リストを出力する。肌色領域抽出部21はメディアンフィルタ及び連接領域抽出の処理により安定した肌色領域を抽出する。
<顔部品追跡部23の構成>
図11は顔部品追跡部の一例の機能構成図である。図11の顔部品追跡部23は認識部31、追跡部32を有する構成である。
認識部31は顔領域検出部22によって検出された顔領域を可変テンプレートDB24に登録されている人物不特定可変テンプレートと照合し、照合により抽出された顔領域の特徴を、可変テンプレートDB24に登録されている認識対象となる人物の人数分の可変テンプレートと比較することにより、誰の顔が映っているかを認識する。
また、追跡部32は顔領域検出部22によって検出された顔領域を可変テンプレートDB24に登録されている人物不特定可変テンプレートと照合することにより、認識部31で認識した顔領域を追跡して認識結果を保持する。
ところで、顔領域検出部22は肌色の領域に、正面に近い向きの顔が写っているときに顔領域として抽出する。言い換えれば顔領域検出部22によって抽出された顔領域には正面に近い向きで顔が写っていることになる。結果として、顔領域検出部22によって抽出された顔領域の特徴点の座標と各特徴点で計測されたガボールウェーブレット特徴とは人物特定可変テンプレートと最もマッチングすることになる。
その後、顔領域に写っている顔が正面の向きから回転して離れると、顔領域の特徴点の座標と各特徴点で計測されたガボールウェーブレット特徴とは人物不特定可変テンプレートと最もマッチングすることになる。ただし、人物不特定可変テンプレートは多数の人物の顔画像を集めて構築した平均的な可変テンプレートである。そこで、人物不特定可変テンプレートと最もマッチングするとき、認識部31は既に人物特定可変テンプレートによって推定した推定(認識)結果を維持する。
このように、図11の顔部品追跡部23は顔領域に写っている顔が正面の向きから回転して離れても、追跡部32により顔の追跡を行い、認識部31により認識結果を維持(保持)することで、様々な顔の向きの人物を認識することを可能としている。
つまり、実施例2の顔画像認識装置20は正面以外の向きについて、認識対象の人物の人数分の人物特定可変テンプレートが無くても、正面の向きで顔が認識されれば、認識には使用できない人物不特定可変テンプレートにより顔の向きの追跡を行い、既に認識した認識結果を連続的に引き継いでいくことにより、様々な向きの顔画像に対して人物の認識結果を付与することができる。
<効果>
例えば認識対象となる人物の可変テンプレートがN個あるとすれば、図7に示した従来の可変テンプレートマッチングではN回の照合を行う。1個の可変テンプレートとの照合に伴う計算量をKと呼べば、従来の可変テンプレートマッチングの計算量は大体NKに比例する。
一方、図8に示した本発明の可変テンプレートマッチングでは人物不特定可変テンプレートとの1回の照合により顔領域のガボールウェーブレット特徴を抽出し、そのガボールウェーブレット特徴をN個の人物特定可変テンプレートと比較する。1個の人物特定可変テンプレートとの比較に伴う計算量をHと呼べば、本発明の可変テンプレートマッチングの計算量は大体K+NHに比例する。
したがって、図7に示した従来の可変テンプレートマッチングと図8に示した本発明の可変テンプレートマッチングとの計算量の比率(軽減の倍率)は
NK/(K+NH)
となる。可変テンプレートの数Nが相当大きくない限り、図7に示した従来の可変テンプレートマッチングと図8に示した本発明の可変テンプレートマッチングとの計算量の比率はNに近づく。なお、可変テンプレートの数Nが相当大きい場合、図7に示した従来の可変テンプレートマッチングと図8に示した本発明の可変テンプレートマッチングとの計算量の比率はK/Hに近づく。
しかし、特殊ハードウェアなしで通常のパソコン(ワークステーション)での実装例では、計った比率K/Hが3000〜8000位であった。このため、数千のオーダなどNが相当大きくないと、比率の分母はKに近く、軽減の倍率がNに近くなる。なお、可変テンプレートの数が数千オーダとなると、軽減の倍率のパフォーマンスは別の原因で劣化していく。
図12は本発明による計算量の軽減の倍率を示したグラフ図である。図12では可変テンプレートの数Nが10〜300のときの、従来の可変テンプレートマッチングと比べた本発明の可変テンプレートマッチングの計算量の比率(軽減の倍率)を示している。図12に示すように、一般的な可変テンプレートの数での軽減の倍率はN倍に近く、大幅に計算量の軽減を実現できる。
本発明は、図3の顔画像認識装置10で行う複数の向きの認証対象となる人物の人数分の可変テンプレートマッチング及び図9の顔画像認識装置20で行う単一の向きの認証対象となる人物の人数分の可変テンプレートマッチングに伴う計算量を軽減し、顔画像認識の高速化を計ることができる。
なお、顔画像認識装置20は顔領域検出部22による顔領域の検出を肌色領域抽出部21によって抽出された肌色の領域に絞ることにより、顔領域の検出の処理時間を、ほぼ(肌色の領域/画面の面積)という比率で低減できる。
また、顔画像認識装置20は以前の顔画像認識システム100と比べて顔部品追跡部23の追跡部32の計算量を大幅に省くことができる。追跡部32の計算量は、正面以外の向きで顔が写っているとき、ほぼ(1/認証対象となる人物の人数)に低減できる。
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。なお、特許請求の範囲に記載したテンプレート格納手段は可変テンプレートDB13、24に相当し、顔領域抽出手段は顔領域検出部11、22に相当し、顔認識手段及び顔追跡手段は顔部品追跡部12、23に相当し、肌色領域抽出手段は肌色領域抽出部21に相当し、人物特定テンプレートは人物特定可変テンプレートに相当し、人物不特定テンプレートは人物不特定可変テンプレートに相当する。
10、20 顔画像認識装置
11、22 顔領域検出部
12、23 顔部品追跡部
13、24 可変テンプレートDB
21 肌色領域抽出部
31 認識部
32 追跡部
50 PC
51 入力装置
52 出力装置
53 記録媒体読取装置
54 補助記憶装置
55 主記憶装置
56 演算処理装置
57 インタフェース装置
58 記録媒体
59 バス

Claims (6)

  1. 映像中の人物の顔を認識する顔画像認識装置であって、
    認識対象となる人物の顔画像の人物特定テンプレート及び多数の人物の平均的な顔画像の人物不特定テンプレートが向きごとに登録されたテンプレート格納手段と、
    映像から人物の顔が写っている顔領域を抽出する顔領域抽出手段と、
    抽出された顔領域と前記テンプレート格納手段に登録された前記人物不特定テンプレートとを照合して、前記顔領域の特徴を抽出すると共に、抽出された前記顔領域の特徴を前記テンプレート格納手段に登録された前記人物特定テンプレートと比較して、前記顔領域に写っている人物の顔を認識する顔認識手段と
    を有することを特徴とする顔画像認識装置。
  2. 映像中の人物の顔を認識する顔画像認識装置であって、
    認識対象となる人物の正面の向きの顔画像の人物特定テンプレート及び多数の人物の向きごとの平均的な顔画像の人物不特定テンプレートが登録されたテンプレート格納手段と、
    映像から人物の顔が写っている顔領域を抽出する顔領域抽出手段と、
    抽出された顔領域と前記テンプレート格納手段に登録された前記人物不特定テンプレートとを照合して、前記顔領域の特徴を抽出すると共に、抽出された前記顔領域の特徴を前記テンプレート格納手段に登録された前記人物特定テンプレートと比較して、前記顔領域に写っている人物の顔を認識する顔認識手段と、
    抽出された顔領域と前記テンプレート格納手段に登録された前記人物不特定テンプレートとを照合して、前記顔領域に写っている前記認識した人物の顔の向きを追跡する顔追跡手段と
    を有することを特徴とする顔画像認識装置。
  3. 前記顔認識手段は、抽出された前記顔領域の特徴との類似度に基づいての競争により前記テンプレート格納手段に登録された前記人物特定テンプレートから前記顔領域に写っている人物の顔を認識すること
    を特徴とする請求項1又は2記載の顔画像認識装置。
  4. 前記人物特定テンプレート及び前記人物不特定テンプレートは複数の特徴点の座標と各特徴点で計測されたガボールウェーブレット特徴とを成分として有しており、
    前記人物不特定テンプレートは、目標とする向きの複数の顔画像の各特徴点について、前記顔画像で前記特徴点を平均位置にずらして調整した第1の平均画像を算出し、
    前記第1の平均画像の各平均特徴点で計測されたガボールウェーブレット特徴と前記複数の顔画像の各特徴点で計測されたガボールウェーブレット特徴との位相の差分により位置ずれを推定し、
    推定した位置ずれを新たに前記複数の顔画像に適用して、複数の顔画像の各特徴点について、前記特徴点ごとに更にずらされた第2の平均画像を算出し、前記第2の平均画像の各平均特徴点で計測されたガボールウェーブレット特徴を成分として有すること
    を特徴とする請求項1乃至3何れか一項記載の顔画像認識装置。
  5. コンピュータを、
    認識対象となる人物の顔画像の人物特定テンプレート及び多数の人物の平均的な顔画像の人物不特定テンプレートが向きごとに登録されたテンプレート格納手段、
    映像から人物の顔が写っている顔領域を抽出する顔領域抽出手段、
    抽出された顔領域と前記テンプレート格納手段に登録された前記人物不特定テンプレートとを照合して、前記顔領域の特徴を抽出すると共に、抽出された前記顔領域の特徴を前記テンプレート格納手段に登録された前記人物特定テンプレートと比較して、前記顔領域に写っている人物の顔を認識する顔認識手段
    として機能させるための顔画像認識プログラム。
  6. コンピュータを、
    認識対象となる人物の正面の向きの顔画像の人物特定テンプレート及び多数の人物の向きごとの平均的な顔画像の人物不特定テンプレートが登録されたテンプレート格納手段、
    映像から人物の顔が写っている顔領域を抽出する顔領域抽出手段、
    抽出された顔領域と前記テンプレート格納手段に登録された前記人物不特定テンプレートとを照合して、前記顔領域の特徴を抽出すると共に、抽出された前記顔領域の特徴を前記テンプレート格納手段に登録された前記人物特定テンプレートと比較して、前記顔領域に写っている人物の顔を認識する顔認識手段、
    抽出された顔領域と前記テンプレート格納手段に登録された前記人物不特定テンプレートとを照合して、前記顔領域に写っている前記認識した人物の顔の向きを追跡する顔追跡手段
    として機能させるための顔画像認識プログラム。
JP2012162475A 2012-07-23 2012-07-23 顔画像認識装置及び顔画像認識プログラム Pending JP2014021896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012162475A JP2014021896A (ja) 2012-07-23 2012-07-23 顔画像認識装置及び顔画像認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012162475A JP2014021896A (ja) 2012-07-23 2012-07-23 顔画像認識装置及び顔画像認識プログラム

Publications (1)

Publication Number Publication Date
JP2014021896A true JP2014021896A (ja) 2014-02-03

Family

ID=50196663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012162475A Pending JP2014021896A (ja) 2012-07-23 2012-07-23 顔画像認識装置及び顔画像認識プログラム

Country Status (1)

Country Link
JP (1) JP2014021896A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021872A (zh) * 2017-11-22 2018-05-11 广州久邦世纪科技有限公司 一种实现实时匹配模板的相机识别方法及其系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003346147A (ja) * 2002-05-23 2003-12-05 Nippon Hoso Kyokai <Nhk> 被写体判別方法、被写体判別装置、被写体判別プログラム、及び被写体判別プログラムを記録した記録媒体
JP2012008967A (ja) * 2010-06-28 2012-01-12 Glory Ltd 画像照合装置および画像照合方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003346147A (ja) * 2002-05-23 2003-12-05 Nippon Hoso Kyokai <Nhk> 被写体判別方法、被写体判別装置、被写体判別プログラム、及び被写体判別プログラムを記録した記録媒体
JP2012008967A (ja) * 2010-06-28 2012-01-12 Glory Ltd 画像照合装置および画像照合方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
クリピングデル サイモン 外1名: "肌色領域抽出と人物不特定可変テンプレートを用いた高速な顔追跡", 情報処理学会研究報告, vol. 2011(平成23)年度▲5▼ [CD−, JPN6016024989, 15 February 2012 (2012-02-15), ISSN: 0003348279 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021872A (zh) * 2017-11-22 2018-05-11 广州久邦世纪科技有限公司 一种实现实时匹配模板的相机识别方法及其系统

Similar Documents

Publication Publication Date Title
Kim et al. Spatiotemporal saliency detection and its applications in static and dynamic scenes
US8165397B2 (en) Identifying descriptor for person or object in an image
US8027521B1 (en) Method and system for robust human gender recognition using facial feature localization
Li et al. Visual tracking via incremental log-euclidean riemannian subspace learning
US7697735B2 (en) Image based multi-biometric system and method
Tome et al. Identification using face regions: Application and assessment in forensic scenarios
US11915518B2 (en) Facial authentication device, facial authentication method, and program recording medium
JP5959093B2 (ja) 人物検索システム
Lei et al. Automatic ear landmark localization, segmentation, and pose classification in range images
Dahmane et al. Head pose estimation based on face symmetry analysis
US7684594B2 (en) Method and apparatus for estimating object part location in digital image data using feature value analysis
Bera et al. Finger contour profile based hand biometric recognition
US8655084B2 (en) Hand-based gender classification
Farooq et al. Performance analysis of biometric recognition system based on palmprint
WO2022130616A1 (ja) 認証方法、情報処理装置、及び認証プログラム
Wu et al. Facial feature extraction and applications: A review
JP5702663B2 (ja) 顔画像認識装置及び顔画像認識プログラム
JP2015219681A (ja) 顔画像認識装置及び顔画像認識プログラム
JP2006277146A (ja) 照合方法および照合装置
US7957555B2 (en) Method and apparatus for localizing an object part in digital image data by updating an initial position estimate based on a displacement of the object part
Boukamcha et al. 3D face landmark auto detection
JP2014021896A (ja) 顔画像認識装置及び顔画像認識プログラム
Zhang et al. Beyond face: Improving person clustering in consumer photos by exploring contextual information
Khalil et al. Authentication of fingerprint biometrics acquired using a cellphone camera: a review
Xu et al. A novel IKP-based biometric recognition using mobile phone camera

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150601

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170124