JP4924836B2 - 顔画像分類方法、顔画像分類装置及び顔画像分類プログラム - Google Patents
顔画像分類方法、顔画像分類装置及び顔画像分類プログラム Download PDFInfo
- Publication number
- JP4924836B2 JP4924836B2 JP2007504745A JP2007504745A JP4924836B2 JP 4924836 B2 JP4924836 B2 JP 4924836B2 JP 2007504745 A JP2007504745 A JP 2007504745A JP 2007504745 A JP2007504745 A JP 2007504745A JP 4924836 B2 JP4924836 B2 JP 4924836B2
- Authority
- JP
- Japan
- Prior art keywords
- face image
- category
- illumination
- face
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
2 照明方向推定手段
3 誤差評価手段
11 顔画像
12 照明空間基底
13 照明方向
14 誤差特徴
15 識別カテゴリ
16 学習用誤差特徴
17 教師カテゴリ
18 学習モデル
40 カテゴリ識別手段
50 カテゴリ学習手段
60 学習モデル蓄積手段
以下、本発明の第1の実施の形態を図面を参照して説明する。図1は、本発明による顔画像分類方法を用いた顔画像分類装置の構成の一例を示すブロック図である。図1に示すように、顔画像分類装置は、複数の照明空間基底蓄積手段1−1〜1−nと、複数の照明方向推定手段2−1〜2−nと、複数の誤差評価手段3−1〜3−nと、カテゴリ識別手段40とを含む。なお、本実施の形態では、照明空間基底蓄積手段1−1〜1−n、照明方向推定手段2−1〜2−n及び誤差評価手段3−1〜3−nを包括的に表現する場合に、それぞれ照明空間基底蓄積手段1、照明方向推定手段2及び誤差評価手段3という。
次に、本発明の第2の実施の形態を図面を参照して説明する。図4は、顔画像分類方法を用いた顔画像分類装置の他の構成例を示すブロック図である。本実施の形態では、図4に示すように、顔画像分類装置は、第1の実施の形態で示した構成要素に加えて、カテゴリ学習手段50及び学習モデル蓄積手段60を含む。また、本実施の形態では、カテゴリ識別手段40Aの機能が、第1の実施の形態で示したカテゴリ識別手段40の機能と異なる。
次に、本発明の第3の実施の形態を図面を参照して説明する。図7は、顔画像分類方法を用いた顔画像分類装置の更に他の構成例を示すブロック図である。本実施の形態では、図7に示すように、顔画像分類装置は、照明空間基底蓄積装置10aと、照明方向推定装置20aと、誤差評価装置30aと、カテゴリ識別装置40aとを含む。なお、本実施の形態は、第1の実施の形態で示した顔画像分類方法を用いた顔画像分類装置の各構成要素を具体的に装置化したものに相当する。
次に、本発明の第4の実施の形態を図面を参照して説明する。図8は、顔画像分類方法を用いた顔画像分類装置の更に他の構成例を示すブロック図である。本実施の形態では、図8に示すように、顔画像分類装置は、第3の実施の形態で示した構成要素に加えて、カテゴリ学習装置50a及び学習モデル蓄積装置60aを含む。また、本実施の形態では、カテゴリ識別装置40dの機能が、第3の実施の形態で示したカテゴリ識別装置40aの機能と異なる。なお、本実施の形態は、第2の実施の形態で示した顔画像分類方法を用いた顔画像分類装置の各構成要素を具体的に装置化したものに相当する。
次に、本発明の第5の実施の形態を図面を参照して説明する。本実施の形態では、第1の実施の形態で示した顔画像分類方法による各処理を実行するための顔画像分類プログラムを、計算機上で実行可能なプログラムとして構成する。また、本実施の形態では、顔画像分類プログラムを計算機で読み取り可能な情報記憶媒体(例えば、CD−ROM)に格納する。
次に、本発明の第6の実施の形態を図面を参照して説明する。本実施の形態では、第2の実施の形態で示した顔画像分類方法による各処理を実行するための顔画像分類プログラムを計算機上で実行可能なプログラムとして構成する。また、本実施の形態では、顔画像分類プログラムを計算機で読み取り可能な情報記憶媒体に格納する。
Claims (23)
- 顔画像を所定のカテゴリに分類する顔画像分類方法であって、
カテゴリを代表する顔について顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積する照明空間基底蓄積ステップと、
カテゴリ毎の前記各照明空間基底データと照明の強度及び方向を示す照明強度ベクトルから算出される顔モデル画像の各画素ベクトルと、処理対象の顔画像の各画素ベクトルとの距離を最小化するような前記照明強度ベクトルをカテゴリ毎に算出する照明方向推定ステップと、
カテゴリ毎の前記照明空間基底データと前記照明強度ベクトルから算出される各カテゴリを代表する顔画像ベクトルと、前記処理対象の顔画像ベクトルの距離で最小のものを特徴量としてカテゴリ毎に算出する特徴算出ステップと、
前記算出された特徴量のうち最小となる特徴量のカテゴリに前記処理対象の顔画像を分類する顔画像分類ステップと
を含むことを特徴とする顔画像分類方法。 - 前記照明方向推定ステップは、カテゴリ毎の前記各照明空間基底データと照明強度ベクトルの内積で求められる顔モデル画像の各画素ベクトルと、処理対象の顔画像の各画素ベクトルとの距離を最小化するような前記照明強度ベクトルをカテゴリ毎に算出する、ことを特徴とする請求項1に記載の顔画像分類方法。
- 前記特徴算出ステップは、カテゴリ毎の前記照明空間基底データと前記算出された照明強度ベクトルの内積で求められる各カテゴリを代表する顔画像ベクトルと、前記処理対象の顔画像ベクトルの距離差で最小のものを前記特徴量としてカテゴリ毎に算出する
ことを特徴とする請求項1又は2に記載の顔画像分類方法。 - 前記特徴算出ステップで、
前記蓄積した各照明空間基底データと前記算出した照明強度ベクトルとに基づいて、カテゴリを代表する顔に前記照明強度ベクトルが示す方向から照明をあてた場合の推定顔画像をカテゴリ毎に作成し、
前記特徴量として、処理対象の顔画像と前記作成した推定顔画像との誤差をカテゴリ毎に求め、
前記顔画像分類ステップで、前記求めた各誤差のうちの最小となる誤差に対応する照明空間基底データを特定する
請求項1から3のいずれかに記載の顔画像分類方法。 - 前記照明方向推定ステップで、処理対象の顔画像に含まれる顔にあてられている照明の方向の推定結果として、前記照明ベクトルをカテゴリ毎に求め、
前記特徴算出ステップで、前記求めた照明ベクトルと蓄積した各照明空間基底データとの内積を求めることによって、前記推定顔画像をカテゴリ毎に作成する
請求項4に記載の顔画像分類方法。 - 前記照明空間基底蓄積ステップで、カテゴリを代表する顔として、前記カテゴリに含まれる顔の平均顔、又は前記カテゴリに含まれる顔を主成分分析して求めた主成分顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積する請求項1から請求項5のうちのいずれか1項に記載の顔画像分類方法。
- 前記照明空間基底蓄積ステップで、顔の三次元形状と反射率とを盛り込んだ照明空間基底データを、カテゴリ毎に予め蓄積する請求項1から請求項6のうちのいずれか1項に記載の顔画像分類方法。
- カテゴリが既知である学習用顔画像を入力し、入力された学習用顔画像について前記照明強度算出ステップにより前記照明強度ベクトルを算出し、前記特徴算出ステップにより前記特徴量を算出し、算出した特徴量と、前記顔画像に対応する既知のカテゴリとを教師データとして学習処理を行うことにより学習モデルを作成する学習モデル作成ステップをさらに含み、
前記顔画像分類ステップは、前記処理対象の顔画像について算出された特徴量を前記学習モデルに入力して、カテゴリを出力させるステップをさらに含む
請求項1から請求項7のうちのいずれか1項に記載の顔画像分類方法。 - 前記学習モデル作成ステップで、ニューラルネットワークを用いて、学習モデルとして所定の重み係数を求める請求項8記載の顔画像分類方法。
- 前記学習モデル作成ステップで、サポートベクタマシンを用いて、学習モデルとしてサポートベクタを求める請求項8記載の顔画像分類方法。
- 前記顔画像分類ステップで、
学習モデルを作成する処理の逆処理を行うことによって、蓄積した各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、
前記処理対象の顔画像を、前記特定した照明空間基底データに対応するカテゴリに分類する
請求項8から請求項10のうちのいずれか1項に記載の顔画像分類方法 - 顔画像を所定のカテゴリに分類する顔画像分類装置であって、
カテゴリを代表する顔について顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積する照明空間基底蓄積手段と、
カテゴリ毎の前記各照明空間基底データと照明の強度及び方向を示す照明強度ベクトルから算出される顔モデル画像の各画素ベクトルと、処理対象の顔画像の各画素ベクトルとの距離を最小化するような前記照明強度ベクトルをカテゴリ毎に算出する照明方向推定手段と、
カテゴリ毎の前記照明空間基底データと前記照明強度ベクトルから算出される各カテゴリを代表する顔画像ベクトルと、前記処理対象の顔画像ベクトルの距離で最小のものを特徴量としてカテゴリ毎に算出する特徴算出手段と、
前記算出された特徴量のうち最小となる特徴量のカテゴリに前記処理対象の顔画像を分類する顔画像分類手段とを
備えたことを特徴とする顔画像分類装置。 - 前記照明方向推定手段は、カテゴリ毎の前記各照明空間基底データと照明強度ベクトルの内積で求められる顔モデル画像の各画素ベクトルと、処理対象の顔画像の各画素ベクトルとの距離を最小化するような前記照明強度ベクトルをカテゴリ毎に算出する
ことを特徴とする請求項12に記載の顔画像分類装置。 - 前記特徴算出手段は、カテゴリ毎の前記照明空間基底データと前記算出された照明強度ベクトルの内積で求められる各カテゴリを代表する顔画像ベクトルと、前記処理対象の顔画像ベクトルの距離差で最小のものを前記特徴量としてカテゴリ毎に算出する
ことを特徴とする請求項12又は13に記載の顔画像分類装置。 - 前記特徴算出手段は、
前記照明空間基底蓄積手段が蓄積する各照明空間基底データと、前記照明方向推定手段が算出した照明強度ベクトルとに基づいて、カテゴリを代表する顔に前記照明強度ベクトルが示す方向から照明をあてた場合の推定顔画像をカテゴリ毎に作成し、
前記特徴量として、処理対象の顔画像と前記作成した推定顔画像との誤差をカテゴリ毎に求め、
前記顔画像分類手段は、前記特徴算出手段が求めた各誤差のうちの最小となる誤差に対応する照明空間基底データを特定する
請求項12から14のいずれかに記載の顔画像分類装置。 - 前記照明方向推定手段は、処理対象の顔画像に含まれる顔にあてられている照明の方向の推定結果として、前記照明ベクトルをカテゴリ毎に求め、
前記特徴算出手段は、前記照明方向推定手段が求めた照明ベクトルと、照明空間基底蓄積手段が蓄積する各照明空間基底データとの内積を求めることによって、前記推定顔画像をカテゴリ毎に作成する
請求項15記載の顔画像分類装置。 - 前記照明空間基底蓄積手段は、カテゴリを代表する顔として、前記カテゴリに含まれる顔の平均顔、又は前記カテゴリに含まれる顔を主成分分析して求めた主成分顔に対応する照明空間基底データを、カテゴリ毎に予め蓄積する請求項12から請求項16のうちのいずれか1項に記載の顔画像分類装置。
- 前記照明空間基底蓄積手段は、顔の三次元形状と反射率とを盛り込んだ照明空間基底データを、カテゴリ毎に予め蓄積する請求項12から請求項17のうちのいずれか1項に記載の顔画像分類装置。
- カテゴリが既知である学習用顔画像を入力し、入力された学習用顔画像について前記照明強度算出手段により前記照明強度ベクトルを算出し、前記特徴算出手段により前記特徴量を算出し、算出した特徴量と、前記顔画像に対応する既知のカテゴリとを教師データとして学習処理を行うことにより学習モデルを作成する学習モデル作成手段をさらに備え、
前記顔画像分類手段は、前記処理対象の顔画像について算出された特徴量を前記学習モデルに入力して、カテゴリを出力させる
請求項12から請求項18のうちのいずれか1項に記載の顔画像分類装置。 - 前記顔画像分類手段は、
学習モデルを作成する処理の逆処理を行うことによって、照明空間基底蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、
前記処理対象の顔画像を、前記特定した照明空間基底データに対応するカテゴリに分類する
請求項19に記載の顔画像分類装置。 - 顔画像を所定のカテゴリに分類するための顔画像分類プログラムであって、
カテゴリを代表する顔に対応する、顔の奥行きと顔にあてられた照明による反射の具合とを示すデータである照明空間基底データを、カテゴリ毎に予め蓄積するコンピュータに、
カテゴリ毎の前記各照明空間基底データと照明の強度及び方向を示す照明強度ベクトルから算出される顔モデル画像の各画素ベクトルと、処理対象の顔画像の各画素ベクトルとの距離を最小化するような前記照明強度ベクトルをカテゴリ毎に算出する照明強度算出処理と、
カテゴリ毎の前記照明空間基底データと前記照明強度ベクトルから算出される各カテゴリを代表する顔画像ベクトルと、前記処理対象の顔画像ベクトルの距離で最小のものを特徴量としてカテゴリ毎に算出する特徴算出処理と、
前記算出された特徴量のうち最小となる特徴量のカテゴリに前記処理対象の顔画像を分類する顔画像分類処理とを
実行させる顔画像分類プログラム。 - 前記コンピュータに、
カテゴリが既知である学習用顔画像を入力し、入力された学習用顔画像について前記照明強度算出処理により前記照明強度ベクトルを算出し、前記特徴算出処理により前記特徴量を算出し、算出した特徴量と、前記顔画像に対応する既知のカテゴリとを教師データとして学習処理を行うことにより学習モデルを作成する学習モデル作成処理を実行させ、
前記顔画像分類処理は、前記処理対象の顔画像について算出された特徴量を前記学習モデルに入力して、カテゴリを出力させる
請求項21の顔画像分類プログラム。 - 前記顔画像分類処理は、
学習モデルを作成する処理の逆処理を行うことによって、蓄積手段が蓄積する各照明空間基底データのうち、いずれの照明空間基底データが処理対象の顔画像に対応するかを特定し、
前記処理対象の顔画像を、前記特定した照明空間基底データに対応するカテゴリに分類する
請求項22記載の顔画像分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007504745A JP4924836B2 (ja) | 2005-02-23 | 2006-02-22 | 顔画像分類方法、顔画像分類装置及び顔画像分類プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005047710 | 2005-02-23 | ||
JP2005047710 | 2005-02-23 | ||
JP2007504745A JP4924836B2 (ja) | 2005-02-23 | 2006-02-22 | 顔画像分類方法、顔画像分類装置及び顔画像分類プログラム |
PCT/JP2006/303151 WO2006090731A1 (ja) | 2005-02-23 | 2006-02-22 | 顔画像分類方法、顔画像分類装置及び顔画像分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006090731A1 JPWO2006090731A1 (ja) | 2008-07-24 |
JP4924836B2 true JP4924836B2 (ja) | 2012-04-25 |
Family
ID=36927369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007504745A Active JP4924836B2 (ja) | 2005-02-23 | 2006-02-22 | 顔画像分類方法、顔画像分類装置及び顔画像分類プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4924836B2 (ja) |
WO (1) | WO2006090731A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8503800B2 (en) * | 2007-03-05 | 2013-08-06 | DigitalOptics Corporation Europe Limited | Illumination detection using classifier chains |
JP4772839B2 (ja) | 2008-08-13 | 2011-09-14 | 株式会社エヌ・ティ・ティ・ドコモ | 画像識別方法および撮像装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175724A (ja) * | 1997-12-11 | 1999-07-02 | Toshiba Tec Corp | 人物属性識別装置 |
JP2004086929A (ja) * | 2003-12-08 | 2004-03-18 | Nec Corp | 画像照合装置 |
-
2006
- 2006-02-22 JP JP2007504745A patent/JP4924836B2/ja active Active
- 2006-02-22 WO PCT/JP2006/303151 patent/WO2006090731A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175724A (ja) * | 1997-12-11 | 1999-07-02 | Toshiba Tec Corp | 人物属性識別装置 |
JP2004086929A (ja) * | 2003-12-08 | 2004-03-18 | Nec Corp | 画像照合装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10878657B2 (en) | 2018-07-25 | 2020-12-29 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11455864B2 (en) | 2018-07-25 | 2022-09-27 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
US11521460B2 (en) | 2018-07-25 | 2022-12-06 | Konami Gaming, Inc. | Casino management system with a patron facial recognition system and methods of operating same |
Also Published As
Publication number | Publication date |
---|---|
WO2006090731A1 (ja) | 2006-08-31 |
JPWO2006090731A1 (ja) | 2008-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6843086B2 (ja) | 画像処理システム、画像においてマルチラベル意味エッジ検出を行う方法、および、非一時的コンピューター可読記憶媒体 | |
CN109697435B (zh) | 人流量监测方法、装置、存储介质及设备 | |
CN108961272B (zh) | 一种基于深度卷积对抗生成网络的皮肤病图像的生成方法 | |
US6778705B2 (en) | Classification of objects through model ensembles | |
Nguyen et al. | Gaussian-mixture-model-based spatial neighborhood relationships for pixel labeling problem | |
US20150325046A1 (en) | Evaluation of Three-Dimensional Scenes Using Two-Dimensional Representations | |
AU2018368279A1 (en) | Meta-learning for multi-task learning for neural networks | |
US9177230B2 (en) | Demographic analysis of facial landmarks | |
US20040091153A1 (en) | Method for detecting object formed of regions from image | |
JP4894741B2 (ja) | 情報処理装置および情報処理方法、プログラム、並びに記録媒体 | |
TW201227535A (en) | Semantic parsing of objects in video | |
JP2006520055A (ja) | 2次元画像からの3次元オブジェクトの不変視点検出および識別 | |
JP2019016114A (ja) | 画像処理装置、学習装置、フォーカス制御装置、露出制御装置、画像処理方法、学習方法、及びプログラム | |
JP2011227704A (ja) | 情報処理装置および方法ならびにプログラム | |
CN110879982A (zh) | 一种人群计数系统及方法 | |
JP2014211719A (ja) | 情報処理装置およびその方法 | |
JP4924836B2 (ja) | 顔画像分類方法、顔画像分類装置及び顔画像分類プログラム | |
CN110163250A (zh) | 基于分布式调度的图像脱敏处理系统、方法以及装置 | |
WO2003044737A1 (en) | Computer vision method and system for blob-based analysis using a probabilistic framework | |
JP2022553779A (ja) | キャビン内の環境の調整方法及び装置 | |
JP2007048172A (ja) | 情報分類装置 | |
CN110633711A (zh) | 训练特征点检测器的计算机装置、方法及特征点检测方法 | |
WO2023283321A1 (en) | Stain-free detection of embryo polarization using deep learning | |
JP2007213528A (ja) | 行動認識システム | |
CN113793326A (zh) | 一种基于图像的疾病识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111012 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120111 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120124 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4924836 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |