JP2006338103A - パラメータ学習装置、パラメータ学習方法、およびプログラム - Google Patents

パラメータ学習装置、パラメータ学習方法、およびプログラム Download PDF

Info

Publication number
JP2006338103A
JP2006338103A JP2005158997A JP2005158997A JP2006338103A JP 2006338103 A JP2006338103 A JP 2006338103A JP 2005158997 A JP2005158997 A JP 2005158997A JP 2005158997 A JP2005158997 A JP 2005158997A JP 2006338103 A JP2006338103 A JP 2006338103A
Authority
JP
Japan
Prior art keywords
learning
head
posture
data
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005158997A
Other languages
English (en)
Other versions
JP4816874B2 (ja
Inventor
Toshinori Hosoi
利憲 細井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005158997A priority Critical patent/JP4816874B2/ja
Publication of JP2006338103A publication Critical patent/JP2006338103A/ja
Application granted granted Critical
Publication of JP4816874B2 publication Critical patent/JP4816874B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Image Generation (AREA)
  • Image Analysis (AREA)

Abstract

【課題】頭部姿勢の上下方向の変化が小さい場合や、正面姿勢と非正面姿勢の境界付近の姿勢である場合も、正面姿勢であるか否かを識別することができ、しかも性能の偏りが少なくなるようなパタン識別パラメータを学習する。
【解決手段】頭部姿勢正規化部211は、学習対象の頭部の3D形状データを頭部特徴位置データを用いて一定の基準姿勢に揃え、正面姿勢合わせ部212は、学習対象の頭部の3D形状データを基準姿勢から正面姿勢に姿勢合わせする。学習画像生成部220は、学習対象の頭部の3D形状データの向きを、正面姿勢から上下方向および/または左右方向に回転させ、テクスチャデータを貼り合わせることで、互いに頭部姿勢が異なる複数の学習画像を生成する。その際、頭部姿勢の上下方向への回転角度を左右方向よりも小さく設定する。パタン識別パラメータ学習部401は、複数の学習画像のそれぞれについてパタン識別パラメータを学習する。
【選択図】図1

Description

本発明は、頭部画像から頭部姿勢が正面を向いた正面姿勢であるか否かを識別するためのパタン識別パラメータを学習するパラメータ学習装置、パラメータ学習方法、およびプログラムに関し、特に、頭部姿勢の上下方向の姿勢変化に対しても正面姿勢であるか否かを容易に識別できるようなパタン識別パラメータを学習するパラメータ学習装置、パラメータ学習方法、およびプログラムに関する。
頭部画像(顔面のみを示す顔画像を含む。以下、同じ)から頭部姿勢(顔面姿勢を含む。以下、同じ)が正面姿勢であるか否かを識別するには、頭部の姿勢角度を推定する方法や、頭部の姿勢を幾つかに分類する方法を用いることができる。頭部姿勢が正面姿勢であるか否かを識別するためのパタン識別パラメータを学習する方法は、非特許文献1,2に開示されている。
非特許文献1に開示された方法は、あらかじめ頭部の姿勢が分かっている頭部画像とその頭部姿勢情報との対を学習データとして大量に用意し、かかる学習データに基づいて顔面の姿勢を幾つかに分類するためのパタン識別パラメータを学習しておく方法である。
非特許文献2に開示された方法は、あらかじめ頭部の姿勢が分かっている頭部画像とその頭部姿勢情報との対を学習データとして大量に用意し、かかる学習データに基づいて顔面姿勢角度を推定するためのパタン識別パラメータを学習しておく方法である。
これら非特許文献1,2に開示された方法に限らず、1枚の頭部画像から頭部姿勢が正面姿勢であるか否かを識別するために、あらかじめ頭部姿勢が分かっている頭部画像とその頭部姿勢情報との対を学習データとして大量に用意し、かかる学習データに基づいてパタン識別パラメータを学習しておく方法がよく用いられている。
学習データに基づいてパタン識別パラメータを学習する代表的な方法には、学習ベクトル量子化、ニューラルネットワーク、サポートベクトルマシン、部分空間法、識別関数の最適化、K最近傍識別法、決定木、隠れマルコフモデル、ブースティングといった方法がある。このうち、学習ベクトル量子化については、非特許文献3に詳細な記述がある。
以降、学習データとして用いる画像のことを学習画像と記述し、かかる学習画像と対になる頭部姿勢情報を教師データと記述する。
Jeffrey Huang’,Xuhui Shao’,Harry Wechsler,"Face Pose Discrimination Using Support Vector Machines(SVM)", In Porc. of 14th Int‘l Conf. on Pattern Recognition (ICPR’98),pages 154−156,1998年 Margarita Osadchy, Matthew L. Miller, Yann Le Cun,"Synergistic Face Detection and Pose Estimation with Energy−Based Models",Neural Information Processing Systems Conference (NIPS2004),2005年 佐藤敦、一般学習ベクトル量子化による文字認識、電子情報通信学会技術報告、PRMU95−219、1996年
しかしながら、上述した従来技術には次のような課題がある。
第1の課題は、従来技術では、頭部姿勢の左右方向への姿勢変化は僅かな角度でも見た目が大きく変化するために正面姿勢であるか否かの識別が容易であるが、上下方向への姿勢変化は20°以下の僅かな角度では見た目が大きく変化しないため、識別精度が悪く、性能が低くなるということである。
第2の課題は、従来技術では、学習画像とその学習画像の頭部姿勢の角度や分類情報である教師データとを学習データとして使用するが、この学習データの姿勢精度が低いために、特に、頭部姿勢が正面姿勢と非正面姿勢との境界付近にあるような場合、識別精度が悪いということである。この要因としては、撮影済みの頭部の学習画像に教師データを付加する場合、自動でも手動でも頭部姿勢の角度が不正確になってしまうこと、頭部と撮影装置との位置関係を設定して撮影する場合でも正確な位置合わせが困難であることが考えられる。さらに、複数の人物間で上下方向の姿勢を正確に合わせることは困難であること、頭部の正面姿勢そのものの定義は用途に応じて異なることも要因であると考えられる。
第3の課題は、従来技術では、学習画像としてあらかじめ姿勢がわかっている頭部画像を用意するものの、特定の頭部姿勢の学習画像が少ない場合や特定の照明条件下での学習画像が少ない場合には識別精度が悪くなるため、性能に偏りが生じるということである。
そこで、本発明の目的は、頭部姿勢が正面姿勢であるか否かのパタン識別において、頭部姿勢の上下方向の変化が小さい場合や、頭部姿勢が正面姿勢と非正面姿勢との境界付近の姿勢である場合においても、正面姿勢であるか否かを識別することができ、しかも性能の偏りが少なくなるようなパタン識別パラメータを学習するパラメータ学習装置、パラメータ学習方法、およびプログラムを提供することにある。
上記目的を達成するために本発明は、
頭部姿勢が正面姿勢であるか否かを識別するためのパタン識別パラメータを学習するパラメータ学習装置であって、
学習対象の頭部姿勢の上下方向への回転角度を左右方向よりも小さな角度に設定した上で、学習対象の頭部姿勢を上下方向および/または左右方向にそれぞれ設定された回転角度に従って回転させて互いに頭部姿勢が異なる複数の学習画像を生成する学習画像生成手段と、
前記学習画像生成手段により生成された前記複数の学習画像のそれぞれについて、前記パタン識別パラメータを学習するパラメータ学習手段とを有する。
この構成によれば、学習対象の頭部の頭部姿勢を上下方向および/または左右方向に回転させて学習画像を複数生成するに際して、上下方向への回転角度を小さくしているため、上下方向の姿勢変化が小さい場合でも、正面姿勢の識別を行うことが可能になる。
また、学習対象の頭部の3D形状データを保持する3D形状データ記憶手段と、
学習対象の頭部のテクスチャデータを保持するテクスチャデータ記憶手段と、
学習対象の頭部の頭部特徴位置データを保持する頭部特徴位置データ記憶手段と、
前記3D形状データ記憶手段に保持された頭部の3D形状データを、前記頭部特徴位置データ記憶手段に保持された頭部特徴位置データに基づき一定の基準姿勢に揃えた上で、その基準姿勢を正面姿勢に姿勢合わせする正面姿勢計算手段とをさらに有し、
前記学習画像生成手段は、前記正面姿勢計算手段により正面姿勢に姿勢合わせされた頭部の3D形状データを、正面姿勢から上下方向および/または左右方向にそれぞれ設定された回転角度に従って回転させ、回転させた姿勢の3D形状データに前記テクスチャデータ記憶手段に保持されたテクスチャデータを貼り合わすことで前記複数の学習画像を生成することとしても良い。
この構成によれば、学習対象の頭部の3D形状データの姿勢を基準姿勢にし、頭部の3D形状データ間で異なっている姿勢を揃えてから、画像化(レンダリング)を行って学習画像を生成しているため、学習画像の姿勢精度が高く、頭部姿勢が正面姿勢と非正面姿勢との境界に近い姿勢であっても高い精度で正面姿勢の識別を行うことが可能になる。
また、前記学習画像生成手段は、複数の互いに異なる照明条件の各々において、前記複数の学習画像を生成することとしても良い。
この構成によれば、特定の頭部姿勢の学習画像が欠落することがないだけでなく、特定の照明条件下での頭部姿勢の学習画像が欠落することもないため、頭部姿勢や照明条件によって正面姿勢の識別精度が悪化することもなく性能に偏りが起こりづらい。
以上説明したように本発明によれば、学習対象の頭部の頭部姿勢を上下方向および/または左右方向に回転させて学習画像を複数生成するに際して、上下方向への回転角度を左右方向よりも小さくしているため、上下方向の姿勢変化が小さい場合でも、正面姿勢の識別を行うことができるという効果が得られる。
以下に、本発明を実施するための最良の形態について図面を参照して説明する。
(第1の実施形態)
図1を参照すると、本発明の第1の実施形態のパラメータ学習装置は、第1の記憶装置100と、第1のデータ処理装置200と、第2の記憶装置300と、第2のデータ処理装置400と、第3の記憶装置500とを有している。なお、図1において、第1の記憶装置100、第2の記憶装置300、および第3の記憶装置500のうち、2以上の記憶装置を同一の記憶装置とする構成でも良い。また、第1のデータ処理装置200および第2のデータ処理装置400を同一のデータ処理装置とする構成でも良い。
本実施形態のパラメータ学習装置は、後述する正面姿勢識別装置において入力パタン(正面姿勢であるかを識別する識別対象の頭部画像)がどのクラス(「正面姿勢」または「非正面姿勢」)であるかを識別するパタン識別に用いられるパタン識別パラメータを学習するものである(後述する第2および第3の実施形態も同様)。かかる学習とは、パタン識別技術の専門用語であり、パタン識別に用いられる1つまたは複数個のパタン識別パラメータの適切な値を学習データを用いて求める動作のことである。
第1の記憶装置100は、学習対象の頭部画像から得られる頭部の頭部データを、複数人分保持する頭部データ記憶部110を有している。
頭部データ記憶部110は、学習対象の頭部の3D(3次元)形状データを保持する3D形状データ記憶部110と、学習対象の頭部のテクスチャデータを保持するテクスチャデータ記憶部112と、学習対象の頭部の3D形状データの特徴点の位置を示す頭部特徴位置データを保持する頭部特徴位置データ記憶部113とを有している。
第1のデータ処理装置200は、正面姿勢計算部210と、学習画像生成部220とを有している。正面姿勢計算部210は、頭部姿勢正規化部211と、正面姿勢合わせ部212とを有している。
頭部姿勢正規化部211は、3D形状データ記憶部111内の頭部の3D形状データのそれぞれを、頭部特徴位置データ記憶部113内の頭部特徴位置データを用いて、一定の基準姿勢に揃える正規化処理を行う。
正面姿勢合わせ部212は、頭部姿勢正規化部211により基準姿勢に揃えられた頭部の3D形状データを正面姿勢に姿勢合わせする。なお、正面姿勢計算部210にて正面姿勢に姿勢合わせされた3D形状データは、学習画像生成部220に直接出力されてもよく、3D形状データ記憶部111に一旦格納され、学習画像生成部220により3D形状データ記憶部111から読み出されてもよい。
学習画像生成部220は、正面姿勢計算部210にて正面姿勢に姿勢合わせされた学習対象の頭部の3D形状データの頭部姿勢の向きを、正面姿勢から上下方向および/または左右方向にそれぞれ設定された回転角度間隔で回転させ、その回転させた姿勢の3D形状データにテクスチャデータ記憶部112内のテクスチャデータを貼り合わせるレンダリングを行うことで、互いに頭部姿勢が異なる複数の学習画像を生成する。その際、学習画像生成部220は、頭部姿勢の上下方向への回転角度を左右方向よりも小さな角度に設定する。頭部姿勢の上下方向への回転角度は、左右方向よりも小さければ特に制限はないが、15°以下程度が好ましい範囲である。なお、3D形状データを回転させる技術は、当業者にとって公知であり、いかなる公知技術も使用できるため、詳細な説明は省略する。
また、学習画像生成部220は、上述のような複数の学習画像の生成を、複数の互いに異なる照明条件(照明が当たる角度、照明の強度、照明の個数、照明の色など)下でそれぞれ行う。
第2の記憶装置300は、学習画像生成部220で生成された複数の学習画像のそれぞれについて、その学習画像の頭部姿勢情報である教師データを対にして学習データとして保持する学習データ記憶部301を有している。
第2のデータ処理装置400は、学習データ記憶部301内の学習データに基づいて、上述したパタン識別に用いられる適切なパタン識別パラメータを学習するパタン識別パラメータ学習部401を有している。
第3の記憶装置500は、パタン識別パラメータ学習部401で学習されたパタン識別パラメータを保持するパタン識別パラメータ記憶部を有している。
以下、図1に示したパラメータ学習装置の動作について図2のフローチャートを参照して説明する。ここでは、第1の記憶装置100の頭部データ記憶部110には、すでに、学習対象の頭部画像から得られる頭部データが保持されているものとする。
図2を参照すると、まず、頭部姿勢正規化部211は、3D形状データ記憶部111内の学習対象の頭部の3D形状データを、頭部特徴位置データ記憶部113内の頭部特徴位置データに基づいて正規化する(ステップ101)。この正規化とは、何らかの基準に基づいて頭部の3D形状データの頭部姿勢を一定の基準姿勢に揃えることである。例えば、頭部特徴位置データの2点を2組(例えば、1組目を左目と右目、2組目を両目の中点と鼻下点)選択し、学習画像生成部220でのレンダリング後に2組の2点の距離が同時に最大になるような姿勢を基準の姿勢とする。
次に、正面姿勢合わせ部212は、頭部姿勢正規化部211にて正規化された3D形状データの基準姿勢を正面姿勢に変換する(ステップ102)。このとき、既に全ての3D形状データは基準姿勢に統一されているので、正面姿勢への変換に際しては、基準姿勢からあらかじめ決められた一定角度だけ回転することで正面姿勢に統一できる。
このように、頭部の3D形状データ間で異なっている姿勢を基準姿勢に揃え、これを正面姿勢に変換してから、後に学習画像生成部220でレンダリングを行うことにより、レンダリング後の学習データの頭部姿勢の識別精度を高めることができる。
ステップ101,102の処理は、学習対象の頭部の3D形状データの個数分だけ繰り返し実行される(ステップ103)。
次に、学習画像生成部220は、ステップ101,102で変換された3D形状データの正面姿勢を基準として頭部姿勢を回転させて得られる学習画像の相対姿勢角度が所定の分布になるようにレンダリングパラメータを設定する(ステップ104)。この所定の分布とは、頭部姿勢の上下方向への回転角度の間隔を左右方向よりも小さくした分布、すなわち頭部姿勢を上下方向に回転させてサンプリングする際のサンプリング間隔を左右方向よりも密にした分布である。そのため、結果的には、上下方向姿勢の学習画像の数の方が、左右方向姿勢よりも相対的に多くなる。
図3は、学習画像の頭部姿勢の分布の一例を示す図である。図3に示すように、上下方向の姿勢のサンプリング間隔は角度5°づつで密であり、左右方向の姿勢のサンプリング間隔は角度15°づつで粗くなっている。
次に、学習画像生成部220は、ステップ104で設定されたレンダリングパラメータにしたがって、ステップ101,102で正面姿勢に変換された3D形状データの頭部姿勢の向きを回転させ、その回転させた姿勢の3D形状データにテクスチャデータ記憶部112内のテクスチャデータを貼り合わせるレンダリングを行うことにより学習画像を生成する(ステップ105)。このレンダリングは、複数の互いに異なる照明条件のそれぞれにおいて行う。レンダリングされた学習画像は、その学習画像の頭部姿勢の姿勢情報である教師データと対になって、学習データとして学習データ記憶部301に記憶される。このとき、頭部姿勢が既知である実際の画像を学習データとして追加して学習データ記憶部301に記憶させても構わない。
ステップ104,105の処理は、頭部姿勢分布が所定の分布になるまで繰り返し実行される(ステップ106)。
次に、パタン識別パラメータ学習部401は、学習データ記憶部301に記憶された学習データを用いて、パタン識別に用いられるパタン識別パラメータを学習する(ステップ107)。
ステップ105の学習方法としては、教師データに基づいてパタン識別パラメータを学習する任意の方法を用いることが可能である。教師データに基づく代表的な学習方法としては、ニューラルネットワーク、LVQ(Learning Vector Quantization)、サポートベクトルマシン、部分空間法、識別関数の最適化、決定木、隠れマルコフモデル、ブースティングといった方法が挙げられる。なお、この学習方法には、パタン識別技術における特徴抽出の処理も含まれる。特徴抽出とは、入力パタンを識別しやすい別の形式のパタンに変換することである。パタン識別パラメータ学習部401にて変換される別の形式のパタンとは、例えば、フーリエ変換やウェーブレット変換によって得られる周波数データから高周波数成分を除去したデータ、主成分分析を行って寄与率が高い成分のみを取り出したデータ、画像の輝度勾配分布のヒストグラムデータなどが挙げられる。
ここで、図1に示した本実施形態のパラメータ学習装置にて学習されたパタン識別パラメータ(または、後述する第2および第3のパラメータ学習装置にて学習されたパタン識別パラメータ)を用いて、識別対象の頭部姿勢が正面姿勢であるか否かを識別する正面姿勢識別装置について図4を参照して説明する。
図4を参照すると、この正面姿勢識別装置は、第4の記憶装置600と、第3のデータ処理装置700とを有している。
第4の記憶装置600は、パタン識別パラメータ記憶部601を有している。
パタン識別パラメータ記憶部601には、図1に示したパタン識別パラメータ記憶部501と同一のデータ、すなわち、図1に示したパタン識別パラメータ学習装置401により求められたパタン識別パラメータが格納される。
第3のデータ処理装置700は、パタン識別部701を有している。
パタン識別部701は、正面姿勢であるか否かを識別する識別対象の頭部画像を入力として受け取り、パタン識別パラメータ記憶部601内のパタン識別パラメータに基づいて正面姿勢を識別し、その識別結果を出力する。パタン識別部701は、図1に示したパタン識別パラメータ学習部401に対応するものであり、パタン識別パラメータ学習部401で用いた学習方法に応じて内部の動作が異なる。例えば、パタン識別パラメータ学習部401における学習方法として、特徴抽出を行わない多層パーセプトロン型のニューラルネットワークが用いられた場合には、パタン識別パラメータはユニット間の重みとなる。この場合、パタン識別部701は、正面姿勢の識別においては、かかる重み値を反映したニューラルネットワークに、正面姿勢であるか否かを識別する識別対象の頭部画像を入力することで、正面姿勢の識別結果を得る。
上述したように本実施形態においては、学習対象の頭部姿勢を回転させて複数の学習画像を生成するに際して、頭部姿勢の上下方向への回転角度を小さく、すなわち頭部姿勢を上下方向に回転させてサンプリングする際のサンプリング間隔を密にしているため、通常の識別では弱点となる上下方向の姿勢変化が小さい場合でも、正面姿勢の識別を行うことが可能になるという効果が得られる。
また、本実施形態においては、学習対象の頭部の3D形状データの頭部姿勢を基準姿勢とし、3D形状データ間で異なっている頭部姿勢を揃えてから、レンダリングにより学習画像を生成しているため、学習データの姿勢精度が高く、それにより、頭部姿勢が正面姿勢と非正面姿勢との境界に近い姿勢であっても高い精度で正面姿勢の識別を行うことが可能になるという効果が得られる。
さらに、本実施形態においては、複数の互いに異なる照明条件のそれぞれにおいて、学習画像を複数生成しているため、特定の頭部姿勢の学習データが欠落することがないだけでなく、特定の照明条件下での頭部姿勢の学習データが欠落することもないため、頭部姿勢や照明条件によって正面姿勢の識別精度が悪化することもなく性能に偏りが起こりづらいという効果が得られる。
(第2の実施形態)
図5を参照すると、本発明の第2の実施形態のパラメータ学習装置は、図1に示した第1の実施形態と比較して、第1のデータ処理装置200に、頭部姿勢合成部230を設けた点が異なる。
頭部姿勢合成部230は、3D形状データ記憶部111に保持された複数の頭部の3D形状データを合成することで頭部形状を変形し、その変形後の3D形状データを新たな3D形状データとして3D形状データ記憶部111に追加格納するとともに、テクスチャデータ記憶部112および頭部特徴位置データ記憶部113に変形後の3D形状データに対応するテクスチャデータおよび頭部特徴位置データをそれぞれ追加格納する。このとき、3D形状データは、既に正面姿勢に変換されているため、複数個の3D形状データの座標値の平均をとることで新たな3D形状データを得られる。
また、頭部姿勢合成部230は、頭部特徴位置データ記憶部113に保持された頭部特徴位置データを用いて、鼻、口といった特定の特徴の形状のみを他の3D形状データで置き換えることで新たな3D形状データの種類を増やすこともできる。
上述したように本実施形態においては、新たな3D形状データを加えることにより学習データの数を増加させることができるため、正面姿勢の識別において人物依存性・表情依存性を低くすることができるという効果が得られる。
(第3の実施形態)
図6を参照すると、本発明の第3の実施形態のパラメータ学習装置は、図1に示した第1の実施形態と比較して、第1のデータ処理装置200に、姿勢ノイズ付加部240を設けた点が異なる。
姿勢ノイズ付加部240は、正面姿勢合わせ部212により正面姿勢に姿勢合わせされた3D形状データの姿勢角度について、ランダムな値を付加して姿勢を意図的にずらす。この際のランダム値としては、一様乱数ではなく正規乱数のように、大きな値の出現頻度が低い乱数を用いる。これにより、特定の頭部姿勢の学習画像を生成する際に、姿勢にずれが生じることになる。
上述したように本実施形態においては、正面姿勢がランダムに変動するため、実際に入力された識別対象の頭部画像の姿勢が、学習データが持つ角度からずれている場合にも、正面姿勢の識別精度の低下を防ぐことができるという効果が得られる。しかも、ランダム値として大きな値の出現頻度が低い正規乱数を用いるため、変動前後で頭部姿勢の角度はほぼ同じ範囲に保たれるという効果が得られる。
以下、本発明のパラメータ学習装置の実施例について説明する。ここでは、第1の実施形態に関する実施例について説明するものとする。
本実施例では、頭部の3D形状データとして顔面の形状データのみを用い、識別対象となる頭部画像は両目の位置を基準に揃えた顔画像のみを扱う。また、パタン識別アルゴリズムには、一般化学習ベクトル量子化という手法を用い、入力パタン(識別対象の頭部画像)を「正面姿勢」または「非正面姿勢」という2クラスのどちらかに識別するものとする。一般化学習ベクトル量子化については、非特許文献3に詳細な記述がある。
また、本実施例では、図1の第1の記憶装置100、第2の記憶装置300、および第3の記憶装置500の3つの記憶装置に相当するものとして、ハードディスクドライブを使用する。また、第1のデータ処理装置および第2のデータ処理装置に相当するものとして、PC(パーソナルコンピュータ)を使用する。
また、本実施例では、3D形状データ記憶部111には、あらかじめ、レンジファインダなどの3D形状計測装置(不図示)によって計測された複数人分の顔形状の3D形状データを格納し、テクスチャデータ記憶部112には、その計測の際に撮影された顔のテクスチャデータを格納しておく。また、頭部特徴位置データ記憶部113には、顔の特徴点として両目と鼻下点の3D位置を格納しておく。
また、本実施例では、図2のステップ104において、頭部姿勢の分布が、図7に示すように、上下方向の姿勢を15°間隔でサンプリングし、左右方向の姿勢のサンプリング間隔30°よりも小さくなるようにレンダンリングパラメータを設定する。
まず、頭部姿勢正規化部211は、学習対象の顔の3D形状データの姿勢を、顔の頭部特徴位置データを用いて、一定の基準姿勢とする正規化処理を行う。この正規化処理においては、顔面の特徴点として両目と鼻下点の3点を用い、3D形状データの顔面の姿勢を、レンダリング後の両目間の距離と、レンダリング後の両目の中点と鼻下点の間の距離とがそれぞれ最大となる基準姿勢に揃える。より具体的には、次の(1)〜(8)の手順により正規化処理を行うことができる。
(1)実際に頭部の3D形状データからCG(Computer Graphics)を作成し、CGの画像上での左目、右目の座標を得る。このときの顔の左右回転角をθとする。
(2)(1)で得た座標値から両目間の距離を計算する。
(3)(1)とは左右方向に僅かに異なる姿勢(θ+Δθ)でCGを作成する。
(4)(2)と同様に、両目間の距離を計算する。
(5)(2)と(4)の計算結果を比較して、(4)の距離の方が長ければ、さらに角度をつけた姿勢(θ+2×Δθ)でCGを作成する。一方、(4)の距離の方が短ければ、逆向きの角度をつけた姿勢(θ−Δθ)でCGを作成する。
(6)(1)〜(5)までの処理を繰り返すことにより、両目間の距離が最大となる左右角度θmaxを求める。
(7)(1)〜(6)と同様にして、両目中点と鼻下点との間の距離が最大となる上下角度φmaxを求める。
(8)(6)で求められた左右角度θmaxおよび(7)で求められた上下角度φmaxだけ回転したデータを、3D形状データの基準姿勢とする。
このように、頭部の3D形状データ間で異なっている姿勢を基準姿勢に揃え、これを正面姿勢に変換してから、後に学習画像生成部220でレンダリングを行うことにより、レンダリング後の学習データの頭部姿勢の識別精度を高めることができる。
次に、正面姿勢合わせ部212は、頭部姿勢正規化部211にて正規化された3D形状データの基準姿勢を正面姿勢に変換する。このとき、基準の姿勢から上方向に10°だけ回転させた姿勢を正面姿勢とする。全ての3D形状データは、正面姿勢に統一される。
なお、本実施例では、顔面の姿勢を正面姿勢に統一する際に、正面姿勢計算部210で全ての3D形状データを直接修正して正面姿勢に揃えているが、本発明はこれに限定されず、正面姿勢計算部210では個別の3D形状データの正面からのずれをパラメータとして計算することのみを行い、後の学習画像生成部220でのレンダリング時に、そのパラメータを加味して3D形状データを補正して正面姿勢に揃えても構わない。
以上の図2のステップ101,102に相当する処理は、学習対象の頭部の3D形状データの個数分だけ繰り返し実行される。
次に、学習画像生成部220は、図7のような顔面姿勢の分布となるように、レンダリングのパラメータを適宜設定してから、レンダリングを行って学習画像を生成するという処理を繰り返す。このレンダリングの際、照明条件の変動による顔画像の見え方の変化に対応するために、照明条件を3種類以上用意し、それぞれの照明条件において、図7のような分布となるように複数の学習画像を生成する。レンダリングされた学習画像は、顔の姿勢情報である教師データと対になって、学習データとして学習データ記憶部301に記憶される。なお、入力パタン(識別対象の顔画像)のパタン識別においては、一般化学習ベクトル量子化により「正面姿勢」または「非正面姿勢」のどちらのクラスであるかを識別する2クラス識別を採用するので、かかる教師データは「正面姿勢」または「非正面姿勢」という情報である。具体的には「正面姿勢」に番号0、「非正面姿勢」に番号1という数値を割り当てればよい。
以上の図2のステップ104,105に相当する処理の繰り返し回数は、「学習対象の顔面の数」×「照明条件の数」×「顔面姿勢の分布における姿勢の数」である。
次に、パタン識別パラメータ学習部401は、学習データ記憶部301に記憶された学習データを一般学習ベクトル量子化によって学習し、その学習結果としてパタン識別パラメータを出力する。一般学習ベクトル量子化によって学習されるパタン識別パラメータとは、例えば、参照ベクトルである。参照ベクトルとは、パタン識別時に、入力パタンとの類似度が計算できるテンプレートの一種である。
すなわち、本実施例のパラメータ学習装置は、図7のような複数の学習画像のそれぞれについて、パタン識別パラメータとして参照ベクトルを学習する。その結果、正面姿勢の参照ベクトルと、非正面姿勢の参照ベクトルとが得られることになる。
これを受けて、図4に示した正面姿勢識別装置では、パタン識別において、入力パタン(正面姿勢であるかを識別する識別対象の顔画像)をベクトルとみなし、入力パタンのベクトルに最も類似度が高い参照ベクトルを探し出し、その参照ベクトルが属しているクラス(「正面姿勢」または「非正面姿勢」)に入力パタンを分類する。
なお、本発明においては、パラメータ学習装置に上記の処理を実行するためのプログラムを記録した記録媒体を備えてさせても良い。この記録媒体は磁気ディスク、半導体メモリまたはその他の記録媒体であってもよい。このプログラムは、記録媒体からパラメータ学習装置に読み込まれ、パラメータ学習装置の動作を制御する。具体的には、パラメータ学習装置内の不図示のCPUがこのプログラムの制御によりパラメータ学習装置のハードウェア資源に特定の処理を行うように指示することにより上記の処理が実現される。
本発明は、頭部画像から人物を照合する用途に適用できる。このような用途において、正面姿勢を向いている頭部を照合対象とすれば、照合性能の改善や一定以上の照合性能の保証を図ることができるようになる。
また、本発明は、証明写真などの頭部撮影装置に適用すれば、人物が正確に正面を向いた瞬間の画像を撮影できるようになる。
また、本発明は、携帯電話・PC・情報端末などの使用者撮影用カメラで撮影した使用者の頭部の正面姿勢の識別に適用すれば、使用者が画面を注視しているか否かを判定することができ、それにより自動的に画面のロックをかける動作、およびロックを解除するといった動作を行うことができるようになる。
また、本発明は、自動車の運転手の頭部の正面姿勢の識別に適用すれば、運転手がよそ見したことを検知することができるようになる。
また、本発明は、映画・録画された動画・個人撮影のビデオでは、人物の正面姿勢が映った瞬間が代表的なシーンを表していることが多いため、代表的なシーンを選択したり、動画を要約したりするといった用途に適用できる。
本発明の第1の実施形態のパラメータ学習装置の構成を示すブロック図である。 本発明の第1の実施形態のパラメータ学習装置の動作を説明するフローチャートである。 本発明の第1の実施形態において、学習画像を生成する際の頭部姿勢の分布の一例を示す図である。 本発明のパラメータ学習装置によって学習されたパタン識別パラメータを用いて、識別対象の頭部姿勢が正面姿勢であるか否かを識別する正面姿勢識別装置の一構成例を示すブロック図である。 本発明の第2の実施形態のパラメータ学習装置の構成を示すブロック図である。 本発明の第3の実施形態のパラメータ学習装置の構成を示すブロック図である。 本発明の第1の実施形態の実施例において、学習画像を生成する際の顔面姿勢の分布の一例を示す図である。
符号の説明
100 第1の記憶装置
110 頭部データ記憶部
111 3D形状データ記憶部
112 テクスチャデータ記憶部
113 頭部特徴位置データ記憶部
200 第1のデータ処理装置
210 正面姿勢計算部
211 頭部姿勢正規化部
212 正面姿勢合わせ部
220 学習画像生成部
230 頭部姿勢合成部
240 姿勢ノイズ付加部
300 第2の記憶装置
301 学習データ記憶部
400 第2のデータ処理装置
401 パタン識別パラメータ学習部
500 第3の記憶装置
501 パタン識別パラメータ記憶部

Claims (9)

  1. 頭部姿勢が正面姿勢であるか否かを識別するためのパタン識別パラメータを学習するパラメータ学習装置であって、
    学習対象の頭部姿勢の上下方向への回転角度を左右方向よりも小さな角度に設定した上で、学習対象の頭部姿勢を上下方向および/または左右方向にそれぞれ設定された回転角度に従って回転させて互いに頭部姿勢が異なる複数の学習画像を生成する学習画像生成手段と、
    前記学習画像生成手段により生成された前記複数の学習画像のそれぞれについて、前記パタン識別パラメータを学習するパラメータ学習手段とを有するパラメータ学習装置。
  2. 学習対象の頭部の3D形状データを保持する3D形状データ記憶手段と、
    学習対象の頭部のテクスチャデータを保持するテクスチャデータ記憶手段と、
    学習対象の頭部の頭部特徴位置データを保持する頭部特徴位置データ記憶手段と、
    前記3D形状データ記憶手段に保持された頭部の3D形状データを、前記頭部特徴位置データ記憶手段に保持された頭部特徴位置データに基づき一定の基準姿勢に揃えた上で、その基準姿勢を正面姿勢に姿勢合わせする正面姿勢計算手段とをさらに有し、
    前記学習画像生成手段は、前記正面姿勢計算手段により正面姿勢に姿勢合わせされた頭部の3D形状データを、正面姿勢から上下方向および/または左右方向にそれぞれ設定された回転角度に従って回転させ、回転させた姿勢の3D形状データに前記テクスチャデータ記憶手段に保持されたテクスチャデータを貼り合わすことで前記複数の学習画像を生成する、請求項1に記載のパラメータ学習装置。
  3. 前記学習画像生成手段は、複数の互いに異なる照明条件の各々において、前記複数の学習画像を生成する、請求項1または2に記載のパラメータ学習装置。
  4. 頭部姿勢が正面姿勢であるか否かを識別するためのパタン識別パラメータを学習するパラメータ学習方法であって、
    学習対象の頭部姿勢の上下方向への回転角度を左右方向よりも小さな角度に設定した上で、学習対象の頭部姿勢を上下方向および/または左右方向にそれぞれ設定された回転角度に従って回転させて互いに頭部姿勢が異なる複数の学習画像を生成する第1のステップと、
    前記複数の学習画像のそれぞれについて、前記パタン識別パラメータを学習する第1のステップとを有するパラメータ学習方法。
  5. 学習対象の頭部の3D形状データを、学習対象の頭部の頭部特徴位置データに基づき一定の基準姿勢に揃えた上で、その基準姿勢を正面姿勢に姿勢合わせする第3のステップをさらに有し、
    前記第1のステップでは、正面姿勢に姿勢合わせされた頭部の3D形状データを、正面姿勢から上下方向および/または左右方向にそれぞれ設定された回転角度に従って回転させ、回転させた姿勢の3D形状データに学習対象の頭部のテクスチャデータを貼り合わすことで前記複数の学習画像を生成する、請求項4に記載のパラメータ学習方法。
  6. 前記第1のステップでは、複数の互いに異なる照明条件の各々において、前記複数の学習画像を生成する、請求項4または5に記載のパラメータ学習方法。
  7. 頭部姿勢が正面姿勢であるか否かを識別するためのパタン識別パラメータを学習するコンピュータに実行させるプログラムであって、
    学習対象の頭部姿勢の上下方向への回転角度を左右方向よりも小さな角度に設定した上で、学習対象の頭部姿勢を上下方向および/または左右方向にそれぞれ設定された回転角度に従って回転させて互いに頭部姿勢が異なる複数の学習画像を生成する第1のステップと、
    前記複数の学習画像のそれぞれについて、前記パタン識別パラメータを学習する第1のステップとを有するプログラム。
  8. 学習対象の頭部の3D形状データを、学習対象の頭部の頭部特徴位置データに基づき一定の基準姿勢に揃えた上で、その基準姿勢を正面姿勢に姿勢合わせする第3のステップをさらに有し、
    前記第1のステップでは、正面姿勢に姿勢合わせされた頭部の3D形状データを、正面姿勢から上下方向および/または左右方向にそれぞれ設定された回転角度に従って回転させ、回転させた姿勢の3D形状データに学習対象の頭部のテクスチャデータを貼り合わすことで前記複数の学習画像を生成する、請求項7に記載のプログラム。
  9. 前記第1のステップでは、複数の互いに異なる照明条件の各々において、前記複数の学習画像を生成する、請求項7または8に記載のプログラム。
JP2005158997A 2005-05-31 2005-05-31 パラメータ学習装置、パラメータ学習方法、およびプログラム Active JP4816874B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005158997A JP4816874B2 (ja) 2005-05-31 2005-05-31 パラメータ学習装置、パラメータ学習方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005158997A JP4816874B2 (ja) 2005-05-31 2005-05-31 パラメータ学習装置、パラメータ学習方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2006338103A true JP2006338103A (ja) 2006-12-14
JP4816874B2 JP4816874B2 (ja) 2011-11-16

Family

ID=37558635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005158997A Active JP4816874B2 (ja) 2005-05-31 2005-05-31 パラメータ学習装置、パラメータ学習方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP4816874B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116589A (ja) * 2017-01-20 2018-07-26 Kddi株式会社 対象画像の変更画像群を用いる状態識別装置、プログラム及び方法
US11330276B2 (en) 2017-04-21 2022-05-10 Zenimax Media Inc. Systems and methods for encoder-guided adaptive-quality rendering
JP7175061B1 (ja) 2022-06-29 2022-11-18 株式会社Novera プログラム、情報処理装置、及び方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573663A (ja) * 1991-09-17 1993-03-26 Nippon Telegr & Teleph Corp <Ntt> 3次元物体の画像認識法
JPH07302327A (ja) * 1993-08-11 1995-11-14 Nippon Telegr & Teleph Corp <Ntt> 物体画像検出方法及び検出装置
JP2001357404A (ja) * 2000-06-14 2001-12-26 Minolta Co Ltd 画像抽出装置
JP2004086625A (ja) * 2002-08-27 2004-03-18 Hitoshi Hongo 顧客情報管理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573663A (ja) * 1991-09-17 1993-03-26 Nippon Telegr & Teleph Corp <Ntt> 3次元物体の画像認識法
JPH07302327A (ja) * 1993-08-11 1995-11-14 Nippon Telegr & Teleph Corp <Ntt> 物体画像検出方法及び検出装置
JP2001357404A (ja) * 2000-06-14 2001-12-26 Minolta Co Ltd 画像抽出装置
JP2004086625A (ja) * 2002-08-27 2004-03-18 Hitoshi Hongo 顧客情報管理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116589A (ja) * 2017-01-20 2018-07-26 Kddi株式会社 対象画像の変更画像群を用いる状態識別装置、プログラム及び方法
US11330276B2 (en) 2017-04-21 2022-05-10 Zenimax Media Inc. Systems and methods for encoder-guided adaptive-quality rendering
JP7175061B1 (ja) 2022-06-29 2022-11-18 株式会社Novera プログラム、情報処理装置、及び方法
JP2024004581A (ja) * 2022-06-29 2024-01-17 株式会社Novera プログラム、情報処理装置、及び方法

Also Published As

Publication number Publication date
JP4816874B2 (ja) 2011-11-16

Similar Documents

Publication Publication Date Title
JP4093273B2 (ja) 特徴点検出装置、特徴点検出方法および特徴点検出プログラム
JP4443722B2 (ja) 画像認識装置及び方法
US7925060B2 (en) Authentication system and registration system related to facial feature information
JP4553141B2 (ja) 重み情報を用いた物体姿勢推定・照合システム
US9053388B2 (en) Image processing apparatus and method, and computer-readable storage medium
US8861800B2 (en) Rapid 3D face reconstruction from a 2D image and methods using such rapid 3D face reconstruction
US9117111B2 (en) Pattern processing apparatus and method, and program
JP4501937B2 (ja) 顔特徴点検出装置、特徴点検出装置
JP4353246B2 (ja) 法線情報推定装置、登録画像群作成装置および画像照合装置ならびに法線情報推定方法
JP6074272B2 (ja) 画像処理装置および画像処理方法
US20040190775A1 (en) Viewpoint-invariant detection and identification of a three-dimensional object from two-dimensional imagery
JP6071002B2 (ja) 信頼度取得装置、信頼度取得方法および信頼度取得プログラム
JP2007072620A (ja) 画像認識装置及びその方法
US20070050639A1 (en) Authentication apparatus and authentication method
JP2009053916A (ja) 顔画像処理装置及び顔画像処理方法、並びにコンピュータ・プログラム
JP2007213378A (ja) 特定表情顔検出方法、撮像制御方法および装置並びにプログラム
JP2007226441A (ja) 顔照合装置
US20140093142A1 (en) Information processing apparatus, information processing method, and information processing program
JPWO2009004916A1 (ja) なりすまし検知システム、なりすまし検知方法およびなりすまし検知用プログラム
CN109858433B (zh) 一种基于三维人脸模型识别二维人脸图片的方法及装置
JP4816874B2 (ja) パラメータ学習装置、パラメータ学習方法、およびプログラム
JP2005309765A (ja) 画像認識装置、画像抽出装置、画像抽出方法及びプログラム
JP4708835B2 (ja) 顔検出装置、顔検出方法、及び顔検出プログラム
JP2008015871A (ja) 認証装置、及び認証方法
JP2007299051A (ja) 画像処理装置、方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080414

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101102

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110803

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110816

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4816874

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150