JP2006059215A - オブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法 - Google Patents

オブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法 Download PDF

Info

Publication number
JP2006059215A
JP2006059215A JP2004241932A JP2004241932A JP2006059215A JP 2006059215 A JP2006059215 A JP 2006059215A JP 2004241932 A JP2004241932 A JP 2004241932A JP 2004241932 A JP2004241932 A JP 2004241932A JP 2006059215 A JP2006059215 A JP 2006059215A
Authority
JP
Japan
Prior art keywords
rotation angle
image
face
mapping
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004241932A
Other languages
English (en)
Inventor
Toshinori Nagahashi
敏則 長橋
Takashi Hiuga
崇 日向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2004241932A priority Critical patent/JP2006059215A/ja
Publication of JP2006059215A publication Critical patent/JP2006059215A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 画像中に存在する人物顔の回転角度を検出する方法は、口や鼻等の顔の特定の部位を抽出して顔の重心位置を算出し、この重心位置と、抽出した顔の代表点とに基づいて、顔の回転角度を算出していたが、顔の向きや顔の周囲の照明に依っては、顔の部位を正しく抽出できず、顔の回転角度を確実に算出できないという問題があった。
【解決手段】 顔の回転角度を検出する顔の回転角度検出装置は、画像の所定の領域を検出対象領域として読み取る画像読取手段10と、所定の大きさで正規化した検出対象領域の画像をブロック毎に分割して、所定の画像特性を示す画像特徴量の代表値から検出対象領域内における画像特性の特徴を示す特徴ベクトルを生成する特徴ベクトル生成手段30と、前記特徴ベクトルから、周期関数により写像された写像値を推定する推定手段50と、前記写像値を逆写像して、顔の回転角度を算出する回転角度算出手段60とを備える。
【選択図】 図1

Description

本発明は、パターン認識やオブジェクト認識技術に係り、画像中に存在する人物顔のようなオブジェクトの回転角度を検出するオブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法に関する。
画像中の人物顔の回転角度を検出する方法としては、下記の特許文献1に記載されるように、顔の特徴点として、口や鼻等の顔の特定の部位を抽出して、この部位の画像から顔の重心位置を算出していた。そして、この重心位置と、抽出した顔の代表点とに基づいて、顔の回転角度を算出していた。
特開平9−35070号公報
しかしながら、従来の方法では、顔の向きや顔の周囲の照明に依っては、顔の部位を正しく抽出できないため、顔の回転角度を確実に算出できないという問題があった。
上記した課題を解決するために、本発明のオブジェクトの回転角度検出装置は、画像中のオブジェクトの回転角度を検出するオブジェクトの回転角度検出装置であって、前記画像の所定の領域を検出対象領域として読み取る画像読取手段と、所定の大きさで正規化した前記検出対象領域の画像を、複数のブロックに分割して、当該ブロック毎に所定の画像特性を示す画像特徴量の代表値を算出し、当該代表値に基づき前記検出対象領域内における当該画像特性の特徴を示す特徴ベクトルを生成する特徴ベクトル生成手段と、前記特徴ベクトルから、周期関数により写像された写像値を推定する推定手段と、前記写像値を逆写像して、オブジェクトの回転角度を算出する回転角度算出手段とを備えることを特徴とする。
上記構成によれば、画像特性の特徴を示す特徴ベクトルを生成して、この特徴ベクトルに基づいて、周期関数への写像値を推定し、その写像値を逆写像することで回転角度を算出するため、特定の部位の抽出に依存することなく、オブジェクトの回転角度を確実に算出できる。
本発明のオブジェクトの回転角度検出装置では、前記オブジェクトの回転角度検出装置は、前記回転角度を周期関数で写像して写像値を算出する回転角度写像手段を更に備え、前記推定手段は、前記特徴ベクトルと、前記特徴ベクトルに対応する前記写像値との関係の学習に基づいて推定することが好ましい。
上記構成によれば、回転角度を周期関数で写像するため、回転角度が0度と360度の近傍において生じる不連続誤差を防止できることに加えて、推定手段は、オブジェクトの回転に応じた写像値と、特徴ベクトルとの関係を学習するため、算出した特徴ベクトルに対応する写像値を高精度で推定できる。
本発明のオブジェクトの回転角度検出装置では、前記回転角度写像手段は、少なくとも2つ以上の異なる周期関数から、それぞれ写像値を算出し、前記回転角度算出手段は、それぞれの周期関数に応じたオブジェクトの回転角度を、前記写像値から算出することが好ましい。
上記構成によれば、少なくとも2つ以上の異なる周期関数から写像値を算出するため、それぞれの異なる周期関数に応じた回転角度を、少なくとも2つ以上算出できる。
本発明のオブジェクトの回転角度検出装置では、前記オブジェクトの回転角度検出装置は、前記周期関数と、前記周期関数に基づいて算出した前記回転角度との組合わせの中から、前記回転角度を所定の規則で規定する回転角度規定手段を更に備えることが好ましい。
上記構成によれば、前記周期関数に基づいて算出した前記回転角度と前記周期関数との組合わせの中から、所定の規則に従い、回転角度を適切に規定できる。
本発明のオブジェクトの回転角度検出装置では、前記推定手段は、サポートベクタ回帰を行う非線型のカーネル関数から成ることが好ましい。
上記構成によれば、推定処理をカーネル関数に置き換えて演算することで、演算の単純化に加えて、演算量を低減できるため、高速な推定処理が可能になる。
本発明のオブジェクトの回転角度検出装置では、前記特徴ベクトル生成手段は、前記検出対象領域内の画像を所定の大きさで正規化する正規化部と、前記画像を前記所定の画像特性で数値化して算出する画像特性算出部と、前記検出対象領域を複数のブロックに分割して、前記数値化された数値の平均値又は分散値を当該ブロック毎に算出する平均・分散値算出部とを備えることが好ましい。
上記構成によれば、所定の大きさで正規化された検出対象領域の画像を複数のブロックに分割して、そのブロック毎の特性値を平均値または分散値で代表して特徴ベクトルを算出する。従って、ブロック毎の特性値が損なわれないことに加え、特徴ベクトルを算出する演算量が激減するため、特徴ベクトルを的確かつ高速に算出できる。
本発明のオブジェクトの回転角度検出装置では、前記画像特性算出部は、前記検出対象領域内の画像を構成する各画素における輝度値を算出する輝度算出部を備えることが好ましい。
更に、本発明のオブジェクトの回転角度検出装置では、前記画像特性算出部は、前記検出対象領域内のエッジの強度を算出するエッジ強度算出部を備えることが好ましい。
上記構成によれば、検出対象領域内にオブジェクト画像が存在する場合は、その画像を精度良く、高速に識別できる。
本発明のオブジェクトの回転角度検出装置では、前記エッジの強度は、前記検出対象領域内の画像を構成する各画素におけるSobelのオペレータを用いて算出されることが好ましい。
上記構成によれば、エッジ強度を精度良く検出できる。
そして、上記したオブジェクトを、顔に適用することで、顔の回転角度を確実に検出できる顔の回転角度検出装置を実現できる。
上記した課題を解決するために、本発明の顔の回転角度検出プログラムは、画像中における顔の回転角度を検出する顔の回転角度検出プログラムであって、コンピュータを、前記画像の所定の領域を検出対象領域として読み取る画像読取手段と、所定の大きさで正規化した前記検出対象領域の画像を、複数のブロックに分割して、当該ブロック毎に所定の画像特性を示す画像特徴量の代表値を算出し、当該代表値に基づき前記検出対象領域内における当該画像特性の特徴を示す特徴ベクトルを生成する特徴ベクトル生成手段と、前記特徴ベクトルから、周期関数により写像された写像値を推定する推定手段と、前記写像値を逆写像して、顔の回転角度を算出する回転角度算出手段として機能させることを特徴とする。
上記プログラムによれば、前記請求項1のオブジェクトの回転角度検出装置と同様の効果を奏するプログラムが実現できる。
上記した課題を解決するために、本発明の顔の回転角度検出方法は、画像中の顔の回転角度を検出する顔の回転角度検出方法であって、推定を行う推定手段が、画像特性の特徴を示す特徴ベクトルと、前記顔の回転角度を周期関数で写像した写像値とを関連付けて学習する学習工程と、前記学習工程で学習した前記推定手段が、前記特徴ベクトルから前記写像値を推定して、前記写像値を逆写像することで前記顔の回転角度を求める検出工程とを備えることを特徴とする。
また、本発明の顔の回転角度検出方法では、前記学習工程は、前記顔を含む画像を読取る工程と、前記顔から抽出した画像特徴量に基づいて特徴ベクトルを生成する工程と、前記顔の回転角度を周期関数で写像して写像値を算出する工程と、前記特徴ベクトルと前記写像値とを関連付けて学習する工程とを備えることが好ましい。
更に、本発明の顔の回転角度検出方法では、前記検出工程は、前記顔を含む画像を読取る工程と、前記顔から抽出した画像特徴量に基づいて特徴ベクトルを生成する工程と、前記特徴ベクトルから、周期関数により写像された写像値を推定する工程と、前記写像値を逆写像して顔の回転角度を算出する工程と、少なくとも2つ以上の周期関数から算出したそれぞれの前記回転角度の中から、前記周期関数と、前記回転角度の数値とに応じて、顔の回転角度を規定する工程とを備えることが好ましい。
上記方法によれば、前記請求項1のオブジェクトの回転角度検出装置と同様の効果を奏する。
以下、本発明の実施形態について、オブジェクトの回転角度検出装置の一例として、人物の顔画像の回転角度を検出する顔の回転角度検出装置を用いて説明する。
(A.装置の構成)
以下、本発明を実施するための最良の形態を添付図面を参照しながら詳述する。
図1は、本発明に係る顔の回転角度検出装置1の実施の一形態の構成を示すブロック図である。また、図2は、画像80中の顔86の回転角度(θ)を示す図である。
図1に示すように、この顔の回転角度検出装置1は、画像80を読み取るための画像読取手段10と、複数のブロックに分割した画像の特徴ベクトルを生成する特徴ベクトル生成手段30と、顔86の回転角度を周期関数で写像して写像値を算出する回転角度写像手段40と、この特徴ベクトルに基づいて、周期関数により写像された写像値を推定するSVM(サポートベクタマシーン)から成る推定手段50と、写像値を逆写像して、顔86の回転角度を算出する回転角度算出手段60と、周期関数と当該周期関数に基づいて算出した回転角度との組合わせの中から、適切な回転角度を規定する回転角度規定手段70とから主に構成されている。
画像読取手段10は、具体的には、デジタルスチルカメラやデジタルビデオカメラ等のCCD(Charge Coupled Device:電荷結合素子)カメラやビジコンカメラ、イメージスキャナ等であり、読み込んだ画像80内の所定の領域をA/D変換して、そのデジタルデータを特徴ベクトル生成手段30へ送る機能を提供する。
特徴ベクトル生成手段30は、画像読取手段10で読み取った画像を所定の大きさに正規化する正規化部31と、正規化された画像の画像特性を数値化して算出する画像特性算出部32と、画素領域を所定の大きさで複数のブロックに分割して、数値化された数値の平均値または分散値を算出する平均・分散値算出部38とを備える。また、この画像特性算出部32は、画像中の輝度を算出する輝度算出部34と、画像中のエッジの強度を算出するエッジ強度算出部36とを備える。そして、これらの機能部により、画像80の画像特性を示す特徴ベクトルが生成される。
この中で、正規化部31は、画像80の大きさを所定の大きさ(例えば、24×24ピクセル)に正規化する。ここで、正規化する方法としては、画像ピクセル間の補間方法であるバイリニア法やバイキュービック法を採用できる。また、特徴ベクトル生成手段30を構成する他の機能の詳細は、後述する。
回転角度写像手段40は、後述するSVM50の学習工程において、画像80中の顔86の回転角度を、周期関数で写像して写像値を算出する。ここで、周期関数は、三角関数である正弦関数(Sin)や余弦関数(Cos)を採用する。
ここで、識別手段としてのSVM50について詳述する。このSVM50は、1995年にAT&TのV.Vapnikによって統計的学習理論の枠組みで提案され、マージンという指標を用いて全ての2クラスの入力データを線形分離するのに最適な超平面を求めることができる学習機械のことであり、パターン認識の能力において最も優秀な学習モデルの一つであることが知られている。また、線形分離不可能な場合でもカーネルトリックというテクニックを用いることにより、高い推定能力を発揮できることが知られている。
そして、このSVM50を用いてサポートベクタ回帰を行うことで、顔86の回転角度を推定する。このサポートベクタ回帰とは、「A Tutorial on Support Vector Regression」(A.J.Smola & B.SscOlkopfシェルコプフ,NeuroCOLT Technical Report Series, NeuroCOLT2 Technical Report Series,NC2-TR-1998-030,Octorber,1998 http://www.neurocolt.com)に記述され、下記の式で示される。
ここで、xは特徴ベクトル、xiはサポートベクトルであり、特徴ベクトル生成手段30で生成された値を用いる。また、Kはカーネル関数であり、一般には、多項式やガウス関数が用いられる。本実施の形態では、非線形関数であるRBF関数を適用する。更に、νiは重み係数であり、bはバイアス項である。上記した式の値(f)は、サポートベクタ回帰で推定する回転角度の写像値を示す。
また、このSVM50は、次の2つの工程において、それぞれ異なる処理を行う。
(1)特徴ベクトルと写像値とを関連付けることで学習する学習工程
(2)学習に基づいて、特徴ベクトルから写像値を推定する推定工程
これらの工程における処理の詳細については、後述する。
回転角度算出手段60は、SVM50の推定工程において、SVM50が推定した写像値に対して、逆写像を行い回転角度を算出する。この逆写像で用いる関数は、SVM50の学習工程において、回転角度写像手段40で用いた周期関数に対して逆写像を行う関数を採用する。例えば、周期関数として、正弦関数(Sin)を用いた場合、逆写像関数は、逆正弦関数(ArcSin)を採用する。また、周期関数として、余弦関数(Cos)を用いた場合、逆写像関数は、逆余弦関数(ArcCos)を採用する。
回転角度規定手段70は、SVM50の推定工程において、周期関数として正弦関数(Sin)を用いた場合に回転角度算出手段60で算出した回転角度と、周期関数として余弦関数(Cos)を用いた場合に回転角度算出手段60で算出した回転角度との中から、それぞれの周期関数と回転角度の値とに基づいて、より適切な値と推測できる方の回転角度を規定する。
次に、図3は、この顔の回転角度検出装置1のハードウェア構成を示す図である。この図に示すように、各種制御や演算処理を担う中央演算処理装置であるCPU(Central Processing Unit)24と、主記憶装置(Main Storage)に用いられるRAM(Random Access Memory)23と、読み出し専用の記憶装置であるROM(Read Only Memory)22と、ハードディスクドライブ装置(HDD)や半導体メモリ等の補助記憶装置(Secondary Storage)25、及びモニタ(LCD(液晶ディスプレイ)やCRT(陰極線管))等からなる出力装置27、イメージスキャナやキーボード、マウス、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の撮像センサ等からなる入力装置26と、これらの入出力インターフェース(I/F)21等との間を、PCI(Peripheral Component Interconnect)バスやISA(Industrial Standard Architecture;アイサ)バスやUSB(Universal Serial Bus)バス等からなるプロセッサバス、メモリバス、システムバス、入出力バス等の各種のバス20によってバス接続されたものである。
そして、例えば、CD−ROMやDVD−ROM等の記憶媒体、あるいは通信ネットワーク(LAN,WAN,インターネット等)28を介して供給される各種制御用プログラムやデータを補助記憶装置25等にインストールすると共に、そのプログラムやデータを必要に応じてRAM23にロードし、そのRAM23にロードされたプログラムに従ってCPU24が各種リソースを駆使して所定の制御及び演算処理を行い、その処理結果(処理データ)をバス20を介して出力装置27に出力して表示すると共に、そのデータを必要に応じて補助記憶装置25によって形成されるデータベースに適宜記憶、保存(更新)処理する。
尚、この顔の回転角度検出装置1を構成する画像読取手段10、特徴ベクトル生成手段30、回転角度写像手段40、SVM50、回転角度算出手段60および回転角度規定手段70等は、実際には、CPU24やRAM23等からなるハードウェア資源と、ROM22や補助記憶装置25に記憶されたソフトウェアとが有機的に協働することにより、それぞれの機能を実現している。
(B.SVMの学習工程)
次に、SVM50による学習工程について説明する。図4は、SVM50に対する学習方法を説明する図である。なお、本実施例である顔の回転角度検出装置1では、回転角度写像手段40を2つ備える。即ち、一方の回転角度写像手段42は、周期関数として正弦関数(Sin)を採用する。また、他方の回転角度写像手段44は、周期関数として余弦関数(Cos)を採用する。加えて、SVM50についても2つ備え、一方の推定手段(SVM)52は、周期関数として正弦関数(Sin)を採用した一方の回転角度写像手段42が算出した写像値を学習する。また、他方の推定手段(SVM)54は、周期関数として余弦関数(Cos)を採用した回転角度写像手段44が算出した写像値を学習する。
図5は、SVM50による学習方法の一例を示すフローチャートであり、この図に従って学習工程の流れを説明する。
本実施例における顔の回転角度検出装置1は、学習工程を開始すると、先ず、学習対象画像と、顔の回転角度とを入力する工程を実行する。即ち、顔の回転角度検出装置1は、画像読取手段10により、例えば、イメージスキャナのような入力装置26を介して、学習の対象となる学習顔画像82を入力し、更に、この学習顔画像82の顔の回転角度を、例えば、キーボードのような入力装置26を介して入力する(ステップS100)。
次に、顔の回転角度検出装置1は、特徴ベクトル生成手段により、所定の画像特性を用いて特徴ベクトルを生成する。この特徴ベクトルの生成については、後述する(ステップS102)。
次に、一方の回転角度写像手段42は、正弦関数(Sin)を周期関数として、入力された学習顔画像82の顔の回転角度の写像値を算出する(ステップS104)。
続いて、一方の推定手段(SVM)52は、前記特徴ベクトルと、前記一方の回転角度写像手段42が算出した写像値とを学習する(ステップS106)。
次に、他方の回転角度写像手段44は、余弦関数(Cos)を周期関数として、入力された学習顔画像82の顔の回転角度の写像値を算出する(ステップS108)。
続いて、他方の推定手段(SVM)54は、前記特徴ベクトルと、前記他方の回転角度写像手段44が算出した写像値とを学習する(ステップS110)。
そして、両方のSVM52,54が正しく学習できたか、否かの学習結果92を、例えば、モニターのような出力装置27に出力して学習工程を終了する。
なお、前記学習工程で用いた学習対象画像を回転させることで、顔の回転角度を変化させ、再度、前記学習工程で学習を行う動作を反復することもできる。
次に、所定の画像特性で特徴ベクトルを生成する方法について説明する。図6は、画像特徴ベクトルの生成を示すフローチャートである。この画像特徴ベクトルの生成処理が開始されると、先ず、顔の回転角度検出装置1は、正規化部31により、検出対象領域の大きさを所定のサイズ、例えば24×24画素に正規化(リサイズ)する。(ステップS120)。
次に、顔の回転角度検出装置1は、画像特性はエッジ強度を採用するか否かを判断する(ステップS122)。ここで、画像特性としてエッジ強度を採用するか、または画素の輝度を採用するかについては、画像特徴ベクトルの生成処理が開始される前に、予め決定されている。
前記決定に従い、画像特性はエッジ強度を採用すると判断された場合(ステップS122でYes)、顔の回転角度検出装置1は、エッジ強度算出部36により画像特徴量として、検出対象領域の画像のエッジ強度を算出する(ステップS124)。その後、次の工程(ステップS128)に進む。
尚、このエッジを検出する方法としては、図7に示すような差分型エッジ検出オペレータの1つである「Sobelのオペレータ」を適用できる。図7(a)に示すオペレータ(フィルタ)は、2行2列目の注目画素を囲む8つの画素値のうち、左列及び右列に位置するそれぞれ3つの画素値を調整することで横方向のエッジを強調し、図7(b)に示すオペレータは、2行2列目の注目画素を囲む8つの画素値のうち、上行及び下列に位置するそれぞれ3つの画素値を調整して縦方向のエッジを強調することで縦横のエッジを検出するものである。
そして、このようなオペレータで生成した結果を二乗和した後、平方根をとることでエッジの強度を求め、各画素におけるエッジの強さ、又はエッジの分散値を生成することにより、画像特徴ベクトルを精度良く検出することができる事が知られている。
また、前記決定に従い、画像特性はエッジ強度を採用すると判断されない場合(ステップS122でNo)、顔の回転角度検出装置1は、輝度算出部34により画像特徴量として、検出対象領域の画素の輝度を算出する(ステップS126)。その後、次の工程(ステップS128)に進む。
顔の回転角度検出装置1は、検出対象領域内を複数のブロックに分割する(ステップS128)。
なお、ブロックの分割画素は、本実施例においては、4×3ピクセルの大きさのブロックで分割している。
次に、顔の回転角度検出装置1は、平均・分散値算出部38において、平均値を採用するか否かを判断する(ステップS130)。ここで、代表値として、平均値を採用するか、または分散値を採用するかについては、画像特徴ベクトルの生成処理が開始される前に、予め決定されている。
前記決定に従い、平均値を採用すると判断された場合(ステップS130でYes)、各ブロック内の画像特徴量の平均値を算出して(ステップS132)、画像特徴ベクトルの生成処理を終了する。
また、前記決定に従い、平均値を採用すると判断されない場合(ステップS130でNo)、各ブロック内の画像特徴量の分散値を算出して(ステップS134)、画像特徴ベクトルの生成処理を終了する。
(C.SVMによる推定工程)
次に、SVM50による推定工程について説明する。図8は、SVM50による推定方法を説明する図である。なお、本実施例である顔の回転角度検出装置1では、回転角度算出手段60を2つ備える。即ち、一方の回転角度算出手段62は、前記一方の推定手段(SVM)52が推定した写像値を逆写像して回転角度を算出する。また、他方の回転角度算出手段64は、前記他方の推定手段(SVM)54が推定した写像値を逆写像して回転角度を算出する。
ここで、前記一方の推定手段(SVM)52は、学習工程において、正弦関数(Sin)を用いて算出した写像値を学習しているため、一方の回転角度算出手段62は、逆写像関数として、逆正弦関数(ArcSin)を採用する。同様に、前記他方の推定手段(SVM)54は、学習工程において、余弦関数(Cos)を用いて算出した写像値を学習しているため、他方の回転角度算出手段64は、逆写像関数として、逆余弦関数(ArcCos)を採用する。
図9は、SVM50による推定方法の一例を示すフローチャートであり、この図に従って推定工程の流れを説明する。
本実施例における顔の回転角度検出装置1は、推定工程を開始すると、先ず、顔の回転角度を検出する検出対象画像84を入力する工程を実行する。即ち、顔の回転角度検出装置1は、画像読取手段10により、例えば、イメージスキャナのような入力装置26を介して、検出対象画像84を入力する(ステップS140)。
次に、顔の回転角度検出装置1は、特徴ベクトル生成手段により、所定の画像特性を用いて特徴ベクトルを生成する(ステップS142)。
次に、顔の回転角度検出装置1は、一方の推定手段(SVM)52により、学習工程における学習に基づいて、特徴ベクトルから正弦関数(Sin)を周期関数とする写像値を推定する(ステップS144)。
続いて、顔の回転角度検出装置1は、一方の回転角度算出手段62により、写像値を逆正弦関数(ArcSin)で逆写像することで、一方の回転角度を算出する(ステップS146)。
次に、顔の回転角度検出装置1は、他方の推定手段(SVM)54により、学習工程における学習に基づいて、特徴ベクトルから余弦関数(Cos)を周期関数とする写像値を推定する(ステップS148)。
続いて、顔の回転角度検出装置1は、他方の回転角度算出手段64により、写像値を逆余弦関数(ArcCos)で逆写像することで、他方の回転角度を算出する(ステップS150)。
次に、顔の回転角度検出装置1は、一方の回転角度算出手段62で算出した回転角度と、他方の回転角度算出手段64で算出した回転角度との中から、より適切な値と推測できる方の回転角度を規定する(ステップS152)。
ここで、適切な回転角度を規定する方法について説明する。図10は、回転角度の数値による周期関数の誤差を示す図である。この図によると、周期関数として正弦関数(Sin)を使用した場合と、余弦関数(Cos)を使用した場合とでは、回転角度の値に依り、推定される誤差の分布が異なる。従って、推定される誤差がより少ない方の周期関数を回転角度の値により選定して、選定した周期関数が示す回転角度を、顔の回転角度検出装置1が示す回転角度94として結果出力90する。例えば、一方の回転角度算出手段62で算出した回転角度と、他方の回転角度算出手段64で算出した回転角度とが共に45度から135度の範囲、または、225度から315度の範囲であれば、逆余弦関数(ArcCos)で逆写像した他方の回転角度算出手段64が算出した角度を採用する。また、上記角度以外の範囲であれば、逆正弦関数(ArcSin)で逆写像した他方の回転角度算出手段64が算出した角度を採用する。
以上、顔の回転角度検出装置1を上述した方法で用いることにより、顔の回転角度を取得できる。そして、取得した顔の回転角度は、図示を略すが、回転装置等に送信される。この回転装置等の近傍には、ニューラルネットやSVM等によるパターン認識装置が更に設置され、このパターン認識装置が検出対象画像84の顔をパターン認識できるように、回転装置等は、検出対象画像84を顔の回転角度を小さくする方向に回転させる。
以上述べたような実施例によれば、次のような効果がある。
(1)検出対象領域内のエッジ強度や画素の輝度等の画像特性を示す画像特徴量から生成した特徴ベクトルを用いて、回転角度との組み合わせを予め学習し、学習を基に推測して回転角度を算出するため、顔の向きや照明などの影響を受け難い。
(2)周期関数として使用する正弦関数(Sin)および余弦関数(Cos)、ならびに、これらの逆関数は、種々の分野で多様される関数であるため、市販のソフトウェア等により、容易かつ高精度に近似計算できる。
以上、本発明を図示した実施形態に基づいて説明したが、本発明は、これに限定されるものではなく、以下に述べるような変形例も想定できる。
(1)本発明では、検出対象画像として、人間の顔全体の画像を対象としたが、これに限らず、人間の顔や体の特定の部位、あるいは、人間に限らない動物の顔の識別にも適用できる。
(2)エッジの強度を求める方法として、「Sobelのオペレータ」を採用したが、これに限らず、「Roberts」や「Prewitt」等のオペレータも採用できる。
本発明に係る顔の回転角度検出装置の実施の一形態を示すブロック図。 画像中の顔の回転角度を示す図。 顔の回転角度検出装置のハードウェア構成を示す図。 SVMに対する学習方法を説明する図。 SVMによる学習方法の流れを示すフローチャート。 画像特徴ベクトルの生成を示すフローチャート。 Sobelのフィルタの形状を示す図。 SVMによる推定方法を説明する図。 SVMによる推定方法の流れを示すフローチャート。 回転角度の数値による周期関数の誤差を示す図。
符号の説明
1…顔の回転角度検出装置、10…画像読取手段、20…バス、22…ROM、23…RAM、24…CPU、25…補助記憶装置、26…入力装置、27…出力装置、30…特徴ベクトル生成手段、31…正規化部、32…画像特性算出部、34…輝度算出部、36…エッジ強度算出部、38…平均・分散値算出部、40,42,44…回転角度写像手段、50,52,54…推定手段(SVM)、60,62,64…回転角度算出手段、70…回転角度規定手段、80…画像、82…学習顔画像、84…検出対象画像、86…顔、90…結果出力、92…学習結果、94…回転角度。

Claims (14)

  1. 画像中のオブジェクトの回転角度を検出するオブジェクトの回転角度検出装置であって、
    前記画像の所定の領域を検出対象領域として読み取る画像読取手段と、
    所定の大きさで正規化した前記検出対象領域の画像を、複数のブロックに分割して、当該ブロック毎に所定の画像特性を示す画像特徴量の代表値を算出し、当該代表値に基づき前記検出対象領域内における当該画像特性の特徴を示す特徴ベクトルを生成する特徴ベクトル生成手段と、
    前記特徴ベクトルから、周期関数により写像された写像値を推定する推定手段と、
    前記写像値を逆写像して、オブジェクトの回転角度を算出する回転角度算出手段とを備えることを特徴とするオブジェクトの回転角度検出装置。
  2. 請求項1に記載のオブジェクトの回転角度検出装置において、
    前記オブジェクトの回転角度検出装置は、前記回転角度を周期関数で写像して写像値を算出する回転角度写像手段を更に備え、
    前記推定手段は、前記特徴ベクトルと、前記特徴ベクトルに対応する前記写像値との関係の学習に基づいて推定することを特徴とするオブジェクトの回転角度検出装置。
  3. 請求項2に記載のオブジェクトの回転角度検出装置において、
    前記回転角度写像手段は、少なくとも2つ以上の異なる周期関数から、それぞれ写像値を算出し、
    前記回転角度算出手段は、それぞれの周期関数に応じたオブジェクトの回転角度を、前記写像値から算出することを特徴とするオブジェクトの回転角度検出装置。
  4. 請求項1乃至3のいずれか1項に記載のオブジェクトの回転角度検出装置において、
    前記オブジェクトの回転角度検出装置は、
    前記周期関数と、前記周期関数に基づいて算出した前記回転角度との組合わせの中から、前記回転角度を所定の規則で規定する回転角度規定手段を更に備えることを特徴とするオブジェクトの回転角度検出装置。
  5. 請求項1乃至4のいずれか1項に記載のオブジェクトの回転角度検出装置において、
    前記推定手段は、サポートベクタ回帰を行う非線型のカーネル関数から成ることを特徴とするオブジェクトの回転角度検出装置。
  6. 請求項1乃至5のいずれか1項に記載のオブジェクトの回転角度検出装置において、
    前記特徴ベクトル生成手段は、
    前記検出対象領域内の画像を所定の大きさで正規化する正規化部と、
    前記画像を前記所定の画像特性で数値化して算出する画像特性算出部と、
    前記検出対象領域を複数のブロックに分割して、前記数値化された数値の平均値又は分散値を当該ブロック毎に算出する平均・分散値算出部とを備えることを特徴とするオブジェクトの回転角度検出装置。
  7. 請求項1乃至6のいずれか1項に記載のオブジェクトの回転角度検出装置において、
    前記画像特性算出部は、前記検出対象領域内の画像を構成する各画素における輝度値を算出する輝度算出部を備えることを特徴とするオブジェクトの回転角度検出装置。
  8. 請求項1乃至7のいずれか1項に記載のオブジェクトの回転角度検出装置において、
    前記画像特性算出部は、前記検出対象領域内のエッジの強度を算出するエッジ強度算出部を備えることを特徴とするオブジェクトの回転角度検出装置。
  9. 請求項8に記載のオブジェクトの回転角度検出装置において、
    前記エッジの強度は、前記検出対象領域内の画像を構成する各画素におけるSobelのオペレータを用いて算出されることを特徴とするオブジェクトの回転角度検出装置。
  10. 請求項1乃至9のいずれかに記載のオブジェクトの回転角度検出装置において、
    前記オブジェクトは、顔であることを特徴とするオブジェクトの回転角度検出装置。
  11. 画像中における顔の回転角度を検出する顔の回転角度検出プログラムであって、
    コンピュータを、
    前記画像の所定の領域を検出対象領域として読み取る画像読取手段と、
    所定の大きさで正規化した前記検出対象領域の画像を、複数のブロックに分割して、当該ブロック毎に所定の画像特性を示す画像特徴量の代表値を算出し、当該代表値に基づき前記検出対象領域内における当該画像特性の特徴を示す特徴ベクトルを生成する特徴ベクトル生成手段と、
    前記特徴ベクトルから、周期関数により写像された写像値を推定する推定手段と、
    前記写像値を逆写像して、顔の回転角度を算出する回転角度算出手段として機能させることを特徴とする顔の回転角度検出プログラム。
  12. 画像中の顔の回転角度を検出する顔の回転角度検出方法であって、
    推定を行う推定手段が、画像特性の特徴を示す特徴ベクトルと、前記顔の回転角度を周期関数で写像した写像値とを関連付けて学習する学習工程と、
    前記学習工程で学習した前記推定手段が、前記特徴ベクトルから前記写像値を推定して、前記写像値を逆写像することで前記顔の回転角度を求める検出工程とを備えることを特徴とする顔の回転角度検出方法。
  13. 請求項12に記載の顔の回転角度検出方法において、
    前記学習工程は、
    前記顔を含む画像を読取る工程と、
    前記顔から抽出した画像特徴量に基づいて特徴ベクトルを生成する工程と、
    前記顔の回転角度を周期関数で写像して写像値を算出する工程と、
    前記特徴ベクトルと前記写像値とを関連付けて学習する工程とを備えることを特徴とする顔の回転角度検出方法。
  14. 請求項12乃至13のいずれかに記載の顔の回転角度検出方法において、
    前記検出工程は、
    前記顔を含む画像を読取る工程と、
    前記顔から抽出した画像特徴量に基づいて特徴ベクトルを生成する工程と、
    前記特徴ベクトルから、周期関数により写像された写像値を推定する工程と、
    前記写像値を逆写像して顔の回転角度を算出する工程と、
    少なくとも2つ以上の周期関数から算出したそれぞれの前記回転角度の中から、
    前記周期関数と、前記回転角度の数値とに応じて、顔の回転角度を規定する工程とを備えることを特徴とする顔の回転角度検出方法。

JP2004241932A 2004-08-23 2004-08-23 オブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法 Withdrawn JP2006059215A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004241932A JP2006059215A (ja) 2004-08-23 2004-08-23 オブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004241932A JP2006059215A (ja) 2004-08-23 2004-08-23 オブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法

Publications (1)

Publication Number Publication Date
JP2006059215A true JP2006059215A (ja) 2006-03-02

Family

ID=36106623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004241932A Withdrawn JP2006059215A (ja) 2004-08-23 2004-08-23 オブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法

Country Status (1)

Country Link
JP (1) JP2006059215A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008033823A (ja) * 2006-07-31 2008-02-14 Casio Comput Co Ltd グラフ表示装置及びグラフ表示処理プログラム
US7995866B2 (en) 2006-10-11 2011-08-09 Seiko Epson Corporation Rotation angle detection apparatus, and control method and control program of rotation angle detection apparatus
KR101842546B1 (ko) * 2011-12-14 2018-03-28 한국전자통신연구원 실감 효과 검출 장치 및 방법
CN113642368A (zh) * 2020-05-11 2021-11-12 杭州海康威视数字技术股份有限公司 人脸姿态的确定方法、装置、设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008033823A (ja) * 2006-07-31 2008-02-14 Casio Comput Co Ltd グラフ表示装置及びグラフ表示処理プログラム
US7995866B2 (en) 2006-10-11 2011-08-09 Seiko Epson Corporation Rotation angle detection apparatus, and control method and control program of rotation angle detection apparatus
KR101842546B1 (ko) * 2011-12-14 2018-03-28 한국전자통신연구원 실감 효과 검출 장치 및 방법
CN113642368A (zh) * 2020-05-11 2021-11-12 杭州海康威视数字技术股份有限公司 人脸姿态的确定方法、装置、设备及存储介质
CN113642368B (zh) * 2020-05-11 2023-08-18 杭州海康威视数字技术股份有限公司 人脸姿态的确定方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110619628B (zh) 一种人脸图像质量评估方法
JP2006048322A (ja) オブジェクト画像検出装置、顔画像検出プログラムおよび顔画像検出方法
JP5836095B2 (ja) 画像処理装置、画像処理方法
JP4364275B2 (ja) 画像処理方法、画像処理装置及びコンピュータプログラム
EP1710747A1 (en) Method for extracting person candidate area in image, person candidate area extraction system, person candidate area extraction program, method for judging top and bottom of person image, system for judging top and bottom, and program for judging top and bottom
US20030108225A1 (en) System and method for effectively extracting facial feature information
JP2005190400A (ja) 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム
JP5975598B2 (ja) 画像処理装置、画像処理方法及びプログラム
US7415140B2 (en) Method of correcting deviation of detection position for human face, correction system, and correction program
JP2005165984A (ja) 人物顔の頭頂部検出方法及び頭頂部検出システム並びに頭頂部検出プログラム
US11462052B2 (en) Image processing device, image processing method, and recording medium
JP5201184B2 (ja) 画像処理装置及びプログラム
WO2005041128A1 (ja) 顔画像候補領域検索方法及び顔画像候補領域検索システム並びに顔画像候補領域検索プログラム
JP4305000B2 (ja) 画像処理方法、画像処理装置、記憶媒体及びプログラム
JP2009212929A (ja) 画像トリミング範囲の評価方法、装置およびプログラム
JP6798609B2 (ja) 映像解析装置、映像解析方法およびプログラム
EP2927869A2 (en) Movement amount estimation device, movement amount estimation method, and movement amount estimation program
JP2006059215A (ja) オブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法
JP2007188407A (ja) 画像処理装置及び画像処理プログラム
JP2007026308A (ja) 画像処理方法、画像処理装置
JP2005165983A (ja) 人物顔のあご検出方法及びあご検出システム並びにあご検出プログラム
JP2007219899A (ja) 個人識別装置、個人識別方法および個人識別プログラム
US10803564B2 (en) Image processing apparatus, program, and radiation imaging apparatus
WO2019155570A1 (ja) 視線推定装置、視線推定方法、および記録媒体
JP7255721B2 (ja) 視線推定装置、視線推定方法、およびプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070403

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071106