JP2008305342A - 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム - Google Patents

画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム Download PDF

Info

Publication number
JP2008305342A
JP2008305342A JP2007154386A JP2007154386A JP2008305342A JP 2008305342 A JP2008305342 A JP 2008305342A JP 2007154386 A JP2007154386 A JP 2007154386A JP 2007154386 A JP2007154386 A JP 2007154386A JP 2008305342 A JP2008305342 A JP 2008305342A
Authority
JP
Japan
Prior art keywords
image
face
face image
evaluation information
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007154386A
Other languages
English (en)
Other versions
JP4434236B2 (ja
Inventor
Kaname Ogawa
要 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007154386A priority Critical patent/JP4434236B2/ja
Priority to US12/104,036 priority patent/US8085996B2/en
Priority to TW097116649A priority patent/TW200917160A/zh
Priority to CNA200810100456XA priority patent/CN101324954A/zh
Publication of JP2008305342A publication Critical patent/JP2008305342A/ja
Application granted granted Critical
Publication of JP4434236B2 publication Critical patent/JP4434236B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • G06V40/175Static expression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Abstract

【課題】画像に含まれる顔に関する複数の属性情報を効率的に作成する。
【解決手段】辞書記憶部230には、正規化画像における2つの位置と、閾値と、重みの値との組合せを複数含む判定用辞書(正規化成否判定用辞書を含む)を複数記憶する。正規化部140は、入力画像から検出された顔画像を所定の解像度となるように正規化する。画像判定部170は、1つの判定用辞書に含まれる各組合せについて、2つの位置に対応する正規化顔画像における輝度の差を算出し、この算出された差の値と閾値とを比較する。そして、この比較結果から、各組合せに係る重みの値を加算または減算することによって、その判定用辞書に係る合計値を算出し、この合計値に基づいて、顔画像がその判定用辞書に係る目的の画像であるか否かを判定する。この判定結果を属性情報として属性情報記憶部240に記憶する。
【選択図】図1

Description

本発明は、画像処理装置に関し、特に、画像に含まれる対象物を検出する画像処理装置、画像表示装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラムに関する。
近年、デジタルビデオカメラやデジタルスチルカメラ等の撮像装置が普及している。また、これらの撮像装置により撮影された画像に含まれる人物の顔を検出し、この検出された顔に関する各種の属性情報を作成しておき、検出された顔を表示する際に、その属性情報を用いて各種の表示をすることが可能な画像処理装置が存在する。
例えば、検出された顔について、男女判定や笑顔/非笑顔判定等の判定を行い、これらの判定結果に基づいて、検出された顔に関する各種の属性情報を作成することができる。そして、検出された複数の顔を表示する場合に、例えば、性別に関する属性情報を用いて女性のみの顔の一覧を表示させることができる。
このように、検出された顔に関する各種の属性情報を作成する場合には、各属性情報の精度を高めるため、精度の高い顔画像を検出することが重要である。
そこで、例えば、入力画像から顔候補を検出して、この顔候補とされた顔との想定距離と、その顔との測定距離との差等の条件に基づいて、検出された顔候補の中から非顔候補を検出し、顔候補から非顔候補を排除する対象物検出装置が提案されている(例えば、特許文献1参照。)。
特開2005−78376号公報(図1)
上述の従来技術によれば、入力画像から顔以外のものが顔候補として誤って検出された場合でも、顔候補から非顔候補を排除するため、顔の誤検出を低減させることができる。このため、精度の高い顔画像に基づいて顔に関する属性情報を作成することができる。
ここで、検出された顔に関する複数の属性情報を作成する場合には、例えば、男女判定や笑顔/非笑顔判定等のように複数種類の判定について、それぞれの判定に応じた処理が独立して実行され、これらの判定結果に基づいて複数の属性情報が作成される。このため、顔に関する複数の属性情報を作成する場合には、装置が複雑になるとともに、属性情報の作成時間が長くなる。
そこで、本発明は、画像に含まれる顔に関する複数の属性情報を効率的に作成することを目的とする。
本発明は、上記課題を解決するためになされたものであり、その第1の側面は、対象となる画像が目的の画像であるか否かを判定するための評価情報を複数記憶する評価情報記憶手段と、画像を入力する画像入力手段と、上記入力された画像に含まれる顔を検出する顔検出手段と、上記検出された顔の周辺画像である顔画像が所定の解像度となるように当該顔画像を正規化する正規化手段と、上記正規化された顔画像の特徴量を抽出する特徴量抽出手段と、上記抽出された顔画像における特徴量と上記評価情報とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを上記評価情報記憶手段に記憶されている評価情報毎に判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する属性情報作成手段とを具備することを特徴とする画像処理装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、入力された画像から検出された顔の周辺画像(顔画像)を正規化して、この正規化された顔画像における特徴量と、評価情報とに基づいて、その顔画像が目的の画像であるか否かを評価情報毎に判定して、この判定結果を顔に関する属性情報として作成するという作用をもたらす。
また、この第1の側面において、上記評価情報は、対象となる画像における位置と閾値との組合せを含み、上記属性情報作成手段は、上記評価情報に含まれる位置に対応する上記正規化された顔画像の特徴量の値と当該位置に係る閾値とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを判定することができる。これにより、評価情報に含まれる位置に対応する特徴量の値と、その位置に係る閾値とに基づいて、顔画像が目的の画像であるか否かを判定するという作用をもたらす。
また、この第1の側面において、上記評価情報は、対象となる画像における2つの位置と閾値との組合せを含み、上記属性情報作成手段は、上記評価情報に含まれる1つの組合せに係る2つの位置に対応する上記正規化された顔画像の特徴量の差を算出して当該算出された差の値と当該組合せに係る閾値とを比較した結果に基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを判定することができる。これにより、評価情報に含まれる1つの組合せに係る2つの位置に対応する特徴量の差を算出し、この算出された差の値と、その組合せに係る閾値とを比較した結果に基づいて、顔画像が目的の画像であるか否かを判定するという作用をもたらす。
また、この第1の側面において、上記評価情報は、対象となる画像における2つの位置と閾値との組合せを複数含み、上記属性情報作成手段は、上記評価情報に含まれる複数の組合せのうちの1つの組合せに係る2つの位置に対応する上記正規化された顔画像の特徴量の差を算出して当該算出された差の値と当該組合せに係る閾値とを上記評価情報に含まれる組合せ毎に比較して当該比較された結果に基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを判定することができる。これにより、評価情報に含まれる1つの組合せに係る2つの位置に対応する特徴量の差を算出し、この算出された差の値と、その組合せに係る閾値とを組合せ毎に比較して、この比較された結果に基づいて、顔画像が目的の画像であるか否かを判定するという作用をもたらす。
また、この第1の側面において、上記評価情報は、対象となる画像における2つの位置と閾値と重みの値との組合せを複数含み、上記属性情報作成手段は、上記評価情報に含まれる複数の組合せのうちの1つの組合せに係る2つの位置に対応する上記正規化された顔画像の特徴量の差を算出して当該算出された差の値と当該組合せに係る閾値とを比較して当該比較された結果に基づいて当該組合せに係る重みの値を加算または減算することにより当該評価情報に含まれる複数の組合せに係る合計値を算出して当該合計値に基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを判定することができる。これにより、評価情報に含まれる1つの組合せに係る2つの位置に対応する特徴量の差を算出し、この算出された差の値と、その組合せに係る閾値とを比較して、この比較された結果に基づいて、その組合せに係る重みの値を加算または減算することによってその評価情報に含まれる複数の組合せに係る合計値を算出し、この合計値に基づいて、顔画像が目的の画像であるか否かを判定するという作用をもたらす。
また、この第1の側面において、上記特徴量抽出手段は、上記正規化された顔画像の特徴量として輝度を抽出することができる。これにより、正規化された顔画像の特徴量として輝度を抽出するという作用をもたらす。
また、この第1の側面において、上記評価情報記憶手段に記憶されている複数の評価情報のうちの少なくとも1つは、上記正規化された顔画像に関する正規化の成否を判定するための正規化成否判定情報であり、上記属性情報作成手段は、上記正規化された顔画像について上記評価情報記憶手段に記憶されている正規化成否判定情報を用いて当該顔画像に関する正規化の成否を判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成することができる。これにより、正規化成否判定情報を用いて、顔画像に関する正規化の成否を判定し、この判定された結果を、その顔に関する属性情報として作成するという作用をもたらす。
また、この第1の側面において、上記属性情報作成手段は、上記正規化された顔画像に関する正規化が失敗であると判定された場合には当該顔画像に含まれる顔に関する他の属性情報の作成を中止することができる。これにより、正規化された顔画像に関する正規化が失敗であると判定された場合には、その顔画像に含まれる顔に関する他の属性情報の作成を中止するという作用をもたらす。
また、この第1の側面において、上記検出された顔に含まれる少なくとも1つの器官を検出する顔器官検出手段をさらに具備し、上記正規化手段は、上記顔画像に含まれる顔について検出された器官の位置に基づいて当該顔画像を正規化することができる。これにより、顔に含まれる器官を検出し、この検出された器官の位置に基づいて、顔画像を正規化するという作用をもたらす。
また、この第1の側面において、上記顔器官検出手段は、上記検出された顔に含まれる両目を検出する目検出手段であり、上記正規化手段は、上記顔画像に含まれる顔について検出された両目の位置に基づいて当該顔画像を正規化することができる。これにより、顔に含まれる両目を検出し、この検出された両目の位置に基づいて、顔画像を正規化するという作用をもたらす。
また、この第1の側面において、上記正規化手段は、上記顔画像に含まれる顔について検出された器官の位置に基づいて当該顔画像にアフィン変換を施して当該顔画像を正規化することができる。これにより、顔について検出された器官の位置に基づいて、その顔画像にアフィン変換を施して正規化するという作用をもたらす。
また、この第1の側面において、上記属性情報作成手段により作成される複数の属性情報は、目の位置、目の開閉状態、顔の表情、性別、顔の世代、顔の人種、顔自体の撮影条件、顔の向きに関する情報のうちの少なくとも2つであることができる。これにより、目の位置、目の開閉状態、顔の表情、性別、顔の世代、顔の人種、顔自体の撮影条件、顔の向きに関する情報のうちの少なくとも2つの属性情報を作成するという作用をもたらす。
また、本発明の第2の側面は、対象となる画像が目的の画像であるか否かを判定するための評価情報を複数記憶する評価情報記憶手段と、画像を入力する画像入力手段と、上記入力された画像に含まれる顔を検出する顔検出手段と、上記検出された顔の周辺画像である顔画像を表示する表示手段と、上記顔画像が所定の解像度となるように当該顔画像を正規化する正規化手段と、上記正規化された顔画像の特徴量を抽出する特徴量抽出手段と、上記抽出された顔画像における特徴量と上記評価情報とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを上記評価情報記憶手段に記憶されている評価情報毎に判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する属性情報作成手段と、上記作成された属性情報に基づいて上記表示手段に表示させる上記顔画像の表示に関する制御を行う表示制御手段とを具備することを特徴とする画像表示装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、入力された画像から検出された顔の周辺画像(顔画像)を正規化して、この正規化された顔画像における特徴量と、評価情報とに基づいて、その顔画像が目的の画像であるか否かを評価情報毎に判定して、この判定結果を顔に関する属性情報として作成して、この属性情報に基づいて、顔画像の表示に関する制御を行うという作用をもたらす。
また、本発明の第3の側面は、対象となる画像が目的の画像であるか否かを判定するための評価情報を複数記憶する評価情報記憶手段と、被写体が撮像された画像を入力する画像入力手段と、上記入力された画像に含まれる顔を検出する顔検出手段と、上記検出された顔の周辺画像である顔画像が所定の解像度となるように当該顔画像を正規化する正規化手段と、上記正規化された顔画像の特徴量を抽出する特徴量抽出手段と、上記抽出された顔画像における特徴量と上記評価情報とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを上記評価情報記憶手段に記憶されている評価情報毎に判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する属性情報作成手段とを具備することを特徴とする撮像装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、入力された画像から検出された顔の周辺画像(顔画像)を正規化して、この正規化された顔画像における特徴量と、評価情報とに基づいて、その顔画像が目的の画像であるか否かを評価情報毎に判定して、この判定結果を顔に関する属性情報として作成するという作用をもたらす。
本発明によれば、画像に含まれる顔に関する複数の属性情報を効率的に作成することができるという優れた効果を奏し得る。
次に本発明の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の実施の形態における画像処理装置100の機能構成例を示すブロック図である。この画像処理装置100は、画像入力部110と、顔検出部120と、目検出部130と、正規化部140と、正規化テンプレート保持部145と、操作受付部150と、特徴量抽出部160と、画像判定部170と、表示制御部180と、表示部190と、顔画像記憶部210と、正規化画像記憶部220と、辞書記憶部230と、作業用メモリ231と、属性情報記憶部240とを備える。なお、この画像処理装置100は、例えば、デジタルビデオカメラやデジタルスチルカメラ等で撮影された画像について各種画像処理を施すことが可能なパーソナルコンピュータによって実現することができる。
画像入力部110は、デジタルビデオカメラやデジタルスチルカメラ等で撮影された動画や静止画等の画像を入力する画像入力部であり、入力された画像を顔検出部120に出力する。
顔検出部120は、画像入力部110から入力された画像に含まれる顔を検出する顔検出部であり、検出された顔を含むその周辺画像である顔画像を、目検出部130、正規化部140および顔画像記憶部210に出力する。また、顔検出部120は、画像入力部110から入力された画像に複数の顔が含まれている場合には、この複数の顔を検出する。例えば、図5(a)に示すように、画像400に2人の人物401および402の顔403および404が含まれている場合には、顔403および404が検出され、検出された顔403および404を含む顔画像410および430が目検出部130、正規化部140および顔画像記憶部210に出力される。
目検出部130は、顔検出部120から出力された顔画像に含まれる両目を検出するものであり、検出された両目の顔画像における各位置を正規化部140に出力する。例えば、図5(b)に示す顔画像410に含まれる顔403において、×印411および412で示す目の位置が検出される。
正規化部140は、顔検出部120から出力された顔画像について、目検出部130から出力された顔画像における両目の位置に基づいて正規化を行うものである。また、正規化テンプレート保持部145は、正規化部140が正規化を行う際に用いられるテンプレートである正規化テンプレートを保持するものである。この正規化テンプレートとして、例えば、図2(a)に示すように、顔画像における両目の位置を基準とするテンプレートを用いることができる。すなわち、正規化部140は、目検出部130から出力された顔画像における両目の位置が、正規化テンプレート保持部145に保持されている正規化テンプレートにおける両目の位置と合致するように、顔検出部120から出力された顔画像を解像度変換するとともに、回転処理を施して、その顔画像を正規化する。そして、正規化された顔画像が正規化画像記憶部220に出力されて記憶される。なお、顔画像の正規化および正規化テンプレートについては、図2を参照して詳細に説明する。
操作受付部150は、各種操作キーを備え、これらのキー等から操作入力を受け付けると、受け付けた操作入力の内容を画像判定部170および表示制御部180に出力するものである。例えば、顔に関する属性情報を作成するための指示をする属性情報作成指示キーや、顔画像記憶部210に記憶されている顔画像を表示部190に表示させるための指示をする顔画像表示指示キー等が操作受付部150に設けられる。なお、操作受付部150をタッチパネルとして、表示部190と一体で構成するようにしてもよい。
特徴量抽出部160は、正規化部140により正規化されて正規化画像記憶部220に記憶されている正規化顔画像の特徴量として、各部における輝度を抽出するものであり、抽出された輝度の値を画像判定部170に出力する。
作業用メモリ231は、辞書記憶部230に記憶されている複数の判定用辞書のうちの1つの判定用辞書を記憶する作業用メモリであり、記憶されている判定用辞書の内容を画像判定部170に出力する。なお、辞書記憶部230に記憶されている各判定用辞書については、図3を参照して詳細に説明する。
画像判定部170は、正規化部140により正規化されて正規化画像記憶部220に記憶されている正規化顔画像について、特徴量抽出部160により抽出された輝度の値と、辞書記憶部230に記憶されている各判定用辞書のうちで作業用メモリ231に記憶されている1つの判定用辞書とを用いて判定処理を行い、この判定結果を顔に関する属性情報として属性情報記憶部240に出力するものである。なお、画像判定部170による判定結果により作成された顔に関する属性情報は、図6および図7を参照して詳細に説明する。
表示制御部180は、顔画像を表示部190に表示する旨の操作入力が操作受付部150から受け付けられた場合には、属性情報記憶部240に記憶されている各属性情報を用いて、顔画像記憶部210に記憶されている各顔画像を表示部190に表示させる制御を行う表示制御部である。
表示部190は、表示制御部180の制御に基づいて、顔画像記憶部210に記憶されている各顔画像を表示するものである。
顔画像記憶部210は、顔検出部120から出力された顔画像を記憶する記憶部であり、記憶されている各顔画像を表示制御部180に出力する。
正規化画像記憶部220は、正規化部140から出力された正規化顔画像を記憶する記憶部であり、記憶されている各正規化顔画像を特徴量抽出部160に出力する。
辞書記憶部230は、正規化画像記憶部220に記憶されている正規化顔画像について、画像判定部170による各判定処理を行うための複数の判定用辞書を記憶する記憶部であり、記憶されている各判定用辞書が作業用メモリ231に順次出力される。なお、これらの各判定用辞書については、図3を参照して詳細に説明する。
属性情報記憶部240は、画像判定部170により作成された顔に関する属性情報を記憶する記憶部であり、記憶されている顔に関する属性情報を表示制御部180に出力する。なお、これらの顔に関する属性情報は、図6および図7を参照して詳細に説明する。
図2は、顔画像を正規化する場合における正規化の一例を示す図である。図2(a)は、顔画像を正規化する際に用いられる正規化テンプレート141を示す図であり、図2(b)は、顔検出部120により検出された顔251を含む顔画像250を正規化する場合における遷移を示す図である。正規化テンプレート141は、正規化テンプレート保持部145に保持されて、正規化部140が正規化を行う際に用いられるテンプレートであり、正規化を行う際に基準となる基準位置142および143が規定されている。この例では、目検出部130により検出された顔画像における両目の位置が、正規化テンプレート141における基準位置142および143に合致するように、顔画像の解像度を変換するとともに、顔画像を回転処理する例について説明する。
顔画像250は、画像入力部110に入力された画像から顔検出部120により検出された顔251を含む周辺画像である。また、顔画像250における目の位置252および253が目検出部130により検出されているものとする。なお、本発明の実施の形態では、目における中心位置を目の位置とする場合を例にして説明する。このように、顔画像250における目の位置252および253が検出されている場合には、目の位置252および253が、図2(a)に示す正規化テンプレート141における基準位置142および143に合致するように、アフィン変換などによって変換される。例えば、図2(b)に示すように、顔画像250について解像度変換および回転処理がされると、正規化された顔画像である正規化顔画像260が生成される。正規化顔画像260においては、顔261の目の位置262および263が、図2(a)に示す正規化テンプレート141における基準位置142および143に合致している。また、本発明の実施の形態では、顔画像の解像度を48画素×48画素に変換して、正規化顔画像を生成する場合について説明する。
なお、基準位置としては、顔に含まれる両目以外の他の器官の位置を用いるようにしてもよい。例えば、顔に含まれる鼻を検出して、この鼻の位置に基づいて顔画像を正規化することができる。また、複数の器官の位置を、基準位置として用いるようにしてもよい。例えば、両目および鼻の位置を用いることができる。
図3は、正規化顔画像について各判定処理を行うための複数の判定用辞書を示す図である。これらの判定用辞書は、正規化画像記憶部220に記憶されている正規化顔画像について、画像判定部170による各判定処理を行うための評価情報であり、辞書記憶部230に記憶されている。本発明の実施の形態では、判定用辞書として、正規化成否判定用辞書310と、男女判定用辞書320と、大人/子供判定用辞書330と、笑顔/非笑顔判定用辞書340とを例にして説明する。
各判定用辞書には、正規化画像における2点の位置を示すpix1(x,y)およびpix2(x,y)と、pix1(x,y)の輝度の値およびpix2(x,y)の輝度の値の差の値に関する閾値θと、pix1(x,y)の輝度の値およびpix2(x,y)の輝度の値の差の値と閾値θとの比較結果に基づいて加算または減算される重みαとの組合せがそれぞれt組格納されている。これらの各値は、例えば、アダブースト(AdaBoost)等の機械学習アルゴリズムにより学習されたもののうちで、最も効果的な上位100組の組合せを用いて設定される。このように、各判定用辞書の形式が同一であるため、複数の判定処理を同一のアルゴリズムで行うことができる。なお、図3では、各判定用辞書に関する「pix1(x,y)」、「pix2(x,y)」、「θ」、「α」については、各判定用辞書に応じて異なる表記として示す。例えば、正規化成否判定用辞書310については、「pix1(x,y)」を「pix成否1(x,y)」とし、「pix2(x,y)」を「pix成否2(x,y)」とし、「θ」を「成否θ」とし、「α」を「成否α」として示す。
次に、正規化顔画像について判定用辞書を用いて判定処理をする例について図面を参照して詳細に説明する。
図4は、正規化部140により正規化された顔画像の一例である正規化顔画像350を示す図である。この例では、図4に示す正規化顔画像350の左上隅を原点として、横軸をx軸とし、縦軸をy軸として、正規化顔画像350について正規化成否判定用辞書310(図3に示す)を用いた判定処理をする場合について説明する。例えば、正規化成否判定用辞書310の1行目に格納されているpix成否1(x,y)の値に対応する正規化顔画像350の位置を位置351とし、pix成否2(x,y)の値に対応する正規化顔画像350の位置を位置352とする。また、正規化成否判定用辞書310の2行目に格納されているpix成否1(x,y)の値に対応する正規化顔画像350の位置を位置353とし、pix成否2(x,y)の値に対応する正規化顔画像350の位置を位置354とする。さらに、正規化成否判定用辞書310の3行目に格納されているpix成否1(x,y)の値に対応する正規化顔画像350の位置を位置355とし、pix成否2(x,y)の値に対応する正規化顔画像350の位置を位置356とする。
最初に、判定を行うためのスコアSの値に0がセットされ、正規化成否判定用辞書310の1行目に格納されている各値を用いた演算が行われる。具体的には、正規化成否判定用辞書310の1行目に格納されているpix成否1(x,y)の値に対応する位置351における輝度の値A(1)と、pix成否2(x,y)の値に対応する位置352における輝度の値B(1)とが抽出され、次式を用いて、抽出された各輝度の値の差C(1)が算出される。
C(1)=A(1)−B(1)
続いて、算出された各輝度の差の値C(1)と、正規化成否判定用辞書310の1行目に格納されている閾値である成否θの値とを比較して、算出された値C(1)が成否θの値よりも小さいか否かが判断される。算出された値C(1)が成否θの値よりも小さい場合には、正規化成否判定用辞書310の1行目に格納されている重みである成否αの値をスコアSに加算する。一方、算出された値C(1)が成否θの値よりも小さくない場合には、正規化成否判定用辞書310の1行目に格納されている成否αの値をスコアSから減算する。
続いて、正規化成否判定用辞書310の2行目に格納されている各値を用いて、上述した各演算を繰り返す。具体的には、正規化成否判定用辞書310の2行目に格納されているpix成否1(x,y)の値に対応する位置353における輝度の値A(2)と、pix成否2(x,y)の値に対応する位置354における輝度の値B(2)とが抽出され、次式を用いて、抽出された各輝度の値の差C(2)が算出される。
C(2)=A(2)−B(2)
続いて、算出された各輝度の差の値C(2)と、正規化成否判定用辞書310の2行目に格納されている成否θの値とを比較して、算出された値C(2)が成否θの値よりも小さいか否かが判断される。算出された値C(2)が成否θの値よりも小さい場合には、正規化成否判定用辞書310の2行目に格納されている成否αの値をスコアSに加算する。一方、算出された値C(2)が成否θの値よりも小さくない場合には、正規化成否判定用辞書310の2行目に格納されている成否αの値をスコアSから減算する。
続いて、正規化成否判定用辞書310の3行目以降、t行目までに格納されている各値を順次用いて、上述した各演算を繰り返す。
すなわち、正規化顔画像350について正規化成否判定用辞書310を用いた判定処理をする場合には、正規化成否判定用辞書310の1行目乃至t行目に格納されている各値を順次用いて、式1を用いてC(i)が算出され、算出されたC(i)が式2を満たすか否かが判定される。ここで、変数iは整数であり、1からtの値を示す。
C(i)=A(i)−B(i)……(式1)
C(i)<θ(i) ……(式2)
そして、算出されたC(i)が式2を満たす場合には、α(i)の値がスコアSに加算され、算出されたC(i)が式2を満たさない場合には、α(i)の値がスコアSから減算される。ここで、i行目に格納されているpix成否1(x,y)に対応する輝度の値をA(i)で表し、i行目に格納されているpix成否2(x,y)に対応する輝度の値をB(i)で表し、i行目に格納されている成否θの値をθ(i)で表し、i行目に格納されている成否αの値をα(i)で表す。
そして、正規化成否判定用辞書310のt行目に格納されている各値を用いた各演算が終了した後に、スコアSの値が0よりも大きいか否かが判断される。
例えば、上述の機械学習アルゴリズムによって学習時における正規化判定成功の学習サンプルを正側とし、正規化判定失敗時の学習サンプルを負側として学習した場合において、正規化成否判定用辞書310の1乃至t行目に格納されている各値を用いた各演算の終了後におけるスコアSの値が0よりも大きければ、判定の対象となっている正規化顔画像は目的の画像であると判定される。すなわち、正規化成否判定用辞書310を用いた判定の場合には、判定の対象となっている正規化顔画像は正規化に成功した画像であると判定される。また、他の判定用辞書についても、同様に考えることができる。例えば、男女判定用辞書320を用いた判定において、男判定成功の学習サンプルを正側として学習した場合、スコアSの値が0よりも大きければ、判定の対象となっている正規化顔画像に含まれる顔は男性の顔であると判定される。また、大人/子供判定用辞書330を用いた判定において、大人判定成功の学習サンプルを正側として学習した場合、スコアSの値が0よりも大きければ、判定の対象となっている正規化顔画像に含まれる顔は大人の顔であると判定される。また、笑顔/非笑顔判定用辞書340を用いた判定において、笑顔判定成功の学習サンプルを正側として学習した場合、スコアSの値が0よりも大きければ、判定の対象となっている正規化顔画像に含まれる顔は笑顔であると判定される。
一方、上述の機械学習アルゴリズムによって学習時における判定成功の学習サンプルを正側とし、判定失敗時の学習サンプルを負側として学習した場合において、判定用辞書の1乃至t行目に格納されている各値を用いた各演算の終了後におけるスコアSの値が0よりも大きくなければ、判定の対象となっている正規化顔画像は目的の画像ではないと判定される。例えば、正規化成否判定用辞書310を用いた判定において、正規化判定成功の学習サンプルを正側として学習した場合、スコアSの値が0よりも大きくなければ、判定の対象となっている正規化顔画像は正規化に失敗した画像であると判定される。また、男女判定用辞書320を用いた判定において、男判定成功の学習サンプルを正側として学習した場合、スコアSの値が0よりも大きくなければ、判定の対象となっている正規化顔画像に含まれる顔は女性の顔であると判定される。また、大人/子供判定用辞書330を用いた判定において、大人判定成功の学習サンプルを正側として学習した場合、スコアSの値が0よりも大きくなければ、判定の対象となっている正規化顔画像に含まれる顔は子供の顔であると判定される。また、笑顔/非笑顔判定用辞書340を用いた判定において、笑顔判定成功の学習サンプルを正側として学習した場合、スコアSの値が0よりも大きくなければ、判定の対象となっている正規化顔画像に含まれる顔は非笑顔であると判定される。なお、本発明の実施の形態では、判定用辞書を用いた判定として、スコアSおよび0を比較する判定例について説明するが、0以外の値を用いて判定するようにしてもよい。すなわち、スコアSと比較する値については、適宜調整することができる。
ここで、判定用辞書の1乃至t行目に格納されている各値を用いた各演算の終了後におけるスコアSは、次式で表すことができる。
ここで、sign(x)は、x>0の場合には1となり、x≦0の場合には−1となる関数を表すものとする。
このように、判定の対象となる正規化画像の解像度を同一の解像度とし、判定に用いる正規化画像の特徴量を2点間の輝度の値に統一することによって、複数の判定用辞書を切り替え可能とすることができ、複数の属性情報を同一のアルゴリズムで作成することができる。
図5は、画像400から作成された正規化顔画像について正規化の成否を判定する場合における遷移の概略を示す図である。画像400は、例えば、デジタルスチルカメラで撮影された静止画であり、2人の人物401および402が含まれているものとする。
図5(a)は、人物401および402が含まれる画像400を示す図である。ここでは、画像400に含まれる人物401の顔403および人物402の顔404を四角の枠で囲んで示し、この枠内の画像が顔画像410および430となる。また、人物401および402は、何れも大人の男性であり、顔の表情は笑っているものとする。
図5(b)は、画像400から取り出された顔画像410および430を示す図である。ここでは、顔画像410において検出された目の位置を×印411および412で示し、顔画像430において検出された目の位置を×印431および432で示す。図5(b)に示すように、顔画像410については、目の位置(×印411および412)が正確に検出されているものとする。一方、顔画像430については、眼鏡の一部が目として誤って検出されてしまい、目の位置(×印431および432)が正確に検出されていないものとする。
図5(c)は、図5(b)に示す顔画像410および430が正規化された正規化顔画像420および440を示す図である。ここでは、図5(b)に示す顔画像410において検出された目の位置に対応する位置を×印421および422で示し、顔画像430において検出された目の位置に対応する位置を×印441および442で示す。図5(c)に示すように、顔画像410については、目の位置(×印411および412)が正確に検出されているため、顔画像410の正規化が成功している。一方、顔画像430については、目の位置(×印431および432)が正確に検出されていないため、顔画像410の正規化が失敗している。このように、顔画像における目の検出が正確に行われた場合には、正規化が成功する可能性が高い。一方、顔画像における目の検出が正確に行われなかった場合には、正規化が失敗する可能性が高い。
図5(c)に示す正規化顔画像420および440について正規化成否判定用辞書310を用いて正規化の成否を判定した場合には、正規化顔画像420については、正規化成功と判定され、正規化顔画像440については、正規化失敗と判定される。なお、正規化失敗と判定された正規化顔画像については、他の判定処理を中止して、顔に関する属性情報の作成を中止するようにしてもよい。
図6は、図5(c)に示す正規化顔画像420および440について、正規化成否判定用辞書310、男女判定用辞書320、大人/子供判定用辞書330、および笑顔/非笑顔判定用辞書340を用いて各判定をした場合における判定結果が格納されている属性情報450および460を示す図である。属性情報450および460には、種別「正規化」、「性別」、「大人/子供(世代)」、「笑顔/非笑顔」の各判定結果が、顔に関する属性情報として格納されている。
「正規化」には、「OK」または「NG」の何れかが格納される。例えば、図6(a)に示すように、正規化顔画像420については、正規化が成功しているため、正規化成否判定用辞書310を用いて行われた正規化成否判定の判定結果として「OK」が格納されている。一方、図6(b)に示すように、正規化顔画像440については、正規化が失敗しているため、正規化成否判定用辞書310を用いて行われた正規化成否判定の判定結果として「NG」が格納されている。
「性別」には、「男」または「女」の何れかが格納される。例えば、図6(a)に示すように、正規化顔画像420については、正規化が成功しているため、男女判定用辞書320を用いて行われた男女判定の判定結果として「男」が格納されている。一方、図6(b)に示すように、正規化顔画像440については、正規化が失敗しているため、正規化顔画像440に対応する人物が男であるにもかかわらず、男女判定用辞書320を用いて行われた男女判定の判定結果として「女」が格納されている。
また、「大人/子供(世代)」には、「大人」または「子供」の何れかが格納される。例えば、図6(a)に示すように、正規化顔画像420については、正規化が成功しているため、大人/子供判定用辞書330を用いて行われた大人/子供判定の判定結果として「大人」が格納されている。一方、図6(b)に示すように、正規化顔画像440については、正規化が失敗しているものの、大人/子供判定用辞書330を用いて行われた大人/子供判定の判定結果として「大人」が格納されている。
また、「笑顔/非笑顔」には、「笑顔」または「非笑顔」の何れかが格納される。例えば、図6(a)に示すように、正規化顔画像420については、正規化が成功しているため、笑顔/非笑顔判定用辞書340を用いて行われた笑顔/非笑顔判定の判定結果として「笑顔」が格納されている。一方、図6(b)に示すように、正規化顔画像440については、正規化が失敗しているため、正規化顔画像440に対応する人物の顔が笑顔であるにもかかわらず、笑顔/非笑顔判定用辞書340を用いて行われた笑顔/非笑顔判定の判定結果として「非笑顔」が格納されている。
このように、正規化に成功している場合には、判定結果の精度が高い。一方、正規化に失敗している場合には、判定結果の精度が低くなることが多い。このため、判定結果に基づいて作成される属性情報については、例えば、種別「正規化」に「OK」が格納されている顔画像については、その属性情報を各アプリケーションに用いるようにする。一方、種別「正規化」に「NG」が格納されている顔画像については、その属性情報を各アプリケーションに用いないようにすることができる。また、判定処理により算出されたスコアSの数値を格納しておき、このスコアSの数値に応じて、属性情報の利用を変更するようにしてもよい。また、正規化失敗と判定された正規化顔画像に対応する顔画像に関連付けて、顔画像の信頼度が低い旨を示すフラグを格納するようにしてもよい。
図7は、属性情報記憶部240に記憶されている属性情報500を示す図である。図6に示すように、各正規化顔画像についての判定結果に基づいて、各顔に関する属性情報が作成され、これらの属性情報が各顔画像と関連付けて属性情報記憶部240に記憶される。例えば、各顔画像を識別する顔識別番号として「001」乃至「005」が付与され、これらと各種別の情報とが対応するように属性情報500に格納される。例えば、図5および図6に示す正規化顔画像420に対応する顔画像410について顔識別番号「001」が付与され、正規化顔画像440に対応する顔画像430について顔識別番号「002」が付与された場合において、顔識別番号「001」の各欄には、図6(a)に示す属性情報450と同一の判定結果が格納され、顔識別番号「002」の各欄には、図6(b)に示す属性情報460と同一の判定結果が格納される。そして、属性情報500に格納されている各情報を用いて、各アプリケーションを実行することができる。
例えば、女性の顔画像の一覧を表示部190に表示する旨の操作入力が操作受付部150から受け付けられた場合には、属性情報500に格納されている各情報のうちの「性別」に関する情報「男/女」を用いて、表示制御部180の制御に基づいて、顔画像記憶部210に記憶されている複数の顔画像のうちから女性の顔画像のみが抽出され、女性の顔画像の一覧を表示部190に表示させることができる。例えば、顔識別番号「002」、「003」、「004」に対応する顔画像が抽出されて、表示部190に表示される。しかしながら、図5に示すように、顔識別番号「002」に対応する顔画像430に含まれる顔404は男性の顔である。この場合には、表示部190に表示される女性の顔画像の一覧に男性の顔が含まれてしまうことになる。
そこで、属性情報500における「正規化」に「NG」が格納されている顔画像に関する属性情報については、信頼できない情報として用いずに、「正規化」に「OK」が格納されている顔画像に関する属性情報のみを用いるようにすることができる。
例えば、女性の顔画像の一覧を表示部190に表示する旨の操作入力が操作受付部150から受け付けられた場合において、属性情報500における「正規化」に「NG」が格納されている顔識別番号「002」に対応する属性情報を用いずに、「正規化」に「OK」が格納されている顔識別番号「001」、「003」、「004」、「005」に対応する属性情報を用いて、顔画像記憶部210に記憶されている複数の顔画像のうちから女性の顔画像のみを抽出して、女性の顔画像の一覧を表示部190に表示させる。このようにすることによって、表示部190に表示される女性の顔画像の一覧に男性の顔が含まれることを防止することができる。また、属性情報500における「正規化」に、判定処理により算出されたスコアSの数値を格納しておき、このスコアSの数値に応じて、利用を変更するようにしてもよい。
次に、本発明の実施の形態における画像処理装置100の動作について図面を参照して説明する。
図8は、画像処理装置100による正規化顔画像の作成処理の処理手順を示すフローチャートである。
最初に、画像が入力される(ステップS911)。続いて、入力された画像に含まれる顔が検出され、検出された顔を含む顔画像が顔画像記憶部210に記憶される(ステップS912)。続いて、検出された顔画像に含まれる両目が検出される(ステップS913)。続いて、検出された両目の位置に基づいて、顔画像が正規化される(ステップS914)。例えば、図2(b)に示すように、顔画像250が正規化されて正規化顔画像260が作成される。続いて、作成された正規化顔画像が正規化画像記憶部220に記憶される(ステップS915)。
図9は、画像処理装置100による顔に関する属性情報の作成処理の処理手順を示すフローチャートである。ここでは、顔に関する属性情報を作成する旨の操作入力が操作受付部150からされた場合に判定処理を実行する例について説明する。また、ここでは、複数の判定用辞書の全てを用いて属性情報を作成する例について説明するが、操作受付部150からの操作入力に応じて、個別に属性情報を作成するようにしてもよい。
最初に、顔に関する属性情報を作成する旨の操作入力が受け付けられたか否かが判断される(ステップS921)。顔に関する属性情報を作成する旨の操作入力が受け付けられていない場合には(ステップS921)、顔に関する属性情報の作成処理の動作を終了する。一方、顔に関する属性情報を作成する旨の操作入力が受け付けられた場合には(ステップS921)、正規化画像記憶部220に記憶されている正規化顔画像が読み出される(ステップS922)。続いて、読み出された正規化顔画像における輝度の値が抽出される(ステップS923)。続いて、辞書記憶部230に記憶されている複数の判定用辞書のうちで、判定処理されていない判定用辞書が取り出され、作業用メモリ231に記憶される(ステップS924)。例えば、図3に示す各判定用辞書のうちから、正規化成否判定用辞書310が取り出される。続いて、取り出された判定用辞書を用いて判定処理が実行される(ステップS930)。なお、この判定処理については、図10を参照して詳細に説明する。
続いて、判定処理によって判定された結果が、判定の対象となっている顔に関する属性情報として、その顔に関連付けて属性情報記憶部240に記憶される(ステップS925)。続いて、辞書記憶部230に記憶されている複数の判定用辞書のうちで、判定処理されていない判定用辞書が存在するか否かが判断される(ステップS926)。辞書記憶部230に記憶されている複数の判定用辞書のうちで、判定処理されていない判定用辞書が存在する場合には(ステップS926)、ステップS924に戻り、同一の顔に関する属性情報の作成処理を繰り返す(ステップS924乃至S926、ステップS930)。一方、辞書記憶部230に記憶されている複数の判定用辞書のうちで、判定処理されていない判定用辞書が存在しない場合には(ステップS926)、顔に関する属性情報の作成処理の動作を終了する。
図10は、画像処理装置100による顔に関する属性情報の作成処理の処理手順のうちの判定処理手順(図9に示すステップS930の処理手順)を示すフローチャートである。本発明の実施の形態では、正規化顔画像が目的の画像であるか否かを判定する判定処理を例にして説明する。
最初に、スコアSが「0」に初期化され(ステップS931)、変数iが「1」に初期化される(ステップS932)。続いて、ステップS923(図9に示す)で正規化顔画像から抽出された輝度の値の中から、ステップS924(図9に示す)で作業用メモリ231に記憶された判定用辞書のi行目に格納されているpix1(x,y)およびpix2(x,y)の位置に対応する輝度の値が選択される(ステップS933)。続いて、選択された2つの輝度の値を用いて、式1に示すC(i)が算出される(ステップS934)。
続いて、算出された2点間の輝度の差の値C(i)が閾値θ(i)よりも小さいか否かが判断される(ステップS935)。算出された値C(i)が閾値θ(i)よりも小さい場合には(ステップS935)、スコアSにα(i)が加算される(ステップS936)。一方、算出された値C(i)が閾値θ(i)よりも小さくない場合には(ステップS935)、スコアSからα(i)が減算される(ステップS937)。
続いて、変数iに「1」が加算され(ステップS938)、変数iがtよりも大きいか否かが判断される(ステップS939)。変数iがtよりも大きくない場合には(ステップS939)、ステップS923(図9に示す)で取り出された判定用辞書の各行の値についての判定処理が終了していないため、ステップS933に戻り、同一の判定用辞書を用いた判定処理を繰り返す(ステップS933乃至S939)。一方、変数iがtよりも大きい場合には(ステップS939)、ステップS923(図9に示す)で取り出された判定用辞書の各行の値についての判定処理が終了しているため、ステップS940に進み、スコアSの値が0よりも大きいか否かが判断される(ステップS940)。
スコアSの値が0よりも大きい場合には(ステップS940)、判定の対象となっている正規化顔画像が、目的の画像であると判定される(ステップS941)。一方、スコアSの値が0よりも大きくない場合には(ステップS940)、判定の対象となっている正規化顔画像が、目的の画像ではないと判定される(ステップS942)。続いて、図9に示すステップS930に戻る。
このように、本発明の実施の形態によれば、辞書記憶部230に記憶されている各判定用辞書の形式が同一であるとともに、判定の対象となる顔画像を正規化部140が正規化して同一の解像度とし、さらに、判定に用いる正規化画像の特徴量を2点間の輝度の値に統一しているため、複数の判定用辞書を切り替えることによって、検出された顔に関する複数の属性情報を同一のアルゴリズムで作成することができる。これにより、検出された顔に関する複数の属性情報を作成する場合には、画像判定部170が複数の判定用辞書を切り替えて複数の属性情報を作成することができるため、装置を簡略化することができ、属性情報の作成に関する演算時間を短縮させることができる。すなわち、画像に含まれる顔に関する複数の属性情報を効率的に作成することができる。また、これらにより、装置のコストを大幅に簡略することができる。
また、他の属性情報を作成する場合と同様に、辞書記憶部230に記憶されている正規化成否判定用辞書310を用いて、正規化顔画像に関する正規化の成否を判定して、この判定結果を、顔画像の属性情報として属性情報記憶部240に記憶することができる。これにより、例えば、顔画像記憶部210に記憶されている顔画像を表示部190に表示させる場合において、「正規化」に「NG」が格納されている顔画像の属性情報は信頼できないとしてその属性情報を用いずに、「正規化」に「OK」が格納されている顔画像に関する属性情報のみを用いて表示をすることができる。このようにすることにより、さらに精度の高い属性情報を用いた表示をすることができる。また、正規化顔画像に関する正規化成否の判定結果が「NG」の場合には、この正規化顔画像に関する他の属性情報の作成を中止することができる。これにより、精度の高い属性情報を迅速に作成することができる。
なお、本発明の実施の形態では、顔に関する属性情報として「正規化」、「性別」、「大人/子供(世代)」、「笑顔/非笑顔」を作成する場合について説明したが、顔に関する他の属性情報を作成する場合についても、本発明の実施の形態を適用することができる。顔に関する属性情報として、例えば、目の位置、目の開閉状態、顔の表情、人種、顔自体の撮影条件、顔の向き等に適用することができる。また、本発明の実施の形態では、正規化顔画像が目的の画像であるか否かを判定するための評価情報として、辞書記憶部230に記憶されている各判定用辞書を用いる場合を例にして説明したが、正規化顔画像が目的の画像であるか否かを判定することができる他の評価情報を用いるようにしてもよい。
また、本発明の実施の形態では、画像に含まれる人の顔を検出し、この検出された顔に関する複数の属性情報を作成する場合について説明したが、画像に含まれる人の顔以外の他の対象物を検出し、この検出された対象物に関する複数の属性情報を作成する場合についても、本発明の実施の形態を適用することができる。画像に含まれる人の顔以外の他の対象物として、例えば、猫や犬等のペットの顔、馬や牛等の動物の顔等に適用することができる。
また、本発明の実施の形態では、画像処理装置を例にして説明したが、動画や静止画等の画像を入力して表示することができる携帯端末装置等の画像表示装置や、デジタルスチルカメラ等の撮像装置に本発明の実施の形態を適用することができる。
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、以下に示すように特許請求の範囲における発明特定事項とそれぞれ対応関係を有するが、これに限定されるものではなく本発明の要旨を逸脱しない範囲において種々の変形を施すことができる。
すなわち、請求項1乃至請求項12において、画像処理装置は、例えば画像処理装置100に対応する。また、請求項13において、画像表示装置は、例えば画像処理装置100に対応する。また、請求項14において、撮像装置は、例えば画像処理装置100に対応する。
また、請求項1、13、14において、評価情報記憶手段は、例えば辞書記憶部230に対応する。また、画像入力手段は、例えば画像入力部110に対応する。また、顔検出手段は、例えば顔検出部120に対応する。
また、請求項1、9乃至11、13、14において、正規化手段は、例えば正規化部140に対応する。
また、請求項1、6、13、14において、特徴量抽出手段は、例えば特徴量抽出部160に対応する。
また、請求項1乃至5、7、8、13、14において、属性情報作成手段は、例えば画像判定部170に対応する。
また、請求項9または請求項10において、顔器官検出手段は、例えば目検出部130に対応する。
また、請求項13において、表示手段は、例えば表示部190に対応する。また、表示制御手段は、例えば表示制御部180に対応する。
また、請求項15または請求項16において、画像入力手順は、例えばステップS911に対応する。また、顔検出手順は、例えばステップS912に対応する。また、正規化手順は、例えばステップS914に対応する。また、特徴量抽出手順は、例えばステップS923に対応する。また、属性情報作成手順は、例えばステップS930に対応する。
なお、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。
画像処理装置100の機能構成例を示すブロック図である。 顔画像を正規化する場合における正規化の一例を示す図である。 正規化顔画像について各判定処理を行うための複数の判定用辞書を示す図である。 正規化部140により正規化された顔画像の一例である正規化顔画像350を示す図である。 画像400から作成された正規化顔画像について正規化の成否を判定する場合における遷移の概略を示す図である。 正規化顔画像420および440についての各判定結果が格納されている属性情報450および460を示す図である。 属性情報記憶部240に記憶されている属性情報500を示す図である。 画像処理装置100による正規化顔画像の作成処理の処理手順を示すフローチャートである。 画像処理装置100による顔に関する属性情報の作成処理の処理手順を示すフローチャートである。 図9に示すステップS930の処理手順を示すフローチャートである。
符号の説明
100 画像処理装置
110 画像入力部
120 顔検出部
130 目検出部
140 正規化部
145 正規化テンプレート保持部
150 操作受付部
160 特徴量抽出部
170 画像判定部
180 表示制御部
190 表示部
210 顔画像記憶部
220 正規化画像記憶部
230 辞書記憶部
231 作業用メモリ
240 属性情報記憶部
310 正規化成否判定用辞書
320 男女判定用辞書
330 子供判定用辞書
340 非笑顔判定用辞書

Claims (16)

  1. 対象となる画像が目的の画像であるか否かを判定するための評価情報を複数記憶する評価情報記憶手段と、
    画像を入力する画像入力手段と、
    前記入力された画像に含まれる顔を検出する顔検出手段と、
    前記検出された顔の周辺画像である顔画像が所定の解像度となるように当該顔画像を正規化する正規化手段と、
    前記正規化された顔画像の特徴量を抽出する特徴量抽出手段と、
    前記抽出された顔画像における特徴量と前記評価情報とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを前記評価情報記憶手段に記憶されている評価情報毎に判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する属性情報作成手段と
    を具備することを特徴とする画像処理装置。
  2. 前記評価情報は、対象となる画像における位置と閾値との組合せを含み、
    前記属性情報作成手段は、前記評価情報に含まれる位置に対応する前記正規化された顔画像の特徴量の値と当該位置に係る閾値とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを判定する
    ことを特徴とする請求項1記載の画像処理装置。
  3. 前記評価情報は、対象となる画像における2つの位置と閾値との組合せを含み、
    前記属性情報作成手段は、前記評価情報に含まれる1つの組合せに係る2つの位置に対応する前記正規化された顔画像の特徴量の差を算出して当該算出された差の値と当該組合せに係る閾値とを比較した結果に基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを判定する
    ことを特徴とする請求項1記載の画像処理装置。
  4. 前記評価情報は、対象となる画像における2つの位置と閾値との組合せを複数含み、
    前記属性情報作成手段は、前記評価情報に含まれる複数の組合せのうちの1つの組合せに係る2つの位置に対応する前記正規化された顔画像の特徴量の差を算出して当該算出された差の値と当該組合せに係る閾値とを前記評価情報に含まれる組合せ毎に比較して当該比較された結果に基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを判定する
    ことを特徴とする請求項1記載の画像処理装置。
  5. 前記評価情報は、対象となる画像における2つの位置と閾値と重みの値との組合せを複数含み、
    前記属性情報作成手段は、前記評価情報に含まれる複数の組合せのうちの1つの組合せに係る2つの位置に対応する前記正規化された顔画像の特徴量の差を算出して当該算出された差の値と当該組合せに係る閾値とを比較して当該比較された結果に基づいて当該組合せに係る重みの値を加算または減算することにより当該評価情報に含まれる複数の組合せに係る合計値を算出して当該合計値に基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを判定する
    ことを特徴とする請求項1記載の画像処理装置。
  6. 前記特徴量抽出手段は、前記正規化された顔画像の特徴量として輝度を抽出する
    ことを特徴とする請求項1記載の画像処理装置。
  7. 前記評価情報記憶手段に記憶されている複数の評価情報のうちの少なくとも1つは、前記正規化された顔画像に関する正規化の成否を判定するための正規化成否判定情報であり、
    前記属性情報作成手段は、前記正規化された顔画像について前記評価情報記憶手段に記憶されている正規化成否判定情報を用いて当該顔画像に関する正規化の成否を判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する
    ことを特徴とする請求項1記載の画像処理装置。
  8. 前記属性情報作成手段は、前記正規化された顔画像に関する正規化が失敗であると判定された場合には当該顔画像に含まれる顔に関する他の属性情報の作成を中止する
    ことを特徴とする請求項7記載の画像処理装置。
  9. 前記検出された顔に含まれる少なくとも1つの器官を検出する顔器官検出手段をさらに具備し、
    前記正規化手段は、前記顔画像に含まれる顔について検出された器官の位置に基づいて当該顔画像を正規化する
    ことを特徴とする請求項1記載の画像処理装置。
  10. 前記顔器官検出手段は、前記検出された顔に含まれる両目を検出する目検出手段であり、
    前記正規化手段は、前記顔画像に含まれる顔について検出された両目の位置に基づいて当該顔画像を正規化する
    ことを特徴とする請求項9記載の画像処理装置。
  11. 前記正規化手段は、前記顔画像に含まれる顔について検出された器官の位置に基づいて当該顔画像にアフィン変換を施して当該顔画像を正規化する
    ことを特徴とする請求項9記載の画像処理装置。
  12. 前記属性情報作成手段により作成される複数の属性情報は、目の位置、目の開閉状態、顔の表情、性別、顔の世代、顔の人種、顔自体の撮影条件、顔の向きに関する情報のうちの少なくとも2つである
    ことを特徴とする請求項1記載の画像処理装置。
  13. 対象となる画像が目的の画像であるか否かを判定するための評価情報を複数記憶する評価情報記憶手段と、
    画像を入力する画像入力手段と、
    前記入力された画像に含まれる顔を検出する顔検出手段と、
    前記検出された顔の周辺画像である顔画像を表示する表示手段と、
    前記顔画像が所定の解像度となるように当該顔画像を正規化する正規化手段と、
    前記正規化された顔画像の特徴量を抽出する特徴量抽出手段と、
    前記抽出された顔画像における特徴量と前記評価情報とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを前記評価情報記憶手段に記憶されている評価情報毎に判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する属性情報作成手段と、
    前記作成された属性情報に基づいて前記表示手段に表示させる前記顔画像の表示に関する制御を行う表示制御手段と
    を具備することを特徴とする画像表示装置。
  14. 対象となる画像が目的の画像であるか否かを判定するための評価情報を複数記憶する評価情報記憶手段と、
    被写体が撮像された画像を入力する画像入力手段と、
    前記入力された画像に含まれる顔を検出する顔検出手段と、
    前記検出された顔の周辺画像である顔画像が所定の解像度となるように当該顔画像を正規化する正規化手段と、
    前記正規化された顔画像の特徴量を抽出する特徴量抽出手段と、
    前記抽出された顔画像における特徴量と前記評価情報とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを前記評価情報記憶手段に記憶されている評価情報毎に判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する属性情報作成手段と
    を具備することを特徴とする撮像装置。
  15. 対象となる画像が目的の画像であるか否かを判定するための評価情報を複数記憶する評価情報記憶手段を具備する画像処理装置における画像処理方法であって、
    画像を入力する画像入力手順と、
    前記入力された画像に含まれる顔を検出する顔検出手順と、
    前記検出された顔の周辺画像である顔画像が所定の解像度となるように当該顔画像を正規化する正規化手順と、
    前記正規化された顔画像の特徴量を抽出する特徴量抽出手順と、
    前記抽出された顔画像における特徴量と前記評価情報とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを前記評価情報記憶手段に記憶されている評価情報毎に判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する属性情報作成手順と
    を具備することを特徴とする画像処理方法。
  16. 対象となる画像が目的の画像であるか否かを判定するための評価情報を複数記憶する評価情報記憶手段を具備する画像処理装置において、
    画像を入力する画像入力手順と、
    前記入力された画像に含まれる顔を検出する顔検出手順と、
    前記検出された顔の周辺画像である顔画像が所定の解像度となるように当該顔画像を正規化する正規化手順と、
    前記正規化された顔画像の特徴量を抽出する特徴量抽出手順と、
    前記抽出された顔画像における特徴量と前記評価情報とに基づいて当該顔画像が当該評価情報に係る目的の画像であるか否かを前記評価情報記憶手段に記憶されている評価情報毎に判定して当該判定された結果を当該顔画像に含まれる顔に関する属性情報として作成する属性情報作成手順と
    をコンピュータに実行させることを特徴とするプログラム。
JP2007154386A 2007-06-11 2007-06-11 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム Expired - Fee Related JP4434236B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007154386A JP4434236B2 (ja) 2007-06-11 2007-06-11 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム
US12/104,036 US8085996B2 (en) 2007-06-11 2008-04-16 Image processing apparatus, image display apparatus, imaging apparatus, method for image processing therefor, and program
TW097116649A TW200917160A (en) 2007-06-11 2008-05-06 Image processing apparatus, image display apparatus, imaging apparatus, method for image processing therefor, and program
CNA200810100456XA CN101324954A (zh) 2007-06-11 2008-06-11 图像处理设备、图像显示设备、成像设备、其图像处理方法和程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007154386A JP4434236B2 (ja) 2007-06-11 2007-06-11 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008305342A true JP2008305342A (ja) 2008-12-18
JP4434236B2 JP4434236B2 (ja) 2010-03-17

Family

ID=40095941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007154386A Expired - Fee Related JP4434236B2 (ja) 2007-06-11 2007-06-11 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム

Country Status (4)

Country Link
US (1) US8085996B2 (ja)
JP (1) JP4434236B2 (ja)
CN (1) CN101324954A (ja)
TW (1) TW200917160A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009086703A (ja) * 2007-09-27 2009-04-23 Fujifilm Corp 画像表示装置、画像表示方法、及び画像表示プログラム
JP2010160758A (ja) * 2009-01-09 2010-07-22 Sony Corp 対象物検出装置、学習装置、対象物検出方法およびプログラム
JP2010160757A (ja) * 2009-01-09 2010-07-22 Sony Corp 対象物検出装置、撮像装置、物体検出方法およびプログラム
JP2017076909A (ja) * 2015-10-15 2017-04-20 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
WO2023189195A1 (ja) * 2022-03-30 2023-10-05 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8532344B2 (en) * 2008-01-09 2013-09-10 International Business Machines Corporation Methods and apparatus for generation of cancelable face template
JP4966260B2 (ja) * 2008-06-25 2012-07-04 キヤノン株式会社 画像処理方法および画像処理装置、プログラム並びに、コンピュータ読み取り可能な記憶媒体
KR20100072772A (ko) * 2008-12-22 2010-07-01 한국전자통신연구원 스테레오 비전을 이용한 실시간 얼굴 검출 시스템 및 그 방법
US9495583B2 (en) 2009-01-05 2016-11-15 Apple Inc. Organizing images by correlating faces
US9514355B2 (en) 2009-01-05 2016-12-06 Apple Inc. Organizing images by correlating faces
US8326001B2 (en) * 2010-06-29 2012-12-04 Apple Inc. Low threshold face recognition
JP2012053606A (ja) * 2010-08-31 2012-03-15 Sony Corp 情報処理装置および方法、並びにプログラム
JP2012203613A (ja) 2011-03-25 2012-10-22 Sony Corp 画像処理装置および方法、記録媒体並びにプログラム
US8718327B2 (en) 2011-04-11 2014-05-06 Intel Corporation Gesture recognition using depth images
JP5918996B2 (ja) * 2011-12-27 2016-05-18 キヤノン株式会社 被写体認識装置および辞書データ登録方法
JP6280382B2 (ja) * 2013-03-08 2018-02-14 キヤノン株式会社 画像処理装置および画像処理方法
EP3063731B1 (en) 2013-10-28 2020-03-04 Google LLC Image cache for replacing portions of images
CN108009465B (zh) * 2016-10-31 2021-08-27 杭州海康威视数字技术股份有限公司 一种人脸识别方法及装置
CN106951825B (zh) * 2017-02-13 2021-06-29 苏州飞搜科技有限公司 一种人脸图像质量评估系统以及实现方法
US10795979B2 (en) 2017-09-27 2020-10-06 International Business Machines Corporation Establishing personal identity and user behavior based on identity patterns
US10803297B2 (en) 2017-09-27 2020-10-13 International Business Machines Corporation Determining quality of images for user identification
US10776467B2 (en) 2017-09-27 2020-09-15 International Business Machines Corporation Establishing personal identity using real time contextual data
US10839003B2 (en) 2017-09-27 2020-11-17 International Business Machines Corporation Passively managed loyalty program using customer images and behaviors
US10565432B2 (en) * 2017-11-29 2020-02-18 International Business Machines Corporation Establishing personal identity based on multiple sub-optimal images
JP2019185384A (ja) * 2018-04-10 2019-10-24 キヤノン株式会社 画像認証装置、画像認証方法、コンピュータプログラムおよび記憶媒体
CN114694186B (zh) * 2022-06-01 2022-08-26 南京优牧大数据服务有限公司 牛脸识别数据处理方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7106887B2 (en) * 2000-04-13 2006-09-12 Fuji Photo Film Co., Ltd. Image processing method using conditions corresponding to an identified person
US7099510B2 (en) * 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
JP4675492B2 (ja) 2001-03-22 2011-04-20 本田技研工業株式会社 顔画像を使用した個人認証装置
US6895103B2 (en) * 2001-06-19 2005-05-17 Eastman Kodak Company Method for automatically locating eyes in an image
EP2955662B1 (en) * 2003-07-18 2018-04-04 Canon Kabushiki Kaisha Image processing device, imaging device, image processing method
JP2005078376A (ja) 2003-08-29 2005-03-24 Sony Corp 対象物検出装置、対象物方法、及びロボット装置
JP4517633B2 (ja) 2003-11-25 2010-08-04 ソニー株式会社 対象物検出装置及び方法
JP4217664B2 (ja) * 2004-06-28 2009-02-04 キヤノン株式会社 画像処理方法、画像処理装置
JP2006115406A (ja) * 2004-10-18 2006-04-27 Omron Corp 撮像装置
JP2007028555A (ja) 2005-07-21 2007-02-01 Sony Corp カメラシステム,情報処理装置,情報処理方法,およびコンピュータプログラム
JP4708948B2 (ja) * 2005-10-03 2011-06-22 富士フイルム株式会社 顔向き特定方法、顔判別方法および装置並びにプログラム
CN100397410C (zh) 2005-12-31 2008-06-25 北京中星微电子有限公司 基于视频的面部表情识别方法及装置
JP4532419B2 (ja) * 2006-02-22 2010-08-25 富士フイルム株式会社 特徴点検出方法および装置並びにプログラム
JP2007272685A (ja) * 2006-03-31 2007-10-18 Fujifilm Corp 自動トリミング方法および装置ならびにプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009086703A (ja) * 2007-09-27 2009-04-23 Fujifilm Corp 画像表示装置、画像表示方法、及び画像表示プログラム
JP4663699B2 (ja) * 2007-09-27 2011-04-06 富士フイルム株式会社 画像表示装置、及び画像表示方法
US8290276B2 (en) 2007-09-27 2012-10-16 Fujifilm Corporation Image display device, image display method and storage medium storing image display program
JP2010160758A (ja) * 2009-01-09 2010-07-22 Sony Corp 対象物検出装置、学習装置、対象物検出方法およびプログラム
JP2010160757A (ja) * 2009-01-09 2010-07-22 Sony Corp 対象物検出装置、撮像装置、物体検出方法およびプログラム
JP4710979B2 (ja) * 2009-01-09 2011-06-29 ソニー株式会社 対象物検出装置、学習装置、対象物検出方法およびプログラム
JP4710978B2 (ja) * 2009-01-09 2011-06-29 ソニー株式会社 対象物検出装置、撮像装置、対象物検出方法およびプログラム
US8391551B2 (en) 2009-01-09 2013-03-05 Sony Corporation Object detecting device, learning device, object detecting method, and program
US8547438B2 (en) 2009-01-09 2013-10-01 Sony Corporation Apparatus, method and program for recognizing an object in an image
JP2017076909A (ja) * 2015-10-15 2017-04-20 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
WO2023189195A1 (ja) * 2022-03-30 2023-10-05 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
US8085996B2 (en) 2011-12-27
US20080304749A1 (en) 2008-12-11
CN101324954A (zh) 2008-12-17
JP4434236B2 (ja) 2010-03-17
TW200917160A (en) 2009-04-16

Similar Documents

Publication Publication Date Title
JP4434236B2 (ja) 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム
JP5629803B2 (ja) 画像処理装置、撮像装置、画像処理方法
JP6013241B2 (ja) 人物認識装置、及び方法
JP4743823B2 (ja) 画像処理装置、撮像装置、画像処理方法
US9036018B2 (en) Facial expression recognition systems and methods and computer program products thereof
Ko et al. Sign language recognition with recurrent neural network using human keypoint detection
KR20220150868A (ko) 모션벡터 및 특징벡터 기반 위조 얼굴 검출 방법 및 장치
JP2009301170A (ja) 画像処理装置および画像処理方法
US20110199505A1 (en) Image processing apparatus and image processing method
US8547438B2 (en) Apparatus, method and program for recognizing an object in an image
US9704024B2 (en) Object discriminating apparatus and method
US20140093142A1 (en) Information processing apparatus, information processing method, and information processing program
JPWO2019003973A1 (ja) 顔認証装置、顔認証方法およびプログラム
JP2010262601A (ja) パターン認識システム及びパターン認識方法
JP5787686B2 (ja) 顔認識装置、及び顔認識方法
WO2020195732A1 (ja) 画像処理装置、画像処理方法、およびプログラムが格納された記録媒体
KR20220106842A (ko) 표정 인식 방법 및 장치, 기기, 컴퓨터 판독 가능한 저장 매체, 컴퓨터 프로그램 제품
CN110674680A (zh) 活体识别的方法、装置、存储介质
KR101661211B1 (ko) 얼굴 인식률 개선 장치 및 방법
CN113033271A (zh) 利用人工智能模块学习脸部辨识的处理方法
CN113642639B (zh) 活体检测方法、装置、设备和存储介质
Dhruva et al. Novel algorithm for image processing based hand gesture recognition and its application in security
JP2012068948A (ja) 顔属性推定装置およびその方法
EP4266242A1 (en) Authentication method, information processing device, and authentication program
CN112183357B (zh) 一种基于深度学习的多尺度活体检测方法及系统

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090612

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090929

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20091021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees