JP5796185B2 - 対象物判定装置 - Google Patents

対象物判定装置 Download PDF

Info

Publication number
JP5796185B2
JP5796185B2 JP2011053201A JP2011053201A JP5796185B2 JP 5796185 B2 JP5796185 B2 JP 5796185B2 JP 2011053201 A JP2011053201 A JP 2011053201A JP 2011053201 A JP2011053201 A JP 2011053201A JP 5796185 B2 JP5796185 B2 JP 5796185B2
Authority
JP
Japan
Prior art keywords
block
template
rectangular
value
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011053201A
Other languages
English (en)
Other versions
JP2012190263A (ja
Inventor
勝司 青木
勝司 青木
ヘーン・チャー・ケーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2011053201A priority Critical patent/JP5796185B2/ja
Priority to PCT/JP2012/001658 priority patent/WO2012120904A1/ja
Priority to US14/003,491 priority patent/US9087231B2/en
Publication of JP2012190263A publication Critical patent/JP2012190263A/ja
Application granted granted Critical
Publication of JP5796185B2 publication Critical patent/JP5796185B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/446Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Description

本発明は、特徴量を用いた統計量的学習に基づくパターン認識により画像内に対象物(例えば人の顔)が含まれているか否かを判定する対象物判定装置に関する。
特徴量を用いた統計量的学習により対象物を検出する装置として、例えば非特許文献1や特許文献1で開示されているものがある。非特許文献1に記載された特徴量は、Haar−like特徴量と呼ばれ、1対のブロック領域内の画素の平均輝度同士の大小関係より得ている。図16は、非特許文献1に記載された特徴量の一例(例1,2)を説明するための図である。同図に示すように、例1,2のいずれにおいても、1対のブロックA,Bのブロック領域内画素の平均輝度Aav,Bavの大小関係が、Aav<Bavであれば、特徴量P=0とし、Aav≧Bavであれば、特徴量P=1としている。
非特許文献1で開示された装置では、顔検出器に上述したHaar−like特徴量を用い、Boostingにより学習を行っている。この顔検出器は、複数の強判別器で構成され、各強判別器は、顔画像に高い通過率を持ち、非顔画像を一定の値で排除する。各強判別器は、複数の弱判別器を有し、各弱判別器は特徴量に対するスコアを返し、そのスコアの合計が所定の閾値を超えるかどうかによって、強判別器が顔・非顔の判定を行う。各弱判別器は、所定のサイズの入力画像から特徴量を作成し、上記Boosting学習結果を用いて特徴量ごとのスコアを強判別器に返す。
他方、特許文献1に記載された特徴量は、全ブロックA〜Aのブロック領域内画素の平均輝度と、各ブロック領域内画素の平均輝度同士の大小関係より得ている。図17は、特許文献1に記載された特徴量の一例を説明するための図である。同図に示すように、全ブロックA〜Aのブロック領域内画素の平均輝度Arefと、各ブロック領域内画素の平均輝度A0av〜A5av同士の大小関係が、Aiav(i=0〜5)<Arefであれば、特徴量P(i=0〜5)=0とし、Aiav(i=0〜5)≧Arefであれば、特徴量P(i=0〜5)=1としている。
Paul Viola、Michael Jones、「Rapid Object Detection Using a Boosted Cascade of Simple Features」、IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR)、2001年12月、ISSN: 1063-6919, Vol.1、P.511-518
特開2006−350645号公報
しかしながら、上述した非特許文献1で開示された技術では、ブロック同士の大小関係が1対しかないため、輝度の空間的分布(配置)情報の量が少な過ぎて、ノイズや文字でも人の顔と判定してしまうといった誤判定が起こり易い。なお、この課題は、専用の判別器(顔用、ノイズ用、文字用等)を用いることで改善可能であるが、専用の判別器を用いることでアルゴリズムが複雑になるとともにコスト高となる。
上述した特許文献1で開示された技術では、比較参照値(基準となるブロックAref)が全ブロックの領域内画素の平均輝度であるため、大域的過ぎる傾向がある。例えば、一般的に学習する顔画像(頭部は除き、眉、目、鼻、口を含む)のサイズは24×24ほどである。図17に示す特許文献1の特徴量の各ブロック領域のサイズが2×2〜4×4であれば、全ブロック領域のサイズは6×4〜12×8となり、顔画像の1/24〜1/6もの範囲を覆う大域的な領域となる。このため、比較参照値とする同全ブロックの領域内画素の平均輝度には顔パーツ(目、鼻、口等)およびその一部の特徴があまり残されず、これらの情報に基づいて顔を検出する顔検出および顔パーツの検出の検出性能が向上しない。また、このように全ブロック領域のサイズが大きいため、部分隠蔽された顔(例えば、帽子を被って片方の目が隠れているときの顔)の場合、同領域が隠蔽部分の画素値を含む可能性が高くなり、この結果、隠蔽部分の影響を受けやすくなる。このため、部分隠蔽された顔の検出にも向かない。
本発明は、係る事情に鑑みてなされたものであり、比較参照値が大局的過ぎることなく、対象物が例えば人の顔であれば、顔の各パーツ(目、鼻、口等)の特徴を多く残すことができ、また隠蔽領域にかかる可能性の低い対象物判定装置を提供することを目的とする。
本発明の対象物判定装置は、画像上に複数の矩形ブロックから構成されるテンプレートを1乃至複数個所設定し、各テンプレートの各々において、当該テンプレートに含まれる各矩形ブロックの輝度の平均値をブロック輝度値として求めるブロック輝度算出手段と、各テンプレートの各々において、当該テンプレートに含まれる各矩形ブロックのうちいずれか2つを1対とするブロック対を複数設定するブロック対設定手段と、前記ブロック対の各々においてブロック輝度値同士の大小関係を求める比較手段と、当該テンプレートに設定された複数のブロック対の各々のブロック輝度値の大小関係によって、前記テンプレート内に対象物の一部が含まれる度合いを示すスコアをテンプレート毎に保持するスコア保持手段と、を備え、前記各テンプレートの複数ブロック対の各々のブロック輝度値の大小関係から、前記スコア保持手段を参照して、全テンプレートのスコアの総和値を求め、同総和値により、前記画像内に対象物が含まれるか否かを判定することを特徴とする。
上記構成によれば、1つのテンプレートに含まれる複数の矩形ブロックのうちいずれか2つを1対とするブロック対を複数設定し、各ブロック対のブロック輝度値の大小関係によって、当該テンプレート内に対象物の一部が含まれる度合いを示すスコアを保持し、この処理を全てのテンプレートに対して行い、全テンプレートのスコアの総和値により、画像内に対象物が含まれるか否かを判定する。特に、本発明では、1つのテンプレートに含まれる複数の矩形ブロックのいずれか1つを比較参照値にできるので、特許文献1で開示された技術と比べて、比較参照値の領域サイズが小さいため(大局的過ぎないため)、対象物が例えば人の顔であれば、顔の各パーツ(目、鼻、口等)の特徴を多く残すことができ、また隠蔽領域にかかる可能性が低くなる。これにより、顔検出および顔の各パーツ検出の検出性能が向上し、部分隠蔽に強くなる。比較参照値は、固定にする場合もあれば、非固定にする場合もある。固定にする場合とは、例えば、1つのテンプレートが6つの矩形ブロックA〜Aで構成されているとし、例えばAを比較参照値として固定する。一方、非固定にする場合とは、例えば矩形ブロックAとAを比較するときは、比較参照値が矩形ブロックAとなり、矩形ブロックAとAを比較するときは、比較参照値が矩形ブロックAとなる場合である。
上記構成において、前記矩形ブロックは、互いに重なり合っていることを特徴とする。
上記構成によれば、矩形ブロックが互いに重なり合っていても、対象物が例えば人の顔であれば、顔の各パーツの特徴を多く残し、また隠蔽領域にかかる可能性が低くなる。
上記構成において、前記矩形ブロックは、互いに接触していることを特徴とする。
上記構成によれば、矩形ブロックが互いに接触していても、対象物が例えば人の顔であれば、顔の各パーツの特徴を多く残し、また隠蔽領域にかかる可能性が低くなる。
本発明によれば、比較参照値が大局的過ぎることなく、対象物が例えば人の顔であれば、顔の各パーツ(目、鼻、口等)の特徴を多く残すことができ、また隠蔽領域にかかる可能性を低くできる。
本発明の実施の形態1に係る対象物判定装置の概略構成を示すブロック図 図1の対象物判定装置の特徴量生成部の概略構成を示すブロック図 図1の対象物判定装置において画像に設定されるテンプレートの一例を示す図 図1の対象物判定装置において、矩形ブロックAのブロック輝度値を比較参照値Ak[1]avとして固定した例を示す図 図1の対象物判定装置において、矩形ブロックAのブロック輝度値を比較参照値Ak[1]avとしたときの特徴量P(i=0〜5)より得られる特徴パターンの一例を示す図 図1の対象物判定装置において、矩形ブロックAを比較参照値(Aref)とした場合の特徴パターンを模式的に示した図 図1の対象物判定装置において、矩形ブロックAのブロック輝度値を比較参照値Ak[1]avとしたときの特徴パターン及び各特徴パターンを合計して平均化したときの特徴パターンの平均画像の一例を示す図 本発明の特徴[1]を説明するための図であって、矩形ブロックAのブロック輝度値を比較参照値Ak[i]av(i=0〜5)としたときの特徴パターンの平均画像の一例を示す図 本発明の特徴[1]を説明するための図であって、特徴パターンの平均画像の一例を示す図 特許文献1で開示された特徴量による特徴パターンの平均画像を示す図 本発明の特徴[2]を説明するための図 図1の対象物判定装置の動作を説明するためのフローチャート 本発明の実施の形態2に係る対象物判定装置において、強度を含めた場合の特徴量を求める工程を模式的に示した図 本発明の実施の形態2に係る対象物判定装置において、矩形ブロックAを比較参照値(Aref)とした場合の特徴パターンを模式的に示した図 本発明の実施の形態2に係る対象物判定装置において、矩形ブロックAを比較参照値(Aref)としたときの各矩形ブロックA,A,A,A,Aの平均輝度と、特徴パターンとを示す図 非特許文献1に記載された特徴量の一例(例1,2)を説明するための図 特許文献1に記載された特徴量の一例を説明するための図
以下、本発明を実施するための好適な実施の形態について、図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る対象物判定装置の概略構成を示すブロック図である。同図において、実施の形態1の対象物判定装置1は、入力部10と、縮小・拡大部11と、画像ウインドウ切り出し部12と、特徴量生成部13と、尤度算出部14と、学習データ記憶部15と、比較部16とを備える。入力部10は、例えばカメラで撮像して得られた画像情報の取り込みを行う。縮小・拡大部11は、入力部10で取り込まれた画像に対して縮小や拡大等の処理を行う。画像ウインドウ切り出し部12は、縮小・拡大部11で処理された画像から部分画像を切り出す。特徴量生成部13は、画像ウインドウ切り出し部12で切り出された画像に対して設定した各テンプレートの特徴量として特徴パターンを求める。この特徴量生成部13が行う処理の詳細については後述する。学習データ記憶部15には、Boostingなどにより事前に学習した人の顔に関する学習データが記憶されている。この学習データは、各テンプレートごとに存在する、当該テンプレートの特徴量(特徴パターン)に対するスコアの対比表となっている。尤度算出部14はこの学習データにより各テンプレートの特徴量(特徴パターン)から同テンプレートのスコアを求め、各テンプレートのスコアを総和することにより、顔らしさの尤度を算出する。比較部16は、尤度算出部14で算出された尤度と所定の尤度閾値を比較して、顔位置情報(切り出された画像が顔であるか否かの情報)を出力する。
図2は、上述した特徴量生成部13の概略構成を示すブロック図である。同図において、特徴量生成部13は、ブロック輝度算出部131と、ブロック対設定部132と、比較部133と、特徴量保持部134とを備える。ブロック輝度算出部131は、画像ウインドウ切り出し部12で切り出された画像上に複数の矩形ブロックから構成されるテンプレートを1乃至複数個所設定し、各テンプレートにおいて、当該テンプレートに含まれる各矩形ブロックの輝度の平均値をブロック輝度値として求める。ここで、図3は、テンプレートの一例を示す図である。図3の(a)に示すテンプレート100は、6つの矩形ブロックA〜Aから構成され、1つの矩形ブロックは他の3つの矩形ブロックと接触している。図3の(b)のテンプレート101は、図3の(a)に示すテンプレート100と同様に6つの矩形ブロックA〜Aから構成されるが、1つの矩形ブロックは他の3つの矩形ブロックと重なり合うように接している。図3の(c)のテンプレート102は、図3の(a)に示すテンプレート100と同様に6つの矩形ブロックA〜Aから構成されるが、矩形ブロック同士が不規則に重なり合っている。例えば、矩形ブロックAと矩形ブロックA及び矩形ブロックAと矩形ブロックAがそれぞれ重なり合っている。このようなテンプレートが画像ウインドウ切り出し部12で切り出された画像上に設定される。
図2に戻り、ブロック対設定部132は、各テンプレートのそれぞれにおいて、当該テンプレートに含まれる各矩形ブロックのうちいずれか2つを1対とするブロック対を複数設定する。比較部133は、ブロック対の各々においてブロック輝度値同士の大小関係を求めることにより特徴パターンを生成する。そして、その特徴パターンは特徴量保持部134に保持される。
なお、図3に示すテンプレートは一例であり、テンプレート内の各ブロックは、離れていても、接していても、重なりあっていてもよい。また、各ブロックのそれぞれのサイズは同じであってもよく、異なっていてもよい。また、テンプレート内のブロックの数は図3のように6に限定するわけではなく、2ブロックを1対として少なくとも2対以上のブロック、つまり3以上であればよい。
また、ブロック数、各ブロックの配置位置、各ブロックのサイズ、1対とするブロック同士の組み合わせは、複数あるそれぞれのテンプレートにおいて、同じであっても、異なっていてもよい。各テンプレートにおける、ブロック数、各ブロックの配置位置、各ブロックのサイズ、1対とするブロック同士の組みあわせ、更には、各テンプレートの位置は、Boostingなどの学習により事前に決定する。
実施の形態1の対象物判定装置1では、複数の矩形ブロックのうちのいずれか1つを比較参照値Ak[i]av(i=0〜5)にして特徴パターンPを求めるようにしている。ここで、“av”は平均値であることを示す。
=0 (Aiav<Ak[i]av) i=0〜5
=1 (Aiav≧Ak[i]av) i=0〜5
テンプレートを構成する複数の矩形ブロックのブロック輝度値はブロック輝度算出部131で算出される。そして、例えば、テンプレートとして、図3に示すものを使用した場合、特徴パターンP(i=0〜5)は、各矩形ブロックA〜Aのブロック輝度値Aiav(i=0〜5)と比較参照値Ak[i]av(i=0〜5)の大小関係が、Aiav<Ak[i]avであれば“0”となり、Aiav≧Ak[i]avであれば“1”となる。
比較参照値Ak[i]avを固定とする(矩形ブロックA〜Aのうちどれか1つを定める)以外に、非固定としても良い。図4は、テンプレート100を使用し、矩形ブロックAのブロック輝度値を比較参照値Ak[1]avとして固定した例を示す図である。この図で示す例では、比較参照値Ak[1]avとした矩形ブロックAのブロック輝度値が、矩形ブロックA,A〜Aそれぞれのブロック輝度値と比較される。
一方、比較参照値Ak[i]avを非固定とする場合、例えば、矩形ブロックAと矩形ブロックAの比較において、矩形ブロックAのブロック輝度値を比較参照値Ak[0]avとして、矩形ブロックAのブロック輝度値と比較し、また矩形ブロックAと矩形ブロックAの比較において、矩形ブロックAのブロック輝度値を比較参照値Ak[1]avとして、矩形ブロックAのブロック輝度値と比較し、また矩形ブロックAと矩形ブロックAの比較において、矩形ブロックAのブロック輝度値を比較参照値Ak[2]avとして、矩形ブロックAのブロック輝度値と比較する、といったようになる。
図5は、テンプレート100を使用した場合において、矩形ブロックAのブロック輝度値を比較参照値Ak[1]avとしたときの特徴パターンP(i=0〜5)の一例を示す図である。また、図6は、画像例150上に設定したテンプレート100において、矩形ブロックAを比較参照値(Aref)とした場合の特徴パターンを模式的に示した図である。矩形ブロックAを比較参照値(Aref)として、他の矩形ブロックA,A,A,A,Aそれぞれの輝度値とを比較することで、同図に示すような特徴パターン110−1,110−2,…が得られる。なお、各テンプレート100に隣接して付随する数(0,100,…)はスコア200である。同図における特徴パターン110−1,110−2,…,とスコア200の対比表が、図1における学習データ記憶部15に記憶されている学習データである。Boosting学習などにより、各テンプレートにおいて、顔の一部を示す特徴パターンであるほど高いスコアになっている。また、図6において、各テンプレート100を構成する6個の矩形ブロックA〜Aにおいて、色が黒になるに従って輝度が暗くなっている。
図7は、テンプレート100で、矩形ブロックAのブロック輝度値を比較参照値Ak[1]avとしたときの特徴パターン及び各特徴パターンを合計して平均化したときの特徴パターンの平均画像の一例を示す図である。図7の(a)に示す特徴パターンはテンプレートの位置(X,Y)が(3×k×m、3×k×n)にある(m、nは整数、kは矩形ブロックのサイズ)特徴パターンである。図7の(b)に示す特徴パターンはテンプレートの位置(X,Y)が(3×k×m+k、k×n)にある特徴パターンである。図7の(c)に示す特徴パターンはテンプレートの位置(X,Y)が(3×k×m+2×k、k×n)にある特徴パターンである。図7の(d)に示す特徴パターンはテンプレートの位置(X,Y)が(3×k×m、k×n+k)にある特徴パターンである。図7の(e)に示す特徴パターンはテンプレートの位置(X,Y)が(3×k×m+k、k×n+k)にある特徴パターンである。図7の(f)に示す特徴パターンはテンプレートの位置(X,Y)が(3×k×m+2×k、k×n+k)にある特徴パターンである。図7の(a)〜(f)の各特徴パターンを合計して平均すると、図7の(g)に示す特徴パターンの平均画像が得られる。
次に、図8〜図11を参照して本発明の特徴について説明する。
(特徴[1])
図8〜図10は、本発明の特徴[1]を説明するための図である。図8は、テンプレート100で、矩形ブロックAのブロック輝度値を比較参照値Ak[i]av(i=0〜5)としたときの特徴パターンの平均画像の一例を示す図である。図8の(a)は、矩形ブロックAのブロック輝度値を比較参照値Ak[0]avとしたときの特徴パターンの平均画像、図8の(b)は、矩形ブロックAのブロック輝度値を比較参照値Ak[1]avとしたときの特徴パターンの平均画像、図8の(c)は、矩形ブロックAのブロック輝度値を比較参照値Ak[2]avとしたときの特徴パターンの平均画像、図8の(d)は、矩形ブロックAのブロック輝度値を比較参照値Ak[3]avとしたときの特徴パターンの平均画像、図8の(e)は、矩形ブロックAのブロック輝度値を比較参照値Ak[4]avとしたときの特徴パターンの平均画像、図8の(f)は、矩形ブロックAのブロック輝度値を比較参照値Ak[5]avとしたときの特徴パターンの平均画像である。図8に示すように、特徴パターンに各方向や細かなエッジ(端)があり、顔パーツの特徴を多く残しているのが分る。
図9は、テンプレート101を用いたときの特徴パターンの平均画像の一例を示す図である。図3の(b)のテンプレート101のように、各矩形ブロックA〜Aが互いに重なり合っていている場合、図9に示すように、より細かなエッジ情報が含まれることになる。
図10は、前述した特許文献1で開示された特徴量による特徴パターンの平均画像を示す図である。図10に示す特徴パターンの平均画像と図7の(g)に示す本発明の特徴量による特徴パターンの平均画像とを比較すると、本発明の特徴量による特徴パターンの平均画像では、鼻輪郭情報300が有るが、特許文献1で開示された特徴量による特徴パターンの平均画像では鼻輪郭情報300が欠落しているのが分る。このように、本発明は、特徴量に各方向のエッジ情報が含まれるという特徴[1]を有している。
(特徴[2])
図11は、本発明の特徴[2]を説明するための図である。図11に示すように、本発明では、異なる顔の向きの各々に共通なテンプレートで、顔/非顔判定が行える可能性が高くなる。図11の(a)は左向き、(b)は正面、(c)は右向き、(d)は左回転、(e)は右回転である。これらの顔の向きに対して、共通の位置関係にある矩形ブロックA〜Aが設定される。そして、以下に示す関係であればスコアを高く、そうでなければスコアを低くする(Boostingなどの学習によってそのように設定される)。
正面:矩形ブロックAの輝度値>矩形ブロックAの輝度値、矩形ブロックAの輝度値>矩形ブロックAの輝度値、…、矩形ブロックAの輝度値<矩形ブロックAの輝度値、矩形ブロックAの輝度値<矩形ブロックAの輝度値
左向き:矩形ブロックAの輝度値<矩形ブロックAの輝度値、矩形ブロックAの輝度値<矩形ブロックAの輝度値、矩形ブロックAの輝度値>矩形ブロックAの輝度値、矩形ブロックAの輝度値<矩形ブロックAの輝度値、…
右向き:矩形ブロックAの輝度値<矩形ブロックAの輝度値、矩形ブロックAの輝度値<矩形ブロックAの輝度値、矩形ブロックAの輝度値<矩形ブロックAの輝度値、…、矩形ブロックAの輝度値<矩形ブロックAの輝度値
左回転:矩形ブロックAの輝度値<矩形ブロックAの輝度値、矩形ブロックAの輝度値<矩形ブロックAの輝度値、…、矩形ブロックAの輝度値>矩形ブロックAの輝度値
右回転:矩形ブロックAの輝度値<矩形ブロックAの輝度値、矩形ブロックAの輝度値<矩形ブロックAの輝度値、…、矩形ブロックAの輝度値>矩形ブロックAの輝度値、…
なお、上述した条件の全てを必ずしも満足する必要はない。例えば、右目をつぶっている場合などを想定し、正面であれば、矩形ブロックAの輝度値および矩形ブロックAの輝度値の大小関係だけが満足していない場合などであっても、スコアを高くしても良い(右目をつぶっている顔画像を学習に加えれば、Boostingなどの学習によってそのように設定される)。
一般的な顔検出では、異なる顔向きごとにテンプレートが異なるために、それぞれの顔向きの特徴量を算出する必要があった。本発明では、異なる顔向きの各々に共通なテンプレートを用いるために、一度に異なる顔向きに対する特徴量である特徴パターンが生成でき、効率的である。このように、本発明は、各顔の向きで共通の特徴パターンで顔/非顔を効率的に分離することができるという特徴[2]を有している。
次に、実施の形態1の対象物判定装置1の動作を説明する。
図12は、実施の形態1の対象物判定装置1の動作を説明するためのフローチャートである。同図において、まずブロック輝度算出部131が、画像上に複数の矩形ブロックから構成されるテンプレートを1乃至複数個設定すると共に、テンプレート内の各矩形ブロックの輝度の平均値(ブロック輝度値)を算出する(ステップS1)。次いで、ブロック対設定部132が、各テンプレートにおいて、当該テンプレートに含まれる各矩形ブロックのうちいずれか2つを1対とするブロック対を複数設定する(ステップS2)。次いで、比較部133が、ブロック対設定部132で設定された複数のブロック対の各々においてブロック輝度値同士の大小関係を示す特徴パターンを求め、特徴量保持部134に保持する(ステップS3)。次いで、尤度算出部14が、学習データ15を参照して各テンプレートの特徴パターンに対するスコアを求め、更に、全テンプレートのスコアを総和して尤度を求める(ステップS4)。最後に、比較部16が、尤度により、画像内に対象物である人の顔(または顔パーツなどの顔の一部)が含まれるか否かを判定する(ステップS5)。
このように、実施の形態1の対象物判定装置1によれば、1つのテンプレートに含まれる複数の矩形ブロックのうちいずれか2つを1対とするブロック対を複数設定し、各ブロック対のブロック輝度値の大小関係によって、当該テンプレート内に対象物の一部が含まれる度合いを示すスコアを保持し、この処理を全てのテンプレートに対して行い、全テンプレートのスコアの総和値により、画像内に対象物が含まれるか否かを判定する。特に、本発明では、1つのテンプレートに含まれる複数の矩形ブロックのいずれか1つを比較参照値にできるので、特許文献1で開示された技術と比べて、比較参照値の領域サイズが小さいため(大局的過ぎないため)、対象物が例えば人の顔であれば、顔の各パーツ(目、鼻、口等)の特徴を多く残すことができ、また隠蔽領域にかかる可能性が低くなる。これにより、部分的特徴検出にも向くとともに、部分隠蔽に強くなる。
なお、実施の形態1の対象物判定装置1のハード構成としては、通常のコンピュータを用いることもできる。即ち、対象物判定装置1は、CPU、RAM等の揮発性メモリ、及びROM等の不揮発性メモリ、及びハードディスク又はSSD(Solid State Drive)等の大容量記憶装置等を備えたコンピュータによって構成できる。
また、実施の形態1の対象物判定装置1における処理を記述したプログラムを、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等の記憶媒体に格納して配布することも可能である。
また、本実施の形態では、テンプレート内の各ブロックは矩形であるとしたが、これが三角形、多角形、円などであっても同様の効果が得られることは言うまでもない。
(実施の形態2)
前述した実施の形態1の対象物判定装置1では、特徴量を特徴パターンPのみとしたが、実施の形態2の対象物判定装置1A(図1参照)では、特徴量は、特徴パターンと、比較参照値(Aref)に対する明暗差を示す値(この値を“強度”と呼ぶ)の組としている。強度を含む特徴量は、特徴量生成部13A(図1参照)で生成される。明暗差を示す強度は、比較参照値(Aref)の矩形ブロックの明るさに対する明(明るい)の矩形ブロック(A<Aref)と、暗(暗い)の矩形ブロック(A>Aref)の振れ幅(即ち、明の矩形ブロックAと暗の矩形ブロックAの差)を示す値とする。これにより、強度Kは、輝度変化量が少なければ小さく、輝度変化量が多ければ大きい値をとり、目、口、鼻それぞれの境界等にあるエッジの強さを示すことになる。なお、特徴パターンを空間的周波数と捉えるならば、強度はその振幅と考えられる。
矩形ブロックが6つある場合の強度Kは以下のようにして求まる。ここで、“av”は平均値であることを示す。
=1 (Aiav<Ak[i]av) i=0〜5
=0 (Aiav≧Ak[i]av) i=0〜5
=0 (Aiav<Ak[i]av) i=0〜5
=1 (Aiav≧Ak[i]av) i=0〜5
K=(ΣB×Aiav)÷ΣB−(ΣD×Aiav)÷ΣD
図13は、強度を含めた場合の特徴量を求める工程を模式的に示した図である。図13の(a)は、前述した図3の(a)と同様の6つの矩形ブロックA〜Aから構成されるテンプレート100を示しており、このテンプレート100において、図13の(b)に示すように、矩形ブロックAの輝度値を「129」、矩形ブロックAの輝度値を「120」、矩形ブロックAの輝度値を「146」、矩形ブロックAの輝度値を「122」、矩形ブロックAの輝度値を「110」、矩形ブロックAの輝度値を「107」とし、矩形ブロックAを比較参照値(Aref)としてパターン化すると、図13の(c)に示すような特徴パターン110が得られる。即ち、矩形ブロックAの輝度値「129」と比較参照値(Aref)「120」との比較においては、129>120であるので、「1」となる。また、矩形ブロックAの輝度値「146」と比較参照値(Aref)「120」との比較においては、146>120であるので、「1」となる。また、矩形ブロックAの輝度値「122」と比較参照値(Aref)「120」との比較においては、122>120であるので、「1」となる。また、矩形ブロックAの輝度値「110」と比較参照値(Aref)「120」との比較においては、110<120であるので、「0」となる。また、矩形ブロックAの輝度値「107」と比較参照値(Aref)「120」との比較においては、107<120であるので、「0」となる。
このようにして得られた特徴パターン110から明の矩形ブロックの平均と暗の矩形ブロックの平均をそれぞれ求める。明の矩形ブロックの平均は、特徴量が「1」になっている矩形ブロックの輝度値より、(129+146+122)/3≒132.23となる。また、暗の矩形ブロックの平均は、特徴量が「0」になっている矩形ブロックの輝度値より、(110+107)/2=108.5となる。そして、強度は、明の矩形ブロックの輝度平均値−暗の矩形ブロックの輝度平均値≒23.833となる。この強度(23.833)と特徴パターン110の組が特徴量となる。このようにしてエッジ強度を含めた特徴量が得られ、この特徴量を用いることで顔検出の性能の向上が図れる。
図14は、画像例150上に設定したテンプレート100において、矩形ブロックAを比較参照値(Aref)とした場合の特徴パターンを模式的に示した図である。矩形ブロックAを比較参照値(Aref)として、他の矩形ブロックA,A,A,A,Aそれぞれの輝度値とを比較することで、同図に示すような特徴パターン110−1,110−2,…が得られる。なお、各テンプレート100に隣接して付随する数(0,30,70,100,…)はスコア200である。同図における特徴パターン110−1,110−2,…,と強度とスコア200の対比表が、実施の形態1同様、図1における学習データ記憶部15に記憶されている学習データである。また、各テンプレート100を構成する6個の矩形ブロックA〜Aにおいて、色が黒になるに従って輝度が暗くなっている。
図15は、画像上の人の顔の鼻を含む位置にテンプレート100を設定し、矩形ブロックAを比較参照値(Aref)としたときの各矩形ブロックA,A,A,A,Aの平均輝度と、特徴パターン110とを示す図である。同図に示すように、人物画像の両目部分が両目間の部分よりも暗くなっており、鼻と鼻を中心とした両側部分が両目間の部分よりも明るくなっているので、特徴パターン110は同図に示すようになる。両目と両目直下部分との輝度変化量が大きくなっている。
このように、実施の形態2の対象物判定装置1Aによれば、エッジ強度を含む特徴量を有するので、顔検出の性能向上が図れる。
なお、実施の形態2の対象物判定装置1Aにおいて、強度は、明暗差を示す値であれば良く、明の矩形ブロック及び暗の矩形ブロックそれぞれの最大値の差でも良い。また、上述した強度は、連続値であるが、これをN段階に量子化しても良い。量子化幅は固定値でも良いが、各矩形ブロックの値から算出された分散値に基づいた値でも良い。
また、実施の形態2の対象物判定装置1Aにおいても、ハード構成として、実施の形態1の対象物判定装置1と同様に、通常のコンピュータを用いることもできる。
また、実施の形態2の対象物判定装置1Aにおいても、処理を記述したプログラムを、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等の記憶媒体に格納して配布することも可能である。
本発明は、比較参照値が大局的過ぎることなく、対象物が例えば人の顔であれば、顔の各パーツ(目、鼻、口等)の特徴を多く残すことができ、また隠蔽領域にかかる可能性を低くできるといった効果を有し、監視カメラ装置等への適用が可能である。
1,1A 対象物判定装置
10 入力部
11 縮小・拡大部
12 画像ウインドウ切り出し部
13,13A 特徴量生成部
14 尤度算出部
15 学習データ記憶部
16 比較部
100,101,102 テンプレート
110−1〜110−5 特徴パターン
131 ブロック輝度算出部
132 ブロック対設定部
133 比較部
134 特徴量保持部
150 画像例
200 スコア
300 鼻輪郭情報
,A,A,A,A,A 矩形ブロック

Claims (3)

  1. 画像上に複数の矩形ブロックから構成されるテンプレートを1乃至複数個所設定し、各テンプレートの各々において、当該テンプレートに含まれる各矩形ブロックの輝度の平均値をブロック輝度値として求めるブロック輝度算出手段と、
    各テンプレートの各々において、当該テンプレートに含まれる各矩形ブロックのうちいずれか2つを1対とするブロック対を複数設定するブロック対設定手段と、
    前記ブロック対の各々においてブロック輝度値同士の大小関係を求める比較手段と、
    当該テンプレートに設定された複数のブロック対の各々のブロック輝度値の大小関係によって、前記テンプレート内に対象物の一部が含まれる度合いを示すスコアをテンプレート毎に保持するスコア保持手段と、を備え、
    前記各テンプレートの複数ブロック対の各々のブロック輝度値の大小関係から、前記スコア保持手段を参照して、全テンプレートのスコアの総和値を求め、同総和値により、前記画像内に対象物が含まれるか否かを判定することを特徴とする対象物判定装置。
  2. 前記矩形ブロックは、互いに重なり合っていることを特徴とする請求項1に記載の対象物判定装置。
  3. 前記矩形ブロックは、互いに接触していることを特徴とする請求項1に記載の対象物判定装置。
JP2011053201A 2011-03-10 2011-03-10 対象物判定装置 Expired - Fee Related JP5796185B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011053201A JP5796185B2 (ja) 2011-03-10 2011-03-10 対象物判定装置
PCT/JP2012/001658 WO2012120904A1 (ja) 2011-03-10 2012-03-09 対象物判定装置
US14/003,491 US9087231B2 (en) 2011-03-10 2012-03-09 Object determination device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011053201A JP5796185B2 (ja) 2011-03-10 2011-03-10 対象物判定装置

Publications (2)

Publication Number Publication Date
JP2012190263A JP2012190263A (ja) 2012-10-04
JP5796185B2 true JP5796185B2 (ja) 2015-10-21

Family

ID=46797875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011053201A Expired - Fee Related JP5796185B2 (ja) 2011-03-10 2011-03-10 対象物判定装置

Country Status (3)

Country Link
US (1) US9087231B2 (ja)
JP (1) JP5796185B2 (ja)
WO (1) WO2012120904A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5895242B2 (ja) * 2011-10-19 2016-03-30 パナソニックIpマネジメント株式会社 蝟集判定装置及び蝟集判定方法
US20140327737A1 (en) * 2013-05-01 2014-11-06 Raymond John Westwater Method and Apparatus to Perform Optimal Visually-Weighed Quantization of Time-Varying Visual Sequences in Transform Space
CN104850818B (zh) * 2014-02-17 2018-05-18 华为技术有限公司 人脸检测器训练方法、人脸检测方法及装置
KR102277379B1 (ko) * 2015-02-25 2021-07-14 삼성디스플레이 주식회사 터치 패널 및 그 제조 방법
JP2019070870A (ja) * 2017-10-05 2019-05-09 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
US10805549B1 (en) * 2019-08-20 2020-10-13 Himax Technologies Limited Method and apparatus of auto exposure control based on pattern detection in depth sensing system

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6792135B1 (en) * 1999-10-29 2004-09-14 Microsoft Corporation System and method for face detection through geometric distribution of a non-intensity image property
US6895103B2 (en) * 2001-06-19 2005-05-17 Eastman Kodak Company Method for automatically locating eyes in an image
US7505621B1 (en) * 2003-10-24 2009-03-17 Videomining Corporation Demographic classification using image components
JP4767595B2 (ja) 2005-06-15 2011-09-07 パナソニック株式会社 対象物検出装置及びその学習装置
JP2007025900A (ja) * 2005-07-13 2007-02-01 Canon Inc 画像処理装置、画像処理方法
US7627149B2 (en) * 2005-11-25 2009-12-01 Quantum Signal, Llc Dot templates for object detection in images
GB0607143D0 (en) * 2006-04-08 2006-05-17 Univ Manchester Method of locating features of an object
JP4908440B2 (ja) * 2008-03-06 2012-04-04 株式会社東芝 画像処理装置及び方法
JP5390943B2 (ja) * 2008-07-16 2014-01-15 キヤノン株式会社 画像処理装置及び画像処理方法
WO2010146786A1 (ja) * 2009-06-16 2010-12-23 日本電気株式会社 画像識別子照合装置
US8526684B2 (en) * 2009-12-14 2013-09-03 Microsoft Corporation Flexible image comparison and face matching application
US8331698B2 (en) * 2010-04-07 2012-12-11 Seiko Epson Corporation Ethnicity classification using multiple features

Also Published As

Publication number Publication date
US20140003728A1 (en) 2014-01-02
JP2012190263A (ja) 2012-10-04
WO2012120904A1 (ja) 2012-09-13
US9087231B2 (en) 2015-07-21

Similar Documents

Publication Publication Date Title
JP5796185B2 (ja) 対象物判定装置
US8891819B2 (en) Line-of-sight detection apparatus and method thereof
Verma et al. Face detection and tracking in a video by propagating detection probabilities
US9098760B2 (en) Face recognizing apparatus and face recognizing method
Leistner et al. On robustness of on-line boosting-a competitive study
JP6111297B2 (ja) 方法、装置、およびプログラム
EP3467774A1 (en) Method for tracking and segmenting a target object in an image using markov chain, and device using the same
Hati et al. Intensity range based background subtraction for effective object detection
JP2007265367A (ja) 視線検出方法および装置ならびにプログラム
Kawulok et al. Precise multi-level face detector for advanced analysis of facial images
Phimoltares et al. Face detection and facial feature localization without considering the appearance of image context
Rezaei et al. 3D cascade of classifiers for open and closed eye detection in driver distraction monitoring
Amjad et al. Multiple face detection algorithm using colour skin modelling
Hossain et al. Fast-D: When non-smoothing color feature meets moving object detection in real-time
US20210174062A1 (en) Image processing device, image processing method, and recording medium
Sengar et al. Moving object tracking using Laplacian-DCT based perceptual hash
Ishraque et al. Local Gabor directional pattern for facial expression recognition
Ahlvers et al. Model-free face detection and head tracking with morphological hole mapping
Anantharajah et al. Quality based frame selection for video face recognition
Vázquez et al. A new image division for LBP method to improve face recognition under varying lighting conditions
Rajeshwari et al. Survey on skin based face detection on different illumination, poses and occlusion
Al-Mukhtar Tracking and Blurring the face in a video file
Shaik et al. A robust method for multiple face tracking using Kalman filter
Phung et al. A new image feature for fast detection of people in images
Sankaran et al. Pose angle determination by face, eyes and nose localization

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140124

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20141008

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150324

R151 Written notification of patent or utility model registration

Ref document number: 5796185

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees