JP2006277682A

JP2006277682A - 位置検出装置及び位置検出方法

Info

Publication number: JP2006277682A
Application number: JP2005100050A
Authority: JP
Inventors: Swaminathan Sivakumar; シバクマールスワミナサン
Original assignee: Denso IT Laboratory Inc
Current assignee: Denso IT Laboratory Inc
Priority date: 2005-03-30
Filing date: 2005-03-30
Publication date: 2006-10-12

Abstract

【課題】顔検出の精度をより向上させることができる位置検出装置及び位置検出方法を提供する。
【解決手段】画像上の特徴から仮想中心線を検出可能な特定の対象物を撮影して得られた画像から対象物の画像における位置及びその位置における、仮想中心線の画像の基準線に対する傾きを検出する位置検出装置であって、基準線に対する仮想中心線の想定される傾きの範囲を複数に分け、撮影された画像を複数に分けられたそれぞれの範囲に対応する処理器によってそれぞれ処理し、処理された結果に基づいて対象物の画像における位置及びその位置における基準線に対する仮想中心線の傾きを検出する。
【選択図】図１

Description

本発明は、撮影された画像から対象物の位置及びその位置における対象物の傾きを検出する位置検出装置及び位置検出方法に関する。

従来から、カメラなどの撮像手段によって撮影された画像において、その画像中における対象物（例えば、顔など）の位置及びその位置における傾きを検出する技術があった。以下では説明をわかりやすくするため、対象物を人の顔に限定して説明する。ここで、顔の位置を検出する際、まっすぐな状態の顔ばかりでなく顔が傾いている場合もあり、顔が傾いている場合の位置を検出する技術が下記の非特許文献１に開示されている。ここで、非特許文献１に開示されている技術について説明する。まず、カメラなどの撮像手段によって顔が撮影される。撮影された画像の顔が傾いている場合、非特許文献１に開示された技術では、撮影された画像から顔を含む所定の領域（大きさ）のウインドウを抽出する。そして、抽出されたウインドウに対して識別器（処理器）を使い、顔のポーズ（傾き）を推定する。推定された傾きに基づいて、ウインドウの顔の傾きをなくす方向、すなわちウインドウの顔がまっすぐ垂直の状態になるように回転させる。そして、処理器がそのウインドウから人の顔として認識できるか否かを判断する。これによって人の顔の位置を検出することができる。
Rotation Invariant Neural Network-Based Face Detection, H.A.Rowley,S.Baluja,and T.kanade.,In Proc. of Computer Vision and Pattern Recognition,pages38-44,1998

しかしながら、非特許文献１に開示された技術では、以下のような問題がある。まず、顔のポーズ（傾き）を推定する際に誤差が生じてしまい、正確な推定が困難であるということである。また、ウインドウの顔の傾きをなくす方向に回転させることにより、認識の精度が低くなるということである。これは、回転させる際に背景部分も含んでいるからである。また、回転させることにより画像の解像度が低下することもある。このような問題があるために顔検出の精度は低くなってしまう。

本発明は、上記問題を解決するためのものであり、顔検出の精度をより向上させることができる位置検出装置及び位置検出方法を提供することを目的とする。

上記目的を達成するために、本発明によれば、画像上の特徴から仮想中心線を検出可能な特定の対象物を撮影して得られた画像から前記対象物の前記画像における位置及びその位置における、前記仮想中心線の前記画像の基準線に対する傾きを検出する位置検出装置であって、前記基準線に対する前記仮想中心線の想定される傾きの範囲を複数に分け、撮影された前記画像を前記複数に分けられたそれぞれの範囲に対応する処理器によってそれぞれ処理し、処理された結果に基づいて前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出する位置検出装置が提供される。この構成により、顔検出の精度をより向上させることができる。

また、本発明の位置検出装置において、前記位置検出装置が、対象物を含む画像を示す画像データを取得する画像データ取得手段と、取得された前記画像データが示す前記画像のうち、所定の画像領域を有する画像を抽出する画像抽出手段と、前記基準線を基準に想定される傾きの、複数に分けられた範囲に対応するマスク領域を前記画像に対してそれぞれ設定するマスク設定手段と、前記マスク領域が設定された前記画像ごとに、それぞれの前記マスク領域に対応する処理器によって処理値を算出する処理値算出手段と、算出された前記処理値に基づいて、前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出する検出手段とを備えることは、本発明の好ましい態様である。この構成により、顔検出の精度をより向上させることができる。

また、本発明の位置検出装置において、前記処理値算出手段によって算出された前記処理値を正規化する正規化手段を更に備えることは、本発明の好ましい態様である。この構成により、処理値の範囲を複数の処理値算出手段の間でそろえることができる。

また、本発明の位置検出装置において、前記処理値算出手段が機械学習手法を用いることは、本発明の好ましい態様である。この構成により、適切な値（処理値）を取得することができる。

また、本発明位置検出装置において、前記位置検出装置が、対象物を含む画像を示す画像データを取得する画像データ取得手段と、取得された前記画像データが示す前記画像のうち、所定の画像領域を有する画像を抽出する画像抽出手段と、抽出された前記画像の基準線に対する前記対象物の仮想中心線の傾きを推定する傾き推定手段と、推定された前記基準線に対する前記仮想中心線の傾きに対応するマスク領域を、抽出された前記画像に対して設定するマスク設定手段と、前記マスク領域が設定された前記画像に基づいて処理値を算出する処理値算出手段と、算出された前記処理値に基づいて、前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出する検出手段とを備えることは、本発明の好ましい態様である。この構成により、処理値算出手段における処理を低減でき、顔検出の精度をより向上させることができる。

また、本発明によれば、画像上の特徴から仮想中心線を検出可能な特定の対象物を撮影して得られた画像から前記対象物の前記画像における位置及びその位置における、前記仮想中心線の前記画像の基準線に対する傾きを検出する位置検出方法であって、前記基準線に対する前記仮想中心線の想定される傾きの範囲を複数に分け、撮影された前記画像を前記複数に分けられたそれぞれの範囲に対応する処理器によってそれぞれ処理するステップと、処理された結果に基づいて前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出するステップとを有する位置検出方法が提供される。この構成により、顔検出の精度をより向上させることができる。

また、本発明の位置検出方法において、前記位置検出方法が、対象物を含む画像を示す画像データを取得するステップと、取得された前記画像データが示す前記画像のうち、所定の画像領域を有する画像を抽出するステップと、前記基準線を基準に想定される傾きの、前記複数に分けられた範囲に対応するマスク領域を前記画像に対してそれぞれ設定するステップと、前記マスク領域が設定された前記画像ごとに、それぞれの前記マスク領域に対応する処理器によって処理値を算出するステップと、算出された前記処理値に基づいて、前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出するステップとを有することは、本発明の好ましい態様である。この構成により、顔検出の精度をより向上させることができる。

また、本発明の位置検出方法において、算出された前記処理値を正規化するステップを更に備えることは、本発明の好ましい態様である。この構成により、処理値の範囲を複数の処理値算出手段の間でそろえることができる。

また、本発明の位置検出方法において、前記処理値を算出する際、機械学習手法を用いることは、本発明の好ましい態様である。この構成により、適切な値（処理値）を取得することができる。

また、本発明の位置検出方法において、前記位置検出方法が、対象物を含む画像を示す画像データを取得するステップと、取得された前記画像データが示す前記画像のうち、所定の画像領域を有する画像を抽出するステップと、抽出された前記画像の基準線に対する前記対象物の仮想中心線の傾きを推定するステップと、推定された前記基準線に対する前記仮想中心線の傾きに対応するマスク領域を、抽出された前記画像に対して設定するステップと、前記マスク領域が設定された前記画像に基づいて処理値を算出するステップと、算出された前記処理値に基づいて、前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出するステップとを有することは、本発明の好ましい態様である。この構成により、処理値算出手段における処理を低減でき、顔検出の精度をより向上させることができる。

本発明の位置検出装置及び位置検出方法は、上記構成を有し、顔検出の精度をより向上させることができる。

＜第１の実施の形態＞
以下、本発明の第１の実施の形態について、図１から図６を用いて説明する。図１は本発明の第１の実施の形態に係る位置検出装置の構成を示す構成図である。図２は本発明の第１の実施の形態に係る位置検出装置における想定される顔の傾きの範囲を説明するための図である。図３Ａは本発明の第１の実施の形態に係る位置検出装置における０度傾いている（傾いていない）ときの顔の画像を示す図である。図３Ｂは本発明の第１の実施の形態に係る位置検出装置における２０度傾いているときの顔の画像を示す図である。図３Ｃは本発明の第１の実施の形態に係る位置検出装置における３４０度傾いているときの顔の画像を示す図である。

図４Ａは本発明の第１の実施の形態に係る位置検出装置における顔の傾きが３５０度から１０度の場合にかけられるマスクを説明するための図である。図４Ｂは本発明の第１の実施の形態に係る位置検出装置における顔の傾きが１０度から３０度の場合にかけられるマスクを説明するための図である。図４Ｃは本発明の第１の実施の形態に係る位置検出装置における顔の傾きが３０度から５０度の場合にかけられるマスクを説明するための図である。図４Ｄは本発明の第１の実施の形態に係る位置検出装置における顔の傾きが３３０度から３５０度の場合にかけられるマスクを説明するための図である。図５は本発明の第１の実施の形態に係る位置検出装置におけるマスク設定手段、識別値算出手段、判定手段における具体的な処理フローの一例を示すフロー図である。図６は本発明の第１の実施の形態に係る位置検出装置における顔検出の処理フローについて説明するためのフロー図である。

まず、本発明の第１の実施の形態に係る位置検出装置の構成について図１を用いて説明する。図１に示すように、位置検出装置１００は、画像データ取得手段１０１、画像抽出手段１０２、マスク設定手段１０３、識別値算出手段（上述した処理値算出手段に相当）１０４、判定手段（検出手段に相当）１０５、情報格納手段１０７から構成されており、バス１０８によってつながっている。なお、正規化手段１０６はオプションであり、後述する第２の実施の形態で説明する。画像データ取得手段１０１は、撮影の対象となる対象物を撮影する撮像手段１０９によって撮影された画像を取得する手段である。なお、本発明の第１の実施の形態では、撮像手段１０９は位置検出装置１００の構成要素となっていないが、位置検出装置１００の構成要素となっていてもよい。また、撮像手段１０９は、例えばカメラなどである。また、撮像手段１０９が撮影する対象物に制約はないが、以下では説明を分かりやすくするため撮影される対象物を人の顔とする。

画像抽出手段１０２は、画像データ取得手段１０１によって取得された画像のうち、所定の画像領域を有する画像を抽出する手段である。ここで、所定の画像領域を有する画像とは、例えば画像データ取得手段１０１によって取得された画像のサイズより小さいサイズ（ｍ×ｎ）の画像である。また、ｍとｎの単位はピクセルであって、ｍとｎは、例えば（ｍ、ｎ）＝｛（２０、２０）、（２５、２５）、（３０、３０）、・・・｝のような同一の値の組み合わせである。

マスク設定手段１０３は、抽出された画像の基準線を基準に想定される顔（対象物）の傾きの、複数に分けられた範囲に対応するマスク領域を画像抽出手段１０２によって抽出された画像に対してそれぞれ設定する手段である。ここで、画像の基準線とは、例えば画像を構成するラスタの基準線を言う。また、想定される顔の傾きの範囲とは、図２に示すように、例えば地面に対する垂直方向を０度とした場合に０度から３６０度までの範囲などを言う。この範囲はこれに限られるものではなく、−４５度（３１５度）から４５度までの範囲（角度９０度の間の範囲）であってもよい。ここで一例として、０度傾いている（傾いていない）ときの顔の画像、２０度傾いているときの顔の画像、３４０度傾いているときの顔の画像を図３Ａ、図３Ｂ、図３Ｃにそれぞれ示す。図３Ａは画像抽出手段１０２によって抽出された０度傾いているときの顔の画像を示している。図３Ｂは画像抽出手段１０２によって抽出された２０度傾いているときの顔の画像を示している。図３Ｃは画像抽出手段１０２によって抽出された３４０度傾いているときの顔の画像を示している。

また、想定される顔の傾きの範囲を複数に分けるとは、上述した範囲を、例えば３５０度から１０度、１０度から３０度、３０度から５０度、・・・と２０度ごとに分けることを言う。また、複数に分けられた想定される顔の傾きの範囲に対応するマスク領域について図４Ａ〜図４Ｄを用いて説明する。図４Ａは、例えば範囲が３５０度から１０度の場合に設定されるマスク４００を示しており、マスク４００の場合にはマスクされる領域はない。このため、抽出された画像にマスク４００をしても何も変わらない。図４Ｂは、例えば範囲が１０度から３０度の場合に設定されるマスク４０１を示しており、四隅の１つにマスクがされる。このマスク４０１は、例えばある隅の角を基点として縦横４ピクセルの三角形のマスク領域４０２を有するものである。抽出された画像にマスク４０１をすると抽出された画像の隅がマスクされ、後述する識別値算出手段１０４による処理の際、マスク領域（背景部分）４０２の影響はなくなる。

図４Ｃは、例えば範囲が３０度から５０度の場合に設定されるマスク４０３を示しており、四隅のうち対向する２つの隅にマスクがされる。隅のマスク領域４０４は図４Ｂで説明した三角形の領域と同じである。抽出された画像にマスク４０３をすると抽出された画像の２つの隅がマスクされ、後述する識別値算出手段１０４による処理の際、マスク領域（背景部分）４０４の影響はなくなる。図４Ｄは、例えば範囲が３３０度から３５０度の場合に設定されるマスク４０５を示しており、四隅の１つにマスクがされる。ただし、図４Ｂに示す場合のものとはマスク領域４０６の位置が異なる。隅のマスク領域４０６は図４Ｂで説明した三角形の領域と同じである。抽出された画像にマスク４０５をすると抽出された画像の隅がマスクされ、後述する識別値算出手段１０４による処理の際、マスク領域（背景部分）４０６の影響はなくなる。

識別値算出手段１０４は、マスク領域が設定された画像ごとに識別値を算出する手段である。識別値算出手段１０４は、上述した範囲ごとの識別器（上述した処理器に相当）から構成されている。これらの識別器は、それぞれあらかじめ学習された情報に基づいて得意とする（適切な処理結果を導出することができる）傾きの範囲を有している。すなわち、これらの識別器は、例えば３５０度から１０度の範囲を得意とする識別器、１０度から３０度の範囲を得意とする識別器、３０度から５０度の範囲を得意とする識別器、・・・などである。ここで、識別値とは、後述する判定手段１０５においてマスク領域が設定された画像が人物の顔であるかを判定する際に用いられる数値であって、例えば０から１の範囲の数値を言う。なお、この数値の範囲はこれに限られるものではない。

判定手段１０５は、それぞれの識別器から算出されたそれぞれの識別値に基づいて、識別器ごとにマスク領域が設定された画像が人物の顔であるか否かを判定し、人物の顔及びその位置を判定する手段である。ここで、判定する際の基準（閾値）は、例えば識別値が０．５以上という基準である。すなわち、算出された識別値が０．５以上であれば対象となっている画像は人物の顔であり、算出された識別値が０．５より小さいものであれば対象となっている画像は人物の顔ではないとされる。

ここで、マスク設定手段１０３、識別値算出手段１０４、判定手段１０５における具体的な処理の一例について図５を用いて説明する。まず、画像抽出手段１０２によって抽出された画像がマスク設定手段１０３のマスク設定部ｖ０、マスク設定部ｖ２０、・・・、マスク設定部ｖ３４０へ引き渡される。引き渡される画像は、後述する画像のコントラスト強調がされたものであることが望ましい。ここで、マスク設定部ｖ０は、上述したように、範囲が３５０度から１０度の場合に相当するマスク領域の情報をマスクモデル格納部ｖ０から取得し、この取得された情報に基づいてマスク領域を抽出された画像に設定するものである。マスク設定部ｖ２０は、範囲が１０度から３０度の場合に相当するマスク領域の情報をマスクモデル格納部ｖ２０から取得し、この取得された情報に基づいてマスク領域を抽出された画像に設定するものである。マスク設定部ｖ３４０は、範囲が３３０度から３５０度の場合に相当するマスク領域の情報をマスクモデル格納部ｖ３４０から取得し、この取得された情報に基づいてマスク領域を抽出された画像に設定するものである。なお、マスクモデル格納部、後述する識別モデル格納部、判定結果格納部は情報格納手段１０７にあってもよく、独立したものとしてあってもよい。

それぞれのマスク設定部は、引き渡された画像に対してマスク領域を設定し、設定された画像をそれぞれの識別器に引き渡す。ここで、識別値算出手段１０４は複数の識別器、識別器ｖ０、識別器ｖ２０、・・・、識別器ｖ３４０から構成されている。各識別器は、あらかじめ各識別モデル格納部に格納された対応する範囲について学習されたパターン（情報）に基づいて、マスク設定部から引き渡された画像に対する識別値を算出する。識別値を算出する際に用いられる技術は、ＮＮ（Neural Network：ニューラルネットワーク）やＳＶＭ（Support Vector Machines：サポートベクターマシン）などである。これらの技術は上述した機械学習手法で公知の技術であり、Computer Vision:A Modern Approach,by David A.Forsyth,Jean Ponce,Prentice Hall;1st edition (August 14,2002)やPattern Classification(2nd ed).by Richard O.Duda,.Peter E.Hart.and David G.Stork.Wiley Interscienceに開示されている。

そして、識別値算出手段１０４によって算出された識別値は判定手段１０５に引き渡される。ここで、判定手段１０５は複数の判定器、判定器ｖ０、判定器ｖ２０、・・・、判定器ｖ３４０から構成されている。各判定器は各識別器から引き渡された識別値とあらかじめ決められた基準値（閾値）とを比較し、所定の関係を満たした場合には対象とされている画像は人物の顔であると判断する。このとき、人物の顔であると判断された場合には、各判定器は判定結果格納部に後述するｘ、ｙ座標、scale_factor、識別器の情報などを格納する。なお、マスク設定手段１０３は、複数のマスク設定部から構成されているが、１つのマスク設定部がマスク領域を設定するようにしてもよい。また、判定手段１０５は、複数の判定器から構成されているが、１つの判定器が判断するようにしてもよい。

次に、本発明の第１の実施の形態に係る位置検出装置における顔検出の処理フローについて図６を用いて説明する。まず、画像データ取得手段１０１は、撮影の対象となる人を撮影するカメラなどの撮像手段によって撮影された画像データを取得する（ステップＳ６０１）。この撮影された画像を取得するものが上述した画像データ取得手段１０１である。次に、取得された画像データに対して、ノイズなどを除去するために平均フィルターを当てはめる（ステップＳ６０２）。ここで、平均フィルターのサイズは７×７（単位：ピクセル）のサイズであるが、これに限られるものではない。また、平均フィルターを当てはめるのは、画像データ取得手段１０１であってもよく、また不図示のフィルター当てはめ処理手段などが行うようにしてもよい。

次に、この処理フローで用いられるパラメータ（scale_min、scale_max、scale_factor、scale_step、ｍ、ｎ、Height、Width、Threshold）の初期化を行う（ステップＳ６０３）。ここで、scale_min及びscale_maxは、取得された画像サイズに対するサイズ変更倍率の下限値及び上限値であり、例えばscale_minは０．５、scale_maxは１．５である。また、scale_factorはscale_minとscale_maxとの間でとり得る値であり、例えば０．５から１．５の間の値である。scale_stepは、scale_factorがscale_minとscale_maxとの間でとる値の間隔であり、例えば０．２５である。この場合のscale_factorは０．５、０．７５、１．０、１．２５、１．５となる。ｍとｎに関しては上述したものである。また、Height及びWidthは画像の縦と横のサイズであり、例えばHeight×Widthが４８０×６４０、２４０×３２０などである。また、Thresholdは上述した判定手段１０５が判定する際に用いる基準値（閾値）であり、例えば０．５である。

そして、取得された画像のサイズを公知の技術である線形補間などを使って修正する（ステップＳ６０４）。修正された画像からｍ×ｎのサイズの画像を抽出する（ステップＳ６０５）。このｍ×ｎの画像を抽出するものが上述した画像抽出手段１０２である。抽出された画像に対して画像のコントラスト強調を行うヒストグラム均等化を施す（ステップＳ６０６）。そして、上述したマスク設定手段１０３、識別値算出手段１０４、判定手段１０５による処理をし、画像が人物の顔である場合にそのときのｘ、ｙ座標、scale_factorの値、識別器の情報（識別器を識別するための情報、ここではｖ０、ｖ２０、・・・、ｖ３４０）などを判定結果格納部に格納する（ステップＳ６０７）。

次に、人の顔の画像として候補とされた画像の数の分だけループさせ、不図示の制御手段はscale_factorが１であるか否かを判定する（ステップＳ６０８）。制御手段にscale_factorが１でないと判定された場合には、制御手段は正規（通常）とされる画像サイズに修正する（ステップＳ６０９）。なお、制御手段にscale_factorが１であると判定された場合には画像のサイズ変更はしない。そして、制御手段は、それぞれの画像をディスプレイなどの表示手段に表示させる（ステップＳ６１０）。

＜第２の実施の形態＞
次に、本発明の第２の実施の形態について図７を用いて説明する。図７は本発明の第２の実施の形態に係る位置検出装置のマスク設定手段、識別値算出手段、正規化手段、判定手段における具体的な処理フローの一例を示すフロー図である。本発明の第２の実施の形態は、図７に示すように、第１の実施の形態の識別値算出手段１０４と判定手段１０５との間に正規化手段１０６を加えたものである。正規化手段１０６では、識別値算出手段１０４から引き渡された識別値を正規化し、正規化された識別値を判定手段１０５へ引き渡す。正規化手段１０６では、下記の式（１）に基づいて正規化された新たな識別値を生成している。

ここで、ｒは識別器の情報（識別器を識別する情報ｖ０、ｖ２０、・・・、ｖ３４０）であり、offline_classification_scoreはモデルデータから得られる識別値の最大値である。このように、正規化手段１０６を備えることにより処理値の範囲を複数の処理値算出手段の間でそろえることができる。

＜第３の実施の形態＞
次に、本発明の第３の実施の形態について図８及び図９を用いて説明する。図８は本発明の第３の実施の形態に係る位置検出装置の構成を示す構成図である。図９は本発明の第３の実施の形態に係る位置検出装置の傾き推定手段、マスク設定手段、識別値算出手段、判定手段における具体的な処理フローの一例を示すフロー図である。

まず、第３の実施の形態に係る位置検出装置の構成について図８を用いて説明する。図８に示すように、位置検出装置２００は、画像データ取得手段１０１、画像抽出手段１０２、マスク設定手段１０３、識別値算出手段１０４、判定手段１０５、正規化手段１０６、情報格納手段１０７、傾き推定手段１１０から構成されており、バス１０８によってつながっている。第１の実施の形態で説明した手段に関しては同一ものであるため説明を省略する。なお、正規化手段１０６はオプションであり、位置検出装置２００に実装されていても実装されていなくてもよい。以下では正規化手段１０６が実装されていない場合について説明する。傾き推定手段１１０は、画像抽出手段１０２によって抽出されたヒストグラム均等化された画像に対して、画像に写された人物の傾きを推定する。この傾きの推定には公知の技術であるＮＮを用いる。これにより人物の傾きがわかる。

次に、本発明の第３の実施の形態に係る位置検出装置の傾き推定手段１１０、マスク設定手段１０３、識別値算出手段１０４、判定手段１０５における具体的な処理の一例について図９を用いて説明する。図９に示すように、まず、画像抽出手段１０２によって抽出された画像が傾き推定手段１１０に引き渡される。引き渡される画像は、上述した画像のコントラスト強調がなされたものであることが望ましい。傾き推定手段１１０によって画像の人物の傾きが推定されると、推定された傾きが含まれる範囲のマスク設定部へ引き渡され、その後の処理は第１の実施の形態で説明した流れで処理される。

本発明に係る位置検出装置及び位置検出方法は、顔検出の精度をより向上させることができるため、撮影された画像から対象物の位置及びその位置における対象物の傾きを検出する位置検出装置及び位置検出方法などに有用である。

本発明の第１の実施の形態に係る位置検出装置の構成を示す構成図である。本発明の第１の実施の形態に係る位置検出装置における想定される顔の傾きの範囲を説明するための図である。本発明の第１の実施の形態に係る位置検出装置における０度傾いている（傾いていない）ときの顔の画像を示す図である。本発明の第１の実施の形態に係る位置検出装置における２０度傾いているときの顔の画像を示す図である。本発明の第１の実施の形態に係る位置検出装置における３４０度傾いているときの顔の画像を示す図である。本発明の第１の実施の形態に係る位置検出装置における顔の傾きが３５０度から１０度の場合にかけられるマスクを説明するための図である。本発明の第１の実施の形態に係る位置検出装置における顔の傾きが１０度から３０度の場合にかけられるマスクを説明するための図である。本発明の第１の実施の形態に係る位置検出装置における顔の傾きが３０度から５０度の場合にかけられるマスクを説明するための図である。本発明の第１の実施の形態に係る位置検出装置における顔の傾きが３３０度から３５０度の場合にかけられるマスクを説明するための図である。本発明の第１の実施の形態に係る位置検出装置におけるマスク設定手段、識別値算出手段、判定手段における具体的な処理フローの一例を示すフロー図である。本発明の第１の実施の形態に係る位置検出装置における顔検出の処理フローについて説明するためのフロー図である。本発明の第２の実施の形態に係る位置検出装置のマスク設定手段、識別値算出手段、正規化手段、判定手段における具体的な処理フローの一例を示すフロー図である。本発明の第３の実施の形態に係る位置検出装置の構成を示す構成図である。本発明の第３の実施の形態に係る位置検出装置の傾き推定手段、マスク設定手段、識別値算出手段、判定手段における具体的な処理フローの一例を示すフロー図である。

符号の説明

１００、２００位置検出装置
１０１画像データ取得手段
１０２画像抽出手段
１０３マスク設定手段
１０４識別値算出手段（処理値算出手段）
１０５判定手段（検出手段）
１０６正規化手段
１０７情報格納手段
１０８バス
１０９撮像手段
１１０傾き推定手段
４００、４０１、４０３、４０５マスク
４０２、４０４、４０６マスク領域

Claims

画像上の特徴から仮想中心線を検出可能な特定の対象物を撮影して得られた画像から前記対象物の前記画像における位置及びその位置における、前記仮想中心線の前記画像の基準線に対する傾きを検出する位置検出装置であって、
前記基準線に対する前記仮想中心線の想定される傾きの範囲を複数に分け、撮影された前記画像を前記複数に分けられたそれぞれの範囲に対応する処理器によってそれぞれ処理し、処理された結果に基づいて前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出する位置検出装置。
前記位置検出装置は、
対象物を含む画像を示す画像データを取得する画像データ取得手段と、
取得された前記画像データが示す前記画像のうち、所定の画像領域を有する画像を抽出する画像抽出手段と、
前記基準線を基準に想定される傾きの、複数に分けられた範囲に対応するマスク領域を前記画像に対してそれぞれ設定するマスク設定手段と、
前記マスク領域が設定された前記画像ごとに、それぞれの前記マスク領域に対応する処理器によって処理値を算出する処理値算出手段と、
算出された前記処理値に基づいて、前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出する検出手段とを、
備える請求項１に記載の位置検出装置。
前記処理値算出手段によって算出された前記処理値を正規化する正規化手段を更に備える請求項２に記載の位置検出装置。
前記処理値算出手段は、機械学習手法を用いることを特徴とする請求項２又は３に記載の位置検出装置。
前記位置検出装置は、
対象物を含む画像を示す画像データを取得する画像データ取得手段と、
取得された前記画像データが示す前記画像のうち、所定の画像領域を有する画像を抽出する画像抽出手段と、
抽出された前記画像の基準線に対する前記対象物の仮想中心線の傾きを推定する傾き推定手段と、
推定された前記基準線に対する前記仮想中心線の傾きに対応するマスク領域を、抽出された前記画像に対して設定するマスク設定手段と、
前記マスク領域が設定された前記画像に基づいて処理値を算出する処理値算出手段と、
算出された前記処理値に基づいて、前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出する検出手段とを、
備える請求項１に記載の位置検出装置。
前記処理値算出手段によって算出された前記処理値を正規化する正規化手段を更に備える請求項５に記載の位置検出装置。
前記処理値算出手段は、機械学習手法を用いる請求項５又は６に記載の位置検出装置。
画像上の特徴から仮想中心線を検出可能な特定の対象物を撮影して得られた画像から前記対象物の前記画像における位置及びその位置における、前記仮想中心線の前記画像の基準線に対する傾きを検出する位置検出方法であって、
前記基準線に対する前記仮想中心線の想定される傾きの範囲を複数に分け、撮影された前記画像を前記複数に分けられたそれぞれの範囲に対応する処理器によってそれぞれ処理するステップと、
処理された結果に基づいて前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出するステップとを、
有する位置検出方法。
前記位置検出方法は、
対象物を含む画像を示す画像データを取得するステップと、
取得された前記画像データが示す前記画像のうち、所定の画像領域を有する画像を抽出するステップと、
前記基準線を基準に想定される傾きの、前記複数に分けられた範囲に対応するマスク領域を前記画像に対してそれぞれ設定するステップと、
前記マスク領域が設定された前記画像ごとに、それぞれの前記マスク領域に対応する処理器によって処理値を算出するステップと、
算出された前記処理値に基づいて、前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出するステップとを、
有する請求項８に記載の位置検出方法。
算出された前記処理値を正規化するステップを更に備えることを特徴とする請求項９に記載の位置検出方法。
前記処理値を算出する際、機械学習手法を用いることを特徴とする請求項９又は１０に記載の位置検出方法。
前記位置検出方法は、
対象物を含む画像を示す画像データを取得するステップと、
取得された前記画像データが示す前記画像のうち、所定の画像領域を有する画像を抽出するステップと、
抽出された前記画像の基準線に対する前記対象物の仮想中心線の傾きを推定するステップと、
推定された前記基準線に対する前記仮想中心線の傾きに対応するマスク領域を、抽出された前記画像に対して設定するステップと、
前記マスク領域が設定された前記画像に基づいて処理値を算出するステップと、
算出された前記処理値に基づいて、前記対象物の前記画像における位置及びその位置における前記基準線に対する前記仮想中心線の傾きを検出するステップとを、
有する請求項８に記載の位置検出方法。
算出された前記処理値を正規化するステップを更に備えることを特徴とする請求項１２に記載の位置検出方法。
前記処理値を算出する際、機械学習手法を用いる請求項１２又は１３に記載の位置検出方法。