JP2008102593A - オブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラム - Google Patents
オブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラム Download PDFInfo
- Publication number
- JP2008102593A JP2008102593A JP2006282517A JP2006282517A JP2008102593A JP 2008102593 A JP2008102593 A JP 2008102593A JP 2006282517 A JP2006282517 A JP 2006282517A JP 2006282517 A JP2006282517 A JP 2006282517A JP 2008102593 A JP2008102593 A JP 2008102593A
- Authority
- JP
- Japan
- Prior art keywords
- detection target
- image
- target image
- detection
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
【課題】学習時間、学習用サンプル画像あるいは弱仮説を記憶するためのメモリ容量を低減する。
【解決手段】画素抽出パターンが前記検出対象画像との相対的な位置関係により検出対象画像の領域外を抽出対象として含む場合に、前記領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出し、検出した画像特徴量に基づいて検出対象画像に含まれるオブジェクトが検出対象のオブジェクトか否かを判別する。あるいは、画素抽出パターンが前記検出対象画像との相対的な位置関係により検出対象画像の領域外を抽出対象として含む場合に、弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させ、再学習後の弱識別器の識別結果に基づいて、検出対象画像に含まれるオブジェクトが検出対象のオブジェクトか否かを判別する。
【選択図】図14
【解決手段】画素抽出パターンが前記検出対象画像との相対的な位置関係により検出対象画像の領域外を抽出対象として含む場合に、前記領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出し、検出した画像特徴量に基づいて検出対象画像に含まれるオブジェクトが検出対象のオブジェクトか否かを判別する。あるいは、画素抽出パターンが前記検出対象画像との相対的な位置関係により検出対象画像の領域外を抽出対象として含む場合に、弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させ、再学習後の弱識別器の識別結果に基づいて、検出対象画像に含まれるオブジェクトが検出対象のオブジェクトか否かを判別する。
【選択図】図14
Description
本発明は、オブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラムに係り、特に検出対象画像において人の顔画像のようなオブジェクトが回転している場合にも所望のオブジェクトが含まれているかを検出するためのオブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラムに関する。
特許文献1記載の発明では、弱仮説を生成する際に、一つの弱仮説から複数の弱仮説を生成する技術が開示されている。
特開2005−44330号公報
しかしながら、画像平面内で回転するオブジェクトである顔画像を検出する場合に、以下のような問題があった。
(1) 識別器を作成するための学習に多大の時間を要する。
(2) 回転角度に対応した多数の学習用サンプル画像(学習用顔画像)が必要になる。
(3) 顔画像は回転角度毎にパターンが異なるため、回転角度毎にサンプル画像を用意して識別器を学習して生成し、かつ、その結果をメモリに記憶する必要があり、弱仮説に関する情報を記憶する大容量のメモリが必要になる。
そこで、本発明の目的は、学習時間、学習用サンプル画像あるいは弱仮説を記憶するためのメモリ容量を低減しつつ、回転したオブジェクトを検出することが可能なオブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラムを提供することにある。
(1) 識別器を作成するための学習に多大の時間を要する。
(2) 回転角度に対応した多数の学習用サンプル画像(学習用顔画像)が必要になる。
(3) 顔画像は回転角度毎にパターンが異なるため、回転角度毎にサンプル画像を用意して識別器を学習して生成し、かつ、その結果をメモリに記憶する必要があり、弱仮説に関する情報を記憶する大容量のメモリが必要になる。
そこで、本発明の目的は、学習時間、学習用サンプル画像あるいは弱仮説を記憶するためのメモリ容量を低減しつつ、回転したオブジェクトを検出することが可能なオブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラムを提供することにある。
上記課題を解決するため、検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置において、前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンと、前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出する特徴量検出部と、前記検出した画像特徴量に基づいて前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別部と、を備えたことを特徴としている。
上記構成によれば、特徴量検出部は、画素抽出パターンが検出対象画像との相対的な位置関係により検出対象画像の領域外を抽出対象として含んでしまう場合に、領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出する。
これによりオブジェクト判別部は、検出した画像特徴量に基づいて前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別する。
したがって、オブジェクトを確実に検出できるとともに、画素抽出パターンを検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および学習用サンプル画像を記憶するためのメモリ容量を低減することが可能となる。
これによりオブジェクト判別部は、検出した画像特徴量に基づいて前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別する。
したがって、オブジェクトを確実に検出できるとともに、画素抽出パターンを検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および学習用サンプル画像を記憶するためのメモリ容量を低減することが可能となる。
この場合において、前記領域外には、前記領域の境界部分と同一の画素が配置されているものとするので、容易に画素、ひいては、画像特徴量の外挿が行え、処理の高速化が図れる。
また、検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置において、前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンと、前記検出対象画像が所定の基準配置位置にある場合に得られる前記画像特徴量に一対一に対応する弱識別器と、前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させる再学習部と、前記再学習後の弱識別器の識別結果に基づいて、前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別部と、を備えたことを特徴としている。
また、検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置において、前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンと、前記検出対象画像が所定の基準配置位置にある場合に得られる前記画像特徴量に一対一に対応する弱識別器と、前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させる再学習部と、前記再学習後の弱識別器の識別結果に基づいて、前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別部と、を備えたことを特徴としている。
上記構成によれば、再学習部は、画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させる。
これによりオブジェクト判別部は、再学習後の弱識別器の識別結果に基づいて、検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別する。
したがって、オブジェクトを確実に検出できるとともに、弱識別器を検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および弱識別器を記憶するためのメモリ容量を低減することが可能となる。
これによりオブジェクト判別部は、再学習後の弱識別器の識別結果に基づいて、検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別する。
したがって、オブジェクトを確実に検出できるとともに、弱識別器を検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および弱識別器を記憶するためのメモリ容量を低減することが可能となる。
これらの場合において、前記画像特徴量は、前記画像特徴量を検出する複数画素で構成される画素領域を二つの画素領域としたときの各画素領域を代表する輝度の輝度差であるようにしてもよい。
上記構成によれば、オブジェクトが人の顔画像であるような場合であっても、人種による肌の色の違いあるいは照明状況の影響を低減して、より確実にオブジェクトの回転角度を検出することができる。
上記構成によれば、オブジェクトが人の顔画像であるような場合であっても、人種による肌の色の違いあるいは照明状況の影響を低減して、より確実にオブジェクトの回転角度を検出することができる。
また、画素領域を代表する輝度は、当該画素領域において検出される輝度を所定の手順で補正した補正輝度であるようにしてもよい。
これにより、より正確にオブジェクトを検出することができる。
さらにまた、所定の基準位置画素および対象画素を対角線上の頂点とする矩形内のすべての画素の輝度値を積分して当該対象画素に対応する積分画素値とし、前記検出対象画像を構成するすべての画素に対応する積分画素値を求めて積分画像を生成する積分画像生成部を備え、前記特徴量検出部は、前記積分画像に基づいて前記画像特徴量を検出するようにしてもよい。
上記構成によれば、単純な演算で高速に画像特徴量を検出することが可能となる。
これにより、より正確にオブジェクトを検出することができる。
さらにまた、所定の基準位置画素および対象画素を対角線上の頂点とする矩形内のすべての画素の輝度値を積分して当該対象画素に対応する積分画素値とし、前記検出対象画像を構成するすべての画素に対応する積分画素値を求めて積分画像を生成する積分画像生成部を備え、前記特徴量検出部は、前記積分画像に基づいて前記画像特徴量を検出するようにしてもよい。
上記構成によれば、単純な演算で高速に画像特徴量を検出することが可能となる。
また、前回の前記検出対象画像のリサイズを行って今回の検出対象画像を生成するリサイズ画像生成部を備えるようにしてもよい。
上記構成によれば、リサイズ処理に要するメモリ容量を必要以上に大きくすることなく、オブジェクトを検出させることができる。
さらに、前記画素抽出パターンのリサイズを行って新たな画素抽出パターンを生成するリサイズパターン生成部を備えるようにしてもよい。
上記構成によれば、リサイズ処理に要するメモリ容量を必要以上に大きくすることなく、オブジェクトを検出させることができる。
さらにまた、前記検出対象のオブジェクトは顔画像であるようにしてもよい。
上記構成によれば、単純な演算で高速に顔画像を検出することが可能となる。
上記構成によれば、リサイズ処理に要するメモリ容量を必要以上に大きくすることなく、オブジェクトを検出させることができる。
さらに、前記画素抽出パターンのリサイズを行って新たな画素抽出パターンを生成するリサイズパターン生成部を備えるようにしてもよい。
上記構成によれば、リサイズ処理に要するメモリ容量を必要以上に大きくすることなく、オブジェクトを検出させることができる。
さらにまた、前記検出対象のオブジェクトは顔画像であるようにしてもよい。
上記構成によれば、単純な演算で高速に顔画像を検出することが可能となる。
また、検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置の制御方法において、前記オブジェクト検出装置は、前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンを有し、前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出する特徴量検出過程と、前記検出した画像特徴量に基づいて前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別過程と、を備えたことを特徴としている。
上記構成によれば、オブジェクトを確実に検出できるとともに、画素抽出パターンを検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および学習用サンプル画像を記憶するためのメモリ容量を低減することが可能となる。
上記構成によれば、オブジェクトを確実に検出できるとともに、画素抽出パターンを検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および学習用サンプル画像を記憶するためのメモリ容量を低減することが可能となる。
また、検出対象画像が所定の基準配置位置にある場合に得られる画像特徴量に一対一に対応する弱識別器および前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンを有し、前記検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置の制御方法において、前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させる再学習過程と、前記再学習後の弱識別器の識別結果に基づいて、前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別過程と、を備えたことを特徴としている。
上記構成によれば、オブジェクトを確実に検出できるとともに、弱識別器を検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および弱識別器を記憶するためのメモリ容量を低減することが可能となる。
上記構成によれば、オブジェクトを確実に検出できるとともに、弱識別器を検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および弱識別器を記憶するためのメモリ容量を低減することが可能となる。
また、検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置をコンピュータにより制御するための制御プログラムにおいて、前記オブジェクト検出装置は、前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンを有し、前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出させ、前記検出した画像特徴量に基づいて前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別させる、ことを特徴としている。
上記構成によれば、オブジェクトを確実に検出できるとともに、画素抽出パターンを検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および学習用サンプル画像を記憶するためのメモリ容量を低減することが可能となる。
上記構成によれば、オブジェクトを確実に検出できるとともに、画素抽出パターンを検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および学習用サンプル画像を記憶するためのメモリ容量を低減することが可能となる。
また、検出対象画像が所定の基準配置位置にある場合に得られる画像特徴量に一対一に対応する弱識別器および前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンを有し、前記検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置をコンピュータにより制御するための制御プログラムにおいて、前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させ、前記再学習後の弱識別器の識別結果に基づいて、前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別させる、ことを特徴としている。
上記構成によれば、オブジェクトを確実に検出できるとともに、弱識別器を検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および弱識別器を記憶するためのメモリ容量を低減することが可能となる。
上記構成によれば、オブジェクトを確実に検出できるとともに、弱識別器を検出対象画像との相対的な位置関係に応じた数だけ設ける必要がないので、学習時間および弱識別器を記憶するためのメモリ容量を低減することが可能となる。
次に本発明の好適な実施の形態について図面を参照して説明する。
以下の説明においては、オブジェクト画像が所望のオブジェクト画像、すなわち、当該オブジェクト画像が人の顔画像であるか否かを検出する場合について説明する。
図1は、実施形態のオブジェクト検出装置の概要構成ブロック図である。
オブジェクト検出装置10は、パーソナルコンピュータとして構成されており、オブジェクト画像の回転角度の検出処理およびオブジェクトが所望のオブジェクトであるか否かを判別する判別処理行う検出装置本体11と、画像入力装置としての撮像カメラ12と、各種操作を行うためのキーボード、マウスなどの入力装置13と、各種表示を行う液晶ディスプレイなどの表示装置14と、印刷を行うプリンタなどの出力装置15と、各種データを記憶するハードディスク装置などの外部記憶装置16と、を備えている。
検出装置本体11は、当該検出装置本体11全体の制御を行うマイクロプロセッサユニット(MPU)21と、各種データを記憶するROM22と、LAN、インターネットなどの外部の通信ネットワーク23との間のインタフェース動作を行う通信インタフェース部24と、を備えている。
以下の説明においては、オブジェクト画像が所望のオブジェクト画像、すなわち、当該オブジェクト画像が人の顔画像であるか否かを検出する場合について説明する。
図1は、実施形態のオブジェクト検出装置の概要構成ブロック図である。
オブジェクト検出装置10は、パーソナルコンピュータとして構成されており、オブジェクト画像の回転角度の検出処理およびオブジェクトが所望のオブジェクトであるか否かを判別する判別処理行う検出装置本体11と、画像入力装置としての撮像カメラ12と、各種操作を行うためのキーボード、マウスなどの入力装置13と、各種表示を行う液晶ディスプレイなどの表示装置14と、印刷を行うプリンタなどの出力装置15と、各種データを記憶するハードディスク装置などの外部記憶装置16と、を備えている。
検出装置本体11は、当該検出装置本体11全体の制御を行うマイクロプロセッサユニット(MPU)21と、各種データを記憶するROM22と、LAN、インターネットなどの外部の通信ネットワーク23との間のインタフェース動作を行う通信インタフェース部24と、を備えている。
[1]第1実施形態
図2は、第1実施形態のオブジェクト検出装置の機能ブロック図である。
オブジェクト検出装置10は、オブジェクト画像を含む検出対象画像から検出したオブジェクトが所望のオブジェクトであるか否かを判別するための複数の画素(画素領域)を抽出するための画素抽出パターンを記憶する画素抽出パターン記憶部31と、検出対象画像から画像特徴量を生成する画像特徴量生成部33と、上記検出対象画像のリサイズを行い新たな検出対象画像を生成するリサイズ部34と、前記画像特徴量生成部が画像特徴量の生成を高速に行うために画像特徴量の積分画像を生成する積分画像処理部35と、画像特徴量および尤度に基づいてオブジェクトの回転角度を判別する回転角度判別部36と、画像特徴量およびオブジェクトの回転角度に基づいて検出対象画像に含まれるオブジェクトが所望のオブジェクト(本実施形態では顔画像)であるか否かを判別するオブジェクト判別部37と、検出のための学習あるいは再学習を行う学習部38と、を備えている。
次に第1実施形態の動作を説明する。
本第1実施形態においては、検出対象画像の回転角度に応じて、後述する画素抽出パターンに対応する領域のうち、検出対象画像の領域外に位置する領域を判別し、当該領域については、推定した所定の画素が配置されているものとして処理を行っている。
図2は、第1実施形態のオブジェクト検出装置の機能ブロック図である。
オブジェクト検出装置10は、オブジェクト画像を含む検出対象画像から検出したオブジェクトが所望のオブジェクトであるか否かを判別するための複数の画素(画素領域)を抽出するための画素抽出パターンを記憶する画素抽出パターン記憶部31と、検出対象画像から画像特徴量を生成する画像特徴量生成部33と、上記検出対象画像のリサイズを行い新たな検出対象画像を生成するリサイズ部34と、前記画像特徴量生成部が画像特徴量の生成を高速に行うために画像特徴量の積分画像を生成する積分画像処理部35と、画像特徴量および尤度に基づいてオブジェクトの回転角度を判別する回転角度判別部36と、画像特徴量およびオブジェクトの回転角度に基づいて検出対象画像に含まれるオブジェクトが所望のオブジェクト(本実施形態では顔画像)であるか否かを判別するオブジェクト判別部37と、検出のための学習あるいは再学習を行う学習部38と、を備えている。
次に第1実施形態の動作を説明する。
本第1実施形態においては、検出対象画像の回転角度に応じて、後述する画素抽出パターンに対応する領域のうち、検出対象画像の領域外に位置する領域を判別し、当該領域については、推定した所定の画素が配置されているものとして処理を行っている。
図3は、第1実施形態の概要処理フローチャートである。
オブジェクト検出装置10に検出対象画像50が入力されると、検出装置本体11は、検出対象画像に含まれるオブジェクト(この段階におけるオブジェクトは、検出対象のオブジェクトおよび非検出対象のオブジェクトの双方を含むものである)の回転角度を検出する(ステップS1)。
次に検出装置本体11は、検出した回転角度に応じ、画素抽出パターンが検出対象画像との相対的な位置関係により検出対象画像の領域外を抽出対象として含んでしまう場合に、領域外には、位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出する(ステップS2)。
そして、検出装置本体11は、検出した画像特徴量に基づいて検出対象画像に含まれるオブジェクトが所望の検出対象のオブジェクトか否かを判別して処理を終了する(ステップS3)。
したがって、全ての回転状態に応じた画素抽出パターンを用意する必要がなく、記憶容量の低減、処理の簡易化並びに高速化を図ることが可能となっている。
オブジェクト検出装置10に検出対象画像50が入力されると、検出装置本体11は、検出対象画像に含まれるオブジェクト(この段階におけるオブジェクトは、検出対象のオブジェクトおよび非検出対象のオブジェクトの双方を含むものである)の回転角度を検出する(ステップS1)。
次に検出装置本体11は、検出した回転角度に応じ、画素抽出パターンが検出対象画像との相対的な位置関係により検出対象画像の領域外を抽出対象として含んでしまう場合に、領域外には、位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出する(ステップS2)。
そして、検出装置本体11は、検出した画像特徴量に基づいて検出対象画像に含まれるオブジェクトが所望の検出対象のオブジェクトか否かを判別して処理を終了する(ステップS3)。
したがって、全ての回転状態に応じた画素抽出パターンを用意する必要がなく、記憶容量の低減、処理の簡易化並びに高速化を図ることが可能となっている。
まず具体的な説明に先立ち、オブジェクトが所望のオブジェクトであるか否かを判別するための画像特徴量を検出するための画素抽出パターンについて説明する。
図4は、画素抽出パターンの一例の説明図である。
図4(a)は、第1の例の画素抽出パターン40Aであり、検出対象画像から画像特徴量としての輝度差を検出する複数画素で構成される長方形状(矩形形状)の画素領域を抽出し、対応する画素領域を代表する輝度値(代表輝度値)が正の値を持つように定義された第1画素抽出領域40A1と、対応する画素領域の輝度値(代表輝度値)が負の値を持つように定義された第2画素抽出領域40A2とに分けた二つの画素抽出領域を有している。
ここで、第2画素抽出領域は、さらに二つの画素抽出領域40A21、40A22に分けられている。
図4は、画素抽出パターンの一例の説明図である。
図4(a)は、第1の例の画素抽出パターン40Aであり、検出対象画像から画像特徴量としての輝度差を検出する複数画素で構成される長方形状(矩形形状)の画素領域を抽出し、対応する画素領域を代表する輝度値(代表輝度値)が正の値を持つように定義された第1画素抽出領域40A1と、対応する画素領域の輝度値(代表輝度値)が負の値を持つように定義された第2画素抽出領域40A2とに分けた二つの画素抽出領域を有している。
ここで、第2画素抽出領域は、さらに二つの画素抽出領域40A21、40A22に分けられている。
そして、図4(a)に示すような画素抽出パターン40Aを用いる場合の輝度差は以下のように表される。
第1画素抽出領域40A1に対応する検出対象画像の画素を代表する輝度の値を輝度値V1とし、第2画素抽出領域40A2の二つに分けられた画素抽出領域40A21、40A22のうち、一方の画素抽出領域に対応する検出対象画像の画素を代表する輝度の値を輝度値をV21とし、他方の画素抽出領域に対応する検出対象画像の画素を代表する輝度の値を輝度値をV22とした場合、対応する画素領域全体の画像特徴量、すなわち、輝度差Vは、
V=V1+V21+V22
となる。
第1画素抽出領域40A1に対応する検出対象画像の画素を代表する輝度の値を輝度値V1とし、第2画素抽出領域40A2の二つに分けられた画素抽出領域40A21、40A22のうち、一方の画素抽出領域に対応する検出対象画像の画素を代表する輝度の値を輝度値をV21とし、他方の画素抽出領域に対応する検出対象画像の画素を代表する輝度の値を輝度値をV22とした場合、対応する画素領域全体の画像特徴量、すなわち、輝度差Vは、
V=V1+V21+V22
となる。
図4(b)は、第2の例の画素抽出パターン40Bであり、検出対象画像から画像特徴量としての輝度差を検出する複数画素で構成される正方形状の画素領域を抽出し、当該正方形状の画素領域を対角線上で4つの正方形状に区分し、一方の対角線上の2つの正方形状の画素領域で構成され、当該画素領域を代表する輝度値(代表輝度値)が正の値を持つように定義された第1画素抽出領域40B1と、他方の対角線上の2つの正方形状の画素領域輝度値(代表輝度値)が負の値を持つように定義された第2画素抽出領域40B2とに分けた二つの画素抽出領域を有している。
ここで、第1画素抽出領域40B1は、さらに二つの正方形状の画素抽出領域40B11、40B12に分けられ、第2画素抽出領域40B2は、さらに二つの正方形状の画素抽出領域40B21、40B22に分けられている。
そして、図4(b)に示すような画素抽出パターンを用いる場合の輝度差は以下のように表される。
第1画素抽出領域40B1を構成する画素抽出領域40B11に対応する検出対象画像の画素を代表する輝度の値を輝度値V11とし、画素抽出領域40B12に対応する検出対象画像の画素を代表する輝度の値を輝度値V12とし、第2画素抽出領域40B2を構成する画素抽出領域40B21に対応する検出対象画像の画素を代表する輝度の値を輝度値V21とし、画素抽出領域40B22に対応する検出対象画像の画素を代表する輝度の値を輝度値V22とした場合、対応する画素領域全体の画像特徴量、すなわち、輝度差Vは、
V=V11+V12+V21+V22
となる。
そして、図4(b)に示すような画素抽出パターンを用いる場合の輝度差は以下のように表される。
第1画素抽出領域40B1を構成する画素抽出領域40B11に対応する検出対象画像の画素を代表する輝度の値を輝度値V11とし、画素抽出領域40B12に対応する検出対象画像の画素を代表する輝度の値を輝度値V12とし、第2画素抽出領域40B2を構成する画素抽出領域40B21に対応する検出対象画像の画素を代表する輝度の値を輝度値V21とし、画素抽出領域40B22に対応する検出対象画像の画素を代表する輝度の値を輝度値V22とした場合、対応する画素領域全体の画像特徴量、すなわち、輝度差Vは、
V=V11+V12+V21+V22
となる。
図4(c)は、第3の例の画素抽出パターン40Cであり、検出対象画像から画像特徴量としての輝度差を検出する複数画素で構成される正方形状の画素領域を抽出し、当該正方形状の画素領域を2つの隣接する長方形状(矩形形状)に区分し、長方形状の画素領域を代表する輝度値(代表輝度値)が正の値を持つように定義された第1画素抽出領域40C1と、長方形状の画素領域輝度値(代表輝度値)が負の値を持つように定義された第2画素抽出領域40C2とに分けた二つの画素抽出領域を有している。
そして、図4(c)に示すような画素抽出パターンを用いる場合の輝度差は以下のように表される。
第1画素抽出領域40C1に対応する検出対象画像の画素を代表する輝度の値を輝度値V1とし、第2画素抽出領域40C2に対応する検出対象画像の画素を代表する輝度の値を輝度値V2とした場合、対応する画素領域全体の画像特徴量、すなわち、輝度差Vは、
V=V1+V2
となる。
そして、図4(c)に示すような画素抽出パターンを用いる場合の輝度差は以下のように表される。
第1画素抽出領域40C1に対応する検出対象画像の画素を代表する輝度の値を輝度値V1とし、第2画素抽出領域40C2に対応する検出対象画像の画素を代表する輝度の値を輝度値V2とした場合、対応する画素領域全体の画像特徴量、すなわち、輝度差Vは、
V=V1+V2
となる。
図4(d)は、第4の例の画素抽出パターン40Dであり、検出対象画像から画像特徴量としての輝度差を検出する複数画素で構成されるそれぞれ長方形状の二つの画素領域を抽出し、長方形状の画素領域を代表する輝度値(代表輝度値)が正の値を持つように定義された第1画素抽出領域40D1と、長方形状の画素領域輝度値(代表輝度値)が負の値を持つように定義された第2画素抽出領域40D2とに分けた二つの画素抽出領域を有している。
そして、図4(d)に示すような画素抽出パターンを用いる場合の輝度差は以下のように表される。
第1画素抽出領域40D1に対応する検出対象画像の画素を代表する輝度の値を輝度値V1とし、第2画素抽出領域40D2に対応する検出対象画像の画素を代表する輝度の値を輝度値V2とした場合、対応する画素領域全体の画像特徴量、すなわち、輝度差Vは、
V=V1+V2
となる。
実際に輝度差Vを用いる場合には、所定のしきい値輝度差を用意して判別を行ったり、最大輝度差および最小輝度差をサンプル画像から推定し、輝度差の量子化(例えば、32段階あるいは64段階)を行う。
そして、図4(d)に示すような画素抽出パターンを用いる場合の輝度差は以下のように表される。
第1画素抽出領域40D1に対応する検出対象画像の画素を代表する輝度の値を輝度値V1とし、第2画素抽出領域40D2に対応する検出対象画像の画素を代表する輝度の値を輝度値V2とした場合、対応する画素領域全体の画像特徴量、すなわち、輝度差Vは、
V=V1+V2
となる。
実際に輝度差Vを用いる場合には、所定のしきい値輝度差を用意して判別を行ったり、最大輝度差および最小輝度差をサンプル画像から推定し、輝度差の量子化(例えば、32段階あるいは64段階)を行う。
以上の説明では、輝度値を検出値そのままとしていたが、補正値を用いるようにしてもよい。例えば、補正輝度値は次式により表される。
補正輝度値=(オブジェクト画像の輝度値−オブジェクト画像の輝度平均値)
/(オブジェクト画像の輝度の標準偏差)/補正値
ここで、補正値は、定数であり、例えば、2.0が用いられる。
補正輝度値=(オブジェクト画像の輝度値−オブジェクト画像の輝度平均値)
/(オブジェクト画像の輝度の標準偏差)/補正値
ここで、補正値は、定数であり、例えば、2.0が用いられる。
ここで、積分画像処理部35の動作について説明する。
図5は、検出対象画像に対応する輝度値積分画像生成の概要説明図である。
図5は、検出対象画像が640×480画素の場合である。
積分画像処理部35は、検出対象画像を構成する基準位置画素PX0,0および対象画素PXm,nを対角線上の頂点とする矩形RA内のすべての画素PX0,0〜PXm,nの画像特徴量である輝度値を積分して当該対象画素PXm,nに対応する輝度積分値としている。
図5は、検出対象画像に対応する輝度値積分画像生成の概要説明図である。
図5は、検出対象画像が640×480画素の場合である。
積分画像処理部35は、検出対象画像を構成する基準位置画素PX0,0および対象画素PXm,nを対角線上の頂点とする矩形RA内のすべての画素PX0,0〜PXm,nの画像特徴量である輝度値を積分して当該対象画素PXm,nに対応する輝度積分値としている。
図6は、積分画像生成の具体的説明のための説明図である。
具体的には、図6に示すように、対象画素PXm,n=PX3,3である場合には、基準位置画素PX0,0および対象画素PX3,3を対角線上の頂点とする矩形RA1内のすべての画素PX0,0〜PX3,3の値を積分(実際には、単純加算)して当該対象画素PX3,3に対応する輝度積分値ΣPX3,3が算出される。
具体的には、図6に示すように、対象画素PXm,n=PX3,3である場合には、基準位置画素PX0,0および対象画素PX3,3を対角線上の頂点とする矩形RA1内のすべての画素PX0,0〜PX3,3の値を積分(実際には、単純加算)して当該対象画素PX3,3に対応する輝度積分値ΣPX3,3が算出される。
図7は、生成した積分画像の説明図である。
図7においては、理解の容易のため、輝度が0〜3の値を採る場合について説明しているが、実際には、より多段階(例えば、256段階)の輝度値が用いられる。
具体的には、図7の場合、輝度積分値は次式により算出される。
ΣPX3,3=0+0+0+0+0+0+1+1+0+1+2+3+0+1+3+1
=13
図7においては、理解の容易のため、輝度が0〜3の値を採る場合について説明しているが、実際には、より多段階(例えば、256段階)の輝度値が用いられる。
具体的には、図7の場合、輝度積分値は次式により算出される。
ΣPX3,3=0+0+0+0+0+0+1+1+0+1+2+3+0+1+3+1
=13
同様にして、基準位置画素PX0,0および対象画素PX3,3を対角線上の頂点とする矩形RA1内の輝度積分値に対応する積分画像は、図6に示すようなものとなる。
図8は、画像抽出パターンを構成する画素抽出領域の設定状態の説明図である。
例えば、図4(a)に示した画素抽出領域40A1、40A21、40A22のサイズをそれぞれ20×20画素とした場合、初期状態(第1回目)において、画素抽出領域40A21は、開始画素PX0,0および終了画素PX19,19を対角線上の頂点とする矩形の領域に相当するものとなっている。
図8は、画像抽出パターンを構成する画素抽出領域の設定状態の説明図である。
例えば、図4(a)に示した画素抽出領域40A1、40A21、40A22のサイズをそれぞれ20×20画素とした場合、初期状態(第1回目)において、画素抽出領域40A21は、開始画素PX0,0および終了画素PX19,19を対角線上の頂点とする矩形の領域に相当するものとなっている。
そして、検出対象画像の画素数を640×480画素とし、終了画素をPXP,Q(0≦P≦639、0≦Q≦479)とした場合には、P=580(=639−59)となるまでは、Qの値は同じにして、画素抽出領域40A1、40A21、40A22を設定する。その後、P=620となった時点で、Qの値に1を加算し、Pの値を再び0として次の画素抽出領域40A1、40A21、40A22を設定する。
同様にして、P=580(=639−59)、Q=460(=479−19)となるまで、画素抽出領域40A1、40A21、40A22の設定を繰り返すこととなる。
ここで輝度積分値の算出の原理について説明する。
画素PXx,yにおける輝度(画像特徴量)をCとした場合の、積分画像II(PXx,y)は、次式により算出される。
同様にして、P=580(=639−59)、Q=460(=479−19)となるまで、画素抽出領域40A1、40A21、40A22の設定を繰り返すこととなる。
ここで輝度積分値の算出の原理について説明する。
画素PXx,yにおける輝度(画像特徴量)をCとした場合の、積分画像II(PXx,y)は、次式により算出される。
いずれかの画素抽出領域の範囲を(x0≦x≦x1、y0≦y≦y1)とすれば、輝度積分値は、次式により表される。
次により具体的な輝度積分値の算出について説明する。
図9は、輝度積分値の算出の説明図である。
輝度積分値の算出において、検出装置本体11は、画素抽出領域40A21に対応する画素の輝度積分値を算出する場合には、矩形RA11〜RA14の各矩形毎の積分値を用いて行う。
具体的には、上述したように画素抽出領域40A21の大きさを20×20画素とすると、画素抽出領域40A21の開始画素がPXS,Tである場合には、終了画素がPXS+19,T+19となる。
このとき、矩形RA11は、開始画素PX0,0および終了画素PXS−1,T−1を対角線上の頂点とする矩形となる。したがって、矩形RA11の積分値ΣRA11は、ΣPXS−1,T−1となる。
図9は、輝度積分値の算出の説明図である。
輝度積分値の算出において、検出装置本体11は、画素抽出領域40A21に対応する画素の輝度積分値を算出する場合には、矩形RA11〜RA14の各矩形毎の積分値を用いて行う。
具体的には、上述したように画素抽出領域40A21の大きさを20×20画素とすると、画素抽出領域40A21の開始画素がPXS,Tである場合には、終了画素がPXS+19,T+19となる。
このとき、矩形RA11は、開始画素PX0,0および終了画素PXS−1,T−1を対角線上の頂点とする矩形となる。したがって、矩形RA11の積分値ΣRA11は、ΣPXS−1,T−1となる。
同様に矩形RA12は、開始画素PX0,0および終了画素PXS+19,T−1を対角線上の頂点とする矩形となる。したがって、矩形RA12の積分値ΣRA12は、ΣPXS+19,T−1となる。
また、矩形RA13は、開始画素PX0,0および終了画素PXS−1,T+19を対角線上の頂点とする矩形となる。したがって、矩形RA13の積分値ΣRA13は、ΣPXS−1,T+19となる。
また、矩形RA14は、開始画素PX0,0および終了画素PXS+19,T+19を対角線上の頂点とする矩形となる。したがって、矩形RA13の積分値ΣRA14は、ΣPX+19,T+19となる。
また、矩形RA13は、開始画素PX0,0および終了画素PXS−1,T+19を対角線上の頂点とする矩形となる。したがって、矩形RA13の積分値ΣRA13は、ΣPXS−1,T+19となる。
また、矩形RA14は、開始画素PX0,0および終了画素PXS+19,T+19を対角線上の頂点とする矩形となる。したがって、矩形RA13の積分値ΣRA14は、ΣPX+19,T+19となる。
これらの結果、画素抽出領域40A21に対応する画素の輝度積分値ΣDWは、次式により表される。
ΣDW=ΣRA14+ΣRA11−ΣRA12−ΣRA13
このようにして得られた輝度積分値に基づいて、画素抽出パターン中の輝度分布を算出し、算出した輝度分布が所定の輝度分布となっているかを判別することにより、オブジェクトであるか否かを判別することができるのである。
ΣDW=ΣRA14+ΣRA11−ΣRA12−ΣRA13
このようにして得られた輝度積分値に基づいて、画素抽出パターン中の輝度分布を算出し、算出した輝度分布が所定の輝度分布となっているかを判別することにより、オブジェクトであるか否かを判別することができるのである。
図10は、検出対象画像(あるいはリサイズ検出対象画像)に画像抽出パターンを適用した場合の説明図である。
図10(a)は、画素抽出パターン40Aを適用した場合、図10(b)、(c)は、画素抽出パターン40Cを適用した場合のものである。
図10に示した場合は、検出対象画像(あるいはリサイズ検出対象画像)50内でオブジェクトである顔画像が回転角度=0°(基準配置位置)の場合であるが、実際には、検出対象画像50内でオブジェクトが所定の回転角度となっているのが一般的である。そこで、本実施形態では、実際の回転角度を検出し、その回転角度に合わせてオブジェクトの検出処理を行っている。
図10(a)は、画素抽出パターン40Aを適用した場合、図10(b)、(c)は、画素抽出パターン40Cを適用した場合のものである。
図10に示した場合は、検出対象画像(あるいはリサイズ検出対象画像)50内でオブジェクトである顔画像が回転角度=0°(基準配置位置)の場合であるが、実際には、検出対象画像50内でオブジェクトが所定の回転角度となっているのが一般的である。そこで、本実施形態では、実際の回転角度を検出し、その回転角度に合わせてオブジェクトの検出処理を行っている。
図11は、オブジェクト検出処理の処理フローチャートである。
図12は、回転させた画素抽出パターンと検出対象画像との相対的位置関係の一例を説明する図である。
検出装置本体11は、公知の回転角度検出処理において検出した回転角度に応じて画素抽出パターン40を回転させる(ステップS21)。
この結果、検出対象画像50に対して画素抽出パターン40は正しい位置となるが、その一部が検出対象画像50の領域からはみ出して、外れる可能性が生じる。
具体的には、図12に示すような場合、画素抽出パターン40が検出対象画像の下部で検出対象画像50の領域からはみ出して外れてしまっている。
この場合に、どの程度の領域が画素抽出パターンから外れているかは、画素抽出パターンの大きさ、検出対象画像の回転角度および検出対象画像の大きさ(サイズ)から、容易に幾何学的演算により算出することが可能である。
図12は、回転させた画素抽出パターンと検出対象画像との相対的位置関係の一例を説明する図である。
検出装置本体11は、公知の回転角度検出処理において検出した回転角度に応じて画素抽出パターン40を回転させる(ステップS21)。
この結果、検出対象画像50に対して画素抽出パターン40は正しい位置となるが、その一部が検出対象画像50の領域からはみ出して、外れる可能性が生じる。
具体的には、図12に示すような場合、画素抽出パターン40が検出対象画像の下部で検出対象画像50の領域からはみ出して外れてしまっている。
この場合に、どの程度の領域が画素抽出パターンから外れているかは、画素抽出パターンの大きさ、検出対象画像の回転角度および検出対象画像の大きさ(サイズ)から、容易に幾何学的演算により算出することが可能である。
そこで画素抽出パターンと検出対象画像領域とが重なっている領域内の輝度については通常通り算出するととともに、検出対象画像領域と重なっていない領域外については、属する画素が全て同一の輝度を有すると見倣して処理を行う(ステップS22)。
この場合において、当該輝度としては、隣接する検出対象画像領域の境界部分の画素の輝度値を用いたり、隣接する検出対象画像領域の境界部分の画素の輝度値の平均値を用いる。
この場合において、当該輝度としては、隣接する検出対象画像領域の境界部分の画素の輝度値を用いたり、隣接する検出対象画像領域の境界部分の画素の輝度値の平均値を用いる。
そして、検出装置本体11は、検出対象画像の検出窓内の画像が所望のオブジェクト画像(本実施形態では、顔画像)である確信度(信頼性)が高いか否かを判別する(ステップS23)。
具体的には、輝度が一定範囲の画素の個数が閾値以上であるか否かなどに基づいて確信度の高さを判別することとなる。
具体的には、輝度が一定範囲の画素の個数が閾値以上であるか否かなどに基づいて確信度の高さを判別することとなる。
この場合において、確信度を判別する際に用いる閾値、範囲等については、多数のオブジェクト画像から構成されるサンプル画像から決定するようにすれば良い。
より、具体的には、検出装置本体11は、AdaBoostに代表される機械学習的な手法を用いてオブジェクト画像であるか否かを判別している。すなわち、本実施形態の検出装置本体11は、予め多数のオブジェクト画像、非オブジェクト画像をサンプル画像として用意し、それらを上述した機械的な学習方法にしたがって学習することにより、オブジェクト判別部37として機能するように構成されており、この結果、より確実にオブジェクト画像か否かの判定が可能になっている。
以上の説明のように、本第1実施形態によれば、回転したオブジェクトを検出する場合に、画素抽出パターンを回転していない基本オブジェクトに対応するものを用いることができるので、画素抽出パターンの記憶容量を低減することができ、また、処理の簡素化、高速化を図ることができる。
より、具体的には、検出装置本体11は、AdaBoostに代表される機械学習的な手法を用いてオブジェクト画像であるか否かを判別している。すなわち、本実施形態の検出装置本体11は、予め多数のオブジェクト画像、非オブジェクト画像をサンプル画像として用意し、それらを上述した機械的な学習方法にしたがって学習することにより、オブジェクト判別部37として機能するように構成されており、この結果、より確実にオブジェクト画像か否かの判定が可能になっている。
以上の説明のように、本第1実施形態によれば、回転したオブジェクトを検出する場合に、画素抽出パターンを回転していない基本オブジェクトに対応するものを用いることができるので、画素抽出パターンの記憶容量を低減することができ、また、処理の簡素化、高速化を図ることができる。
[2]第2実施形態
次に第2実施形態について説明する。
以上の第1実施形態の説明においては、画素抽出パターンがサンプル画像からはみ出して外れている場合には、当該はみ出して外れている部分については、画素抽出パターンの第1画素領域の輝度値および第2画素領域の輝度値がそれぞれの領域で一定であるものとして推定して処理するようにしていたが、本第2実施形態は、はみ出している部分については、弱識別器の学習において採用せず、はみ出していない部分について再学習を行う実施形態である。
次に第2実施形態について説明する。
以上の第1実施形態の説明においては、画素抽出パターンがサンプル画像からはみ出して外れている場合には、当該はみ出して外れている部分については、画素抽出パターンの第1画素領域の輝度値および第2画素領域の輝度値がそれぞれの領域で一定であるものとして推定して処理するようにしていたが、本第2実施形態は、はみ出している部分については、弱識別器の学習において採用せず、はみ出していない部分について再学習を行う実施形態である。
まず、T個の弱識別器htのプールを作成する。
ここで、弱識別器htは、画素抽出パターンに対応している。
弱識別器htとしては種々考えられるが、本実施形態においては、以下の弱識別器htを用いるものとする。
ht=sign((V1−THt)*Pt
ここで、弱識別器htは、画素抽出パターンに対応している。
弱識別器htとしては種々考えられるが、本実施形態においては、以下の弱識別器htを用いるものとする。
ht=sign((V1−THt)*Pt
図13は、画像特徴量のしきい値とオブジェクトとの関係説明図である。
ここで、V1は、画素抽出パターンであり、THtは、画像特徴量のしきい値であり、本実施形態では、図16に示すように、画像特徴量がこのしきい値THt以下であれば、対応するオブジェクトが所望のオブジェクト(本実施形態では、顔画像)であるといえる。
また、Ptはパリティであり、その値は1または−1である。
より詳細には、弱識別器htは、画像特徴量がしきい値THt以上であれば、オブジェクト画像であり、画像特徴量がしきい値THt未満であれば、非オブジェクト画像であると判定することとなる。あるいは、画像特徴量がしきい値THt以下であれば、オブジェクト画像であり、画像特徴量がしきい値THtより大きければ、非オブジェクト画像であると判定することとなる。
ここで、V1は、画素抽出パターンであり、THtは、画像特徴量のしきい値であり、本実施形態では、図16に示すように、画像特徴量がこのしきい値THt以下であれば、対応するオブジェクトが所望のオブジェクト(本実施形態では、顔画像)であるといえる。
また、Ptはパリティであり、その値は1または−1である。
より詳細には、弱識別器htは、画像特徴量がしきい値THt以上であれば、オブジェクト画像であり、画像特徴量がしきい値THt未満であれば、非オブジェクト画像であると判定することとなる。あるいは、画像特徴量がしきい値THt以下であれば、オブジェクト画像であり、画像特徴量がしきい値THtより大きければ、非オブジェクト画像であると判定することとなる。
なお、しきい値THtおよびパリティPtの値については、予め収集した検出対象のオブジェクト画像のサンプル画像により決定される。
t回目の学習におけるサンプル画像iの重みをDt(i)とし、サンプル画像数をNとすれば、重みDt(i)の初期値は、
Dt(i)=1/N
となる。
次に選択した弱識別器を画素抽出パターン記憶部に記憶する。
つづいて弱識別器の学習を行わせて、弱仮説を生成する。そしてiを弱識別器で誤ったサンプル画像とした場合に
誤り率εt=ΣDt(i)
を算出して、最も誤り率εtの低い弱識別器htを選択する。
つづいて誤り率εtを用いて、以下の式のように、サンプル画像iの重みDt(i)を更新する。
t回目の学習におけるサンプル画像iの重みをDt(i)とし、サンプル画像数をNとすれば、重みDt(i)の初期値は、
Dt(i)=1/N
となる。
次に選択した弱識別器を画素抽出パターン記憶部に記憶する。
つづいて弱識別器の学習を行わせて、弱仮説を生成する。そしてiを弱識別器で誤ったサンプル画像とした場合に
誤り率εt=ΣDt(i)
を算出して、最も誤り率εtの低い弱識別器htを選択する。
つづいて誤り率εtを用いて、以下の式のように、サンプル画像iの重みDt(i)を更新する。
次に基本オブジェクト画像を回転(変形)した変形オブジェクト画像(=画像平面内回転オブジェクト画像)に対する弱仮説を生成すべく、再学習を行わせることとなる。
まず、画素抽出パターン記憶部に記憶されている複数の弱識別器htからいずれかの弱識別器htを選択する。
つづいて選択した弱識別器htが、図12に示したように、画素抽出パターン40がサンプル画像からはみ出している場合には、はみ出している部分の輝度の算出を行わないようにする。
すなわち、サンプル画像において、はみ出す部分の画素に関して算出を行わない。
まず、画素抽出パターン記憶部に記憶されている複数の弱識別器htからいずれかの弱識別器htを選択する。
つづいて選択した弱識別器htが、図12に示したように、画素抽出パターン40がサンプル画像からはみ出している場合には、はみ出している部分の輝度の算出を行わないようにする。
すなわち、サンプル画像において、はみ出す部分の画素に関して算出を行わない。
ここで、再学習時のしきい値TH‘tおよびパリティP’tの値については、予め収集した検出対象のオブジェクト画像のサンプル画像により決定される。
t回目の学習におけるサンプル画像iの重みをDt(i)とし、サンプル画像数をNとすれば、重みDt(i)の初期値は、
Dt(i)=1/N
となる。
次に選択した弱識別器を画素抽出パターン記憶部に記憶する。
つづいて弱識別器の学習を行わせて、弱仮説を生成する。そしてiを弱識別器で誤ったサンプル画像とした場合に、
誤り率εt=ΣDt(i)
を算出して、最も誤り率εtの低い弱識別器htを選択する。
つづいて誤り率εtを用いて、以下の式のように、サンプル画像iの重みDt(i)を更新する。
t回目の学習におけるサンプル画像iの重みをDt(i)とし、サンプル画像数をNとすれば、重みDt(i)の初期値は、
Dt(i)=1/N
となる。
次に選択した弱識別器を画素抽出パターン記憶部に記憶する。
つづいて弱識別器の学習を行わせて、弱仮説を生成する。そしてiを弱識別器で誤ったサンプル画像とした場合に、
誤り率εt=ΣDt(i)
を算出して、最も誤り率εtの低い弱識別器htを選択する。
つづいて誤り率εtを用いて、以下の式のように、サンプル画像iの重みDt(i)を更新する。
図14は、第2実施形態の処理フローチャートである。
まず検出装置本体11は、回転角度0゜に相当する基本オブジェクトに対応した弱識別器で検出対象画像に含まれているオブジェクトの判定処理を行う(ステップS31)。
次に当該判定処理対象のオブジェクトが基本オブジェクトであるか否かを判別する(ステップS32)。
ステップS32の判別において、基本オブジェクトである場合には(ステップS32;Yes)、所望のオブジェクトであると判定して処理を終了する(ステップS37)。
ステップS32の判別において、基本オブジェクトではない場合には(ステップS32;No)、所定の回転角度(≠0゜)に相当する回転オブジェクトに対応した弱識別器で検出対象画像に含まれているオブジェクトの判定処理を行う(ステップS33)。
次に当該判定処理対象のオブジェクトが選択した弱識別器に対応する回転オブジェクトであるか否かを判別する(ステップS34)。
ステップS34の判別において、選択した弱識別器に対応する回転オブジェクトである場合には(ステップS34;Yes)、所望のオブジェクトであると判定して処理を終了する(ステップS37)。
まず検出装置本体11は、回転角度0゜に相当する基本オブジェクトに対応した弱識別器で検出対象画像に含まれているオブジェクトの判定処理を行う(ステップS31)。
次に当該判定処理対象のオブジェクトが基本オブジェクトであるか否かを判別する(ステップS32)。
ステップS32の判別において、基本オブジェクトである場合には(ステップS32;Yes)、所望のオブジェクトであると判定して処理を終了する(ステップS37)。
ステップS32の判別において、基本オブジェクトではない場合には(ステップS32;No)、所定の回転角度(≠0゜)に相当する回転オブジェクトに対応した弱識別器で検出対象画像に含まれているオブジェクトの判定処理を行う(ステップS33)。
次に当該判定処理対象のオブジェクトが選択した弱識別器に対応する回転オブジェクトであるか否かを判別する(ステップS34)。
ステップS34の判別において、選択した弱識別器に対応する回転オブジェクトである場合には(ステップS34;Yes)、所望のオブジェクトであると判定して処理を終了する(ステップS37)。
ステップS34の判別において、選択した弱識別器に対応する回転オブジェクトではない場合には(ステップS34;No)、回転オブジェクトに対応した全ての弱識別器で判定が終了したか否かを判別する(ステップS35)。
ステップS35の判別において、未だ回転オブジェクトに対応した全ての弱識別器で判定を終了していない場合には(ステップS35;No)、再びステップS33に移行し、未選択の他の弱識別器を選択して以下同様の処理を行う。
ステップS35の判別において、回転オブジェクトに対応した全ての弱識別器で判定が終了した場合には(ステップS35;Yes)、検出対象画像に含まれているオブジェクトは所望のオブジェクトではないと判定して処理を終了する(ステップS36)。
ステップS35の判別において、未だ回転オブジェクトに対応した全ての弱識別器で判定を終了していない場合には(ステップS35;No)、再びステップS33に移行し、未選択の他の弱識別器を選択して以下同様の処理を行う。
ステップS35の判別において、回転オブジェクトに対応した全ての弱識別器で判定が終了した場合には(ステップS35;Yes)、検出対象画像に含まれているオブジェクトは所望のオブジェクトではないと判定して処理を終了する(ステップS36)。
以上の説明のように、本第2実施形態によれば、画素抽出パターンが検出対象画像の一部がサンプル画像の領域からはみ出し外れてしまっている場合であっても、第1実施形態とは異なり当該外れた部分の輝度の推定が不要となるため、検出結果の精度が高い弱識別器を得ることができる。
また、基本オブジェクトおよび回転した(変形した)オブジェクトについて共通の基本オブジェクトに弱識別器を用いることができるので、学習時間を大幅に削減することができる。
また、基本オブジェクトおよび回転した(変形した)オブジェクトについて共通の基本オブジェクトに弱識別器を用いることができるので、学習時間を大幅に削減することができる。
以上の説明のように、各実施形態によれば、基本オブジェクトに関する学習のみを行えば良く、学習時間を大幅に削減することができる。
また学習に用いるサンプル画像としては、基本オブジェクト(顔画像の場合には、例えば、正立した顔画像)のみを用いればよいので、少数の学習用サンプル画像(学習用顔画像)で効率よく、学習が行え、学習時間の短縮が可能となる。
以上の説明においては、画像特徴量である輝度積分値を生成する際に、画像検出パターンの大きさを一定にし、検出対象画像のサイズをリサイズする構成を採っていたが、検出対象画像のリサイズは行わず、画像検出パターンの大きさを検出対象画像の大きさを超えない範囲でリサイズ(拡大または縮小)する構成を採ることも可能である。
また学習に用いるサンプル画像としては、基本オブジェクト(顔画像の場合には、例えば、正立した顔画像)のみを用いればよいので、少数の学習用サンプル画像(学習用顔画像)で効率よく、学習が行え、学習時間の短縮が可能となる。
以上の説明においては、画像特徴量である輝度積分値を生成する際に、画像検出パターンの大きさを一定にし、検出対象画像のサイズをリサイズする構成を採っていたが、検出対象画像のリサイズは行わず、画像検出パターンの大きさを検出対象画像の大きさを超えない範囲でリサイズ(拡大または縮小)する構成を採ることも可能である。
10…オブジェクト検出装置、11…検出装置本体、12…撮像カメラ、13…入力装置、14…表示装置、15…出力装置、16…外部記憶装置、21…MPU、22…ROM、23…通信ネットワーク、24…通信インタフェース部、31…画素抽出パターン記憶部、33…画像特徴量生成部、34…リサイズ部、35…積分画像処理部、36…回転角度判別部、37…オブジェクト判別部、38…学習部、40…画素抽出パターン、40A…画素抽出パターン、40B…画素抽出パターン、40C…画素抽出パターン、40D…画素抽出パターン、50…検出対象画像、40A1…第1画素抽出領域、40A2…第2画素抽出領域、40B1…第1画素抽出領域、40B2…第2画素抽出領域、40C1…第1画素抽出領域、40C2…第2画素抽出領域、40D1…第1画素抽出領域、40D2…第2画素抽出領域、40A21…画素抽出領域、40B11…画素抽出領域、40B12…画素抽出領域、40B21…画素抽出領域、40B22…画素抽出領域。
Claims (13)
- 検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置において、
前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンと、
前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出する特徴量検出部と、
前記検出した画像特徴量に基づいて前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別部と、
を備えたことを特徴とするオブジェクト検出装置。 - 請求項1記載のオブジェクト検出装置において、
前記領域外には、前記領域の境界部分と同一の画素が配置されているものとすることを特徴とするオブジェクト検出装置。 - 検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置において、
前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンと、
前記検出対象画像が所定の基準配置位置にある場合に得られる前記画像特徴量に一対一に対応する弱識別器と、
前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させる再学習部と、
前記再学習後の弱識別器の識別結果に基づいて、前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別部と、
を備えたことを特徴とするオブジェクト検出装置。 - 請求項1ないし請求項3記載のオブジェクト検出装置において、
前記画像特徴量は、前記画像特徴量を検出する複数画素で構成される画素領域を二つの画素領域としたときの各画素領域を代表する輝度の輝度差であることを特徴とするオブジェクト検出装置。 - 請求項4記載のオブジェクト検出装置において、
前記画素領域を代表する輝度は、当該画素領域において検出される輝度を所定の手順で補正した補正輝度であることを特徴とするオブジェクト検出装置。 - 請求項4または請求項5記載のオブジェクト検出装置において、
所定の基準位置画素および対象画素を対角線上の頂点とする矩形内のすべての画素の輝度値を積分して当該対象画素に対応する積分画素値とし、前記検出対象画像を構成するすべての画素に対応する積分画素値を求めて積分画像を生成する積分画像生成部を備え、
前記特徴量検出部は、前記積分画像に基づいて前記画像特徴量を検出することを特徴とするオブジェクト検出装置。 - 請求項1ないし請求項6のいずれかに記載のオブジェクト検出装置において、
前回の前記検出対象画像のリサイズを行って今回の検出対象画像を生成するリサイズ画像生成部を備えたことを特徴とするオブジェクト検出装置。 - 請求項1ないし請求項6のいずれかに記載のオブジェクト検出装置において、
前記画素抽出パターンのリサイズを行って新たな画素抽出パターンを生成するリサイズパターン生成部を備えたことを特徴とするオブジェクト検出装置。 - 請求項1ないし請求項8のいずれかに記載のオブジェクト検出装置において、
前記検出対象のオブジェクトは顔画像であることを特徴とするオブジェクト検出装置。 - 検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置の制御方法において、
前記オブジェクト検出装置は、前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンを有し、
前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出する特徴量検出過程と、
前記検出した画像特徴量に基づいて前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別過程と、
を備えたことを特徴とするオブジェクト検出装置の制御方法。 - 検出対象画像が所定の基準配置位置にある場合に得られる画像特徴量に一対一に対応する弱識別器および前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンを有し、前記検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置の制御方法において、
前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させる再学習過程と、
前記再学習後の弱識別器の識別結果に基づいて、前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別するオブジェクト判別過程と、
を備えたことを特徴とするオブジェクト検出装置の制御方法。 - 検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置をコンピュータにより制御するための制御プログラムにおいて、
前記オブジェクト検出装置は、前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンを有し、
前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記領域外には、前記位置関係に基づいて設定した画素が配置されているものとして、画像特徴量を検出させ、
前記検出した画像特徴量に基づいて前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別させる、
ことを特徴とする制御プログラム。 - 検出対象画像が所定の基準配置位置にある場合に得られる画像特徴量に一対一に対応する弱識別器および前記検出対象画像を構成する画素から画像特徴量を検出する複数の画素を抽出するための複数種類の画素抽出パターンを有し、前記検出対象画像に含まれ、かつ、画像平面内の基準配置位置に対して回転したオブジェクトが検出対象のオブジェクトであるか否か検出するオブジェクト検出装置をコンピュータにより制御するための制御プログラムにおいて、
前記画素抽出パターンが前記検出対象画像との相対的な位置関係により前記検出対象画像の領域外を抽出対象として含んでしまう場合に、前記弱識別器を当該検出対象画像の領域内に含まれる複数の画素のみで再学習させ、
前記再学習後の弱識別器の識別結果に基づいて、前記検出対象画像に含まれるオブジェクトが前記検出対象のオブジェクトか否かを判別させる、
を備えたことを特徴とする制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006282517A JP2008102593A (ja) | 2006-10-17 | 2006-10-17 | オブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006282517A JP2008102593A (ja) | 2006-10-17 | 2006-10-17 | オブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008102593A true JP2008102593A (ja) | 2008-05-01 |
Family
ID=39436900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006282517A Pending JP2008102593A (ja) | 2006-10-17 | 2006-10-17 | オブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008102593A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013186906A1 (ja) * | 2012-06-14 | 2013-12-19 | トヨタ自動車株式会社 | 識別器生成装置およびパターン検出装置 |
CN111815570A (zh) * | 2020-06-16 | 2020-10-23 | 浙江大华技术股份有限公司 | 区域入侵检测方法及其相关装置 |
-
2006
- 2006-10-17 JP JP2006282517A patent/JP2008102593A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013186906A1 (ja) * | 2012-06-14 | 2013-12-19 | トヨタ自動車株式会社 | 識別器生成装置およびパターン検出装置 |
JPWO2013186906A1 (ja) * | 2012-06-14 | 2016-02-01 | トヨタ自動車株式会社 | 識別器生成装置およびパターン検出装置 |
US9818025B2 (en) | 2012-06-14 | 2017-11-14 | Toyota Jidosha Kabushiki Kaisha | Discrimination container generation device and pattern detection device |
KR101860616B1 (ko) * | 2012-06-14 | 2018-05-23 | 도요타지도샤가부시키가이샤 | 식별기 생성 장치 및 패턴 검출 장치 |
CN111815570A (zh) * | 2020-06-16 | 2020-10-23 | 浙江大华技术股份有限公司 | 区域入侵检测方法及其相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4840066B2 (ja) | 回転角度検出装置、および回転角度検出装置の制御方法 | |
US8693785B2 (en) | Image matching devices and image matching methods thereof | |
JP6088792B2 (ja) | 画像検出装置及び制御プログラム並びに画像検出方法 | |
JP4479756B2 (ja) | 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム | |
KR101747216B1 (ko) | 표적 추출 장치와 그 방법 및 상기 방법을 구현하는 프로그램이 기록된 기록 매체 | |
JP4694613B2 (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
CN109117846B (zh) | 一种图像处理方法、装置、电子设备和计算机可读介质 | |
JP2008033424A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP2006350704A (ja) | 判別器の学習方法、顔判別方法および装置並びにプログラム | |
US20100172577A1 (en) | Red eye detecting apparatus, red eye detecting method and red eye detecting program | |
JP4518139B2 (ja) | 画像処理装置 | |
JP2006295606A (ja) | 画像処理装置及びその方法、プログラム並びに記憶媒体 | |
US20230237777A1 (en) | Information processing apparatus, learning apparatus, image recognition apparatus, information processing method, learning method, image recognition method, and non-transitory-computer-readable storage medium | |
US20220180122A1 (en) | Method for generating a plurality of sets of training image data for training machine learning model | |
JP6110174B2 (ja) | 画像検出装置及び制御プログラム並びに画像検出方法 | |
WO2019159414A1 (ja) | 読取システム、読取方法、及び記憶媒体 | |
JP5201184B2 (ja) | 画像処理装置及びプログラム | |
CN107958202B (zh) | 人体检测设备、人体检测设备的控制方法和存储介质 | |
JP6887154B2 (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
JP2008102593A (ja) | オブジェクト検出装置、オブジェクト検出装置の制御方法および制御プログラム | |
JP2005045799A (ja) | 部分的テンプレート照合を用いた画質向上 | |
JP4779851B2 (ja) | オブジェクト検出装置 | |
JP6656453B2 (ja) | 読取システム、読取装置、プログラム、及び記憶媒体 | |
US10380463B2 (en) | Image processing device, setting support method, and non-transitory computer-readable media | |
CN106469034A (zh) | 描绘命令处理装置和描绘命令处理方法 |