JP5290401B2

JP5290401B2 - 被写体識別方法、被写体識別プログラムおよび被写体識別装置

Info

Publication number: JP5290401B2
Application number: JP2011505767A
Authority: JP
Inventors: 亨米澤
Original assignee: Glory Ltd
Current assignee: Glory Ltd
Priority date: 2009-03-27
Filing date: 2009-03-27
Publication date: 2013-09-18
Anticipated expiration: 2029-03-27
Also published as: WO2010109644A1; JPWO2010109644A1

Description

本発明は、ブースティング手法を用いて所定の被写体画像と非被写体画像とを分離する学習を行うことで所定の被写体を識別する被写体識別方法、被写体識別プログラムおよび被写体識別装置に関し、特に、被写体の検出精度を向上しつつ、検出処理に要する時間を短縮することができる被写体識別方法、被写体識別プログラムおよび被写体識別装置に関するものである。

従来から、監視カメラや認証用カメラによって撮像された画像に人の顔が含まれているか否かを自動的に識別する顔画像識別手法が知られている。そして、かかる顔画像識別手法には、部分空間法などの技術が一般的に用いられている。

たとえば、ＩｎｔｅｇｒａｌＩｍａｇｅ法を用いた顔画像識別手法としては、画像中に複数の矩形領域を設定したうえで、各矩形領域に含まれるすべての画素の特徴量を合算することで得られる合算値に基づいて顔画像を検出する技術がある（特許文献１、特許文献２および非特許文献１参照）。

特開２００４−３６２４６８号公報特開２００７−３４７２３号公報 Paul Viola, Michael Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features", In Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Volume 1, pp.511-518, December 2001

しかしながら、上述した従来技術には、顔画像の検出処理に要する時間をさらに短縮しつつ、検出精度を向上させることが難しいという問題があった。

具体的には、部分空間法を用いて顔画像を検出する場合、部分空間法は演算量が多いので、顔画像検出処理に要する処理時間がかさんでしまう。

また、ＩｎｔｅｇｒａｌＩｍａｇｅ法を用いた顔画像識別手法によって顔画像を検出する場合、顔画像検出処理に要する処理時間を短縮するためには、特徴量合算値の算出対象となる矩形領域の面積を比較的大きく設定する必要がある。しかし、矩形領域の面積を大きくすると、直射日光が顔に当たっている画像などでは、直射日光の影響で特徴量合算値が大きく変動し、顔画像の検出精度が低下してしまう。

また、非特許文献１の技術は、矩形特徴ごとに閾値をもつ必要があるため、特に、判別初期段階で、非顔画像を排除する能力に乏しいという問題もあった。

これらのことから、顔画像の検出精度を向上しつつ、検出処理に要する時間を短縮することができる顔画像識別方法、顔画像識別プログラムあるいは顔画像識別装置をいかにして実現するかが大きな課題となっている。なお、かかる課題は、顔画像を識別対象とする場合にのみ発生する課題ではなく、特定の被写体を識別対象とする場合についても同様に発生する課題である。

本発明は、上述した従来技術の課題を解決するためになされたものであり、被写体の検出精度を向上しつつ、検出処理に要する時間を短縮することができる被写体識別方法、被写体識別プログラムおよび被写体識別装置を提供することを目的とする。

上述した課題を解決し、目的を達成するために、本発明は、ブースティング手法を用いて所定の被写体画像と非被写体画像とを分離する学習を行うことで所定の被写体を識別する被写体識別方法であって、被写体画像サンプルと非被写体画像サンプルとの分離に用いる所定の特徴量にそれぞれ対応する２値化判別器の中から最も誤り率が低い最良判別器を選択するとともに、当該最良判別器に対応する重み係数を決定し、次の学習では当該最良判別器を誤り率が０．５である判別器とするように当該重み係数に基づくサンプル重みの更新を繰り返す繰返工程と、前記繰返工程によって所定個数の前記最良判別器が選択されたならば、前記繰返工程によって既に選択された前記最良判別器からなる判別器群について該最良判別器のそれぞれに保持される未２値化データを用いて線形判別分析を行うことによって当該判別器群に対応する集約判別器を導出する集約判別器導出工程と、前記集約判別器導出工程によって導出された前記集約判別器が次の学習では前記誤り率が０．５である判別器となるように当該集約判別器に対応する集約重み係数を決定する集約重み係数決定工程と、前記集約重み係数決定工程によって決定された前記集約重み係数に基づいて前記繰返工程によって用いられる前記サンプル重みを更新するサンプル重み更新工程と、前記集約判別器導出工程によって導出された前記集約判別器および前記集約重み係数決定工程によって決定された前記集約重み係数に基づいて前記被写体画像と前記非被写体画像とを分離する最終判別器を決定する最終判別器決定工程とを含んだことを特徴とする。

また、本発明は、上記の発明において、前記集約判別器導出工程は、所定の最小個数以上であって所定の最大個数以下となる前記所定個数ごとに前記集約判別器の候補をそれぞれ導出し、導出した前記候補の中から１つの前記集約判別器を選択することを特徴とする。

また、本発明は、上記の発明において、前記集約判別器導出工程は、前記最小個数から前記最大個数までの範囲において前記所定個数までの範囲では前記非被写体画像に対する全面スキャンを行ったうえで前記所定個数より大きい範囲では前記全面スキャンで排除できなかったエリアに対する部分スキャンを行うと仮定した場合に、前記全面スキャンおよび前記部分スキャンによるスキャン面積の総和が最小となる前記候補を前記集約判別器として選択することを特徴とする。

また、本発明は、上記の発明において、前記集約判別器導出工程は、既に導出した前記集約判別器に含まれる前記２値化判別器の組合せとは異なるように、あらたに導出する前記集約判別器に含まれる前記２値化判別器の組合せを決定することを特徴とする。

また、本発明は、上記の発明において、前記集約判別器導出工程は、既に導出した前記集約判別器に含まれる前記２値化判別器を含まないように、あらたに導出する前記集約判別器に含まれる前記２値化判別器を決定することを特徴とする。

また、本発明は、ブースティング手法を用いて所定の被写体画像と非被写体画像とを分離する学習を行うことで所定の被写体を識別する被写体識別プログラムであって、被写体画像サンプルと非被写体画像サンプルとの分離に用いる所定の特徴量にそれぞれ対応する２値化判別器の中から最も誤り率が低い最良判別器を選択するとともに、当該最良判別器に対応する重み係数を決定し、次の学習では当該最良判別器を誤り率が０．５である判別器とするように当該重み係数に基づくサンプル重みの更新を繰り返す繰返手順と、前記繰返手順によって所定個数の前記最良判別器が選択されたならば、前記繰返手順によって既に選択された前記最良判別器からなる判別器群について該最良判別器のそれぞれに保持される未２値化データを用いて線形判別分析を行うことによって当該判別器群に対応する集約判別器を導出する集約判別器導出手順と、前記集約判別器導出手順によって導出された前記集約判別器が次の学習では前記誤り率が０．５である判別器となるように当該集約判別器に対応する集約重み係数を決定する集約重み係数決定手順と、前記集約重み係数決定手順によって決定された前記集約重み係数に基づいて前記繰返手順によって用いられる前記サンプル重みを更新するサンプル重み更新手順と、前記集約判別器導出手順によって導出された前記集約判別器および前記集約重み係数決定手順によって決定された前記集約重み係数に基づいて前記被写体画像と前記非被写体画像とを分離する最終判別器を決定する最終判別器決定手順とをコンピュータに実行させることを特徴とする。

また、本発明は、ブースティング手法を用いて所定の被写体画像サンプルと非被写体画像サンプルとを分離する学習を行うことで所定の被写体を識別する被写体識別装置であって、被写体画像サンプルと非被写体画像サンプルとの分離に用いる所定の特徴量にそれぞれ対応する２値化判別器の中から最も誤り率が低い最良判別器を選択するとともに、当該最良判別器に対応する重み係数を決定し、次の学習では当該最良判別器を誤り率が０．５である判別器とするように当該重み係数に基づくサンプル重みの更新を繰り返す繰返手段と、前記繰返手段によって所定個数の前記最良判別器が選択されたならば、前記繰返手段によって既に選択された前記最良判別器からなる判別器群について該最良判別器のそれぞれに保持される未２値化データを用いて線形判別分析を行うことによって当該判別器群に対応する集約判別器を導出する集約判別器導出手段と、前記集約判別器導出手段によって導出された前記集約判別器が次の学習では前記誤り率が０．５である判別器となるように当該集約判別器に対応する集約重み係数を決定する集約重み係数決定手段と、前記集約重み係数決定手段によって決定された前記集約重み係数に基づいて前記繰返手段によって用いられる前記サンプル重みを更新するサンプル重み更新手段と、前記集約判別器導出手段によって導出された前記集約判別器および前記集約重み係数決定手段によって決定された前記集約重み係数に基づいて前記被写体画像と前記非被写体画像とを分離する最終判別器を決定する最終判別器決定手段とを備えたことを特徴とする。

本発明によれば、被写体画像サンプルと非被写体画像サンプルとの分離に用いる所定の特徴量にそれぞれ対応する２値化判別器の中から最も誤り率が低い最良判別器を選択するとともに、選択された最良判別器に対応する重み係数を決定し、次の学習ではこの最良判別器を誤り率が０．５である判別器とするように、決定された重み係数に基づくサンプル重みの更新を繰り返し、所定個数の最良判別器が選択されたならば、既に選択された最良判別器からなる判別器群について最良判別器のそれぞれに保持される未２値化データを用いて線形判別分析を行うことによって判別器群に対応する集約判別器を導出し、導出された集約判別器が次の学習では誤り率が０．５である判別器となるようにこの集約判別器に対応する集約重み係数を決定し、決定された集約重み係数に基づいてサンプル重みを更新し、導出された集約判別器および集約重み係数に基づいて被写体画像と非被写体画像とを分離することとしたので、複数の未２値化判別器を線形判別分析で集約することによって集約判別器を導出し、導出した集約判別器を用いて最終判別器を決定することで、被写体の検出精度を向上しつつ、検出処理に要する時間を短縮することができるという効果を奏する。

また、本発明によれば、所定の最小個数以上であって所定の最大個数以下となる所定個数ごとに集約判別器の候補をそれぞれ導出し、導出した候補の中から１つの集約判別器を選択することとしたので、集約判別器の選択を柔軟に行うことができるという効果を奏する。また、複数の集約判別器候補を比較することで最適な集約判別器を選択することができるという効果を奏する。

また、本発明によれば、最小個数から最大個数までの範囲において所定個数までの範囲では非被写体画像に対する全面スキャンを行ったうえで所定個数より大きい範囲では全面スキャンで排除できなかったエリアに対する部分スキャンを行うと仮定した場合に、全面スキャンおよび部分スキャンによるスキャン面積の総和が最小となる候補を集約判別器として選択することとしたので、排除対象を効率的に排除することができるという効果を奏する。

また、本発明によれば、既に導出した集約判別器に含まれる２値化判別器の組合せとは異なるように、あらたに導出する集約判別器に含まれる２値化判別器の組合せを決定することとしたので、集約判別器の重複を回避することで、判別精度を向上させることができるという効果を奏する。

また、本発明によれば、既に導出した集約判別器に含まれる２値化判別器を含まないように、あらたに導出する集約判別器に含まれる２値化判別器を決定することとしたので、集約対象とならない２値化判別器をなくすことで、各２値化判別器を有効活用することができるという効果を奏する。

図１は、本発明に係る被写体識別手法の概要を示す図である。図２は、本実施例に係る顔画像識別装置の構成を示すブロック図である。図３は、サンプル画像から特徴量を取得する処理を示す図である。図４は、集約判別器候補を算出する処理を示す図である。図５は、集約判別器候補のオフセットを算出する処理を示す図である。図６は、集約判別器選択の一例を示す図である。図７は、集約判別器を導出する処理を示す図である。図８は、顔画像識別装置が実行する処理手順を示すフローチャートである。図９は、集約判別器決定処理の処理手順を示すフローチャートである。図１０は、アダブースト手法の概要を示す図である。

符号の説明

１０顔画像識別装置
１１制御部
１１ａアダブースト処理部
１１ｂ集約判別器導出部
１１ｃ集約重み係数決定部
１１ｄサンプル重み更新部
１１ｅ最終判別器決定部
１２記憶部
１２ａ顔画像サンプル
１２ｂ非顔画像サンプル
１２ｃ集約判別器候補
１２ｄ集約判別器
１２ｅ集約重み係数

以下に、添付図面を参照して、本発明に係る被写体識別手法の好適な実施例を詳細に説明する。なお、以下では、ブースティング学習手法として広く用いられているアダブースト（AdaBoost）手法について図１０を用いて、本発明に係る被写体識別手法の概要について図１を用いて、それぞれ説明した後に、本発明に係る被写体識別手法を適用した顔画像識別装置についての実施例を説明する。また、以下では、識別対象とする被写体を、顔画像とした場合について説明することとする。

図１０は、アダブースト手法の概要を示す図である。アダブースト手法は、ＹＥＳ／ＮＯ、正／負といった２値化された判別結果を出力する２値化判別器を学習結果に基づいて多数組み合わせることによって、正答率が高い最終判別器を導出する学習手法である。

ここで、組合せ対象となる判別器は、正答率が５０％を若干超える程度の弱い判別器（以下、「弱判別器」と記載する）である。すなわち、アダブースト手法では、正答率が低い弱判別器を多数組み合わせることで、正答率が高い最終判別器を導出する。

まず、アダブースト手法に用いられる数式について説明する。なお、以下では、顔画像のサンプル群をクラスＡ、非顔画像のサンプル群をクラスＢとし、クラスＡとクラスＢとを判別する場合について説明することとする。

アダブースト手法において、学習回数をｓ（１≦ｓ≦Ｓ）、各特徴量をｘ、特徴量ｘに対応する判別器をｈ-_ｓ（ｘ）、判別器ｈ_ｓ（ｘ）の重み係数をα_ｓとすると、最終判別器Ｈ（ｘ）は、

式（１−１）のようにあらわされる。

ここで、関数ｓｉｇｎ（）は、かっこ内の値が０以上であれば＋１、０未満であれば−１とする２値化関数である。また、式（１−２）に示したように、判別器ｈ_ｓ（ｘ）は、−１または＋１の値をとる２値化判別器であり、クラスＡと判別した場合には＋１の値をとり、クラスＢと判別した場合には−１の値をとる。

アダブースト手法では、式（１−１）に示した判別器ｈ_ｓ（ｘ）を１回の学習で１つずつ選択するとともに、選択した判別器ｈ_ｓ（ｘ）に対応する重み係数α_ｓを逐次決定していく処理を繰り返すことで、最終判別器Ｈ（ｘ）を導出する。以下では、アダブースト手法についてさらに詳細に説明する。

ｘ_ｉを各特徴量とし、ｙ_ｉを｛−１，＋１｝（上記したクラスＡは＋１、上記したクラスＢは−１）とすると、学習サンプルは、｛（ｘ_１，ｙ_１），（ｘ_２，ｙ_２），…，（ｘ_Ｎ，ｙ_Ｎ）｝とあらわされる。ここで、Ｎは、判別対象とする特徴量の総数である。

また、Ｄ_ｓ（ｉ）を、ｉ番目の学習サンプルに対してｓ回目の学習を行った場合のサンプル重みとすると、Ｄ_ｓ（ｉ）の初期値は、式「Ｄ_１（ｉ）＝１／Ｎ」であらわされる。そして、各特徴量ｘ_ｉに対応する判別器をｈ_ｓ（ｘ_ｉ）、各判別器の重み係数をα_ｓとすると、アダブースト手法に用いられる各数式は、

となる。

以下では、図１０を用いながら、上記した式（２−１）〜式（２−４）についてそれぞれ説明する。同図の（１）に示したように、１回目の学習では、サンプル重みＤ_１（ｉ）を１／Ｎとしたうえで、判別器ｈ_ｓごとの学習サンプル分布を算出する。このようにすることで、同図に示したように、クラスＡの分布とクラスＢの分布とが得られる。

そして、同図の（２）に示したように、式（２−１）を用いて判別器ｈ_ｓごとの誤り率（たとえば、クラスＡのサンプルをクラスＢと誤判別した確率）ε_ｓを算出し、最も誤り率ε_ｓが低い、すなわち、最も良好な判別を行った判別器ｈ_ｓを最良判別器として選択する。

つづいて、同図の（３−１）に示したように、式（２−２）を用いて判別器ｈ_ｓ（同図の（２）で選択された最良判別器）の重み係数α_ｓを決定する。そして、式（２−３）を用いて次回の学習における各学習サンプル重みＤ_ｓ＋１を更新する。なお、式（２−３）の分母であるＺ_ｓは、式（２−４）であらわされる。

このようにして、次回の学習サンプル重みＤ_ｓ＋１が更新されると、同図の（４）に示したように、判別器ｈ_ｓごとの学習サンプル分布は、同図の（１）に示した分布とは異なるものとなる。そして、学習回数ｓをカウントアップし、同図の（４）で算出された分布で同図の（１）に示した分布を更新したうえで、同図の（２）以降の処理を繰り返す。

ここで、式（２−３）は、同図の（２）で選択された最良判別器が、次回の学習では、誤り率が０．５である判別器となるように次回の学習サンプル重みＤ_ｓ＋１を決定することを示している。すなわち、最良判別器が最も苦手とする学習サンプル重みを用いて次の最良判別器を選択する処理を行うことになる。

このように、アダブースト手法は、学習を繰り返すことで、判別器の選択と各判別器の重み係数の最適化とを行い、最終的には、正答率が高い最終判別器を導出することができる。しかし、式（１−２）に示したように、アダブースト手法によって選択される判別器ｈ_ｓ（ｘ）は、２値化判別器であり、判別器内部で保持する値を最終的には２値に変換したうえで出力する。すなわち、２値変換に伴う判断分岐が必要となり、演算量がかさむという問題がある。

なお、リアルブースト（RealBoost）手法では、多値判別器を用いるので、アダブースト手法で発生する判断分岐による演算量増大の問題を回避することができるが、多値判別器が保持する多値それぞれに対応した重み係数を保持する必要があるため、メモリ使用量が増大するという問題がある。

そこで、本発明に係る被写体識別手法では、アダブースト手法を改良することで、判断分岐による演算量増大という問題を回避するとともに、リアルブースト手法のように大きなメモリを必要とすることなく識別精度を向上させることとした。以下では、本発明に係る被写体識別手法の概要について図１を用いて説明する。

図１は、本発明に係る被写体識別手法の概要を示す図である。なお、同図の（Ａ）には、図１０を用いて説明したアダブースト手法の概要について、同図の（Ｂ）には、本発明に係る被写体識別手法の概要についてそれぞれ示している。また、同図の（Ａ）に示したｈ_ｉは２値化判別器を、同図の（Ｂ）に示したｆ_ｉは、ｈ_ｉが所定の閾値で２値化する前の関数である未２値化判別器を、それぞれあらわしている。

図１の（Ａ）に示したように、アダブースト手法では、１回目の学習で、誤り率が最小の判別器をｈ_１として決定する（同図の（Ａ−１）参照）。そして、ｈ_１の重み係数を決定し（同図の（Ａ−２）参照）、次回の学習では、ｈ_１が、誤り率が０．５である判別器となるように、各サンプルに対するサンプル重みを更新する（同図の（Ａ−３）参照）。

そして、判別器の選択、選択した判別器に対する重み係数の決定およびサンプル重みの更新を繰り返すことで、最終判別器を導出する。

一方、図１の（Ｂ）に示したように、本発明に係る被写体識別手法では、所定個数の未２値化判別器ｆｉをＬＤＡ（Linear Discriminant Analysis）法を用いて集約することで集約判別器を導出し、導出した１個または複数個の集約判別器に基づいて１個の最終判別器を導出する点に主たる特徴がある。

具体的には、所定の手順に従って未２値化判別器を集約し（同図の（Ｂ−１）参照）、ＬＤＡを用いて集約判別器を導出する（同図の（Ｂ−２）参照）。また、導出した集約判別器の重み係数を決定するとともに（同図の（Ｂ−３）参照）、各サンプルに対するサンプル重みを更新する（同図の（Ｂ−４）参照）。

そして、集約判別器の選択、選択した集約判別器に対する重み係数の決定およびサンプル重みの更新を繰り返すことで、１個の最終判別器を導出する。このように、本発明に係る被写体識別手法では、所定数の未２値化判別器を線形結合するので、判別処理に伴う演算量を削減することができる。

すなわち、排除対象（上記したクラスＢ）をある程度分離することができるようになるまで未２値化判別器を集約するので、無駄な判断分岐（図１の（Ａ）に示したｈ_ｉが必ず行う２値変換に伴う判断分岐）を削減することができる。また、図１の（Ａ）に示したアダブースト手法では考慮されていなかった特徴量間の関係を、あらたな特徴として捉えることができるので、判別精度を向上させることができる。

なお、以下では、図１の（Ｂ）に示した手法を、「ＬＤＡＡｒｒａｙ法」と呼ぶこととする。また、以下では、かかるＬＤＡＡｒｒａｙ法を、顔画像と非顔画像（たとえば、背景画像）との識別を行う顔画像識別装置に適用した場合について説明する。なお、ＬＤＡＡｒｒａｙ法は、画像識別の分野には限らず、アダブースト手法が対象とする分野についても広く適用することができる。

図２は、本実施例に係る顔画像識別装置１０の構成を示すブロック図である。同図に示すように、顔画像識別装置１０は、制御部１１と、記憶部１２とを備えている。また、制御部１１は、アダブースト処理部１１ａと、集約判別器導出部１１ｂと、集約重み係数決定部１１ｃと、サンプル重み更新部１１ｄと、最終判別器決定部１１ｅとをさらに備えている。そして、記憶部１２は、顔画像サンプル１２ａと、非顔画像サンプル１２ｂと、集約判別器候補１２ｃと、集約判別器１２ｄと、集約重み係数１２ｅとを記憶する。

制御部１１は、上記したＬＤＡＡｒｒａｙ法を用いた学習によって最終判別器を導出する処理を行う処理部である。なお、図２では、最終判別器を決定するために用いられる処理部のみを示しているが、最終判別器決定部１１ｅによって決定された最終判別器を用いて顔画像の識別処理を行う処理部等を含むように顔画像識別装置１０を構成することとしてもよい。

アダブースト処理部１１ａは、図１０を用いて既に説明したアダブースト手法を実行する処理を行う処理部である。また、アダブースト処理部１１ａは、記憶部１２から読み出した顔画像サンプル１２ａおよび非顔画像サンプル１２ｂをサンプルとする学習を繰り返し、選択した２値化判別器と決定した重み係数との組を集約判別器導出部１１ｂに渡す処理を併せて行う。

そして、アダブースト処理部１１ａは、サンプル重み更新部１１ｄから更新後のサンプル重みを受け取った場合には、受け取ったサンプル重みでサンプル重みＤ_ｓ（図１０参照）を更新する。つづいて、アダブースト処理部１１ａは、２値化判別器の選択を最初からやり直す。すなわち、図１０に示した学習回数ｓを１としたうえで、２値化判別器の選択処理等を繰り返す。

ここで、アダブースト処理部１１ａの学習に用いられる顔画像サンプル１２ａおよび非顔画像サンプル１２ｂについて図３を用いて説明しておく。図３は、サンプル画像から特徴量を取得する処理を示す図である。

なお、同図の（Ａ）には、顔画像から特徴量を取得する処理の流れを、同図の（Ｂ）には、背景画像のような非顔画像から特徴量を取得する処理の流れを、それぞれ示している。また、同図に示した各顔画像および各非顔画像は、事前の拡大／縮小処理によってサイズ合わせがなされているものとする。

同図の（Ａ）に示したように、顔画像を所定サイズのブロックに分割し（同図の（Ａ−１）参照）、各ブロックについて、エッジ方向とその強度（太さ）、全体強度といった特徴量を抽出する（同図の（Ａ−２）参照）。

たとえば、顔画像の左目に相当するブロック３１については、上向きエッジ強度３２ａ、右上向きエッジ強度３２ａ、右向きエッジ強度３２ｂ、右下向きエッジ強度３２ｃ、ブロック３１の全体強度３２ｄといった特徴量が抽出される。なお、３２ａ〜３２ｅに示した矢印の太さは強度をあらわしている。また、同図に示した３２ａ〜３２ｅは、特徴量の一例であり、特徴量の種類は問わない。

このように、各ブロックについて特徴量を抽出する処理を顔画像全体について繰り返すことで、１枚の顔画像についての特徴量が揃うことになる。そして、同様の処理を他の複数枚の顔画像に対しても行うことで、顔画像サンプル１２ａが得られる。

また、同図の（Ｂ）に示したように、非顔画像についても顔画像と同様のブロック分割を行い（同図の（Ｂ−１）参照）、各ブロックについて、顔画像と同様の手順で特徴量を抽出する（同図の（Ｂ−２）参照）。たとえば、顔画像のブロック３１に対応する位置のブロック３３についても、上向きエッジ強度３４ａ、右上向きエッジ強度３４ａ、右向きエッジ強度３４ｂ、右下向きエッジ強度３４ｃ、ブロック３３の全体強度３４ｄといった特徴量が抽出される。

このように、各ブロックについて特徴量を抽出する処理を非顔画像全体について繰り返すことで、１枚の非顔画像についての特徴量が揃うことになる。そして、同様の処理を他の複数枚の非顔画像に対しても行うことで、非顔画像サンプル１２ｂが得られる。

集約判別器導出部１１ｂは、上記したＬＤＡＡｒｒａｙ法における集約判別器１２ｄを導出する処理を行う処理部である。具体的には、この集約判別器導出部１１ｂは、アダブースト処理部１１ａによって所定個数の２値化判別器が選択されると、選択された２値化判別器と決定された重み係数との組を受け取り、これらの２値化判別器をＬＤＡによって結合することで、集約判別器を導出する処理を行う処理部である。

また、集約判別器導出部１１ｂは、集約判別器の候補となる集約判別器候補１２ｃを２値化判別器の個数に応じてそれぞれ導出し、導出した集約判別器候補１２ｃの中から１つの集約判別器１２ｄを決定する処理を併せて行う。

ここで、ＬＤＡＡｒｒａｙ法について各数式を用いて説明しておく。集約判別器の導出回数をあらわす集約カウンタをｔ（１≦ｔ≦Ｔ）、特徴量をｘ、特徴量ｘに対応する集約判別器をＫ_ｔ（ｘ）、所定のオフセット値をｔｈとすると、最終判別器Ｆ（ｘ）は、

式（３−１）のようにあらわされる。ここで、関数ｓｉｇｎ（）は、かっこ内の値が０以上であれば＋１、０未満であれば−１とする２値化関数である。なお、オフセット値ｔｈは、図５を用いて後述するｏｆｆｓｅｔ_ｔの算出手順と同様の手順で算出することができる。

また、未２値化判別器をｆ_ｔｓ（ｘ）、ＬＤＡによって算出されるｆ_ｔｓ（ｘ）の重みをβ_ｔｓ、所定のオフセット値をｏｆｆｓｅｔ_ｔとすると、集約判別器Ｋ_ｔ（ｘ）は、式（３−２）のようにあらわされる。

なお、オフセット値ｏｆｆｓｅｔ_ｔの算出手順については、図５を用いて後述する。また、式（３−２）のオフセット値ｏｆｆｓｅｔ_ｔは必須ではなく、オフセット値ｏｆｆｓｅｔ_ｔを省略したうえで、式（３−１）のオフセット値ｔｈで最終的な調整を行うこととしてもよい。

ここで、未２値化判別器ｆ_ｓ（ｉ）と、２値化判別器ｈ_ｓ（ｉ）との関係は、

式（４）であらわされる。すなわち、未２値化判別器ｆ_ｓ（ｉ）を関数ｓｉｇｎ（）で２値化したものが２値化判別器ｈ_ｓ（ｉ）となる。

ＬＤＡａｒｒａｙ法では、集約カウンタｔごとに、複数の集約判別器候補の中から集約判別器Ｋｔ（ｘ）を１つずつ選択するとともに、選択した集約判別器Ｋ_ｔ（ｘ）に対応する重み係数α_ｔを逐次決定していく処理を繰り返すことで、最終判別器Ｆ（ｘ）を導出する。以下では、ＬＤＡａｒｒａｙ法についてさらに詳細に説明する。

また、Ｌ_ｔ（ｉ）を、ｉ番目の学習サンプルについて、ｔ回目の判別器集約を行った場合のサンプル重みとすると、Ｌｔ（ｉ）の初期値は、式「Ｌ_１（ｉ）＝１／Ｎ」であらわされる。そして、特徴量ｘ_ｉに対応する集約判別器をＫ_ｔ（ｘ_ｉ）とすると、ＬＤＡａｒｒａｙ法に用いられる各数式は、

となる。

ＬＤＡａｒｒａｙ法では、式（５−１）を用いて集約判別器Ｋ_ｔごとの誤り率（たとえば、クラスＡのサンプルをクラスＢと誤判別した確率）ε_ｔを算出する。そして、式（５−１）で算出された誤り率ε_ｔおよび式（５−２）を用いて集約判別器Ｋ_ｔの重み係数α_ｔを決定する。さらに、式（５−３）を用いて次回の集約における各学習サンプル重みＬ_ｔ＋１を更新する。なお、式（５−３）の分母であるＺ_ｔは、Ｌ_ｔ＋１を「ΣＬ_ｔ＋１（ｉ）＝１」とするための規格化因子であり、式（５−４）であらわされる。

ここで、式（５−３）は、集約判別器Ｋ_ｔが、次回の集約では、誤り率が０．５である判別器となるように次回の学習サンプル重みＬ_ｔ＋１を決定することを示している。

このようにして、次回の集約における学習サンプル重みＬ_ｔ＋１が更新されると、ＬＤＡａｒｒａｙ法では、学習サンプル重みＬ_ｔを、アダブースト処理における学習サンプル重みＤ_ｓへコピーする。そして、アダブースト処理では、ＬＤＡａｒｒａｙ法によって更新された学習サンプル重みＤ_ｓを初期値として判別器選択処理を繰り返すことになる。

図２の説明に戻り、集約判別器導出部１１ｂについての説明をつづける。集約判別器導出部１１ｂは、最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）および最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）という２つの次元数を有している。ここで、「次元数」とは、たとえば、特徴量の数をあらわすものとする。また、上記した２つの次元数（最小ＬＤＡ次元数および最大ＬＤＡ次元数）としては、処理時間と精度との兼ね合いから導出した値（経験値）を用いることができる。

そして、アダブースト処理部１１ａによって選択された判別器の個数（ｓ）が最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）以上となると、ＬＤＡによって集約判別器候補１２ｃを導出する。そして、集約判別器候補１２ｃの導出処理を、判別器の個数（ｓ）が最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）と等しくなるまで繰り返す。

たとえば、最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）が２であり、最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）が５である場合には、２個の判別器を集約した集約判別器候補１２ｃ、３個の判別器を集約した集約判別器候補１２ｃ、４個の判別器を集約した集約判別器候補１２ｃ、５個の判別器を集約した集約判別器候補１２ｃをそれぞれ導出し、導出した集約判別器候補１２ｃの中から１つの集約判別器１２ｄを選択する。

ここで、集約判別器導出部１１ｂが行う集約判別器候補算出処理の概要について図４を用いて説明しておく。図４は、集約判別器候補を算出する処理を示す図である。なお、同図では、最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）が４であり、最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）が２０である場合について示している。

集約判別器導出部１１ｂは、アダブースト処理部１１ａによって選択された判別器の個数（ｓ）が４、すなわち、最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）と等しくなると、クラスＡ（顔画像サンプル１２ａ）およびクラスＢ（非顔画像サンプル１２ｂ）を用いてＬＤＡによる判別分析を行う。このようにして、ｓが４である場合の集約判別器の候補ｋ_ｔ４（ｘ）を算出する。そして、同様の処理をｓが２０、すなわち、最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）と等しくなるまで繰り返す。

ここで、図４に示した各オフセット値（ｏｆｆｓｅｔ_ｔｎ）の算出手順について図５を用いて説明しておく。図５は、集約判別器候補１２ｃのオフセットを算出する処理を示す図である。なお、同図に示す５１ａ、５２ａおよび５３ａは、クラスＡ（顔画像サンプル１２ａ）の確率密度分布をあらわすグラフを、同図に示す５１ｂ、５２ｂおよび５３ｂは、クラスＢ（非顔画像サンプル１２ｂ）の確率密度分布をあらわすグラフを、それぞれ示している。また、同図に示した横軸は各集約判別器候補（ｋ_ｓ）の値を、同図に示した縦軸は確率密度を、それぞれあらわしている。

図５に示したように、ｏｆｆｓｅｔ_ｔ４は、クラスＡのグラフ５１ａとクラスＢのグラフ５１ｂとが、交差する点に対応する横軸値として算出される。すなわち、ｏｆｆｓｅｔ_ｔ４は、顔画像を非顔画像と誤認識した確率と非顔画像を顔画像と誤認識した確率とが等しいように調整される。また、誤り率ε_ｔ４は、同図に示した斜線部の面積として算出される。

なお、図５に示したように、ＬＤＡ次元数（ｓ）の変化にともなって、ｏｆｆｓｅｔ_ｔｎの値も変化する。このため、集約判別器導出部１１ｂは、ＬＤＡ次元数（ｓ）ごとにｏｆｆｓｅｔ_ｔｎをそれぞれ算出する。

集約判別器導出部１１ｂは、図４および図５に示した処理を行うことで、各集約判別器の候補ｋ_ｔｎ（ｘ）を、それぞれ算出する。つづいて、集約判別器導出部１１ｂは、算出した集約判別器候補１２ｃの中から１つの集約判別器１２ｄを選択する処理を行う。ここで、かかる選択処理の一例について図６を用いて説明しておく。

図６は、集約判別器選択の一例を示す図である。なお、同図には、最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）から最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）までの間で１回だけＬＤＡ関数を実行させると仮定した場合におけるスキャン総面積（クラスＢなどのサンプル画像に対するスキャン総面積）の変化をあらわすグラフ６１を示している。また、同図では、グラフ６１が、ＬＤＡ次元数（ｓ）が６のときに最小値６２をとる場合について例示している。

たとえば、ＬＤＡ関数を実行させるＬＤＡ次元数（ｓ）をｎとすると、スキャン総面積は、ｎ×画像面積＋（ｍａｘ＿ｌｄａ＿ｄｉｍ−ｎ）×（ｎ回の全面スキャンで排除できなかったエリアの面積）となる。このようにして算出されたスキャン総面積とｎとの関係は、たとえば、グラフ６１のようになる。

ここで、同図では、ＬＤＡ次元数（ｓ）が６の場合に最小値６２をとる場合について示したが、集約カウンタをｔが変化すると、スキャン総面積が最小となる次元数も変化する。このため、集約判別器導出部１１ｂは、集約カウンタｔに対応する集約判別器候補１２ｃを用いて図６に示した判定処理を行い、スキャン総面積が最小となるＬＤＡ次元数（ｓ）の候補ｋ_ｔｎを、集約判別器Ｋ_ｔとして選択する。

なお、図６では、スキャン総面積が最小となるＬＤＡ次元数（ｓ）を有する候補ｋ_ｔｎを、集約判別器Ｋ_ｔとして選択する場合について示したが、ＬＤＡ次元数（ｓ）を固定することとしてもよい。このようにすることで、ＬＤＡ処理の処理負荷が集約カウンタｔによって変化しないので、並列処理が可能となる。したがって、処理時間の短縮を図ることができる。

図２の説明に戻り、集約重み係数決定部１１ｃについて説明する。集約重み係数決定部１１ｃは、集約判別器導出部１１ｂが集約判別器Ｋ_ｔを導出した場合に、集約判別器Ｋ_ｔに対する重み係数（集約重み係数α_ｔ）を決定し、集約重み係数１２ｅとして記憶部１２へ記憶させる処理を行う処理部である。なお、集約重み係数α_ｔは、上記した式（５−２）を用いて算出される。

サンプル重み更新部１１ｄは、集約判別器導出部１１ｂによって導出された集約判別器Ｋ_ｔおよび集約重み係数決定部１１ｃによって決定された集約重み係数α_ｔに基づいて次回の集約における各学習サンプル重みＬ_ｔ＋１を更新する処理（式（５−３）参照）を行う処理部である。また、サンプル重み更新部１１ｄは、学習サンプル重みＬ_ｔを、アダブースト処理部１１ａが用いる学習サンプル重みＤ_ｓへコピーする処理を行う処理部でもある。

このようにして、集約カウンタｔをカウントアップしながら、集約カウンタｔに対応する集約判別器１２ｄおよび集約重み係数１２ｅが記憶部１２へ記憶されていく。そして、最終判別器決定部１１ｅは、集約判別器１２ｄ（Ｋ_ｔ）および集約重み係数１２ｅ（α_ｔ）を用いた最終判別器Ｆの正答率が所定値以上となったことを条件として集約カウンタｔを用いたループを終了する。なお、最終判別器決定部１１ｅは、集約対象とする２値化判別器（ｈ_ｓ）がない場合にもかかるループを終了する。

ここで、制御部１１によって行われる集約判別器導出処理についてまとめておく。図７は、集約判別器Ｋ_ｔを導出する処理を示す図である。同図に示したように、制御部１１は、ＬＤＡ候補（集約判別器候補）抽出を行い（同図の（Ａ）参照）、学習１回目の集約判別器Ｋ_１を決定する（同図の（Ｂ）参照）。

そして、Ｋ_１を決定したならば、つづいて、Ｋ_２の決定処理を開始し（同図の（Ｃ）参照）、Ｋ_２を決定する（同図の（Ｄ）参照）。さらに、Ｋ_３の決定処理を開始し（同図の（Ｅ）参照）、Ｋ_３、Ｋ_４を順次決定していく。なお、同図では、Ｋ_１のＬＤＡ次元数が４で、Ｋ_２のＬＤＡ次元数が５である場合について示しているが、このように、後続のＫになるほどＬＤＡ次元数が増加するとは限らない。

図２の説明に戻り、記憶部１２について説明する。記憶部１２は、不揮発性メモリやハードディスクドライブといった記憶デバイスで構成される記憶部であり、顔画像サンプル１２ａと、非顔画像サンプル１２ｂと、集約判別器候補１２ｃと、集約判別器１２ｄと、集約重み係数１２ｅとを記憶する。なお、記憶部１２に記憶される各情報については、制御部１１の説明において既に説明したので、ここでの説明は省略する。

次に、顔画像識別装置１０が実行する処理手順について図８を用いて説明する。図８は、顔画像識別装置１０が実行する処理手順を示すフローチャートである。同図に示すように、最小ＬＤＡ次元（ｍｉｎ＿ｌｄａ＿ｄｉｍ）および最大ＬＤＡ次元（ｍａｘ＿ｌｄａ＿ｄｉｍ）を設定し（ステップＳ１０１）、集約カウンタ（ｔ）を１とするとともに（ステップＳ１０２）、アダブーストカウンタ（ｓ）を１とする（ステップＳ１０３）。なお、集約カウンタ（ｔ）およびアダブーストカウンタ（ｓ）を用いて図７における判別器ｆをあらわすと、ｆ_ｔ−ｓとなる。

そして、アダブースト処理部１１ａは、最良判別器（ｈ_ｓ）を選択し（ステップＳ１０４）、ステップＳ１０４で選択された最良判別器（ｈ_ｓ）の重み係数（α_ｓ）を算出するとともに（ステップＳ１０５）、各サンプルに対するサンプル重み（Ｄ_ｓ）を更新する（ステップＳ１０６）。

つづいて、集約判別器導出部１１ｂは、アダブーストカウンタ（ｓ）が最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）以上であるか否かを判定し（ステップＳ１０７）、アダブーストカウンタ（ｓ）が最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）未満である場合には（ステップＳ１０７，Ｎｏ）、アダブーストカウンタ（ｓ）をカウントアップし（ステップＳ１１０）、ステップＳ１０４以降の処理を繰り返す。

一方、アダブーストカウンタ（ｓ）が最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）以上である場合には（ステップＳ１０７，Ｙｅｓ）、未２値化判別器（ｆ_１〜ｆ_ｓ）についてＬＤＡを行い、集約判別器候補（ｋ_ｓ）を算出する（ステップＳ１０８）。

つづいて、アダブーストカウンタ（ｓ）が最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）と等しいか否かを判定し（ステップＳ１０９）、アダブーストカウンタ（ｓ）が最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）と等しくない場合には（ステップＳ１０９，Ｎｏ）、アダブーストカウンタ（ｓ）をカウントアップし（ステップＳ１１０）、ステップＳ１０４以降の処理を繰り返す。

一方、アダブーストカウンタ（ｓ）が最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）と等しい場合には（ステップＳ１０９，Ｙｅｓ）、集約判別器（Ｋ_ｔ）を決定する処理を行う（ステップＳ１１１）。なお、ステップＳ１１１の詳細な処理手順については、図９を用いて後述することとする。

つづいて、集約重み係数決定部１１ｃは、集約判別器（Ｋ_ｔ）の重み係数（α_ｔ）を決定し（ステップＳ１１２）、サンプル重み更新部１１ｄは、サンプル重み（Ｌ_ｔ）を更新する（ステップＳ１１３）。そして、最終判別器決定部１１ｅは、最終判別器（Ｆ）による判別結果に基づいてクラスＡとクラスＢとの分離が十分であるか、または、未集約判別器がないか、のいずれかの条件を満たすか否かを判定する（ステップＳ１１４）。

そして、ステップＳ１１４の判定条件を満たした場合には（ステップＳ１１４，Ｙｅｓ）、最終判別器（Ｆ）を決定して処理を終了する。一方、ステップＳ１１４の判定条件を満たさなかった場合には（ステップＳ１１４，Ｎｏ）、集約判別器導出部１１ｂが用いるサンプル重み（Ｌ_ｔ）をアダブースト処理部１１ａが用いるサンプル重み（Ｄ_ｓ）へコピーする（ステップＳ１１５）。そして、集約カウンタ（ｔ）をカウントアップし（ステップＳ１１６）、ステップＳ１０３以降の処理を繰り返す。

次に、図８のステップＳ１１１に示した集約判別器決定処理の詳細な処理手順について図９を用いて説明する。図９は、集約判別器決定処理の処理手順を示すフローチャートである。同図に示すように、集約判別器導出部１１ｂは、ＬＤＡ次元数（ｓ）の初期値を最小ＬＤＡ次元数（ｍｉｎ＿ｌｄａ＿ｄｉｍ）とし（ステップＳ２０１）、全面スキャン総面積（ｓ×全面積）を算出する（ステップＳ２０２）。

つづいて、ｓ回の全面スキャンで排除できなかったエリアの面積を残存面積としたうえで（ステップＳ２０３）、部分スキャン総面積（（ｍａｘ＿ｌｄａ＿ｄｉｍ−ｓ）×残存面積）を算出する（ステップＳ２０４）。そして、総スキャン面積（全面スキャン総面積＋部分スキャン総面積）を算出する（ステップＳ２０５）。

つづいて、ｓが最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）と等しいか否かを判定し（ステップＳ２０６）、ｓが最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）と等しくない場合には（ステップＳ２０６，Ｎｏ）、ｓをカウントアップしたうえで（ステップＳ２０７）、ステップＳ２０２以降の処理を繰り返す。一方、ｓが最大ＬＤＡ次元数（ｍａｘ＿ｌｄａ＿ｄｉｍ）と等しい場合には（ステップＳ２０６，Ｙｅｓ）、総スキャン面積が最も小さいＬＤＡ次元数（ｓ）に対応する集約判別器候補（ｋ_ｓ）を集約判別器（Ｋ_ｔ）とし（ステップＳ２０８）、処理を終了する。

上述してきたように、本実施例では、アダブースト処理部が、被写体画像サンプルと非被写体画像サンプルとの分離に用いる所定の特徴量にそれぞれ対応する２値化判別器の中から最も誤り率が低い最良判別器を選択するとともに、選択された最良判別器に対応する重み係数を決定し、次の学習ではこの最良判別器を誤り率が０．５である判別器とするように、決定済の重み係数に基づくサンプル重みの更新を繰り返し、集約判別器導出部が、所定個数の最良判別器が選択されたならば、既に選択された最良判別器からなる判別器群について最良判別器のそれぞれに保持される未２値化データを用いて線形判別分析を行うことによって判別器群に対応する集約判別器を導出し、集約重み係数決定部が、導出された集約判別器が次の学習では誤り率が０．５である判別器となるようにこの集約判別器に対応する集約重み係数を決定し、サンプル重み更新部が、決定された集約重み係数に基づいてアダブースト処理部が用いるサンプル重みを更新し、導出された集約判別器および集約重み係数に基づいて最終判別器決定部が決定した最終判別器を用いて被写体画像と非被写体画像とを分離するように顔画像識別装置を構成した。

したがって、アダブースト手法における判断分岐による演算量増大という問題を回避するとともに、リアルブースト手法のように大きなメモリを必要とすることなく識別精度を向上させることができる。すわなち、被写体の検出精度を向上しつつ、検出処理に要する時間を短縮することが可能となる。

以上のように、本発明に係る被写体識別方法、被写体識別プログラムおよび被写体識別装置は、所定の画像から特定の被写体を検出する処理を高速かつ高精度に行いたい場合に有用であり、特に、背景画像から顔画像を検出する処理に適している。

Claims

ブースティング手法を用いて所定の被写体画像と非被写体画像とを分離する学習を行うことで所定の被写体を識別する被写体識別方法であって、
被写体画像サンプルと非被写体画像サンプルとの分離に用いる所定の特徴量にそれぞれ対応する２値化判別器の中から最も誤り率が低い最良判別器を選択するとともに、当該最良判別器に対応する重み係数を決定し、次の学習では当該最良判別器を誤り率が０．５である判別器とするように当該重み係数に基づくサンプル重みの更新を繰り返す繰返工程と、
前記繰返工程によって所定個数の前記最良判別器が選択されたならば、前記繰返工程によって既に選択された前記最良判別器からなる判別器群について該最良判別器のそれぞれに保持される未２値化データを用いて線形判別分析を行うことによって当該判別器群に対応する集約判別器を導出する集約判別器導出工程と、
前記集約判別器導出工程によって導出された前記集約判別器が次の学習では前記誤り率が０．５である判別器となるように当該集約判別器に対応する集約重み係数を決定する集約重み係数決定工程と、
前記集約重み係数決定工程によって決定された前記集約重み係数に基づいて前記繰返工程によって用いられる前記サンプル重みを更新するサンプル重み更新工程と、
前記集約判別器導出工程によって導出された前記集約判別器および前記集約重み係数決定工程によって決定された前記集約重み係数に基づいて前記被写体画像と前記非被写体画像とを分離する最終判別器を決定する最終判別器決定工程と
を含んだことを特徴とする被写体識別方法。
前記集約判別器導出工程は、
所定の最小個数以上であって所定の最大個数以下となる前記所定個数ごとに前記集約判別器の候補をそれぞれ導出し、導出した前記候補の中から１つの前記集約判別器を選択することを特徴とする請求項１に記載の被写体識別方法。
前記集約判別器導出工程は、
前記最小個数から前記最大個数までの範囲において前記所定個数までの範囲では前記非被写体画像に対する全面スキャンを行ったうえで前記所定個数より大きい範囲では前記全面スキャンで排除できなかったエリアに対する部分スキャンを行うと仮定した場合に、前記全面スキャンおよび前記部分スキャンによるスキャン面積の総和が最小となる前記候補を前記集約判別器として選択することを特徴とする請求項２に記載の被写体識別方法。
前記集約判別器導出工程は、
既に導出した前記集約判別器に含まれる前記２値化判別器の組合せとは異なるように、あらたに導出する前記集約判別器に含まれる前記２値化判別器の組合せを決定することを特徴とする請求項１、２または３に記載の被写体識別方法。
前記集約判別器導出工程は、
既に導出した前記集約判別器に含まれる前記２値化判別器を含まないように、あらたに導出する前記集約判別器に含まれる前記２値化判別器を決定することを特徴とする請求項１、２または３に記載の被写体識別方法。
ブースティング手法を用いて所定の被写体画像と非被写体画像とを分離する学習を行うことで所定の被写体を識別する被写体識別プログラムであって、
被写体画像サンプルと非被写体画像サンプルとの分離に用いる所定の特徴量にそれぞれ対応する２値化判別器の中から最も誤り率が低い最良判別器を選択するとともに、当該最良判別器に対応する重み係数を決定し、次の学習では当該最良判別器を誤り率が０．５である判別器とするように当該重み係数に基づくサンプル重みの更新を繰り返す繰返手順と、
前記繰返手順によって所定個数の前記最良判別器が選択されたならば、前記繰返手順によって既に選択された前記最良判別器からなる判別器群について該最良判別器のそれぞれに保持される未２値化データを用いて線形判別分析を行うことによって当該判別器群に対応する集約判別器を導出する集約判別器導出手順と、
前記集約判別器導出手順によって導出された前記集約判別器が次の学習では前記誤り率が０．５である判別器となるように当該集約判別器に対応する集約重み係数を決定する集約重み係数決定手順と、
前記集約重み係数決定手順によって決定された前記集約重み係数に基づいて前記繰返手順によって用いられる前記サンプル重みを更新するサンプル重み更新手順と、
前記集約判別器導出手順によって導出された前記集約判別器および前記集約重み係数決定手順によって決定された前記集約重み係数に基づいて前記被写体画像と前記非被写体画像とを分離する最終判別器を決定する最終判別器決定手順と
をコンピュータに実行させることを特徴とする被写体識別プログラム。
ブースティング手法を用いて所定の被写体画像サンプルと非被写体画像サンプルとを分離する学習を行うことで所定の被写体を識別する被写体識別装置であって、
被写体画像サンプルと非被写体画像サンプルとの分離に用いる所定の特徴量にそれぞれ対応する２値化判別器の中から最も誤り率が低い最良判別器を選択するとともに、当該最良判別器に対応する重み係数を決定し、次の学習では当該最良判別器を誤り率が０．５である判別器とするように当該重み係数に基づくサンプル重みの更新を繰り返す繰返手段と、
前記繰返手段によって所定個数の前記最良判別器が選択されたならば、前記繰返手段によって既に選択された前記最良判別器からなる判別器群について該最良判別器のそれぞれに保持される未２値化データを用いて線形判別分析を行うことによって当該判別器群に対応する集約判別器を導出する集約判別器導出手段と、
前記集約判別器導出手段によって導出された前記集約判別器が次の学習では前記誤り率が０．５である判別器となるように当該集約判別器に対応する集約重み係数を決定する集約重み係数決定手段と、
前記集約重み係数決定手段によって決定された前記集約重み係数に基づいて前記繰返手段によって用いられる前記サンプル重みを更新するサンプル重み更新手段と、
前記集約判別器導出手段によって導出された前記集約判別器および前記集約重み係数決定手段によって決定された前記集約重み係数に基づいて前記被写体画像と前記非被写体画像とを分離する最終判別器を決定する最終判別器決定手段と
を備えたことを特徴とする被写体識別装置。