JP4599730B2

JP4599730B2 - 画像領域抽出装置

Info

Publication number: JP4599730B2
Application number: JP2001058497A
Authority: JP
Inventors: 貴洋石川; 毅川島
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2001-03-02
Filing date: 2001-03-02
Publication date: 2010-12-15
Anticipated expiration: 2021-03-02
Also published as: JP2002259974A; US7076098B2; US20020122592A1

Description

【０００１】
【発明の属する技術分野】
本発明は、画像認識技術に関し、特に、任意の画像から特徴的な領域を抽出する画像領域抽出装置に関する。
【０００２】
【従来の技術及び発明が解決しようとする課題】
近年、車両や看板、人物などを監視する分野において、画像認識による方法が注目されている。例えば特開２０００−２２９２９号公報には、人物画像処理装置として、画像中の顔の領域を抽出する技術が開示されている。ここに開示された技術は、顔が肌色で撮影されることに着目したものであり、各画素のＲＧＢ値が肌色基準を満たすか否かで顔の領域を判断している。
【０００３】
しかしながら、顔領域の色は、たとえ同一人物であっても、撮影条件によって大きく変わってくる。つまり、撮影条件によってＲＧＢ値が大きく異なるのである。そのため、ＲＧＢ値の肌色基準を設定するのは困難であり、上述した手法では、撮影条件によっては顔領域を適切に抽出できない可能性が高くなる。
【０００４】
もちろん、撮影条件に合わせてＲＧＢ値の肌色基準を変更することで対応することが考えられるが、全ての撮影条件を予測し、ＲＧＢ値の肌色基準を設定することは現実的でない。
本発明は、任意画像中の特徴的な領域を抽出する際に、当該画像の撮影条件に応じ適応的に抽出処理内容を更新することによって、正確な領域抽出を実現することを目的とする。
【０００５】
【課題を解決するための手段及び発明の効果】
上述した目的を達成するためになされた本発明の画像領域抽出装置では、対象物の特定部分を含む任意の評価対象と、その特定部分と色の特徴が同じ基準被写体とを同様の撮影条件で撮影手段が撮影し、撮影手段を介して評価対象を含む評価画像を評価画像取得手段が取得し、撮影手段を介して基準被写体を含む学習画像を学習画像取得手段が取得する。評価画像と学習画像とは、同一の画像としてもよい。撮影条件が同じであればよいためである。また、教師画像取得手段は、学習画像中の各画素が前記被写体の撮影領域としての特徴領域の画素であるか否かを２値データによって示す教師画像を取得する。
【０００６】
そして本発明では、モデル生成手段が、学習画像取得手段にて取得される学習画像から任意に選択された選択画素における複数の画素値を入力値とし、教師画像取得手段にて取得される教師画像中の各画素のうち、その選択画素に対応する画素における２値データによって規定される第１特徴量を出力値とする画素評価モデルを、予め設定された基本関数を用いてその基本関数の係数を決定することにより生成する。学習画像の複数の画素値は、それぞれ例えば８ビット（０〜２５５）のＲＧＢ値で示されるものであることが考えられる。これに対して、教師画像は２値、例えば特徴領域の画素を「２５５」で示し、それ以外の画素を「０」で示すものとすることが考えられる。したがってこの場合、学習画像のＲＧＢ値から教師出力「０」又は「２５５」への各画素の対応関係を用いて画素評価モデルを生成する。
【０００７】
さらに、領域決定手段が、モデル生成手段にて生成された画素評価モデルに、評価画像取得手段にて取得された評価画像中の各画素における同様の複数の画素値を入力することにより、その評価画像中の各画素に対応する出力値としての第２特徴量を算出し、当該算出した画素毎の第２特徴量を、上記の第１特徴量に基づき予め決められた閾値を用いてそれぞれ２値化することにより、評価画像における特定部分の撮影領域としての抽出対象領域を決定する。この第２特徴量は、上述した例で言えば、評価画像における上記のＲＧＢ値から算出される値となる。
すなわち、本発明では、学習画像と教師画像とから画素評価モデルを自動的に生成でき、しかも、学習画像は、評価画像と同様の撮影条件で撮影されたものである。したがって、評価画像の撮影条件が変わった場合、学習画像と教師画像とからその撮影条件に応じた画素評価モデルを作成すれば、画像の撮影条件に応じ適応的に抽出処理内容を更新することができるため、正確な領域抽出を実現することができる。
【０００８】
なお、領域決定手段は、算出した第２特徴量に基づき特徴画素を決定し、当該決定された特徴画素に基づいて抽出対象領域を決定することが考えられる。例えば、閾値を「１２８」として、第２特徴量が「１２８」以上の画素を特徴画素として決定することが考えられる。そして、このような特徴画素からなる領域をそのまま抽出対象領域としてもよい。また、特徴画素からなる領域を含む矩形領域を抽出対象領域としてもよい。後者のように矩形領域を抽出対象領域とすることによって、例えば顔の領域を抽出する場合に、顔の輪郭部分が適切に抽出できるし、顔の領域以外のノイズ部分を適切にカットすることができる。
【０００９】
そして、領域決定手段は、具体的には、抽出対象領域を画素単位で特定可能な抽出指示データを生成することが考えられる。この抽出指示データは、例えば抽出する画素に「１」、抽出しない画素に「０」を対応させた２値のデータとすればよい。そして、このような抽出指示データを出力するようにすれば、その後、外部装置にて、評価画像の抽出対象領域を簡単に取り出せる。
【００１０】
ところで、上述した画素評価モデルは、いわゆるニューラルネットワークにて実現することができる。しかし、ニューラルネットワークは、図１０に示すようにニューロンとシナプスから構成されており、全てのシナプスの重みを決定することでモデル化される。つまり、全てのシナプスの重みが決定されるまでは、機能しない。そのため、高速な応答性を確保することができない。
【００１１】
そこで、請求項２に示すように、モデル生成手段は、複数の基本関数を階層的に組み合わせてなる多項式型推定モデルを用いて、その多項式推定モデルにおける各基本関数の係数を決定することにより、画素評価モデルを生成するとよい。即ち、ＧＭＤＨ演算手法を応用した多項式型推定モデルを画素評価モデルとして生成するようにするとよい。
従来、入力データと入力データに対応する出力データとから入出力関係を推定する手法として、種子の品種改良をまねた数学モデルであるＧＭＤＨ（Group Method of Data Handling ）が知られている。このＧＭＤＨについては、例えば「日本ファジィ学会誌 Vol.17, No.2, pp.270-274（1995年）」や、「システムと制御 Vol.23, No.12, pp.710-717（1979年）」に詳しく解説されている。
【００１２】
ＧＭＤＨとは、部分多項式と呼ばれる２変数の２次多項式を階層的に組み合わせて、非線形の多項式型推定モデルを得る手法である。
基本的なＧＭＤＨ演算手法について、ここで説明する。
Ｎ組の入出力データが与えられている場合を考える。入出力データとは、例えば入力変数が３つであれば、３つの入力データ（ｘ₁，ｘ₂，ｘ₃）及びこの入力データに対応する出力データ（ｙ）をセットにしたものをいう。すなわちこの場合は、入出力データは、（ｘ₁，ｘ₂，ｘ₃，ｙ）と表現できる。
【００１３】
ＧＭＤＨでは、この入出力関係が次の式３に示す従属関係ｆを満足すると考え、関係ｆの推定モデルを特定する。
ｙ＝ｆ（ｘ₁，ｘ₂，ｘ₃） …式３
例えば３つの入力データ（ｘ₁，ｘ₂，ｘ₃）を学習画像の画素情報であるＲＧＢ値、出力データｙを教師画像で規定される教師出力とすれば、関係ｆの推定モデルが、上述した画素評価モデルに相当することになる。
【００１４】
上述したＮ組の入出力データは、学習用データと評価用データとに分割されて用いられる。学習用データとは、モデルを同定するために用いるデータであり、一方、評価用データとは、モデルを評価するために用いるデータである。学習用データがＮ_t組存在し、評価用データがＮ_c組存在するとして説明を続ける。通常は、Ｎ_t＋Ｎ_c＝Ｎである。なお、分割の方法としては、入出力データの最初のデータセットから交互に学習用データと評価用データに分配する方法が考えられる。また、乱数を用いて分配してもよい。さらにまた、出力データの分散の大きさで分割する方法もある。したがって、本画像領域抽出装置においては、学習画像と教師画像との対応関係から、Ｎ_t組の学習用データとＮ_c組の評価用データとを適宜選択すればよい。
【００１５】
また、Ｎ組の入出力データをＮ組の学習用データとして、また、Ｎ組の評価用データとして用いることもできる。すなわち、学習画像と教師画像との同一の対応関係を学習用データ及び評価用データとして利用しても事足りる。
モデルの推定は、以下に示す手順▲１▼〜▲４▼によって行われる。
【００１６】
(1)まず３個の入力変数の組み合わせ（ｘ₁，ｘ₂），（ｘ₁，ｘ₃），（ｘ₂，ｘ₃）について，次の式４に示す部分多項式を構成する。
ｚ_k＝ｃ₀＋ｃ₁ｘ_p＋ｃ₂ｘ_q＋ｃ₃ｘ_p ²＋ｃ₄ ｘ _q ²＋ｃ₅ｘ_pｘ_q…式４
ここでｋ，ｐ，ｑ＝１，２，３、また、ｃ₀，ｃ₁，・・・，ｃ₅は係数である。なお、式４に示すｚ_kを中間変数という。
【００１７】
▲２▼上述したＮ_t組の学習用データを用いて、各部分多項式に対し、次の式５で示される二乗誤差Ｅ_kを最小にする係数ｃ₀，ｃ₁，・・・，ｃ₅を線形回帰分析により決定する。なお、ｚ_k［ｉ］は、Ｎ_t組の学習用データのうちのｉ番目の入力データに対する上記式４の値であり、ｙ［ｉ］はＮ_t組の学習用データのうちのｉ番目の出力データである。また、記号Σは、ｉについての和記号である。これによって、部分多項式が生成される。
Ｅ_k＝Σ（ｙ［ｉ］−ｚ_k［ｉ］）² …式５
▲３▼生成された部分多項式に、Ｎ_c組の評価用データを代入し、上記式５のＥ_kを計算する。この場合、ｚ_k［ｉ］はＮ_c組の評価用データのｉ番目の入力データを代入したときの上記式４の値であり、ｙ［ｉ」はＮ_c組の評価用データのｉ番目の出力データである。そして、得られた二乗誤差Ｅ₁，Ｅ₂，Ｅ₃の中から，値が小さいｍ個を選択し，残りの部分多項式は捨てる。
【００１８】
つまり、Ｎ_t組の入出力データを使って決定した係数ｃ₁，ｃ₂，・・・，ｃ₅が本当に有効か否かを、残りのＮ_c組の評価用データを用いてチェックする。
▲４▼選択した部分多項式モデルの出力ｚ_kを次の層の部分多項式を特定するための入力変数と見なし，次の式６に示す条件が成立するまで、上述した▲１▼からの手順を繰り返す。
Ｅ_min＞Ｅ’_min …式６
ここでＥ_minは、二乗誤差Ｅ₁，Ｅ₂，Ｅ₃の最小値である。すなわち、入出力関係をもっとも精度よく近似している部分多項式の評価値である。また、Ｅ’_minは、前層での評価値Ｅ_minである。つまりここでは、層を増加させたとき、誤差が減少せず逆に増加するときに終了する。
【００１９】
そして、前層で評価値Ｅ_minを与える部分多項式及びその部分多項式に関係したそれ以前の層の部分多項式を階層的に組み合わせたものが、上述した関係ｆの推定モデルとなる。
なお、部分多項式は上記式４に示したものに限定されず、２変数の２次多項式であればよい。例えば次の式７に示す部分多項式を用いることもできる。
ｚ_k＝ｃ₀＋ｃ₁ｘ_p＋ｃ₂ｘ_q＋ｃ₃ｘ_pｘ_q …式７
以上が従来より知られているＧＭＤＨによるモデル推定の手順である。この従来のＧＭＤＨによるモデル推定の手順を図１１に概念図として示した。
【００２０】
すなわち、上述した手順▲１▼及び▲２▼により、入力データ（ｘ₁，ｘ₂，ｘ₃，・・・，ｘ_n）を２つずつ組み合わせ、図１１中に示す１層目の部分多項式を生成する。つまり、 _nＣ₂の部分多項式が生成される。そして、手順▲３▼及び▲４▼によって、生成された各部分多項式を評価用データで評価してｍ個の部分多項式を選択すると共に終了判定を行う。これが図１１中に記号Ａで示す推定モデルの判別と終了判定に相当する。
【００２１】
次に、選択したｍ個の部分多項式の出力を２つずつ組み合わせて２層目の部分多項式を生成する（手順▲１▼，手順▲２▼）。つまり、 _mＣ₂の部分多項式が生成される。そして、手順▲３▼及び▲４▼によって、生成された各部分多項式を評価用データで評価し、ｍ’個の部分多項式を選択すると共に終了判定を行う。図１１中の記号Ｂで示す如くである。
【００２２】
これを繰り返すことによって最終的な推定モデルの出力が得られる。
ただし、このようなＧＭＤＨ演算手法をそのまま用いると、例えばコンピュータシステムを用いて計算させることを考えた場合、次のような問題がある。
それは、各層それぞれの計算において、入力データに対応する変数を２つずつ組み合わせて部分多項式を生成するため、入力データが多くなると、生成される部分多項式の数が多くなる。そのため、各部分多項式の評価等に要する計算時間が多くなり、最終的な推定モデルを得るまでに時間を要する。
【００２３】
したがって、より高速な応答性を確保するという観点からは、請求項３に示す構成を採用するとよい。なお、複数の基本関数のうち、一層目の基本関数を第一部分多項式、二層目の基本関数を第二部分多項式、三層目の基本関数を第三部分多項式、四層目の基本関数を第四部分多項式とする。
具体的には、多項式型推定モデルは、以下の４つのステップによって評価画像中の各画素に対応する第２特徴量を算出するモデルであればよい。
（１）評価画像取得手段にて取得された評価画像中の各画素における３つの画素値をそれぞれ入力変数ｘ₁，ｘ₂，ｘ₃として第一部分多項式に代入して出力ｘ₄を取得する第１のステップ。
（２）第１のステップにて取得した出力ｘ4と入力変数ｘ₁，ｘ₂とを第二部分多項式に代入して出力ｘ₅を取得する第２のステップ。
（３）第２のステップにて取得した出力ｘ₅と入力変数ｘ₂，ｘ₃とを第三部分多項式に代入して出力ｘ₆を取得する第３のステップ。
（４）第２のステップにて取得した出力ｘ₅と第３のステップにて取得した出力ｘ₆と入力変数ｘ₁とを第四部分多項式に代入して出力ｘ₇を取得する第４のステップ。
そして、請求項４に示すように、領域決定手段は、教師画像中の各画素における２値データによって規定される第１特徴量を教師出力とし、学習画像取得手段にて取得される学習画像中の各画素における３つの画素値をそれぞれ入力変数ｘ₁，ｘ₂，ｘ₃として、多項式型推定モデルの各ステップにて取得する出力ｘ₄，ｘ₅，ｘ₆，ｘ₇である中間出力と、教師出力との誤差を表す評価値に基づいて、第Ｎステップ（Ｎは２〜４の整数）における評価値が第Ｎ−１ステップにおける評価値を上回る場合、評価画像取得手段にて取得された評価画像中の各画素における３つの画素値をそれぞれ入力変数ｘ₁，ｘ₂，ｘ₃として第Ｎ−１ステップにて取得した中間出力を、評価画像中の各画素に対応する第２特徴量として抽出対象領域を決定する。
この場合、多項式型推定モデルの生成過程において、部分多項式の二乗誤差というような評価値が過去に算出された評価値よりも良いものであれば、部分多項式の出力を画素評価モデルの出力とする。
【００２４】
つまり、最終的な画素評価モデルが得られる途中の部分多項式の中で最も評価値がよいもの、例えば評価値として二乗誤差を用いる場合には、その二乗誤差が最小であるものの出力を画素評価モデルの出力とする。このようにすれば、逐次的にモデルを更新でき、初期段階においては幾分精度が低くなるものの、高速な応答性を確保することができる。
【００２５】
また、多項式型推定モデルの生成過程において、部分多項式の評価値が予め定められた基準値を満たすと、部分多項式の出力を画素評価モデルの出力とする。ここで基準値を画像処理に十分な精度を保証できるだけの値としておけば、ある程度の応答性が確保され、さらに、精度も保証されることになる。なお、このような基準値を満たした場合の部分多項式の出力を最終的な画素評価モデルの出力としてもよい。
【００２６】
なお、生成される部分多項式の数を減らして計算時間を削減することを考えた場合、モデル生成手段は、以下手順（１）〜（５）を実行することによって画素評価モデルを生成する。
【００２７】
（１）学習画像を構成する画素情報に対応させた変数を含む入力データの中から所定数の変数を選択する。
（２）選択された変数及び学習画像と教師画像との画素単位の対応関係を用いて部分多項式を生成する。
【００２８】
（３）生成された部分多項式に対応関係を用いて、当該部分多項式の評価値を算出する。
（４）算出された出力値が過去に算出された評価値よりも良いものであれば、当該部分多項式を記憶し、当該部分多項式の出力を前記入力データに加える。
【００２９】
（５）予め定められた終了条件を判断し、終了条件が成立しなければ、上記手順（１）〜（４）を繰り返す。
この手法の技術思想は、本出願人が特願２０００−４５９０８号に開示したものである。つまり、上述したように従来の手法では、ｍ個の入力データに対して各階層毎に _mＣ₂個の部分多項式を生成していた。そのため、計算量が多くなっていた。
【００３０】
これに対して上記手順（１）〜（５）で示す手法は、評価値の相対的に悪い部分多項式の出力を次の階層の入力データとしても評価値が改善されることは少なく、評価値の相対的に悪い部分多項式は無駄になることが多い、という事実に着目したものである。そこで、所定数の変数を選択して１つの部分多項式を生成し、部分多項式の評価値が良くなっていた場合に限り、その部分多項式を記憶し、その部分多項式の出力を入力データに加えて連鎖を可能にする。これによって、部分多項式の生成数を減少させることができ、計算量を削減できるため、計算時間を大幅に短くすることができる。すなわち、さらなる応答性の向上に寄与できる。一方、精度面においても従来の手法と比較して遜色ないものとなる。
【００３１】
なお、上記手順（５）における終了条件の成立は、次の（ア）〜（ウ）の如く判断することができる。
（ア）手順（１）〜（４）が所定回数だけ実行されたときに終了条件が成立したと判断することが考えられる。この場合は、２０回とか３０回とか決まった回数だけ手順（１）〜（４）が繰り返されたときに計算が終了する。
【００３２】
（イ）手順（４）において算出される評価値に基づいて終了条件の成立を判断することが考えられる。例えば評価値に二乗誤差を用いる場合、例えば、二乗誤差がある値よりも小さくなったときに、終了条件が成立したと判断するという具合である。なお、請求項５に示した構成を前提とし、ここでいう「ある値」を基準値とすることも考えられる。
【００３３】
（ウ）手順（４）にて部分多項式が所定回数だけ更新されたときに、終了条件が成立したと判断することが考えられる。この場合は、有効な多項式がいくつ生成されたかによって終了条件を判断する。
ところで、従来のＧＭＤＨ演算手法では、入力データから２つの変数を選択して、部分多項式を生成する。しかし、本発明では、３次元空間（ＲＧＢ値やＹＣｒＣｂ値）に分解される画素情報を入力データとしている。
【００３４】
そこで、学習画像を構成する画素情報に対応させた変数を含む入力データの中から３つの変数を選択して、部分多項式を生成することが考えられる。
このとき生成される部分多項式は、選択された３つの変数をｘ_p ，ｘ_q ，ｘ_r とし、係数をｃ₀ ，ｃ₁ ，ｃ₂ ，ｃ₃ ，ｃ₄ ，ｃ₅ 、ｃ₆ ，ｃ₇ ，ｃ₈，ｃ₉ とすると、次の式８で示される。
ｃ₀＋ｃ₁ ｘ_p ＋ｃ₂ ｘ_q ＋ｃ₃ ｘ_r ＋ｃ₄ｘ_p ²＋ｃ₅ ｘ_q ²＋ｃ₆ ｘ_r ²
＋ｃ₇ ｘ_p ｘ_q ＋ｃ₈ ｘ_pｘ_r ＋ｃ₉ ｘ_q ｘ_r …式８
また、選択された３つの変数をｘ_p ，ｘ_q ，ｘ_r とし、係数をｃ₀ ，ｃ₁ ，ｃ₂ ，ｃ₃ ，ｃ₄，ｃ₅ 、ｃ₆ として、次の式９で示されるものとしてもよい。
ｃ₀ ＋ｃ₁ ｘ_p ＋ｃ₂ ｘ_q ＋ｃ₃ ｘ_r
＋ｃ₄ ｘ_p ｘ_q ＋ｃ₅ ｘ_p ｘ_r＋ｃ₆ ｘ_q ｘ_r …式９
このようにすれば、生成される部分多項式が少なくなるため、画素評価モデルの生成に要する時間を削減でき、結果として、高速な応答性が確保される。そして、このようにしても、評価値としての二乗誤差を比較すると、従来の手法と遜色ない精度で演算が行われる。これについては後述の実施例にて、その実験データの一部を示す。
【００３５】
ところで、領域決定手段は、画素評価モデルにて算出された画素に対応する第２特徴量に基づいて抽出対象領域を決定する。したがって、抽出対象となり得る領域とそれ以外の領域とで第２特徴量が大きく異なるほど、抽出対象として適切な領域を決定できる。したがって、学習画像取得手段及び評価画像取得手段は、画素の第１及び第２特徴量に基づき抽出対象領域を適切に決定できるような画像変換処理を行うようにすることが望ましい。例えば、フィルタ処理などを行うという具合である。これによって、抽出対象の領域を、より適切に決定することができる。
【００３６】
なお、学習画像と教師画像との対応関係に同一のものが存在することを考えると、学習画像と教師画像との間の全ての画素の対応関係を用いる必要はない。
すなわち、モデル生成手段は、学習画像の画素情報から教師画像にて規定される教師出力への対応関係の一部である特定の対応関係を用いて、画像評価モデルを生成することが考えられる。これは簡単に言えば、対応関係を間引くことに相当する。例えば連続する４画素の対応関係から３画素分を間引くという具合である。このように一律に間引いてよい理由は、抽出対象の領域がある程度の面積を有することを前提としている。これによって、画素評価モデル生成に要する時間をさらに短縮することができ、高速な応答性を確保できる。
【００３７】
なお、このような画像領域抽出装置の各手段をコンピュータにて実現する機能は、例えば、コンピュータ側で起動するプログラムとして備えることができる。このようなプログラムの場合、例えば、ＦＤ、ＭＯ、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、ハードディスク等のコンピュータ読み取り可能な記録媒体に記録し、必要に応じてコンピュータにロードして起動することにより用いることができる。この他、ＲＯＭやバックアップＲＡＭをコンピュータ読み取り可能な記録媒体として前記プログラムを記録しておき、このＲＯＭあるいはバックアップＲＡＭをコンピュータシステムに組み込んで用いてもよい。
【００３８】
【発明の実施の形態】
以下、本発明を具体化した一実施例を図面を参照して説明する。
図１は、本発明の画像領域抽出装置を具体化した画像処理装置１を示す機能ブロック図である。
【００３９】
画像処理装置１は、モデル化ユニット１０と、抽出ユニット２０とを備えている。モデル化ユニット１０は、教師画像取得ブロック１１、学習画像取得ブロック１２、及びモデル生成ブロック１３を有している。一方、抽出ユニット２０は、評価画像取得ブロック２１、特徴量算出ブロック２２、抽出指示データ生成ブロック２３、及び結果画像出力ブロック２４を有している。
【００４０】
この画像処理装置１には、メモリ装置３０と、２台のデジタルビデオカメラ４０，５０と、モニタ６０とが接続されている。なお、以下の説明では、２台のデジタルビデオカメラ４０，５０を区別するために、それぞれＡデジタルビデオカメラ４０、Ｂデジタルビデオカメラ５０と記述する。
【００４１】
抽出ユニット２０では、Ｂデジタルビデオカメラ５０から評価対象の画像である評価画像を評価画像取得ブロック２１にて取得し、評価画像中の人物の顔の領域を抽出し、その結果を結果画像出力ブロック２４がモニタ６０へ出力する。具体的には、図２（ａ）に示すような評価画像から、図２（ｂ）に示すような顔部分だけを矩形領域として抜き出しそれ以外をマスクした結果画像を出力する。
【００４２】
ここで、評価画像は、カラー画像データであり、画素毎にそれぞれ８ビットのＲ（Ｒｅｄ）値、Ｇ（Ｇｒｅｅｎ）値、Ｂ（Ｂｌｕｅ）値を有している。このとき抽出ユニット２０では、特徴量算出ブロック２２が評価画像の各画素に対して画素評価モデルによりその特徴量を算出し、抽出指示データ生成ブロック２３が、算出した特徴量に基づいて抽出対象の矩形領域を示す抽出指示データを生成する。この抽出指示データを用いて、結果画像出力ブロック２４は、評価画像から上述した結果画像を出力する。
【００４３】
そして、上述した画素評価モデルを生成するのが、モデル化ユニット１０である。モデル化ユニット１０では、教師画像取得ブロック１１がメモリ装置３０から教師画像を取得し、学習画像取得ブロック１２がＡデジタルビデオカメラ４０から学習画像を取得する。そして、モデル生成ブロック１３が、この教師画像及び学習画像に基づき、ＧＭＤＨ演算手法を応用した演算を行い画素評価モデルを生成する。
【００４４】
そこで次に、学習画像及び教師画像について説明する。
学習画像は、評価画像と同様の撮影条件で撮影されたカラー画像データである。一方、教師画像は、学習画像中の特徴領域、すなわち学習画像中の人の顔領域を示すものである。本実施例の教師画像は、学習画像と同一画素数のモノクロ画像データであり、画素毎に８ビットの値を有する。具体的には、特徴領域の画素には「２５５」が設定され、それ以外の領域の画素には「０」が設定された２値データとなっている。この画素毎の値が教師画像で規定される教師出力に相当する。したがって、上述した学習画像には人物の顔画像が含まれていることが前提となるが、実際の人間でなく、人形を用いることも考えられる。ただし、顔部分の画素のＲＧＢ値が実際の人間を撮影した場合と大きく異ならないことが条件となるのは言うまでもない。図３（ａ）には教師画像を例示し、図３（ｂ）には人形を撮影した学習画像を例示した。このとき、教師画像は、学習画像中の顔部分を厳密に示すものである必要はない。
【００４５】
本実施例では、このような学習画像と教師画像との画素毎の対応関係、すなわち、学習画像のＲＧＢ値から教師出力「０」又は「２５５」への対応関係を用いて、上述した画素評価モデルが生成される。
以上のような画像処理装置１は、例えば周知のコンピュータシステムとして実現することができる。ただし、モデル生成ブロック１３における演算処理の負荷を考慮し、画像処理に特化させたマイクロプロセッサであるＤＳＰとしてモデル化ユニット１０を実現し、抽出ユニット２０として制御するＣＰＵから独立させて処理の分散を図ることが考えられる。
【００４６】
次に、モデル化ユニット１０におけるモデル生成処理を説明し、さらに続けて、抽出ユニット２０における抽出処理を説明する。
図４は、モデル生成処理を示すフローチャートである。このモデル生成処理は、例えば１０分というような所定時間間隔で実行される。
【００４７】
まず最初のステップ（以下、ステップを単に記号Ｓで示す。）１００において、入力変数を選択する。この処理は、入力データに対応させた変数の中から３つの変数をランダムに選択するものである。ただし、変数は重複しないように選択されるものとする。ここで選択された変数を入力変数ｘ_p，ｘ_q，ｘ_rとする。最初は、学習画像の画素情報であるＲＧＢ値が入力データであり、これらの入力データに対応する変数ｘ₁，ｘ₂，ｘ₃が選択される。
【００４８】
次のＳ１１０では、Ｓ１００にて選択された３つの入力変数ｘ_p，ｘ_q，ｘ_rを用い、部分多項式を生成する。部分多項式は、次の式１０に示す如くである。

ここでｃ₀，ｃ₁，・・・，ｃ₉は係数であり、学習画像のＲＧＢ値を上記式１０に代入したときの出力ｚとＲＧＢ値に対応する教師出力ｙとの二乗誤差を最小にするよう線形回帰分析により決定される。すなわち、ｉ番目の画素のＲＧＢ値を代入したときの出力をｚ［ｉ］とし、対応するｉ番目の教師出力をｙ［ｉ］とした場合、次の式１１にて計算される二乗誤差Ｅを最小にするという条件の下で係数ｃ₀，ｃ₁，・・・，ｃ₉を決定する。なお、ここでΣは、ｉ（＝１，２，・・・，Ｎ）についての和記号である。
Ｅ＝Σ（ｙ［ｉ］−ｚ［ｉ］）² …式１１
続くＳ１２０では、学習画像のＲＧＢ値と教師画像の教師出力ｙへの対応関係を用いて、評価値としての二乗誤差を算出する。ｉ番目の画素のＲＧＢ値を代入したときの値をｚ［ｉ］とし、対応するｉ番目の教師出力をｙ［ｉ］とした場合、上記式１１にて計算される二乗誤差Ｅを求める。以下、このＳ１２０にて算出された二乗誤差をＥ_hと記述する。
【００４９】
そして、次のＳ１３０では、Ｓ１２０にて算出された二乗誤差Ｅ_hと過去に算出された最小二乗誤差Ｅ_minとを比較する。続くＳ１４０では、Ｓ１３０における二乗誤差Ｅ_h，Ｅ_minの比較結果に基づき、追加条件を満たすか否かを判断する。ここでＥ_h＜Ｅ_minである場合（Ｓ１４０：ＹＥＳ）、追加条件を満たすとしてＳ１５０へ移行する。一方、Ｅ_h≧Ｅ_minである場合（Ｓ１４０：ＮＯ）、Ｓ１５０及びＳ１６０の処理を実行せず、Ｓ１７０へ移行する。
【００５０】
Ｓ１５０では、Ｓ１１０で生成した部分多項式の係数ｃ₀，ｃ₁，・・・，ｃ₉を抽出ユニット２０へ出力する。Ｓ１６０では、算出した二乗誤差Ｅ_hを最小二乗誤差Ｅ_minとし、最小二乗誤差Ｅ_minを更新する。また、Ｓ１１０にて生成した部分多項式を記憶する。さらにまた、その部分多項式の出力ｚを入力変数に追加する。例えばｘ₁，ｘ₂，ｘ₃が入力変数となっている場合、部分多項式の出力変数ｚに対応する新たな入力変数ｘ₄を追加するという具合である。そして、Ｓ１６０の処理終了後、Ｓ１７０へ移行する。
【００５１】
Ｓ１７０では、終了条件を満たすか否かを判断する。本実施例では、Ｓ１１０からの処理が所定回数だけ繰り返された場合に終了条件が成立したと判断する。ここで終了条件が満たされた場合（Ｓ１７０：ＹＥＳ）、本推定モデル構築処理を終了する。一方、終了条件が満たされていない場合（Ｓ１７０：ＮＯ）、Ｓ１００からの処理を繰り返す。
【００５２】
このモデル生成処理を模式的に示せば、図５に示す如くとなる。
すなわち処理開始後、学習画像の画素情報ＲＧＢ値にそれぞれ対応するｘ₁，ｘ₂，ｘ₃が選択される（Ｓ１００）。次に、選択された入力変数ｘ₁，ｘ₂，ｘ₃を用いて上記式１０に示す部分多項式を生成する（Ｓ１１０）。これによって、係数ｃ₀，ｃ₁，・・・，ｃ₉が決定される。
【００５３】
続いて、学習画像と教師画像との対応関係を用い、上記式１１によって評価値としての二乗誤差Ｅ_hを算出する（Ｓ１２０）。最初は、最小二乗誤差Ｅ_minが存在しないため、必ずＥ_h＜Ｅ_minと判断される（Ｓ１３０）。このときは追加条件を満たすので（Ｓ１４０：ＹＥＳ）、係数ｃ₀，ｃ₁，・・・，ｃ₉を抽出ユニット２０へ出力する（Ｓ１５０）。また、最小二乗誤差Ｅ_minに二乗誤差Ｅ_hを代入して更新し、生成した部分多項式を記憶し、その部分多項式の出力ｚに対応する入力変数をｘ₄として追加する（Ｓ１６０）。これは、図５中に記号ａで示す１層目の部分多項式が記憶されることに相当する。
【００５４】
そして、終了条件が満たされないうちは（Ｓ１７０：ＮＯ）、Ｓ１００からの処理が繰り返される。
２回目の繰り返し処理においては、入力データｘ₁〜ｘ₄の中から、ｘ_p，ｘ_qｘ_rが選択される（Ｓ１００）。ここでは、ｘ₁，ｘ₂，ｘ₄が選択されて部分多項式が生成されたとする（Ｓ１１０）。そして同様に二乗誤差Ｅ_hを算出し、Ｅ_h＜Ｅ_minならば（Ｓ１３０，Ｓ１４０：ＹＥＳ）、係数ｃ₀，ｃ₁，・・・，ｃ₉を抽出ユニット２０へ出力し（Ｓ１５０）、最小二乗誤差Ｅ_minを更新して、入力変数ｘ₅を追加する（Ｓ１６０）。これは、図４中の記号ｂで示す２層目の部分多項式の追加に相当する。
【００５５】
このようにしてＳ１００からの処理が所定回数実行されることによって、二乗誤差Ｅ_hを減少させる部分多項式のみが順に追加され、目的とする画素評価モデルが生成される。すなわち、図５では、さらに記号ｃ，ｄで示す部分多項式がそれぞれ３，４層目の部分多項式として追加され、記号ｄで示す部分多項式の出力ｘ₇を最終的な出力とする４層の画素評価モデルが生成されている。
【００５６】
続いて、抽出ユニット２０における抽出処理について説明する。
図６は、抽出ユニット２０における抽出処理を示すフローチャートである。
まず最初のＳ２００において、特徴量を算出する。このとき、上述したモデル生成処理においてＳ１５０で出力された係数で規定される多項式型推定モデルを画素評価モデルとして用い、評価画像のＲＧＢ値から特徴量を算出する。
【００５７】
続くＳ２１０では、算出された特徴量が「１２８」以上であるか否かを判断する。ここで特徴量≧１２８である場合（Ｓ２１０：ＹＥＳ）、Ｓ２２０にてその画素を特徴画素として記憶し、Ｓ２３０へ移行する。一方、特徴量＜１２８である場合（Ｓ２１０：ＮＯ）、Ｓ２２０の処理を実行せずＳ２３０へ移行する。
【００５８】
Ｓ２３０では、全ての画素を処理したか否かを判断する。ここで全ての画素を処理したと判断されると（Ｓ２３０：ＹＥＳ）、Ｓ２４０へ移行する。一方、処理していない画素があるうちは（Ｓ２３０：ＮＯ）、Ｓ２００からの処理を繰り返す。
【００５９】
Ｓ２４０では、抽出領域を決定する。この処理は、特徴画素で形成されるある程度の大きさを有する領域を含む矩形領域を決定するものである。そして、Ｓ２５０にて、Ｓ２４０の矩形領域を示す抽出指示データを生成する。
続くＳ２６０では、生成された抽出指示データに基づいて、結果画像を出力する。
【００６０】
以上説明したように、本画像処理装置１では、評価画像と同様の撮影条件で撮影された学習画像を用いて、モデル化ユニット１０が、例えば１０分というような所定時間間隔で、画素評価モデルを生成する。具体的には、ＧＭＤＨ演算手法を応用して部分多項式を生成し（図４中のＳ１００，Ｓ１１０）、二乗誤差Ｅ_hに基づき（Ｓ１２０〜Ｓ１４０）、部分多項式の係数を出力する（Ｓ１５０）。一方の抽出ユニット２０では、この係数で規定される画素評価モデルによって評価画像の画素毎の特徴量を算出し（図６中のＳ２００）、算出した特徴量に基づき抽出領域を決定する（Ｓ２１０〜Ｓ２４０）。つまり、撮影条件が変化する中、Ａデジタルビデオカメラ４０からの学習画像に基づき、撮影条件に合わせた画素評価モデルをモデル化ユニット１０が生成することによって、抽出ユニット２０では、評価画像の画素毎の特徴量を撮影条件に合わせて適切に算出することができ、撮影条件が変化しても、評価画像から抽出対象とする顔領域を適切に切り出すことができる。すなわち、本画像処理装置を用いれば、評価画像の撮影条件に応じ適応的に抽出処理内容を更新することができ、正確な領域抽出を実現することができる。なお、本実施例では、顔領域を抽出する構成を説明したが、学習画像と教師画像とを変更することによって、画像中の任意の特徴部分を抽出することができる。
【００６１】
そして、本画像処理装置１では、モデル化ユニット１０におけるモデル生成処理において、従来から知られているＧＭＤＨ演算手法を下記▲１▼〜▲３▼のように改良して、画像評価の応答性を向上させた。
▲１▼従来の手法では、ある階層における入力数がｍであった場合、その階層において _mＣ₂の部分多項式が機械的に生成される（図１１参照）。そのため、計算量が多くなっていた。
【００６２】
これに対して、本実施例では、一つの部分多項式を生成し（Ｓ１１０）、部分多項式の二乗誤差が小さくなっていた場合に限り（Ｓ１２０，Ｓ１３０，Ｓ１４０：ＹＥＳ）、その部分多項式を記憶し、その部分多項式の出力を入力変数に加えて連鎖を可能にする（Ｓ１６０）。つまり、部分多項式の生成数を減少させることができるのである。その結果、計算量を削減でき、画素評価モデルの迅速な生成に寄与する。また、精度面においても、従来手法と比べて遜色ないものとなる。
【００６３】
なお、この技術思想については、特願２０００−４５９０８号に詳細に開示した。この思想は、入力データ数が例えば１３というように多くなればなる程、その効果が極めて高くなる。画像評価においては入力データ数が３つであるため、計算量は幾分多くなるものの、従来のＧＭＤＨ演算手法を用いてもよい。
【００６４】
▲２▼また、本実施例の手法では、生成した部分多項式の二乗誤差が最小二乗誤差よりも小さくなっている場合、すなわち追加条件を満たす場合には（図４中のＳ１４０：ＹＥＳ）、その時点の部分多項式の係数を出力する（Ｓ１５０）。すなわち、最終的な画素評価モデルの生成途中の部分多項式の出力を画素評価モデルの出力としている。これによって、初期段階の精度は幾分低くなるものの、画素評価の応答性を向上させることができる。
【００６５】
▲３▼従来のＧＭＤＨ演算手法では、入力データから２つの変数を選択して、部分多項式を生成する。しかし、画像の評価を行う場合、３次元空間（ＲＧＢ値やＹＣｒＣｂ値）に分解される画素情報が入力データとなる。
そのため、従来のＧＭＤＨ演算手法を用いると、図７（ｂ）に示したように、ＲＧＢ値の全ての値を用いたモデルを表現する場合、少なくとも２つの部分多項式が必要になる。これに対して、本実施例では、上記式１０で示したような３変数の２次多項式を利用している。つまり、図７（ａ）に示すように、最低限一つの部分多項式があれば、モデルを表現することができる。その結果、本実施例によれば、演算コストを小さくすることができる。
【００６６】
これについて説明する。
本出願人は、実際に、上記式４で示される２変数の基本関数と、上記式１０で示される３変数の基本関数を用いて、演算精度を比較した。なお、部分多項式生成の基礎となる関数を、ここでは基本関数と呼ぶことにする。
【００６７】
基本関数の個数と二乗誤差との関係を図８のグラフに示した。ここで、図８（ａ）は従来のＧＭＤＨ演算手法（従来法）によるものであり、図８（ｂ）は、本実施例の演算手法（提案法）によるものである。また、それぞれの二乗誤差で必要な基本関数の個数と演算コストとの関係を図９の表に示した。なお、今回使用したデータ数は、Ｎ＝３０７２００である。ここでは各基本関数の入力変数はランダムに選択されるため、同一データを用いて５回試行している。図８では、それぞれの試行における二乗誤差の減少を区別できるように示した。一方、図９に示した表は、５回の試行の平均を示す。
【００６８】
図８のグラフにより、提案法の方が、少ない基本関数で精度の高い、すなわち二乗誤差の小さい出力結果を算出できることが分かる。これは、提案法が各基本関数においてより多くの情報を利用しているためである。
また、図９の表により、同じ演算精度（二乗誤差）を達成するために必要な基本関数の個数は、提案法の方が少ないことが分かる。例えば二乗誤差が０．７５×１０⁹を切るためには、従来法では平均１０．２個の基本関数が必要だが、提案法では平均５．２個で足りる。このとき、基本関数の出力値計算コスト（加算数・乗算数）について注目しても提案法が優れている。この事実は、提案法では、基本関数一つあたりの演算量は多少増加するが、基本関数の個数を減らすことで全体での演算量を減少させることができることを意味する。
【００６９】
上記▲１▼〜▲３▼の改良により、例えば８０ナノ秒／画素といったリアルタイム性の高い出力が要求される場合であっても、演算量を極力削減することができ、精度を落とすことなく、画像評価の応答性を向上させることができる。
また、本実施例では、評価画像の画素の特徴量に基づき、特徴画素を記憶し（図６中のＳ２２０）、この特徴画素で形成されるある程度の大きさの領域を含む矩形領域を決定する（Ｓ２４０）。これによって、顔領域を抽出するときに顔の輪郭部分が適切に抽出されることになる。また、顔領域以外のノイズ部分をカットすることができる。
【００７０】
さらに、抽出領域としての矩形領域は、抽出指示データの形式で指示される。
抽出指示データは、例えば、評価画像中の抽出画素を「１」、それ以外の画素を「０」とした２値データとすることが考えられる。本実施例では、このような抽出指示データに基づき、抽出領域以外の領域にマスクをかけた結果画像を出力しているが、このような抽出指示データを直接出力して、外部装置で評価画像に対する情報処理を行うようにしてもよい。このような抽出指示データを生成することで、評価画像の抽出領域を外部の装置においても簡単に把握できる。
【００７１】
なお、本実施例の画像処理装置１において、モデル化ユニット１０の教師画像取得ブロック１１が「教師画像取得手段」に相当し、学習画像取得ブロック１２が「学習画像取得手段」に相当し、モデル生成ブロック１３が「モデル生成手段」に相当する。そして、図４に示したモデル生成処理がモデル生成手段としての処理に相当する。また、抽出ユニット２０の評価画像取得ブロック２１が「評価画像取得手段」に相当し、特徴量算出ブロック２２及び抽出指示データ生成ブロック２３が「領域決定手段」に相当する。そして、図６中のＳ２００〜Ｓ２５０が領域決定手段としての処理に相当する。
【００７２】
以上、本発明はこのような実施例に何等限定されるものではなく、本発明の主旨を逸脱しない範囲において種々なる形態で実施し得る。
（い）上記実施例では、モデル生成処理において、二乗誤差が最小二乗誤差を下回ると、その時点での部分多項式の出力を、画素評価モデルの出力としていた。これに対して、二乗誤差がある基準を満たしたときにはじめて、部分多項式の出力を、画素評価モデルの出力とすることもできる。具体的には、ある基準を満たしたときに、図４中のＳ１５０と同様に、係数を出力する。
【００７３】
このとき、上記実施例と同様に、Ｓ１７０にて終了条件が成立するまで、Ｓ１００からの処理を繰り返して、最終的な画素評価モデルを生成するようにしてもよい。また、上述したある基準を二乗誤差が満たすこと自体を終了条件にしてもよい。
【００７４】
（ろ）抽出ユニット２０では、画素評価モデルにて算出された評価画像の画素毎の特徴量に基づいて抽出領域を決定する。したがって、抽出対象となり得る領域とそれ以外の領域とで特徴量が大きく異なるほど、抽出対象として適切な領域を決定できる。したがって、学習画像取得ブロック１２及び評価画像取得ブロック２１にて、適切な画像変換処理を行うようにしてもよい。例えば、フィルタ処理などを行うという具合である。このようにすればさらに、特徴画素を適切に決定することができ、抽出領域をより適切に決定することができる。
【００７５】
（は）上記実施例では、特徴画素からなる領域を含む矩形領域を抽出領域としていたが、特徴画素からなる領域そのものを抽出領域としてもよい。
（に）上記実施例では、学習画像と教師画像との対応関係に基づいて部分多項式を生成する。このとき、全ての画素の対応関係を用いて、モデル生成を行ってもよいが、実際には、学習画像と教師画像との画素単位の対応関係には同一のものが多数存在する。
【００７６】
したがって、精度面に支障のない範囲で、対応関係を間引いて用いることが考えられる。例えば画素毎の対応関係を４つおきに用いるという具合である。この場合、データ数は１／４になる。このように一律に間引いてよい理由は、抽出対象の領域がある程度の面積を有することを前提としている。これによって、画素評価モデル生成に要する時間をさらに短縮することができ、高速な応答性を確保できる。
【００７７】
（ほ）上記実施例では、Ａ，Ｂの２台のデジタルビデオカメラ４０，５０を用いて学習画像と評価画像を入力していたが、１台のデジタルビデオカメラを用い、評価画像だけを入力し、この評価画像を学習画像として利用してもよい。
【００７８】
（と）上記実施例の式１０に代えて、次の式１２を基本関数としてもよい。

【図面の簡単な説明】
【図１】実施例の画像処理装置の構成を示す機能ブロック図である。
【図２】（ａ）は評価画像を例示する説明図であり、（ｂ）は評価画像に対する結果画像を例示する説明図である。
【図３】（ａ）は教師画像を例示する説明図であり、（ｂ）は学習画像を例示する説明図である。
【図４】モデル化ユニットにおけるモデル生成処理を示すフローチャートである。
【図５】モデル化の手順を模式的に示す説明図である。
【図６】抽出ユニットにおける抽出処理を示すフローチャートである。
【図７】画像処理に必要な部分多項式を示す説明図である。
【図８】基本関数の個数と二乗誤差との関係を示す説明図である。
【図９】基本関数の個数と演算コストとの関係を示す説明図である。
【図１０】ニューラルネットワークを模式的に示す説明図である。
【図１１】従来のＧＭＤＨ演算手法を模式的に示す説明図である。
【符号の説明】
１…画像処理装置
１０…モデル化ユニット
１１…教師画像取得ブロック
１２…学習画像取得ブロック
１３…モデル生成ブロック
２０…抽出ユニット
２１…評価画像取得ブロック
２２…特徴量算出ブロック
２３…抽出指示データ生成ブロック
２４…結果画像出力ブロック
３０…メモリ装置
４０，５０…デジタルビデオカメラ
６０…モニタ

Claims

対象物の特定部分を含む任意の評価対象と、該特定部分と色の特徴が同じ基準被写体とを同様の撮影条件で撮影する撮影手段と、
前記撮影手段を介して前記評価対象を含む評価画像を取得する評価画像取得手段と、
前記撮影手段を介して前記基準被写体を含む学習画像を取得する学習画像取得手段と、
前記学習画像中の各画素が前記基準被写体の撮影領域としての特徴領域の画素であるか否かを２値データによって示す教師画像を取得する教師画像取得手段と、
前記学習画像取得手段にて取得される学習画像から任意に選択された選択画素における複数の画素値を入力値とし、前記教師画像取得手段にて取得される教師画像中の各画素のうち、前記選択画素に対応する画素における２値データによって規定される第１特徴量を出力値とする画素評価モデルを、予め設定された基本関数を用いて該基本関数の係数を決定することにより生成するモデル生成手段と、
前記モデル生成手段にて生成された画素評価モデルに、前記評価画像取得手段にて取得された評価画像中の各画素における前記複数の画素値を入力することにより、該評価画像中の各画素に対応する出力値としての第２特徴量を算出し、当該算出した画素毎の第２特徴量を、前記第１特徴量に基づき予め決められた閾値を用いてそれぞれ２値化することにより、該評価画像における前記特定部分の撮影領域としての抽出対象領域を決定する領域決定手段とを備えること
を特徴とする画像領域抽出装置。
請求項１に記載の画像領域抽出装置において、
前記モデル生成手段は、複数の前記基本関数を階層的に組み合わせてなる多項式型推定モデルを用いて、該多項式推定モデルにおける各基本関数の係数を決定することにより、前記画素評価モデルを生成すること
を特徴とする画像領域抽出装置。
請求項２に記載の画像領域抽出装置において、
前記複数の基本関数のうち、一層目の基本関数を第一部分多項式、二層目の基本関数を第二部分多項式、三層目の基本関数を第三部分多項式、四層目の基本関数を第四部分多項式として、
前記多項式型推定モデルは、
前記評価画像取得手段にて取得された評価画像中の各画素における３つの画素値をそれぞれ入力変数ｘ₁，ｘ₂，ｘ₃として前記第一部分多項式に代入して出力ｘ₄を取得する第１のステップと、
前記第１のステップにて取得した出力ｘ₄と前記入力変数ｘ₁，ｘ₂とを前記第二部分多項式に代入して出力ｘ₅を取得する第２のステップと、
前記第２のステップにて取得した出力ｘ₅と前記入力変数ｘ₂，ｘ₃とを前記第三部分多項式に代入して出力ｘ₆を取得する第３のステップと、
前記第２のステップにて取得した出力ｘ₅と前記第３のステップにて取得した出力ｘ₆と前記入力変数ｘ₁とを前記第四部分多項式に代入して出力ｘ₇を取得する第４のステップと、
によって前記評価画像中の各画素に対応する第２特徴量を算出するモデルであること
を特徴とする画像領域抽出装置。
請求項３に記載の画像領域抽出装置において、
前記領域決定手段は、
前記教師画像中の各画素における２値データによって規定される第１特徴量を教師出力とし、前記学習画像取得手段にて取得される学習画像中の各画素における３つの画素値をそれぞれ前記入力変数ｘ₁，ｘ₂，ｘ₃として、
前記多項式型推定モデルの各ステップにて取得する出力ｘ₄，ｘ₅，ｘ₆，ｘ₇である中間出力と、前記教師出力との誤差を表す評価値に基づいて、第Ｎステップ（Ｎは２〜４の整数）における前記評価値が第Ｎ−１ステップにおける前記評価値を上回る場合、
前記評価画像取得手段にて取得された評価画像中の各画素における３つの画素値をそれぞれ入力変数ｘ₁，ｘ₂，ｘ₃として第Ｎ−１ステップにて取得した中間出力を、前記評価画像中の各画素に対応する第２特徴量として前記抽出対象領域を決定することを
特徴とする画像領域抽出装置。