JP3979122B2 - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法 Download PDFInfo
- Publication number
- JP3979122B2 JP3979122B2 JP2002049147A JP2002049147A JP3979122B2 JP 3979122 B2 JP3979122 B2 JP 3979122B2 JP 2002049147 A JP2002049147 A JP 2002049147A JP 2002049147 A JP2002049147 A JP 2002049147A JP 3979122 B2 JP3979122 B2 JP 3979122B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- characteristic
- azimuth
- color
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、画像処理に関し、特に画像中から対象物体の領域を推定するための技術に関する。
【0002】
【従来の技術】
デジタルカメラ等により得られるデジタル自然画像から、対象となる物体の領域を推定する処理は、シーンの判別や特定領域に対する色補正処理など、幅広い応用が可能である。特に、色補正処理では、推定された領域に対して、色や輝度の補正を行うことにより、補正をする必要のない領域をそのままの状態に保つことができる。これにより、例えば、画像全体に補正処理を施すことにより、もともと明るかった領域の色がとんでしまうことなどを防ぐことができる。このように対象物体の領域推定は、自動色補正処理や自動画質調整の前処理としても有用な技術である。しかしながら、自然画像からの対象物体領域推定は、現在も困難な技術課題として挙げられている。
【0003】
対象物体領域の特定として、特に人物の顔領域の特定に関する技術はこれまで数多く発表されており、需要も多い。中でもパターン照合や特定の形への当てはめによるものが多く、例えば、特開平11−312243号公報には、高周波成分を保存しつつ行ったモザイク化による変換とあらかじめ用意されたテンプレートとの相関により、画像中から顔領域の抽出を行う手法が開示されている。また、特開平10−293840号公報には、肌色の色相を検出した後、楕円の長軸と短軸の比を利用した当てはめを行うことにより顔領域の近似を行い、顔領域を正規化する手法が開示されている。その他にも特開平6−309457号公報には、回転により変動されない点として両目の中心値の探索を行った後に、あらかじめ顔輪郭を学習したニューラルネットワークにより顔画像であるか否かの判定を行う手法などがある。
【0004】
また、顔領域以外でも、汎用的に物体領域を特定する手法として、特開平11−328420号公報に記載のように、あらかじめ対象物体領域がもつ特徴をニューラルネットワークにより学習させ、任意領域との適合度からエネルギー関数を定義し、エネルギー関数が減少するように領域変更を行い、収束したときの領域を切出すことにより対象物体の領域を特定する方法などがある。
【0005】
【発明が解決しようとする課題】
このように従来技術では、テンプレートまたは特定の形への当てはめや、あらかじめ学習したニューラルネットワークによって、対象物体の候補となる領域を特定する構成をとるものが多い。このような手法では、対象物体の大きさが未知である場合には、処理過程で大きさを変えて再度適合度処理を行ったり、あるいは数多くの種類のテンプレートを用意して適用したりする必要があり、それだけ多くの照合処理時間を要することになる。
【0006】
また、ニューラルネットワークを用いてあらかじめ学習する場合には、学習時間に注意しなければならない。一般に、顔画像認識等の高度な認識をさせるには、ニューラルネットワークの学習が収束するのに長時間を要する。
【0007】
また、ニューラルネットワークを用いた領域推定の性能は、学習に用いたサンプルの質や数に依存するため、高い推定性能を得ようとするには良質のサンプルをかなりの数だけ用意する必要があった。同様に、テンプレートを用いる手法の推定性能も、用いるテンプレートの質や数に依存し、高い推定性能を得るには良質なテンプレートを用いる必要がある。
【0008】
さらに、上記のような手法では、対象物体がもつ特徴の個体差に対する対応が不十分で、物体の候補領域を柔軟に推定することは困難である。また上記の手法では、対象物体の種類に応じてテンプレートをいくつも用意しなければならず、また、特定の形への当てはめでは適用範囲に限界がある。このように、テンプレート照合や当てはめによるシステムは拡張性に乏しく、シーンに含まれる様々な領域を特定する手法としては不十分である。
【0009】
【課題を解決するための手段】
本発明は、個体差を持つ物体に対しても柔軟に領域推定を行うことができ、膨大な数のテンプレート照合演算や特定の形への当てはめを必要とすることなく、対象物体の領域を特定することができる画像処理方法及び装置を提供することを目的とする。
【0010】
この目的を達成するため本発明は、デジタル画像から、対象物体の領域を推定するために、所定の各方位ごとに、当該方位の輪郭成分を抽出するフィルタを前記デジタル画像に適用することより当該方位に対応する方位成分画像を生成し、前記デジタル画像の各画素の色と前記対象物体の代表色との距離を示す色成分距離画像を生成し、生成された前記各方位に対応する方位成分画像に基づき、前記デジタル画像のうち前記対象物体の領域の輪郭が持つ方位特性を備えた画像部分を求め、それら画像部分を示した特性強調画像を生成し、前記特性強調画像に基づき、前記デジタル画像における前記対象物体の領域を推定する。ここで、特性強調画像の生成では、前記各方位に対応する方位成分画像と前記色成分距離画像との間で画素ごとに積をとることで、それら各方位に対応する合成画像をそれぞれ生成し、これら各方位に対応する合成画像を前記対象物体の輪郭が持つ方位特性に応じた重み付けで重み付け加算することにより前記特性強調画像を生成する。
【0011】
【発明の実施の形態】
図1は本発明の実施の形態を示す機能ブロック図である。
【0012】
この装置は、色成分変換部11、色成分距離画像生成部13、方位成分画像生成部14、合成画像生成部15、特性強調画像生成部17、領域推定画像生成部18を備える。この装置は、典型的には、コンピュータシステムを基盤とし、それら各構成要素の機能、処理内容(詳細な内容については後述)を記述したプログラムをそのコンピュータシステムに実行させることにより実現される。
【0013】
この実施形態では、一例として、入力される入力画像100はRGB(赤、緑、青)画像とする。
【0014】
色成分変換部11は、入力画像のRGB成分から輝度情報と色差(色度とも呼ばれる)情報が獲得できる成分への変換を行う。人間の視覚は、輝度情報の方が色情報よりも敏感であることが知られており、後の処理である方位成分の抽出では、輝度情報を用いて処理を行うことにより、人間の視覚に適合した特徴抽出を効率的に実行可能としている。画像の各画素を輝度情報と色情報をもつ色成分を表す色空間として、輝度をY、青からの色差をCb、赤からの色差をCrとしたYCbCr空間がある。ここではRGB成分からYCbCr成分への変換行列を用いて、例えば次式にしたがって色成分変換を行う。
【0015】
【数1】
ここではYCbCr色空間に変換したが、これ以外にも、変換行列が存在し、色相等の色情報と輝度とに分離できる色空間を用いることができる。
【0016】
上記のように、色成分変換としては輝度情報と色情報(色差)とを抽出できるものが好適であるが、このようなもの以外の色成分変換でも原理的には同様の処理が実現可能である。例えば、色相・彩度・明度からなるHSV成分などに変換したり、場合によってはRGBのまま処理することも考えられる。RGB色空間で処理する場合、RGB値を単純平均してグレースケール値を求め、これを輝度情報に準じたものとして利用することもできる。なお、入力画像100の色空間表現のまま以降の処理を行う場合は、色成分変換部11は設けなくてよい。
【0017】
色成分距離画像生成部13は、図4に示すように、入力画像100の色成分変換部11による変換結果のうちの色差成分(Cb,Cr)から、色成分距離画像105を生成する。色成分距離画像105は、大略的に言えば、推定すべき対象物体の代表色12に対する、入力画像100の各画素の色の違いの程度を表す画像である。ここでは、色の違いを色差成分(Cb,Cr)の距離で求める。
【0018】
ここで代表色とは、対象物体の呈する代表的な色のことである。この対象物体代表色12の情報は、本装置の記憶部にあらかじめ登録されているものとする。ここで、対象物体の代表色が明確に一つに決められるものである場合は、その1つの代表色の色情報(Cb,Cr)が登録される。この代表色情報は、色差Cb,Crをそれぞれの軸とする2次元色差空間の1つの点を示す。以下ではこの1つの代表色を示す点を代表点と呼ぶ。対象物体として色について差を持つ個体が複数ある場合には、それらを代表する代表色情報(Cb,Cr)を複数個登録してもよい。登録する代表色情報は、実際に対象物体を撮影して得た画像から抽出したものでもよいし、ユーザが指定してもよい。例えば前者の場合、対象物体として人の顔の領域を推定する場合、実際に人を撮影したデジタル画像を複数用意してそれらを画像処理ソフトウエアで表示し、それら各画像中で人の顔領域をユーザに指定してもらい、その領域の色情報を抽出して登録すればよい。後者の場合は、例えば画像処理ソフトウエアにて色成分を徐々に変えていったときの色彩の変化をグラデーションとして表示し、その中でユーザに対象物体の色を指定してもらい、その色の成分値を求めて登録すればよい。
【0019】
色成分距離画像生成部13にて色成分距離画像105を生成する場合、入力画像100の各画素の色と、対象物体の色の代表色(代表点)との距離を求める必要がある。図2にこの色成分距離の求め方を例示する。ここでの色成分距離は、色差CbとCrからなる色差空間での距離である。代表点(代表色)が1点しかない場合、入力画像100の1つの画素についての色成分距離としては、図2(a)に示すように、色差空間において、その画素の色が示す点からその代表点までのユークリッド距離を用いればよい。代表色が複数登録されているケースでは、図2(b)に示すように、色差空間中でのそれら代表色を表す代表点群から色相直線を推定し、この色相直線から当該画素の色を表す点までの距離を色成分距離とすればよい。ここで色相直線は例えば回帰分析により推定することができる。また、これら2つの方法以外にも、色差空間において、注目する画素の色を示す点と複数の代表点との統計的な距離を色成分距離として用いることも可能である。統計的な距離としては、例えばマハラノビス距離がある。
【0020】
色成分距離としては、上記のように様々な定義のものを用いることができるが、その中でも色相直線からの距離は、代表点1点からの距離と比べた場合、対象物体の明るさに影響を受けにくいと言う点で優れている。このため、通常の場合から逆光条件まで等、広範囲にわたる照明条件での対象物体の領域推定を行う場合には、色相直線からの距離を色成分距離として用いることが好適である。
【0021】
なお、以上では色成分距離として色差空間(Cb,Cr)での距離を用いたが、他の色空間、例えばYCbCr色空間やRGB空間など、での距離を同様の方法で求め、色成分距離として用いることもできる。ただし、輝度情報を分離した色差情報に基づいて色成分距離を求める方が、照明の明るさの違いによる対象物体の輝度の違いの影響が色成分距離に影響しにくくなるので、照明環境ごとに代表色を用意するなどの繁雑さがより少なくなって便利である。
【0022】
このようにして入力画像の各画素についての色成分距離が算出されると、次にそれら各画素の色成分距離に対して、図3で示されるような単調関数を適用することで、その色成分距離に対する強調処理を施す。図3では、横軸dは色成分距離を、縦軸wはその強調結果の値(重み値)を表す。ここで用いる単調関数は、色成分距離が小さい(すなわち代表色に近い色)ほど大きい値になる(すなわち強調する)ように変換する関数である。各画素の色成分距離を、この単調関数によって変換した結果が、この色成分距離画像生成部13の出力である色成分距離画像105となる。
【0023】
方位成分画像生成部14では、色成分変換部11で得られたYCbCr画像のうち、輝度を表すY成分からなる輝度画像を用いて、画像中の方位成分の抽出が行われる。ここで、方位成分とは、画像中で特定の方位を持つ形状(例えば輪郭形状)の部分であり、例えば、図5に示すような方位選択性をもつフィルタにより抽出される。このフィルタは、図5(a)に3次元的に示すように、DOG(Difference Of two Gaussian)関数を変形したものである。数式で表すと、フィルタを構成する2次元の位置を(x,y)としたとき、このフィルタは以下に示すH(x,y)で表される。
【0024】
【数2】
ここで、σx,eは輝度成分に対する反応の興奮性の分散を、σx,iは反応の抑制性の分散を、σyは特定方位への分散を表す。図5(b)は(2)式のフィルタ特性を2次元的に表示したものであり、H(x,y)の値をグレー階調で示している。ここで更に、以下の式のHφ(x,y)で表されるように回転角φを指定し、方位選択性をもたせることにより、図5(c)で示される特定の方位に反応するフィルタを得ることができる。
【0025】
【数3】
図5(c)では、0°、45°、90°、135°の順に4つの方位についてのフィルタを例示したが、これに限るものではなく、何方位でも用いることが可能である。このようなフィルタを輝度画像に対して適用することで、輝度画像中から、そのフィルタに応じた方位の形状を持つ部分が強調され、残りの部分が抑圧された画像が得られる。
【0026】
次に図6を参照して、方位成分画像生成部14における方位成分の抽出過程を説明する。この例では、図5(c)に例示した回転角45°刻みの4方位のフィルタを用いた。これにより、入力画像100のY(輝度)画像から、0°方向の方位成分画像110a、45°方向の方位成分画像110b、90°方向の方位成分画像110c、135°方向の方位成分画像110dが得られる。なお、図1では、これをより一般化し、異なるN個の方位について方位成分画像110−1〜110−Nを生成するものとして示している。
【0027】
なお、以上では、YCbCr色空間の輝度成分Yを用いて方位成分画像を生成したが、この代わりに、元のRGB画像のR,G,Bの各値を画素ごとに単純平均して求めたグレースケール画像を用いて、同様の方法で方位成分画像を生成することも出来る。
【0028】
このようにして色成分距離画像と、異なるN個の方位についての方位成分画像が求められると、次に合成画像生成部15が、それらをもとにN個の合成画像120−1〜120−Nを生成する。
【0029】
図6のように0度、45度、90度、135度の4方位の方位成分画像110a〜dを生成した場合、この合成画像生成部15では、図7に示すようにそれら各方位成分画像110a〜dごとに、色成分距離画像生成部13で生成された色成分距離画像105との合成処理を行う。この合成処理では、方位成分画像110a〜dの各々と色成分距離画像105との間で画素ごと積をとる。その積が、合成画像120a〜dにおける当該画素の値となる。
【0030】
この合成処理により、各方位成分画像110a〜dにおいて、対象物体に近い色成分を持った領域の方位成分ほど強調され、対象物体の領域と異なる色成分をもった領域の方位成分ほど抑制された合成画像120a〜dが得られる。
【0031】
特性強調画像生成部17は、これら各方位に対応するN個の合成画像120−1〜120−Nから、特性強調画像を生成する。ここで生成する特性強調画像は、画像において対象物体の形状特徴を持ち、かつ対象物体の代表色に近い色を持った部分を強調した画像である。例えば、人間の顔は円乃至楕円に近い輪郭形状を持っており、立木は鉛直方向に真っ直ぐ延びた輪郭を持っている。したがって、例えば人の顔の画像領域は、あらゆる方位の輪郭成分を均等に近い割合で持っており、立木の画像領域は、鉛直方向の輪郭成分の割合が顕著に高いということが言える。そこで、特性強調画像生成部17は、各合成画像120−1〜120−Nの情報から、そのような輪郭形状の特徴を備えた部分を求める。
【0032】
図8は、特性強調画像生成部17の処理内容を説明するための図である。この例は、図4及び図7の例に対応しており、シーン画から人物の顔領域を推定する場合における特性強調画像生成処理の一例を示す。この処理では、入力画像100中から選んだ注目画素x(i,j)(i,jは整数)について、その注目画素pを基準点とする演算領域125を設定する。図では、注目画素xを中心とする所定半径の略円形の領域を演算領域125として設定している。そして、0度、45度、90度、135度の各方位に対応する合成画像120a〜dの各々について、当該画像におけるその演算領域125の範囲の各画素の値の平均値を求める。0度、45度、90度、135度の各合成画像についての、注目画素xを基準とした演算領域125内の画素値の平均値をそれぞれ0pij,45pij,90pij,135pijと表す。ここで一例として人の顔の領域を推定する場合、次式で規定される反応特性値E1を計算する。
【0033】
【数4】
この反応特性値E1は、上記4方位の平均値0pij,45pij,90pij,135pij がすべて高いときに大きい値となる。すなわち、入力画像100が、上記4方位の全ての方位成分(人の顔の代表色のもの)を含めば、(4)式の値E1も大きくなり、特定の方位のみを含む場合は(4)式の値は小さくなる。これは、人の顔があらゆる方位の輪郭成分をほぼ均等に近い形で含んでいるという性質に基づく。特性強調画像生成部17は、注目画素xを例えばラスタ走査順序等に従って順に替えていき、各画素ごとに反応特性値E1を求めていく。
【0034】
基本的には、この反応特性値E1を各画素の値とする画像を特性強調画像とすることができるが、本実施形態では対象物体の領域が更に強調できる演算処理を行う。この演算処理は、エントロピーの考え方を利用したものである。
【0035】
よく知られるように、確率統計の分野では、ある試行においてK通りの事象が起こりうる場合に、事象k(k=1,2,・・・,K)の起こる確率をPkとすると、その確率の曖昧さを表す値として、次の式で表されるエントロピー値がある。
【0036】
【数5】
この(5)式の値が大きいほど、どの事象が生じるかあいまいであり、逆に(5)式の値が小さいほど特定の事象しか生じないことを意味する。本実施形態では、上述した各合成画像の演算領域125内の画素値の平均から、このエントロピー値に近い性質を持つ第2の特性値E2を求める。ここで、エントロピーは、起こりうる各事象の確率値の和が全事象の確率「1」になる場合に意味を持つのに対し、各合成画像の演算領域125の画素値の平均は必ずしもこの条件を満足しないので、第2の特性値E2を求める際には、それら各平均の値がその条件を満足するように正規化する。
【0037】
例えば図8の例に示す4つの方位の合成画像120a〜dから特性強調画像を生成する場合、それら各合成画像120a〜dの演算領域125の画素値の平均0pij,45pij,90pij,135pijを、次式を満足するように正規化する。
【0038】
【数6】
そして、このように正規化した0pij,45pij,90pij,135pijから、次式に従って特性値E2を算出する。
【0039】
【数7】
(7)式から分かるように、第2の特性値E2はエントロピー値の定義に従っており、入力画像の演算領域125中に含まれる輪郭成分の方位に偏りが少ないほど、大きい値となる。すなわち特性値E2は、図9(c)に示すように、演算領域内に一方向に延びる直線的な輪郭しかない場合は小さい値となるのに対し、閉曲線に近くなるほど多方向の輪郭成分を含むので大きい値となる。このように特性値E2は、図9(a)、図9(b)に示すように、閉じた輪郭300を含む領域ほど大きくなると言う性質を持っているので、画像の閉包性を示す評価値として用いることができる。また別の観点では、この特性値E2は、演算領域内の輪郭成分の方向に偏りがないほど大きい値になるので、等方性を示す評価値と捉えることもできる。
【0040】
スナップ写真等では、人の顔の領域は閉領域となっている場合が一般的である。このように、入力画像中で対象物体の領域が閉領域となっていると想定される場合には、閉包性の特性値E2を導入することで、対象物体の領域をよりよく推定することができる。なぜなら、閉包性の特性値E2を求める際に演算領域125内の画素値の平均pを正規化しているので、特性値E2は合成画像中の画像領域の明るさの影響を受けにくいからである。仮に演算領域125内の画素値の平均を正規化せずに用いて特性値を求めた場合、演算領域125内に含まれる輪郭が閉じていない場合でも、画素値が大きければその特性値は大きい値となるが、上記の特性値E2では画素値が大きさ(すなわち明るさ)の影響が正規化により低減されているので、画素値の大小よりも輪郭の閉包度合いがより直接的に特性値E2に反映される。
【0041】
このように(7)式で定義される特性値E2が閉包性又は等方性を示す評価値と捉えることができるのに対し、(4)式で定義される特性値E1は、演算領域125に含まれる輪郭が、その方位について対象物体の輪郭の特徴を備えているほど大きい値になるので、方位性を表す評価値と捉えることができる。このことは、(4)式を一般化した次式を見ると更に明らかになる。
【0042】
【数8】
この(8)式は、図8に示すように4つの方位についての合成画像を用いる場合のものであり、0w,45w,90w,135wはそれら各方位に与える重みである。例えば、入力画像中から立木の画像領域を推定しようとする場合は、方位90度の重み90wを大きい値とし、他の方位の重みを小さい値とすればよい。これにより、90度方向の輪郭(ただし木の色に近いもの)を多く含む演算領域ほど、方位性特性値Eが大きくなる。また、人の顔と同様肌色だが特定の方位性が強い腕や足の領域を推定する場合にも、1つの方向に大きい重みを与え、(8)式により方位性に関する特性値E1を計算すればよい。
【0043】
なお、(4)式は、この(8)式において、全ての方位についての重みwを均等にしたものに相当し、これは人の顔を表す画像の領域が比較的円形に近い輪郭を持っているという性質に基づくものである。また、都市風景画像などからビル等の建築物の画像領域を推定しようとする場合には、(8)式において、垂直方向と水平方向の重みwを大きくすればよい。
【0044】
特性強調画像生成部17は、画像の各画素(i,j)について演算領域125を設定し、その演算領域125において方位性についての特性値E1と閉包性についての特性値E2を計算する。そして、特性値E1と特性値E2の積E3を求め、これを当該画素(i,j)の値(図8の画素132)とすることで、特性強調画像130を生成する。特性強調画像130では、対象物体の色及び輪郭形状特性に近い輪郭部分が画素値の高い領域134となり、それ以外の部分は画素値の低い領域136となる。図8の例は、人の顔領域を推定しようとするものなので、顔の輪郭に近いほぼ円形の領域が高い画素値となっており、この他に顔と同系統の色を持つ腕の部分などが高い画素値となっている。
【0045】
なお、上記(4)式や(7)式、(8)式に従った特性強調画像の生成手順は、対象物体形状特性16の情報として、本実施形態の装置にあらかじめ登録されている。本装置で取り扱う対象物体が複数ある場合は、対象物体ごとに適切な特性強調画像生成手順が登録されている。
【0046】
図10は、それぞれ人物の顔の大きさが異なる3つの入力画像100A,B,Cから、それぞれどのような特性強調画像130A,B,Cが求められるかを説明するための図である。入力画像100Aは顔領域が演算領域125よりも大きい場合、入力画像100Cは顔領域が演算領域125の大きさよりも小さい場合の例をそれぞれ表し、入力画像Bはその中間の場合の例である。この図から分かるように、対象となる顔領域が演算領域125に比して大きい入力画像100A,Bでは、高画素値となる領域134a,bが顔領域の輪郭に沿ったリング状の形状を呈するが、顔領域が演算領域125に比して小さい入力画像100Cでは、高画素値となる領域134cは中実な形状となる。
【0047】
このように特性強調画像生成部17の処理により、対象物体の代表色に近く、かつ対象物体の輪郭が持つ形状的な性質を強く持った部分が強調された特性強調画像130が生成される。以上に説明した処理内容から明らかなように、この強調処理は対象物体の大きさによらず適用できるので、対象物体の大きさが未知である画像に対しても、柔軟に対応して強調処理を行うことができる。
【0048】
なお、図10等で挙げた例は、一般に画像において比較的コンパクトで閉じた領域となる場合の多い人の顔を推定する場合であったので、方位性の特性値E1に加え閉包性の特性値E2を用いて特性強調画像130を形成した。これに対し、立木や高層ビルが画面一杯に写っている画像では、それら立木等の領域は画面の上下にわたって長く分布することが一般的であり、コンパクトに閉じているとは言い難い。このような場合は、閉包性の特性値E2を用いずに方位性の特性値E1のみを用いて特性強調画像を生成すればよい。
【0049】
このようにして生成された特性強調画像130に対し、領域推定画像生成部18は、図11に示すように平滑化処理を施す。特性強調画像130は、前述の生成手順から分かるように、対象物体の輪郭近傍が高い画素値となるが、実際に推定したい領域には輪郭だけでなくその内部も含まれる。そこで、領域推定画像生成部18により平滑化処理を行うことで、リング状ではなく輪郭内部まで連結した領域を生成することができる。
【0050】
図11の例では、特性強調画像130では、高い画素値の領域134はリング状であるが、平滑化処理により生成された領域推定画像140では、そのリングの内部まで高い画素値となっている(領域推定画像140では、白に近いほど画素値が高い)。
【0051】
この平滑化処理は、例えば、以下の式で表されるGauss関数によって行うことができる。
【0052】
【数9】
この(9)式のGauss関数の一例を図12(a)、図12(b)に図示した。図12(a)は、座標(x,y)に対応する関数値G(x,y)を高さとして三次元的に示したものであり、図12(b)は、関数値G(x,y)をグレースケールで示したものである。ここで、σは興奮性の分散を表し、平滑化の強度を決定するものである。対象物体の領域が特定の方位の輪郭成分を多く含む場合は、パラメータを適切に設定することにより、(3)式に示したフィルタ(このフィルタも平滑化作用を持つ)で平滑化を行うこともできる。
【0053】
このようにして生成された領域推定画像140の各画素の値は、その画素が対象物体である度合いを示しているものと捉えることができる。
【0054】
なお、領域推定画像生成部18では、このような平滑化処理に加え、更に領域強調処理を行うこともできる。この領域強調処理は、例えば図13(a)に示すような単調増加な関数を用いることによって行うことができる。また、図13(b)に示すようなステップ関数を用いることにより2値化(強調の極限と捉えることができる)を行うこともできる。図13(a)、(b)はいずれも、横軸が平滑化結果の画像の画素値、縦軸がその画素値を強調した値を示す。また、2値化の場合、図13(b)のような関数を使う代わりに、例えば判別分析法などで閾値を求めて2値化しても良いし、予め設定された閾値をもとに行ってもよい。
【0055】
図14は、特性強調画像130に対し平滑化を加え、更に図13(a)の領域強調関数によって強調することで、領域強調画像140を生成する過程を表している。特性強調画像130では、同じ肌色の領域であっても、顔領域輪郭部分はリング状となり、しかも高い画素値となるのに対し、顔輪郭と形状が異なる腕などの部分の画素値は周囲よりも高いが顔輪郭部分よりは低い。このため、強調処理により顔領域の部分は画素値がより高くなるのに対し、腕などの部分は画素値が低くなり、結果として顔領域が強く強調された領域推定画像140が得られる。
【0056】
このように本実施形態によれば、入力画像の各画素が対象物体を表す度合いを示す領域推定画像140を生成することができる。この領域推定画像140を用いて、もとの入力画像をマスクすれば、入力画像の中から対象物体である可能性の高い領域を抽出することができる。
【0057】
例えば逆光条件で撮影した人物の顔を明るく補正しようとした場合、上記の手法で求めた領域推定画像140で元の入力画像100をマスクすることで顔画像の領域を抽出し、この領域内の各画素の輝度を上昇させればよい。この方法によれば、背景部分(対象物体以外の部分)についてはほとんど輝度補正なされないため、背景部分の色とびを惹起することなく、対象物体の領域に対して輝度補正を行うことができる。
【0058】
なお、ここでは顔領域に対して選択的に輝度補正を施す場合を例にとったが、この手法は人物の顔以外の対象物体にも適用可能である。また対象物体の領域に対して施す画像処理が輝度補正以外の場合に(例えば色補正など)も適用可能である。
【0059】
以上説明した各実施形態では、画像中の対象物体のサイズにかかわりなく、その対象物体の領域を抽出したり、その領域に対して選択的に画像処理を施したりすることができる。したがって、テンプレート照合などに比べて処理が高速化できる。またテンプレートマッチングでは、多種類の対象物体の場合、テンプレートが多数必要になるが、本実施形態の方式では多種類の対象物体に対して、例えば(8)式の重みwを替えるなどといった軽微な変更で対応できる。
【0060】
また、以上の例では、方位成分画像生成部14においてDOG関数を変形したフィルタ(図5参照)を用いたが、この代わりに単なるエッジ検出フィルタを用いてもよい。
【0061】
また、以上の例では、複数の方位成分画像110−1〜110−Nを色成分距離画像105とそれぞれ合成して複数の合成画像120−1〜120−Nを生成した後、それら複数の合成画像120−1〜120−Nから特性強調画像130を生成するという手順であったが、本発明の範囲内で別の手順も可能である。例えば、合成画像120−1〜120−Nから特性強調画像130を生成する処理と同様の処理により、複数の方位成分画像110−1〜110−Nから1つの方位特性強調画像を形成し、この方位特性強調画像を色成分距離画像105と合成することで特性強調画像140に近い性質を持つ画像を得ることもできる。
【図面の簡単な説明】
【図1】 実施形態の画像処理装置の構成を示すブロック図である。
【図2】 色成分距離を説明するための図である。
【図3】 色成分距離を強調する関数の一例を示す図である。
【図4】 色成分距離画像生成部の処理を説明するための図である。
【図5】 方位選択性を持つフィルタを説明するための図である。
【図6】 方位成分画像生成部の処理を説明するための図である。
【図7】 色成分距離画像と方位成分画像との合成処理を説明するための図である。
【図8】 特性強調演算を説明するための図である。
【図9】 閉包性に関する特性値を説明するための図である。
【図10】 入力画像中の対象物体領域と演算領域との大小関係の、特性強調画像に対する影響を説明するための図である。
【図11】 領域推定画像生成部の処理を説明するための図である。
【図12】 平滑化に用いるGauss関数の一例を示す図である。
【図13】 領域強調に用いられる関数の例を示す図である。
【図14】 領域強調処理を含む場合の、領域推定画像生成部の処理を説明するための図である。
【符号の説明】
11 色成分変換部、12 対象物体代表色、13 色成分距離画像生成部、14 方位成分画像生成部、15 合成画像生成部、16 対象物形状特性、17 特性強調画像生成部、18 領域推定画像生成部。
Claims (20)
- デジタル画像から、対象物体の領域を推定する画像処理装置であって、
所定の各方位ごとに、当該方位の輪郭成分を抽出するフィルタを前記デジタル画像に適用することにより当該方位に対応する方位成分画像を生成する方位成分画像生成部と、
前記デジタル画像の各画素の色と前記対象物体の代表色との距離を示す色成分距離画像を生成する色成分距離画像生成部と、
前記方位成分画像生成部で生成された前記各方位に対応する方位成分画像に基づき、前記デジタル画像のうち前記対象物体の領域の輪郭が持つ方位特性を備えた画像部分を求め、それら画像部分を示した特性強調画像を生成する特性強調画像生成部と、
前記特性強調画像に基づき、前記デジタル画像における前記対象物体の領域を推定する領域推定部と、
を備え、
前記特性強調画像生成部は、前記各方位に対応する方位成分画像と前記色成分距離画像との間で画素ごとに積をとることで、それら各方位に対応する合成画像をそれぞれ生成し、これら各方位に対応する合成画像を前記対象物体の輪郭が持つ方位特性に応じた重み付けで重み付け加算することにより前記特性強調画像を生成する、
ことを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記領域推定部にて推定された前記デジタル画像における前記対象物体の領域に対して、選択的に所定の画像処理を施すことを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記方位成分画像生成部は、前記デジタル画像の輝度成分に対して前記フィルタを適用することで前記方位成分画像を生成することを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記色成分距離画像生成部は、所定の色空間における前記デジタル画像の各画素の色と前記対象物体の代表色との距離に基づき前記色成分距離画像を生成することを特徴とする画像処理装置。 - 請求項4記載の画像処理装置であって、
前記色成分距離画像生成部は、前記対象物体の複数の代表色から規定される色相に対する、前記デジタル画像の各画素の色の距離に基づき前記色成分距離画像を生成することを特徴とする画像処理装置。 - 請求項4記載の画像処理装置であって、
前記色成分距離画像生成部は、前記所定の色空間において、前記対象物体の複数の代表色が表す点群に対する、前記デジタル画像の画素の色が示す点のマハラノビス距離に基づき前記色成分距離画像を生成することを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記特性強調画像生成部は、前記特性強調画像の各画素ごとに、その画素に対応する演算領域を前記各合成画像にそれぞれ設定し、それら各合成画像の前記演算領域内の各画素の値に基づき、前記特性強調画像の当該画素の値を算出することを特徴とする画像処理装置。 - 請求項7記載の画像処理装置であって、
前記特性強調画像生成部は、前記各方位についての前記合成画像の前記演算領域内の各画素の値を、前記対象物体の領域の輪郭が持つ方位特性に従って重み付け合成し、この重み付け合成により得られる方位性特性値に基づき、前記演算領域に対応する前記特性強調画像の画素の値を計算することを特徴とする画像処理装置。 - 請求項8記載の画像処理装置であって、
前記特性強調画像生成部は、前記各方位についての前記合成画像の前記演算領域内の各画素の値に対してエントロピー演算を行うことにより閉包性特性値を計算し、この閉包性特性値と前記方位性特性値とに基づき、前記演算領域に対応する前記特性強調画像の画素 の値を計算することを特徴とする画像処理装置。 - 請求項1記載の画像処理装置であって、
前記領域推定部は、前記特徴強調画像に対して平滑化処理を施すことにより領域推定画像を生成することを特徴とする画像処理装置。 - デジタル画像から、対象物体の領域を推定する画像処理方法であって、
所定の各方位ごとに、当該方位の輪郭成分を抽出するフィルタを前記デジタル画像に適用することより当該方位に対応する方位成分画像を生成するステップと、
前記デジタル画像の各画素の色と前記対象物体の代表色との距離を示す色成分距離画像を生成するステップと、
生成された前記各方位に対応する方位成分画像に基づき、前記デジタル画像のうち前記対象物体の領域の輪郭が持つ方位特性を備えた画像部分を求め、それら画像部分を示した特性強調画像を生成するステップと、
前記特性強調画像に基づき、前記デジタル画像における前記対象物体の領域を推定するするステップと、
を含み、前記特性強調画像を生成するステップでは、前記各方位に対応する方位成分画像と前記色成分距離画像との間で画素ごとに積をとることで、それら各方位に対応する合成画像をそれぞれ生成し、これら各方位に対応する合成画像を前記対象物体の輪郭が持つ方位特性に応じた重み付けで重み付け加算することにより前記特性強調画像を生成する、ことを特徴とする方法。 - 請求項11記載の画像処理方法であって、
前記推定された前記デジタル画像における前記対象物体の領域に対して、選択的に所定の画像処理を施すことを特徴とする画像処理方法。 - 請求項11記載の画像処理方法であって、
前記方位成分画像は、前記デジタル画像の輝度成分に対して前記フィルタを適用することで生成されることを特徴とする画像処理方法。 - 請求項11記載の画像処理方法であって、
所定の色空間における前記デジタル画像の各画素の色と前記対象物体の代表色との距離に基づき前記色成分距離画像を生成することを特徴とする画像処理方法。 - 請求項14記載の画像処理方法であって、
前記対象物体の複数の代表色から規定される色相に対する、前記デジタル画像の各画素の色の距離に基づき前記色成分距離画像を生成することを特徴とする画像処理方法。 - 請求項14記載の画像処理方法であって、
前記所定の色空間において、前記対象物体の複数の代表色が表す点群に対する、前記デジタル画像の画素の色が示す点のマハラノビス距離に基づき前記色成分距離画像を生成することを特徴とする画像処理方法。 - 請求項11記載の画像処理方法であって、
前記特性強調画像の各画素ごとに、その画素に対応する演算領域を前記各合成画像にそれぞれ設定し、それら各合成画像の前記演算領域内の各画素の値に基づき、前記特性強調画像の当該画素の値を算出することを特徴とする画像処理方法。 - 請求項17記載の画像処理方法であって、
前記各方位についての前記合成画像の前記演算領域内の各画素の値を、前記対象物体の領域の輪郭が持つ方位特性に従って重み付け合成し、この重み付け合成により得られる方位性特性値に基づき、前記演算領域に対応する前記特性強調画像の画素の値を計算することを特徴とする画像処理方法。 - 請求項18記載の画像処理方法であって、
前記各方位についての前記合成画像の前記演算領域内の各画素の値に対してエントロピー演算を行うことにより閉包性特性値を計算し、この閉包性特性値と前記方位性特性値とに基づき、前記演算領域に対応する前記特性強調画像の画素の値を計算することを特徴とする画像処理方法。 - コンピュータを、デジタル画像から、対象物体の領域を推定する画像処理装置として機能させるためのプログラムであって、前記プログラムは、前記コンピュータを、
所定の各方位ごとに、当該方位の輪郭成分を抽出するフィルタを前記デジタル画像に適用することにより当該方位に対応する方位成分画像を生成する方位成分画像生成部、
前記デジタル画像の各画素の色と前記対象物体の代表色との距離を示す色成分距離画像を生成する色成分距離画像生成部、
前記方位成分画像生成部で生成された前記各方位に対応する方位成分画像に基づき、前記デジタル画像のうち前記対象物体の領域の輪郭が持つ方位特性を備えた画像部分を求め、それら画像部分を示した特性強調画像を生成する特性強調画像生成部、
前記特性強調画像に基づき、前記デジタル画像における前記対象物体の領域を推定する領域推定部、
として機能させると共に、前記特性強調画像生成部は、前記各方位に対応する方位成分画像と前記色成分距離画像との間で画素ごとに積をとることで、それら各方位に対応する合成画像をそれぞれ生成し、これら各方位に対応する合成画像を前記対象物体の輪郭が持つ方位特性に応じた重み付けで重み付け加算することにより前記特性強調画像を生成する、ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002049147A JP3979122B2 (ja) | 2002-02-26 | 2002-02-26 | 画像処理装置および画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002049147A JP3979122B2 (ja) | 2002-02-26 | 2002-02-26 | 画像処理装置および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003248824A JP2003248824A (ja) | 2003-09-05 |
JP3979122B2 true JP3979122B2 (ja) | 2007-09-19 |
Family
ID=28661736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002049147A Expired - Fee Related JP3979122B2 (ja) | 2002-02-26 | 2002-02-26 | 画像処理装置および画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3979122B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006155595A (ja) * | 2004-11-05 | 2006-06-15 | Fuji Xerox Co Ltd | 画像処理方法および画像処理装置 |
JP5578965B2 (ja) * | 2010-07-02 | 2014-08-27 | 富士フイルム株式会社 | オブジェクト推定装置および方法ならびにプログラム |
JP5748472B2 (ja) * | 2010-12-15 | 2015-07-15 | 富士フイルム株式会社 | オブジェクト判別装置、方法、及びプログラム |
US9292910B2 (en) | 2012-05-14 | 2016-03-22 | National Institute Of Japan Science And Technology Agency | Image processing apparatus, image processing method, program, printing medium, and recording medium |
US9418403B2 (en) | 2013-10-04 | 2016-08-16 | Fuji Xerox Co., Ltd. | Image processor and non-transitory computer readable medium for generating a reproduction image which is reproduced so that visibility of an original image is enhanced |
-
2002
- 2002-02-26 JP JP2002049147A patent/JP3979122B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003248824A (ja) | 2003-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7413400B2 (ja) | 肌質測定方法、肌質等級分類方法、肌質測定装置、電子機器及び記憶媒体 | |
JP4251719B2 (ja) | 複数人物が存在する場合の人間の顔のロバスト追跡システム | |
WO2019100282A1 (zh) | 一种人脸肤色识别方法、装置和智能终端 | |
Shin et al. | Does colorspace transformation make any difference on skin detection? | |
US7903870B1 (en) | Digital camera and method | |
KR101141643B1 (ko) | 캐리커쳐 생성 기능을 갖는 이동통신 단말기 및 이를 이용한 생성 방법 | |
CN106023151B (zh) | 一种开放环境下中医舌象目标检测方法 | |
US20110299774A1 (en) | Method and system for detecting and tracking hands in an image | |
JP4597391B2 (ja) | 顔領域検出装置およびその方法並びにコンピュータ読み取り可能な記録媒体 | |
CN108596197A (zh) | 一种印章匹配方法及装置 | |
JP2007257087A (ja) | 肌色領域検出装置及び肌色領域検出方法 | |
Gritzman et al. | Comparison of colour transforms used in lip segmentation algorithms | |
JP2019175093A (ja) | 推定装置、推定方法、推定プログラム、学習装置、学習方法、及び学習プログラム | |
US7620246B2 (en) | Method and apparatus for image processing | |
WO2023273247A1 (zh) | 人脸图像处理方法及装置、计算机可读存储介质、终端 | |
Hussain et al. | Color constancy for uniform and non-uniform illuminant using image texture | |
US20220164601A1 (en) | Methods and Apparatuses of Contrastive Learning for Color Constancy | |
JP3979122B2 (ja) | 画像処理装置および画像処理方法 | |
CN112101260B (zh) | 一种作业人员安全带识别方法、装置、设备和存储介质 | |
CN112102348A (zh) | 图像处理设备 | |
JP5203159B2 (ja) | 画像処理方法、画像処理システムおよび画像処理プログラム | |
JP4202692B2 (ja) | 画像処理方法および装置 | |
JP4475395B2 (ja) | 画像処理方法および画像処理装置、画像処理プログラム、記憶媒体 | |
JP2007243987A (ja) | 画像処理方法、画像処理システムおよび画像処理プログラム | |
CN110245590B (zh) | 一种基于皮肤图像检测的产品推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040913 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070306 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070618 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100706 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110706 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110706 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120706 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130706 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |