JP4861806B2 - 赤目の検出及び補正 - Google Patents

赤目の検出及び補正 Download PDF

Info

Publication number
JP4861806B2
JP4861806B2 JP2006336099A JP2006336099A JP4861806B2 JP 4861806 B2 JP4861806 B2 JP 4861806B2 JP 2006336099 A JP2006336099 A JP 2006336099A JP 2006336099 A JP2006336099 A JP 2006336099A JP 4861806 B2 JP4861806 B2 JP 4861806B2
Authority
JP
Japan
Prior art keywords
red
eye
probability
pixel
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006336099A
Other languages
English (en)
Other versions
JP2007172608A (ja
Inventor
ヴィラモウスキー ユッタ
クスルカ ガブリエラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2007172608A publication Critical patent/JP2007172608A/ja
Application granted granted Critical
Publication of JP4861806B2 publication Critical patent/JP4861806B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Ophthalmology & Optometry (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Description

本例示的実施形態は、画像処理に関する。これは、デジタル画像の赤目の自動補正と関連して特定の用途を見出す。
赤目は、写真画像に共通の問題である。これは、フラッシュが用いられるときにはいつでも生じ、人間の網膜から反射する光が、目を本来の色ではなく、赤く見せる。この問題を認識して、カメラの製造業者は、実際の写真の完了直前に、1つ又はそれ以上の光の前露光を発する能力をカメラに備えることにより、赤目を最小にするか又は抑制することを試みた。これらの前露光は、被写体の瞳孔を収縮させて、網膜上に入射し、ここから反射する光を最小にすることを意図する。前露光ハードウェアが備えられたカメラは、赤目問題を緩和することができるが、赤目アーチファクトは必ずしも防止されるわけではないため、これらは必ずしも良好に受け入れられるわけではない。これらはさらに、より多くのエネルギを消費し、ボタンを押すことと写真を撮ることとの間に大幅な遅延を引き起し、人々に瞬きをさせることになる傾向をもつ。赤目は、カメラが、統合されたフラッシュをもってより小さく作られるようになってから、より普及し、ひどくなった。小さいサイズは、フラッシュが内蔵された性質と結びついて、対物レンズに近接してフラッシュを配置することを必要とする。したがって、被写体の網膜から反射される光のより大きい部分が対物レンズに入り、記録される。
画像における赤目の検出及び補正のための技術が開発されている。1つの方法においては、オペレータが全ての画像に目を通し、更なる処理のために赤目を含む画像をマーキングする。この処理は、典型的には、識別された赤目における赤いピクセルを修正することを含む。オペレータの関与を取り除くか又は低減する努力により、色、サイズ、及び形状の基準に基づいた赤目の検出を試みる自動処理がもたらされた。赤目が検出されたときには、自動処理は、赤色領域に対して修正を適用する。赤色は非常にありふれたものであり、赤目が多数の画像(例えば、フラッシュを用いずに撮影されたもの、人間の被写体を含まないものなど)に存在しないことを前提とすると、偽陽性がしばしば生じる。したがって、こうした自動赤目検出技術を用いると、赤色のボタン、1つの赤いキャンディなどは全て赤目として誤認される可能性がある。
幾つかの赤目補正技術は、顔の検出に依存する。しかし、顔の検出自体が困難な作業である。これは、正面ではない、回転された、近接した顔に対しては良好に行われない。こうした場合においては、これらの方法は、不良に行われる傾向になる。
例示的な実施形態の1つの側面においては、画像補正のためのシステムは、デジタル画像における複数のピクセルの各々に対して、ピクセルが赤目内にある確率を指定する検出モジュールを含む。分類器モジュールは、少なくとも、ピクセルが赤目内にあるしきい値確率を有する連続するピクセルの領域を含む画像のパッチを分類する。分類器モジュールは、赤目を含む確度を有するパッチを、顔エラー及び背景エラーの少なくとも一方を含む確度を有するパッチから区別する。補正モジュールは、分類器が、赤目を含む確度を有するとして識別したパッチ内にある連続するピクセルの領域におけるピクセルに適用する補正を指定する。
例示的なシステムにおいては、補正モジュールにより適用される補正は、ピクセルの色の関数とすることができる。指定される補正は、分類器モジュールの出力の関数とすることができる。分類器モジュールは、赤目を含む確率を有するパッチを、顔エラーを含む確率を有するパッチから区別する第1の分類器と、赤目を含む確率を有するパッチを、背景エラーを含む確率を有するパッチから区別する第2の分類器とを含む。分類器モジュールは、少なくとも2つの部類の一方にパッチを指定することができる。第1のパッチの部類は、第1及び第2の分類器の両方が、赤目を含む確率を有するとして識別するパッチを含むことができ、第2のパッチの部類は、第1の分類器の少なくとも一方が顔エラーを含む確率を有するとして識別するパッチか、第2の分類器が、背景エラーを含む確率を有するとして識別するパッチ、の少なくとも1つを含むことができる。補正モジュールにより適用される補正は、パッチが指定される部類の関数とすることができる。適用される補正は、分類器が、パッチが第1の部類にあると識別する確率を増加させるパラメータにより修正された赤目にピクセルがある確率の関数とすることができる。適用される補正は、分類器が、パッチが第2の部類にあると識別する確率を減少させるパラメータにより修正された赤目にピクセルがある確率の関数とすることができる。分類器モジュールは、パッチを、3つの部類の1つに指定することができ、第3のパッチの部類は、両方の分類器が、パッチが赤目を含むかどうか断定できないパッチを含む。検出モジュールは、さらに、循環性の確率を複数のピクセルの各々に指定する部品を含むことができ、ピクセルが赤目内にある確率は、指定された循環性の確率の関数である。
別の側面においては、画像処理方法は、デジタル画像の複数のピクセルの各々に対して、ピクセルの色の関数として、赤目にあるピクセルのピクセルに確率を指定するステップを含む。少なくとも、ピクセルが赤目内にあるしきい値の確率を有する連続するピクセルの領域を含む画像のパッチに関して、この方法は、赤目を含む確率を有するパッチを、他のパッチから区別するように訓練された分類器モジュールにより、パッチを分類するステップを含む。赤目を含む確率を有するとして分類器により識別された画像のパッチに関しては、連続するピクセル領域におけるピクセルに適用する補正が求められる。
この方法は、さらに、分類器モジュールが、画像の訓練の組を用いて、赤目を含む確率を有するパッチを、他のパッチから区別するように分類器モジュールを訓練するステップを含み、訓練の組における各々の画像は、少なくとも、ピクセルが赤目内にあるしきい値確率を有する連続するピクセル領域を含む。訓練の組は、領域が赤目を含まなさそうであると試験が立証した連続するピクセル領域を含む画像を除外することができる。求められた補正は、ピクセルの色の関数とすることができる。補正は、分類器モジュールの出力の関数とすることができる。分類器モジュールは、赤目を含む確率を有するパッチを、顔エラーを含む確率を有するパッチから区別する第1の分類器と、赤目を含む確率を有するパッチを、背景エラーを含む確率を有するパッチから区別する第2の分類器とを含み、パッチの分類は、第1の分類器によりパッチを分類するステップと、第2の分類器によりパッチを分類するステップとを含む。パッチの分類は、パッチを少なくとも2つの部類の一方に指定するステップを含むことができ、第1のパッチの部類は、第1及び第2の分類器の両方が、赤目を含む確率を有するとして識別するパッチを含むことができ、第2のパッチの部類は、第1の分類器の少なくとも一方が顔エラーを含む確率を有するとして識別するパッチ、又は、第2の分類器が、背景エラーを含む確率を有するとして識別するパッチ、の少なくとも1つを含むことができる。求められた補正は、パッチが指定される部類の関数とすることができる。パッチが第1の部類に指定された場合には、求められた補正は、確率を増加させるパラメータにより修正された赤目にピクセルがある確率の関数とすることができる。パッチが、第2の部類に指定された場合には、求められた補正は、確率を減少させるパラメータにより修正された赤目にピクセルがある確率の関数とすることができる。
第1の分類器が、パッチが顔エラーを含むかどうかに対して未決定であり、第2の分類器が、パッチが背景エラーを含むかどうかに対して未決定であるパッチを含む第3のパッチの部類があるとすることができる。パッチが、第3の部類に指定された場合には、求められた補正は、分類器モジュールにより修正されていない赤目にピクセルがある確率の関数とすることができる。ピクセルが赤目内にある確率は、デジタル画像における全てのピクセルに指定することができる。ピクセルが赤目にある確率は、デジタル画像にわたり換算することができる。確率の指定は、ピクセルの赤色成分、緑色成分、青色成分の関数である赤み確率を求めることを含むことができる。ピクセルが赤目にある確率は、ピクセルが緑色及び青色であるより赤色である程度の関数とすることができる。ピクセルが赤目内にあるという確率の指定は、ピクセルが緑色及び青色であるより赤色である程度の関数であり、さらに、ピクセルが明るいというより赤色である程度の関数である赤み/輝度の確率を指定することを含むことができる。画像における複数のピクセルは、ピクセルが0と1との間の赤目にある確率を指定されることができる。ピクセルの補正は、しきい値より大きい赤目にある確率を有するピクセルの赤色成分値を、補正された赤色成分値と置き換えることを含むことができる。補正された赤色成分値は、ピクセルにおける赤色成分、緑色成分、及び青色成分の関数、及び、ピクセルが赤目内にあるという指定された確率の関数とすることができる。画像は、元の画像の低解像度画像とすることができ、この方法は、さらに、低解像度画像を形成するステップと、元の画像におけるピクセルに適用する補正を求めるステップと、を含むことができ、この補正は、ピクセルの各々に対して、低解像度画像における対応するピクセルが赤目内にあるという指定された確率、元の画像におけるピクセルの色、及び領域を含むパッチが分類器により指定される部類の関数である。
別の側面においては、処理方法は、デジタル画像における複数のピクセルの各々に対して、ピクセルの色の関数として、赤目にあるピクセルのピクセルに、自動的に確率を指定するステップを含む。画像における連続するピクセルの領域が識別され、ここでピクセルは、少なくとも、赤目にあるしきい値確率を有する。この領域を含むパッチは、顔領域より赤色領域を含む傾向をもつパッチを識別するように訓練された第1の分類器と、背景領域より赤色領域を含む傾向をもつパッチを識別するように訓練された第2の分類器とを含む分類器モジュールにより、自動的に分類される。分類器モジュールは、第1及び第2の分類器の出力に応じて、少なくとも2つの部類の一方にパッチを指定する。パッチがどちらの部類に指定されたかによって異なるパラメータがピクセルに指定される。識別された領域における複数のピクセルの各々に対して、この方法は、ピクセルに適用する補正を自動的に求めるステップを含み、この補正は、ピクセルが赤目内にあるという指定された確率、ピクセルに指定されたパラメータ、及びピクセルの色の関数である。
本例示的な実施形態の側面は、デジタル画像における赤目に対処するためのシステム及び方法に関する。システムは、画像処理段階において、赤目の完全自動検出及び補正を可能にして、前露光ハードウェア及びそれに関連する欠点をなくすことを可能にする。処理されるべき画像は、デジタルカメラ、スキャナ、デジタルビデオレコーダその他同様なものといったデジタル画像形成デバイスにより生成することができる。例示的な検出及び補正システムは、デジタル画像形成デバイスに組み込んでもよいし、又は、デジタル画像形成デバイスとは別個の、パーソナルデスクトップコンピュータ、ラップトップ、又は焼き付け装置といった専用の画層形成処理システムといった好適な画像処理装置上に格納してもよいソフトウェアを含む処理モジュールを含む。処理されるべき画像は、デジタル形態であるか、又は、処理前にデジタル形態に変換される。画像データは、赤色、緑色、青色(RGB)の色空間といった色空間により表現される複数のピクセル値により定義することができ、又は、これに変換することができる。
赤目に対応するデジタル画像の領域を識別し、補正するための完全に又は実質的に自動化されたコンピュータにより実施される処理は、赤目検出モジュールが、自動的に、バイナリ値ではない確率値を、可能性のある赤目領域におけるピクセルに指定するという意味で、確率的なものである。具体的には、検出モジュールは、各々の画像ピクセルに対して、値が間であることが可能である0から1までの赤目確率の属性を与える。出力がバイナリである(イエスであれば赤目であり、又は、ノーであれば赤目ではない)他の赤目検出方法とは異なり、これらの確率値は、例えば、赤み、輝度、及び空間循環性といった、実際に、赤目である領域との相関が見出された異なるピクセル特徴の組み合わせからもたらされることができる。結果としてもたらされる確率値は、次いで、補正モジュールにおいて用いられて、各々のピクセルに適用する補正の量を求める。
関連する分類器モジュールにより実行することができる付加的な自動化分類ステップは、デジタル画像の赤目の補正前に、上述の検出方法の出力に対して実行することができる。他の実施形態においては、分類ステップは、可能性のある赤目の識別についてデジタル画像を評価する他の自動化赤目検出方法と組み合わせることができる。
1つの側面においては、例示的なシステムは、検出モジュールと、任意的には試験モジュールと、分類器モジュールと、補正モジュールとを含む。検出モジュールは、デジタル画像のピクセルに、ピクセルが配置されている区域の色、輝度、及び/又は循環性といった1つ又はそれ以上のピクセル特徴に基づいて、赤目にある確率を指定する。試験に通らない領域をフィルタ処理して除去するために、試験モジュールにより、さらに別の試験を、各々がしきい値の赤目確率を有する連続するピクセル領域上に実行することができる。除去された領域においては、確率は、ゼロであるか又は幾らかの比較的低い確率値に設定することができる。あらゆる残りの領域又は画像内の領域(可能性のある赤目領域)におけるピクセルは、赤目にある確率を少なくとも幾らか保持し、低い又はゼロの赤目にある確率が指定された区域により、他の可能性のある赤目領域から離間されている。
分類器モジュールは、入力として、検出モジュール及び/又は試験モジュールの出力を受け取る。分類器モジュールは、実際の使用前に、局所的な記述子が人の赤目に対応する、以前に識別された赤目領域を含むパッチを、局所的な記述子が顔の他の部分又は背景に対応するパッチから区別するように訓練される。訓練中の目的は、局所的な記述子が目に対応するパッチを認識することを学習し、したがって、検出モジュール/試験モジュールにより正しく検出された、可能性のある赤目を識別することである。このように、顔の目ではない領域又は背景に対応し、或いは別の場合には、その色及び/又は形状のために、赤目を含む高い確率が指定されることがあるパッチは、赤目である確率を減少され、したがって、補正ステップにおいて、赤目補正をほとんど受けないか、又は全く受けないことができる。
各々の中心に可能性のある赤目を有するパッチは、赤目領域より大きく、一般に、目を囲むのに十分大きいものである(可能性のある赤目がまさに赤目である場合)。一般に、パッチは、画像区域全体より小さい。例えば、パッチは、瞳孔(赤目)、虹彩、少なくとも虹彩の1つ又はそれ以上の側部における白目部分、及び目を取り囲む皮膚の一部を囲む大きさにすることができる。これらの区域の各々は、部分の各々の色又は相対的なグレーレベルといった多数の人に共通の特徴、及び、形状又は相対的なサイズといった他の特徴を有し、これらは、分類器モジュールが、目を含むパッチと顔の別の部分又は画像の背景を形成するパッチとの間を区別するために、局所的な記述子として用いることができる。分類器を訓練するのに用いられるパッチの訓練の組は、異なる年齢、人種、目の色、皮膚の色等の人から取得されたパッチを含むことができるため、これらの群について異なる特徴が考慮される。分類器の出力は、顔より赤目でありそうで、背景より赤目でありそうであると分類された、可能性のある赤目領域の確率値が、検出モジュールの出力と比較すると、高められており、顔より赤目ではなさそうで、及び/又は、背景より赤目ではなさそうな領域は、確率値が変更されないか、又は減少された確率マップである。
補正モジュールは、入力として、分類器の出力を受け取り、分類器により出力された確率値及びピクセルの色の関数として、補正を画像におけるピクセルに適用する。一般に、高い確率値の/大きい赤色成分を有するピクセルには、低い確率/低い赤色含量をもつピクセルより相対的に多い補正が与えられる。一般に、補正は、ピクセルの赤色成分を減少させることと、緑色成分及び青色成分を増加させることを含む(RGBスキームにおいて)。したがって、分類器は、該分類器が、顔より赤目でありそうで、背景より赤目でありそうであると識別した、可能性のある赤目領域におけるピクセルに対して、補正モジュールにより適用される、補正の量を増加させる(すなわち、赤色成分をより多量に減少させる)ように作用する。さらに、分類器は、顔より赤目ではなさそうで、背景より赤目ではなさそうな、可能性のある赤目領域におけるピクセルに適用される補正の量を減少させるように(すなわち、より多くのピクセルの元の赤色成分が保持されるように)作用することができる。分類器が決定的ではない領域においては、確率は変更されないことができ、すなわち、補正は、検出器モジュールの出力に基づいて適用されるものと同じである。
デジタル画像における赤目処理のための例示的な方法は、ファジイ(ソフト)な赤目検出ステップと、分類ステップと、任意的なファジイ(ソフト)な赤目補正ステップとで構成される。したがって、ピクセルが赤目にあるかどうかについて、厳しい(イエス又はノー)決定をする代わりに、一般には、ピクセルが赤目にある確度に対応する値が各々のピクセルに指定され、補正処理は、補正されるべき各々のピクセルが、個々の確率によって補正されるソフトな補正を含むことができる。分類ステップは、少なくとも、可能性のある赤目の部分について、ソフトな検出ステップにおいて出力された確率を修正するが、それにもかかわらず、画像にわたり、確率の段階を保持することができる(すなわち、0と1との間の値を含む)。
種々の側面においては、分類ステップは、赤目、顔、及び背景を区別する多部類問題として扱われる。幾つかの側面においては、分類器モジュールは、独立した訓練の組においてではなく、検出モジュールの出力において訓練される。このように、訓練中、分類器モジュールは、その多く又はほとんどが検出モジュールにより、赤目にある低い確率が与えられ、結果として、分類器モジュールを改良するのに大きな助けとなることがない、可能性のある赤目の大きい群ではなく、検出モジュールが識別した、可能性のある赤目を考慮するだけでよい。
提案される向上されたシステム及び方法は、特に、デジタル及び走査された写真の複製及び印刷といった生産印刷に採用することができる。これはさらに、デジタルスチルカメラ及び他のカメラ付き電話といった手持ち式セットデバイスに用途を見出す。非常に多くの場合において、向上された方法は、実質的に、以前の方法により出力された赤目補正を改善する。これはさらに、顔及び背景におけるアーチファクトの数及び強さを減少させるという意味で、以前の方法より安全である。
図1は、例示的な赤目検出及び補正処理のステップを示す。図2は、画像の一部及び循環性の確率が指定されるピクセルを取り囲む画像及び領域の概略図であり、図3は、分類ステップ前の赤目検出における検討区域を示す画像の概略図である。図4は、図1のステップを実行するためのデジタルデバイスの概略図である。図4における例示的なデジタル画像形成デバイス又はデジタル画像処理装置100は、本書ではモジュールとして示される種々の処理部品を含む処理部品102を組み込んでおり、画像の解像度を求め、適切な場合には、より低い解像度の画像を生成するための解像度選択モジュール104を含む。処理部品102は、さらに、種々の赤目検出ステップ(図1のステップS14)を実行するための部品を含む検出モジュール106と、可能性のある赤目領域にさらに別の試験を適用する(ステップS15)ための試験モジュール108と、補正をデジタル画像に適用する(ステップS18)ための補正モジュール110とを含む。図示される処理部品は、さらに、分類器モジュールと呼ばれるプロセッサ200を含む。処理モジュールは、ユーザが、補正された画像を視認し、その補正を許容するか又は拒絶することを可能にするユーザインターフェース116により通信することができる。デジタルデバイス100は、処理部品102のモジュールによりアクセスされる好適なメモリ112を含んで、ステップの出力、及び元の画像並びに修正された画像を格納する。分類器モジュール200は処理部品102の一部として示されるが、別個の部品であってもよいことが理解されるであろう。
図1を参照すると、検出、分類、及び任意的には赤目補正のための処理は、デジタル画像がデジタル画像処理装置100(図4)により受け取られたときに、ステップS10で開始する。
画像は、DVD、CDROM、又はフレキシブルディスクといったディスク上、又は他の画像格納媒体上に格納して、処理のために、一時的に画像処理装置のメモリに転送することができる。
赤目検出を実行する前に、画像の解像度を、1メガピクセルといった標準化された数のピクセルに減少させて、処理ステップの数を減少させることができる(ステップS12)。ファジイ検出ステップ(S14)においては、システムの検出モジュールが、ピクセルの1つ又はそれ以上の色及び空間の特性に基づいて、デジタル画像のピクセルを評価する。色の評価においては、検出モジュールは、ピクセルの赤み及び輝度(明るさ)を考慮して、これらの及び/又は組み合わされた確率の一方又は両方に確率値を指定することができる(サブステップS14A、S14B、S14C、S14D)。赤みと輝度との間の関係を考慮することは、赤目は、通常は、明るいというより赤色であるのに対して、赤色というより明るい皮膚及び顔といった偽陽性の大きな割合をなくすことを可能にする(低い確率の指定により)。空間特性(空間循環性)の評価(サブステップS14E)は、ピクセルを取り囲む領域の循環性に関する確率をピクセルに指定することを含むことができる。ステップS14Eにおいて指定された確率は、画像全体について取得された確率にわたり正規化することができる。
輝度に対する代替的手法として、局所的なコントラストといった一般に赤目に関連する何らかの他の特徴を評価することができる(ピクセルが、コントラストをもつ色及び/又は明るさの一方に隣接する領域にあるかどうか)。
本実施形態の側面においては、赤みの確率pR1及び赤み/輝度の確率pR2は、最も予想される画像の赤目領域上に着目する方法として求められる(サブステップS14A及びS14B)。赤み/輝度の確率pR2は、ステップS14Aにおいて求められた赤みの確率pR1を組み込むことができる。確率pR1及びpR2の何らかの関数である組み合わされた確率pRは、その色及び輝度を考慮して、少なくとも、赤目になる最小の確率を有する領域を識別するように求めることができる(サブステップS14C)。出力は、画像における全てのピクセルに対するpRの確率マップである(サブステップS14D)。次いで、ピクセルのpR3値により識別された領域のピクセルに対する循環性の確率(pSC)が求められ、各々のピクセルに指定されて、これは、実際は、予測される赤目領域が、ありそうもない赤目領域により取り囲まれているという原理に基づくものとすることができる(サブステップS14E)。さらに、試験が、次いで、残りの、予測される高い赤目領域に適用されて、偽陽性をなくすことができる(pSC+試験)(サブステップS15A及びS15B)。さらに別の試験を、残りの可能性のある赤目領域の全てに適用して、さらなる偽陽性をなくすことができる。
ステップS17において、前の試験により出力された、各々が可能性のある赤目を囲むパッチが分類器モジュールにより再検査されて、分類器モジュールの出力に基づいて、顔の区域より赤目でありそうで、背景区域より赤目でありそうな可能性のある赤目を識別する。このステップにおいては、分類試験を満たす、可能性のある赤目は、確率値を1に近い値に増加させられて、補正ステップS18において幾らか大きい程度の補正を保証し、分類器試験に満たない、可能性のある赤目領域(赤目より顔でありそうで、赤目より背景でありそうな)は、確率値を0に近いか又はゼロに等しい値に減少されることができる。分類器の結果が曖昧な赤目は、変更されないまま残る。
可能性のある赤目領域においては、分類器ステップにより修正されたpR2値といった確率値が、次いで、赤目になり得る赤色成分を修正する(減少させる)ように用いられる(ステップS18)。このステップは、適用されるべき赤目補正を求めること(サブステップS18A)と、例えば、元の画像と「赤色が減少された」画像とを配合することにより、赤目を補正すること(サブステップ18B)とを含む。分類器ステップにより修正されたpR2は、赤みの確率及び量をより良好に反映し、これによって、pR1又はpRよりピクセルの赤色成分が減少されるが、これらの確率値(例えば、分類器ステップにより修正された)を補正ステップで用いることができることが想定される。
例示的な実施形態においては、画像における全て又は大半のピクセルは、赤みの確率(pR1)(サブステップS14A)、赤み/輝度の確率(pR2)(サブステップS14B)、及び循環性の確率(pSC)(サブステップS14C)という3つの特徴について評価されるが、さらに、検出ステップは、全てのピクセルの各々の確率pR1、pR2、pSCを計算することを含まないことがあることが想定される。例えば、pR1及び/又はpR2が最小しきい値より下である、すなわち、低い又はゼロ(すなわち、低い赤目の確率を示唆する)の領域又は個々のピクセルにおいては、pSCは、計算される必要がないとすることができる。ステップS14の出力は、評価される各々のピクセルに対する、ピクセルが赤目にある確率(P)を示す確率マップとすることができる(サブステップS14F)。各々のステップにおいて、いずれかのピクセルが0より大きい値を有する画像にスケーリング(例えば、正規化)を実行して、画像全体にわたり最大値が1になるようにすることができる。スケーリングは、最大値で除算することにより達成できるが、他のスケーリングの非線形方法もまた想定される。各々の後続する処理のサブステップ(S14B、S14C、S14D、S14E)は、前のものの出力に依存し、これを改善することができる。
ステップS14における確率マップ出力に基づいて、赤目の確率が高い領域が識別され(ステップS15)、さらに分類され(ステップS16)、後に続く補正ステップ(ステップS18)において、これらの領域における各々のピクセルの色が個々に修正される。その結果、赤目における1つのピクセルに適用された補正は、その赤目における別のピクセルに適用された補正とは異なることになる。
赤目が生じる画像においては、ステップS14Eにおいて生成された確率マップはバイナリではないが、0と1との間の値(又は他の指定された最大値及び最小値)を含み、ここでは、0はピクセルが赤目にある最低の確率を示し、1はピクセルが赤目にある最高の確率を示す。0と1との間の値は、黒色が0に対応し、白色が1に対応する、グレーレベルとして図示することができる。上述のように、この確率は、色の属性(例えば赤み)、輝度、及び空間循環性といった1つ又はそれ以上の異なるピクセル特徴の組み合わせとすることができる。分類器ステップ(S17)の後で、修正された確率マップは、依然として、0と1との間の値を含むことができる。
ピクセルの色(赤みの率)pR1(ステップ14A)は、ピクセルの赤色成分の尺度から求めることができ、赤色成分を、ピクセルの色空間の緑色成分及び青色成分といった補色成分と比較することを含むことができる。用いられる色スケールに応じて、色成分は、数値として表現することができ、値が高ければ高いほど、彩度が大きい。例えば、RGB色空間においては、ピクセルの色は、赤色成分、緑色成分、及び青色成分により定義され、この各々には、例えば、0ないし255の数値が指定される。赤みの確率は、これらの値の各々を考慮してもよいし、又は赤色成分だけを考慮してもよい。一実施形態において、ピクセルの「赤み」(D)程度は、以下の式を用いて、ピクセルの緑色(G)値及び青色(B)値の平均を赤色(R)値から減算することにより求められる。
Reddish(D)=R−(G+B)/2 式1
ピクセルが赤色である赤みの確率(pR1)は、例えば、画像について、赤み値(D)を最大の赤み値(Dmax)により除算し、この値の最大値及びゼロを取り上げて、負の値を排除することによって、式1によって取得された赤み値を換算することにより取得することができ、以下のように表現することができる。
pR1=max(0,D/Dmax) 式2
例えば、以下の値R=220、G=130、B=90を有するピクセルについて、
D=220−[(130+90)/2]=110
画像の最大の赤み値Dmaxが220である場合には、
pR1=max(0,110/220)で、この場合、pR1=0.5になる。
サブステップS14Aの出力は、したがって、各々のピクセルに指定され、その赤みの幾らかの相対的な尺度と等しい確率pR1である。図示実施形態においては、確率pR1は、ピクセルが緑色及び青色であるより、赤色である程度の尺度である。ピクセルが赤目の色と同様である程度を識別するように適応された他の色尺度もまた想定される。pR1は、Dの換算値である必要はなく、例えば、pR1は、Dと等しくてもよいし、又は、何らかの他のDの関数であってもよいことが理解されるであろう。
次のサブステップ(S14B)は、赤み/輝度の確率(pR2)を各々のピクセルに指定する。ピクセルの輝度(又は明るさ)は、ピクセルのグレーレベル(彩度)により表現することができる。したがって、例えば、輝度又はグレーレベル(V)は各々のピクセルについて求められ、これは、赤色、緑色、及び青色の値の重み付けられた合計である。一実施形態においては、グレーレベルは、以下の式を用いて求められ、
V=0.25*R+0.6*G+0.15*B 式3
ここで、*は、乗算関数である。赤み/輝度値(L)は、次いで、グレーレベルを、式1において求められた赤み値Dの関数から減算することにより求められる。一実施形態においては、関数は以下のように2Dである。
L=2*D−V 式4
Lは、画像について、Lの最大値(Lmax)により除算することによって正規化することができる。いずれの負の値もゼロに設定することができる。pR2は、このように式から求められる。
pR2=max(0,L/Lmax) 式5
式5は、このように、(サブステップS14Aにおいて識別された)低いグレーレベルを有する赤みピクセルを識別するように働く。式5は、このように、赤目に一般的である、ピクセルが明るいより赤いという表示を与える。このことは、例えば、そのような特性を示す皮膚及び顔のような領域上の偽陽性の大部分を排除する。
一実施形態においては、サブステップS14Bの出力は、したがって、ピクセルのグレーレベルV及びその赤みDを考慮する各々のピクセルの確率値pR2である。
R=220、B=90である上述の例において、Lmaxが100である場合には、
V=0.25*220+0.6*130+0.15*90=146.5
L=2*110−146.5=73.5
pR2=73.5/100=0.735
或いは、ピクセルのpR2値は、以下の式により求めることができ、
pR2=(R−LPF(R+G+B)/3)/255又はこれが負である場合には0 式6
ここで、LPFは、低域フィルタを示す(例えば、評価されているピクセルを含む5×5ピクセルの正方形)。低域フィルタにおけるピクセルのR、G、及びBの値の平均値は、このように、3で除算され、ピクセルの赤色値から減算される。0から1までの値を生成するためには、結果を最大値(この場合には255)で除算する。
ステップS14A及びステップ14Bで指定された確率値pR1及びpR2は、任意的には、pR1及びpR2の積又は重み付けられた合計といった単一の確率値pRに組み合わされて(サブステップS14C)、最も予想される赤目領域上に集中するようにさらに別の処理を可能にする。例えば、組み合わされた赤み及び赤み/輝度確率Fは、pR1とpR2の積として取得し、次いで、以下のように、負の値がゼロに設定された状態で、画像にわたり、Fの最大値(Fmax)で除算することにより正規化することができる。
F=pR1*pR2 式7
pR=max(0,F/Fmax) 式8
式8は、このように、pR1及びpR2の両方が大きい値を有する確率を強化し、pR1又はpR2のいずれかが低い/ゼロである確率をゼロに減少させる/設定する。pRは、このように、赤みがあり、さらに、明るいより赤みがあるという意味で、ピクセルが赤目にある確率として考慮することができる。確率pRは、このように、ピクセルが、実際に赤目にあるピクセルと色及び輝度が同様である確率の近似を与える。一般に、pRの値が高ければ高いほど、ピクセルが赤目にある傾向が高くなる。pR(或いはpR2又はpR1)は、次のステップ(サブステップS14E)において計算された循環性の確率に対する入力を構成する。
サブステップS14Eにおいては、循環性の確率値pSCを各々のピクセルに(又は、pR3>0又はpR3>0.1といった、少なくとも、pR3の最小値をもつピクセルを含むと識別された領域10のいずれかにおけるピクセルに)指定することができる。このサブステップの1つの側面は、各々の可能性のある赤目が循環性形状であり、その幅/高さの比率が1に近いことを保証することである。ピクセルの循環性の確率値pSCは、このように、ピクセルが配置された領域の循環性程度と関連される。一実施形態においては、確率値pSCは、上述のサブステップS14Cにおいて求められたpRにおいて算出される。
例えば、図2に示すように、サブステップS14Eにおいては、評価されているピクセルCから選択された距離rだけ半径方向に離間されており、互いに等しい距離で弧状に離間された一組SのピクセルP1、P2、P3、P4などが選択される。この組は、4、6、8、またはいずれかの利便性ある数のピクセルを含むことができる。一組のピクセルにおけるピクセルP1、P2、P3、P4などの各々が、ほぼ等しいpR確率を有する場合には、中央のピクセルPが円形領域に存在する高い確率を有することを示唆する。このことは、ピクセルが配置される領域12の周りで最も顕著である。ピクセルからさらに離れるように徐々に移動し、半径が増加する複数のピクセルの組を見ることにより、これらの組の各々に対する循環性の確率を算出することができ、最大確率、平均確率、又は、これらの1つ又はそれ以上を考慮する他の関数を求めることができる。一実施形態においては、半径rにおけるピクセルN1,N2,..Npの数(ピクセル計数)及び循環性の確率pSCr(C,r)は中央ピクセルCについて取得され、最大値としての半径rは、以下の式のゼロより少ない場合には切り捨てられ、
pSC(C,r)=max(0,1/2*PixelCount*pR(C)−[pR(N1)+...+pR(Np)]) 式9
ここで、PixelCountは、Cの周りの円上で選択されたピクセルの数である。
例えば、中央のピクセルの4つのピクセルN S E Wについて、式の値
pSC(C,r)=1/2**pR(C)−[pR(N1)+...+pR(N4)]が求められる。
pSC(C,r)の値が、異なるrの値について求められる(例えば、中央のピクセルから3、5、9、13、19、23、27のr値における7組のピクセル)。一実施形態においては、全ての考慮される半径pSC(C)にわたるpSC(C,r)の最大値が求められる。
pSC(C)=max(pSCr(C,r)) 式10
pSC(C)の値が換算され、例えば、画像全体(pSC(C)max)にわたり、pSC(C)をpSC(C)の最大値で除算することにより正規化されて、正規化された確率pSCが求められ、以下のように、0より少ない場合には切り捨てる。
pSC=max(0,pSC(C)/(pSC(C)max) 式11
これは、高い確率pSCを、低い確率pRをもつピクセルの円により取り囲まれた高い確率pRを有するピクセルに指定する。
代替的な実施形態においては、pSC(C,r)の値を平均化して、pSC(C)を求める。
4より少ない又は8より多いピクセルを各々の組Sについて選択することができ、選択されたピクセルは、等しく弧状に離間される必要がないことが理解されるであろう。さらに、異なる半径方向距離を選択することができ、例えば、rは1から100ピクセルまでとすることができ(調査中の画像の解像度に応じるとすることができる)、並びに、異なる数のピクセルの組、例えば2から20までのピクセルの組を選択することができ、一実施形態においては3から10の組を選択できることが想定される。
循環性の他の測定がさらに想定される。一般に、循環性の確率pSCの判断は、実質的に円形の区域の中心の方向に向かい、周辺において高い局所的なコントラスト(すなわち、実質的に異なる色及び/又は明るさの周囲区域)を有するピクセルに、ゼロより大きく、1までとすることができる確率pSCを指定し、値は循環性が増加するに伴い、一般に増加する。周辺において高い局所的なコントラストを有する実質的に円形の区域の一部ではないピクセルには、ゼロ又はゼロに近い確率pSCが指定される。
一実施形態においては、pSCの値は、全てのピクセルについては求められない。例えば、pSCは、pRが0より大きいか、最小しきい値より大きい、例えば、正規化された値0.1より大きいピクセルについてしか求められない。別の実施形態においては、同じpSCの値は、測定されたピクセルにすぐ隣接するか又は密接に隣接する一組のピクセルに対して用いることができる。例えば、一組の3×3又は5×5のピクセルは、中央のピクセルのpSCの値が指定される。このことは、精度を明らかに減少させることなく、算出時間をかなり減少させることができる。
したがって、一般に、指定された確率pSCは、ピクセルが一部を形成する赤み値pRにより定義された領域の循環性の何らかの尺度を考慮する。確率は、さらに、直接又は間接的に、ピクセルの局所的なコントラストと、ピクセルが配置される区域が実質的に赤色ではない区域により境界される程度を考慮することができる。
サブステップS14Eの出力は、画像における各々のピクセル(又は、pR3のしきい値を満たす領域におけるピクセル)についてのpSCの指定された値の確率マップである(サブステップS14F)。
任意的には、1つ又はそれ以上の試験が実行されて、赤目補正が適切であるかどうかを判断する(ステップS15)。例えば、これらの試験は、pSC(及び/又はpR)の最小値を有する連続するピクセルの領域を評価して(サブステップS15A及びS15B)、これらがサイズ及び/又は形状の基準を満たすかどうかを判断する。これらの試験は、偽陽性、すなわち、ピクセルがpSCの最小値を有するが、例えば、画像のサイズに関して大きすぎるか或いは小さすぎるために、又は、細長すぎるか或いは小型さがないために、赤目ではなさそうな領域をなくすように設計される。これらの試験は、幾つかのピクセルを含む領域に適用され、領域が、全体として、赤目であると考慮されるべきであるかどうか、したがって、補正を保証するかどうかを示す。これらの試験は、特定の領域が、赤目として考慮から外されて、このために、その領域におけるピクセルにはどのような補正も適用されないことを可能にする。例えば、試験のいずれかが満たされない場合には、元の赤み値は保持され、pR1、pR2、及び/又はpR3はゼロに設定される。一実施形態においては、領域は、赤目であると考慮されるためには、全ての試験を通過しなければならない。区域が、試験を通らなかった場合には、その区域内の全てのピクセルに対する確率はゼロに設定される(そして元の赤み値は保持される)。
これらの試験は、潜在的な赤目領域の異なる特性に関するものとすることができ、確率マップ(pSC値)又は中間確率マップ(例えば、pR、pR1、又はpR2)に適用することができる。図示実施形態においては、これらはpSCに適用される。
図3に示すように、潜在的な赤目領域40、42、44は、0より大きく、1より小さいpSCのしきい値確率を上回る連結ピクセルの領域として識別される。しきい値確率は、例えば約0.05から約0.2まで、例えば0.1とすることができる。このしきい値を満たす、幾つかの潜在的な赤目領域40、42、44が画像50に存在することができる。領域40、42、44の各々において、領域40、42、44の幅w及び高さが求められる。以下の試験は、領域40に関して述べられるが、試験は、各々の潜在的な領域40、42、44(又は先行する試験に通る各々の領域)について実行されることが理解されるであろう。試験に通る潜在的な領域40は、分類器ステップS17のための可能性のある赤目と考慮される。
サイズ試験(サブステップS15A)は、領域40が全体の画像50に関して小さすぎないかどうかを判断する個々の領域の各々に対する第1のサイズ試験を含む。この試験においては、例えば、ピクセルの数により、領域の最大幅w及び最大高さhが求められる。試験は、
w>j/100*sMax 式12
及び
h>k/100*sMax 式13
である場合に満たされ、
ここで、sMaxはピクセルにおける画像50の幅及び高さの最大値であり:sMax=max(W,H)
j及びkは、個々に、例えば、約0.1から約0.5まで、例えば約0.25とすることができ、例えば、
w>0.25/100*sMax及び
h>0.25/100*sMax
である。
領域40がこの試験を満たさない場合、すなわち、画像に関して小さすぎる場合には、可能性のある赤目領域とは考慮されない。
個々の領域40の各々に対する第2のサイズ試験は、この領域が全体の画像に関して大きすぎないかどうかを判断するものとすることができる。この試験は、
w<t/100*sMin 式14
及び
h<u/100*sMin 式15
である場合に満たされ、
ここで、sMinはピクセルにおける画像の幅W及び高さHの最小値であり:sMin=min(W,H)
t及びuは、個々に、例えば、約5から約20まで、例えば、約10とすることができ、例えば、
w<10/100*sMin及び
h<10/100*sMin
である。
領域40が試験を満たさない場合、すなわち、画像に関して大きすぎる場合には、可能性のある赤目とは考慮されない。
形状試験(サブステップS15B)は、個々の領域40の各々に対する第1の形状試験を含んで、この領域が細長すぎないかどうか、すなわち、高さが幅より大幅に大きくないかどうか、及び、幅が高さより大幅に大きくないかどうかを求めることができる。この試験は、
w<y*h 式16
及び
h<z*w 式17
である場合に満たされ、
ここでy及びzは、個々に、例えば、約1.5から約3までとすることができる。例えば、幅は高さの約2倍より少なく、高さは幅の約2倍より少ない:w<2*h;h<2*w。
領域がこの試験を満たさない場合、すなわち、幅又は高さのいずれかの方向において、細長すぎる場合には、可能性のある赤目とは考慮されない。
個々の領域40の各々に対する第2の形状試験は、領域が相対的に小型であるかどうかを判断するものとすることができる。この試験は、
fpb>f 式18
である場合に満たされ、ここで、fpbは領域40に属する領域の長方形の境界ボックス54内のピクセル52の部分であり、fは約0.1から約0.3まで、例えば、約0.25とすることができる。
領域40がこの試験を満たさない場合、すなわち、分散しすぎている場合には、可能性のある赤目とは考慮されない。
ステップS15の出力は、適用された試験の各々に通った、可能性のある赤目領域におけるピクセル以外の全てのピクセルに対して、確率値P=0を指定する確率マップである。試験に通った、可能性のある赤目領域におけるピクセルに対しては、指定された確率値P=pR2が保持される。これらの可能性のある赤目領域は、次いで、分類ステップ(ステップS17)を受ける。
上述の4つの試験より少ない又は多い試験を適用することができ、領域は、全ての試験より少ない試験が満たされた場合、例えば、少なくとも、試験の2つ又は3つといった、試験の最小の数が満たされた場合には、可能性のある赤目と考慮できることが理解されるであろう。
付加的な試験を任意的に行って、さらに偽陽性を減少させることができる。例えば、第5の試験(S15C)は、ステップS15A及びBにおいて、潜在的な赤目(P>0)として識別された領域が、高い赤み確率pR2又はpR1を有するピクセルの領域と重なるかどうかを判断する。図3に示すように、この試験は、あらゆる残りの、潜在的な赤目領域40、42、44(すなわち、上述のステップS15A及びS15Bにおいて排除されなかった潜在的な赤目領域40、42、44)及びpSCからのそれらの確率を、pR2における対応する領域60、62、64上にマッピングすることを含むことができる。このステップにおいては、赤目領域においては、サイズは、制限された要因によってのみ変化するべきであるため、サイズがpR2とpSCとの間で変化しすぎる領域が排除される。
このステップにおいては、pSCにおける各々の潜在的な赤目領域40、42、44は、最初に、pR2における対応する領域60、62、64のそれぞれにリンクされる。例えば、pSCにおける各々の領域40、42、44に対して、pR2における全ての重なる領域60、62、64、66が求められる。pR2における領域60、62、64、66は、pR2が、pSCにおける領域に属するピクセルに指定した確率の平均値の約四分の一だけ上回るピクセルの連結領域として識別されるが、0.2から約0.3までといった四分の一より大きい又は小さい値もまた想定される。全ての重なり領域60、62、64、66から、次いで、最も重なるもの(ピクセルの数において)が対応する領域60、62、64として選択される。
次いで、pSCにおける領域40、42、44のサイズが、pR2における重なり領域60、62、64のサイズのそれぞれと比較されて、これらの領域が同等のサイズであるかどうかを調べる。例えば、同等な領域60、60については、ピクセルの数における領域のサイズに関する以下の試験に通らなければならない。
np1>1/4*np2 式19
ここで、np1は領域40におけるピクセルの数(pSC)であり、
np2は対応する領域60におけるピクセルの数(pR2)である。
同様の試験が各々の対応する領域の対、42、62及び44、64に対して実行される。
この第5の試験に通り、pR2領域62、64、66が、可能性のある赤目領域の特性に関する望ましいサイズ及び形状の基準を満たす場合には(S15A、S15B)、pR2領域62、64、66は、その確率値P=pR2と併せて保持される。このステップの後、確率マップは、P=0の値を、サイズ及び形状の試験に通ったpR2からの対応する赤目領域に対応する62、64、66から選択された領域におけるもの以外の全てのピクセルに指定する。任意的には、pR2値は、次いで、例えば、画像全体にわたり、pR2の値をpR2の最大値(pR2max)で除算するように正規化することにより換算される。
P=pR2/pR2max 式20
一例として、図3に示す画像においては、領域40について、pR2における対応する領域60が大きすぎ(領域40におけるピクセル数<領域60におけるピクセル数の1/4)、したがって排除され、領域40における全てのpR2領域が0に設定され、すなわち、この領域においては、P=0になる。領域42においては、pR2における対応する領域62は式19を満たし、したがって、領域42の確率は保持される。領域44においては、対応する領域64は領域44と重なる最大の区域を有し、したがって領域44は保持される。pScの領域であり、pR2の領域64と重なる領域66は、領域64より領域44と重なる部分が少なく、したがって、領域44に関する決定において役割を果たすことはない。
一実施形態においては、ステップS15は完全に排除され、全ての潜在的な赤目領域40、42、44は、ステップS17において、可能性のある赤目領域と考慮される。
上述の赤目検出ステップ及び潜在的な赤目に適用される任意的な試験は、付加的な又はより少ないステップを含むことができ、ピクセルの色及び/又はピクセルが属する連続する領域のサイズ及び/又は形状の関数として、赤目にあるピクセルのピクセルに確率を指定するために、異なる方法を採用することができることが理解されるであろう。具体的には、付加的な分類ステップS17が採用される場合には、上述の提示された制約の1つ又はそれ以上を除去する又は緩和することが可能である。分類ステップS17は、これらの任意的な試験が識別するように設計されたエラーのほとんどを排除する。したがって、可能性のある赤目を見逃すことを少なくするために、特定の制約を緩和することが可能である。付加的な分類ステップは、エラーを減らし、補正を増加させるため、一般に、制約を設定する際に、十分に包括的にして、実際に赤目であるとすることができる可能性のある赤目が、分類ステップに先立つ試験によって間違って排除されないようにすることが好都合である。
分類モジュール200及び分類の動作をここでより詳細に述べる。1つの側面においては、分類ステップS17は、検出モジュールにより出力された、可能性のある赤目領域を囲むパッチを述べる。例示的な、可能性のある赤目領域40は、色の関数として、赤目検出モジュール106により求められた、少なくとも、赤目にあるしきい値確率を有するピクセルを含み、この確率は、さらに、輝度及び循環性といった他の赤目関連の特徴を考慮に入れることができる。例えば、分類器に曝される、可能性のある赤目領域は、特定の最小値を上回る確率P=pR2を有することができ、ステップS15において、さらに別のスクリーニングを受けた可能性がある。
使用前に、分類器モジュール200は、訓練ステップS16において訓練されて、局所的な記述子が人の目に対応するパッチ(したがって、正確に検出された赤目)を認識し、これらを、検出モジュールが、可能性のある赤目として不正に考慮することがある顔の他の部分に対応するパッチから区別する一方、他方では背景の片と区別する。精度を向上させるためには、認識処理は、例えば、赤目を顔から区別し、赤目を背景から区別するといった多部類問題として取り扱うことができる。さらに、個々の訓練の組においてではなく、検出モジュール106/試験モジュール108の出力において分類器モジュールを訓練することにより、訓練は、最も関連のあるパッチに着目する。
ユーザ研究においては、顔のエラー(赤目として不正に識別され、したがって、補正が不適切であった区域)及び不十分に補正された実際の赤目の重要性は、背景補正エラー(赤目として不正に識別され、そのため補正が不適切であった背景区域)の重要性より高い重要性として格付けされる。具体的には、ユーザ研究は、大いに目に見える顔のエラー及び不十分に補正された赤目の重要性は、背景エラーの重要性よりはるかに高いことを示した。事実、ユーザは、多くの場合、背景の修正に気づくことさえない。その代わり、ユーザは、はるかに多く顔に着目し、具体的には、顔にある邪魔で不自然なアーチファクトに着目する一方、他方では、残っている赤目に着目する。おそらく、より幅広い範囲の特徴を有することができる背景より、顔は、目、鼻、口などの識別可能な特徴の組がより限定されているため、画像を見る場合に、顔/目に、より多く着目するというこのユーザの傾向は、顔のエラーを識別するユーザの自然な技能と組み合わされる。したがって、顔と背景との比較を異なって取り扱うことが適切である。
検出モジュール106の出力において分類期モジュール200を訓練する(ステップS16)ことは、最初の方法(ステップS14及びS15)により戻された真陽性(実際の赤目)と偽陽性(不正に識別された、可能性のある赤目)とを区別するように特別に適応された分類器モジュール200を提供する。これらの2つの側面は、より精度の高い赤目補正をもたらす。
本発明の分類器モジュール200なしで動作するシステム100は、画像処理段階において赤目を検出し、補正するために、完全に自動で確率的な解決法として有効であるが、限られた数の場合において、システム100は、邪魔なアーチファクトを人の顔、特に唇又は鼻の周りに導入することがあることが見出された。このことは、これらの領域が赤目と同様な配色を有するためであるとすることができる。さらに、幾つかの正しく検出された赤目について取得された確率値(例えばP=pR2)が十分に高くないため、システムは、常に赤目補正の最適レベルに達するとは限らない。最後に、システムは、時々、例えば、画像の背景における小さい赤いスポットの赤みを減少させるといった、背景にアーチファクトを導入することがある。背景は、説明目的のために、人の顔に配置されていない全ての区域を含む。一般に、顔は、目(赤目以外の)鼻、口、耳、及びこれらの特徴と取り囲む皮膚領域を含むが、腕、脚、胴、足、及び手といった他の皮膚領域は除き、これらは背景として考慮される。人の服の上方に見える首部分は、さらに、顔の一部として考慮することができる。
提案された付加的な分類ステップS17は、(より赤目の顔及び背景でありそうな)3つの異なる領域の部類に指定された赤目の確率を修正することを可能にする。結果として、このことは、
1)顔領域に導入されるアーチファクトの数及び強さの減少
2)正しく検出された赤目に適用される補正強さの増加
3)背景領域に導入されるアーチファクトの数及び強さの減少
例示的な実施形態は、目、顔(目以外の)、及び背景(顔及び目以外の全て)という3つの部類について述べられるが、さらに別の部類を提供できることが想定される。例えば、唇、鼻、及び他の顔のエラーといった典型的な顔のエラーを別々に分析して、さらに高い精度をもたらすことができるが、処理要求及び訓練要求が増加される。或いは、顔及び背景のエラーを含む共通の部類は訓練することができ、その出力は、顔対赤目及び顔対背景の分類器の出力と組み合わせることができる。別の実施形態においては、この共通の部類は、先行する2つの部類を置き換えて、パッチが赤目であるかどうかを決定するために単独で用いることができる。
1つの側面においては、分類ステップS17は、(分類器により識別された)真陽性赤目領域に指定された確率を増加させ、(分類器により識別された)偽陽性、すなわち、人の顔又は背景に配置される誤って検出された赤目領域の確率を減少させることができる。
検出モジュールにより出力された、可能性のある赤目領域を囲むパッチの局所的な記述子が、分類ステップS17で用いられる。分類器200は、局所的な記述子が人の目に対応する(したがって、正しく検出された赤目に対応する)パッチを学習して認識し、検出モジュール106により誤って識別された顔の他の部分又は背景のそれぞれに対応する偽陽性パッチからこれらを区別するための処理能力を含む。
分類ステップS17は、可能性のある赤目領域を囲むパッチの局所的な記述子に基づく。パッチの位置によれば、各々のパッチは、複数の部類の1つに属する。図示実施形態においては、赤目、顔、又は背景という3つの部類が採用される。機械学習手法がステップS16で用いられて、分類器モジュール200が、これらの3つの部類の対(赤目対顔及び赤目対背景)の間で区別するように訓練する。分類器モジュール200の出力に応じて、可能性のある赤目領域の確率を調整することができる。例えば、確率(P=pR2)は、顔より赤目でありそうで、背景より赤目でありそうであると分類されたパッチにおける、可能性のある赤目領域に対して上昇させることができ、分類器の1つにより、顔又は背景のいずれかとして高い信頼性をもって分類されたパッチに対して減少させることができる。バイナリ分類器の顔対赤目を有する信頼性は、赤目をもたない信頼性と等価であることに注目されたい。分類器がこれらの2つの群の一方に十分な信頼性を指定することができるパッチに対しては、確率は修正されないまま残るとすることができる。
分類器モジュール200は、好適なソフトウェア又はハードウェア上で実施することができる処理部品を含む。図4においては、分類器は処理モジュール102の一部として示されるが、ここから物理的に離すこともできる。分類器モジュール200は、存在する場合には、試験モジュール108から入力を受け取り、又は、検出モジュール106から直接入力を受け取る。修正された確率値(Pclass)といった分類器モジュールの出力は、補正モジュール110に入力される。
図5及び図6を参照すると、パッチ210、212、214、216が、各々の可能性のある赤目領域に指定される(ステップS17A)。具体的には、各々の可能性のある赤目は、それぞれのパッチの中央における境界ボックスの中央に配置されている。図5に示す画像50においては、パッチ210及び212は、実際の赤目に対応する赤目領域40、218を囲む。パッチ214は、画像の背景領域222であるブローチ上の円形のビーズ220を囲み、パッチ216は、画像の顔領域226上の唇の赤色領域224を囲む。図5は、例示的なものに過ぎず、より少ない又はより多い、可能性のある赤目、及び結果として、より少ない又はより多いパッチを所与の画像に識別できることが理解されるであろう。この段階においては、目的は、どのパッチ210、212、214、216が、実際の目に対応する高い確率を有し、したがって、補正ステップにおいて色補正される赤目を囲むかを識別することである。
パッチ210、212、214、216は、正方形又は長方形の形状であってもよいし、又は、他の好適な連続する形状のいずれかであってもよく、それぞれの可能性のある赤目領域40、218、220、224を取り囲むことができる。一般に、パッチは互いに離間されているが、幾つかの場合においては、パッチは重なっていてもよいことが想定される。例えば、各々のパッチ210、212、214、216は、少なくとも、予想される赤目領域40(図3)の境界ボックス54ほど大きいとすることができる。一実施形態においては、検出モジュール106により出力された、可能性のある赤目領域40、218、220、224の境界ボックスのk2倍のパッチ区域を採用することができ、ここでkは、例えば、約2から約5までとすることができる。k=3においては、パッチ210、212は、一般に、図5に示すように、全体の目228、230、又は、その主な部分を囲む(可能性のある赤目40、218が実際の目228、230の一部を形成する場合)。このことは、可能性のある赤目の各々を取り囲む特徴の考慮を可能にする。
ステップS17Bにおいて、画像における各々のパッチ210、212、214、216は、例えばM×Mピクセルといった共通のサイズに換算することができる。Mは、例えば、約10から40までといった、約5から約100までとすることができる。この差異換算は、異なる、可能性のある赤目をほぼ同じ解像度にすることを可能にする。サンプル試験においては、M=32が満足いく結果を与えた。Mのサイズは、ある程度、システムが実施されるシステム上のデバイスの処理能力に依存することができる。一般に、Mは、各々のサイズ変更されたピクセルの特徴を考慮する各々のパッチの局所的な記述子が、分類器モジュールが訓練された場合に、赤目と他の顔又は背景との間を区別することを可能にするのに十分に大きいものであるべきである。
局所的な記述子は、各々の再換算されたパッチ210、212、214に関して算出される(ステップS17C)。局所的な記述子を用いて、可能性のある赤目領域を取り囲むパッチ210、212、214を表わす。局所的な記述子は、勾配志向ヒストグラム、ウェーブレット及びガボールフィルタ、又は例えば、K.Milolajcznk及びC.Schmidの「A Performance Evaluation of Local Descriptoers」IEEE Transactions on Pattern Analysis and Machine Intelligence、第27巻、第10号(2005年10月)に述べられるような差分記述子といった局所的な組織記述子とすることができる。
一実施形態においては、各々のパッチに関して取得される最初の局所的な組織記述子は、寸法M×M(図示実施形態においては32×32=1024)の特徴ベクトルである。例えば、ベクトルは、M×M行列における各々のピクセルのグレー値(例えば、赤み(D)=R−(G+B)/2値)を含むことができる。分類器モジュールの訓練/適用前に、この寸法を主成分分析(PCA)により減少させることができる。PCAは、サンプルの情報のほとんどを保持する相関していない変数の小さい組を識別することにより。データの組の寸法を減少させるのに有益な技術である。これは、主寸法を求め、これに沿って、データの変動が最大固有値に対応する共分散行列の固有ベクトルにより高度に定義される。PCA技術は、例えば、R.A.Calvo、M.Partridge、及びM.A.Jabriの「A Comparative Study of Principa Component Analysis Techniques」Australian Conference inNeural Networks、ブリスベン(1998年)、及び、F.Dela Torre及びM Blackの「Robust Principa Component Analysis for Computer Vision」Internaltional Conference on Conputer Vision(2001)に述べられている。
分類器モジュール200は、訓練ステップS16において顔に対して赤目を分類するように訓練された第1の分類器230と、背景に対して赤目を分類するように訓練された第2の分類器232という2つの1対1の分類器を含むことができる。実際の赤目に向かった場合、両方の分類器は、「赤目」を出力するように訓練される。顔のエラーが提示された場合、第1の分類器は、「顔」を出力するように訓練されるが、第2の分類器は、赤目と顔との間を区別するようには訓練されていないため、「目」又は「背景」を出力することになる。一実施形態においては、分類器は、信頼性レベルを出力し、高い信頼性レベルは、分類が正しいという分類器の大きい確実性レベルと関連される。したがって、例えば、赤目対顔といった顔エラーの場合には、分類器は、顔エラーをFaceとして分類し、その決定に対して高いレベルを指定するように訓練される。背景分類器は、顔エラーが提示された場合には、その判断をするように特に訓練されていないため、顔エラーをRed Eye又はBackgroundとして識別することになるが、その決定に対して、相対的に低いレベルの信頼性を指定する。こうした場合においては、分類器は、Undecidedを出力するように訓練することができる。しきい値の信頼性レベルは、Face及びBackgroundの決定に対して確立することができ、この上の出力は(Red Eye対Face分類器の場合には)Faceであり、又はBackground分類器の場合にはBackgroundであり、この下の出力はUndecidedである。
ステップS17Dにおいて、分類器は、それらの局所的な記述子に基づいて、パッチを分類する。一実施形態においては、2つの1対1の分類器の出力が以下のように組み合わされる。両方の分類器230、232がパッチ210、212、214をRed Eyeとして分類した場合には、Red Eyeとして取り扱われる(ステップS17E)。少なくとも一方が(高い信頼性レベルで)パッチをNon−Eye、すなわち、Face又はBackgroundとして分類した場合には、Not Red Eyeとして取り扱われる。2つのUndecidedの決定は、Undecidedとして取り扱われる。さらに、異なる信頼性レベルの重み付けに応じて、他の機構も考えることができる。
Red Eyeとして分類されたパッチに対するステップS17Eにおいては、それぞれのパッチの、可能性のある赤目領域内のピクセルの確率値(例えば、P=pR2)が、第1のパラメータPREを適用することにより増加される。Not Red Eyeとして分類されたパッチに対しては、それぞれのパッチの、可能性のある赤目領域内のピクセルの確率値(例えば、P=pR2)が、第2のパラメータ設定PNREを適用することにより、減少される。Undecidedとして分類されたパッチの、可能性のある赤目領域におけるピクセルの確率値は、変更されないまま残ることができる。
或いは、確率値は、Undecided、又は、(両方の分類器の応答を組み合わせることにより)赤目、顔、又は背景を有することに対する信頼性が最高であるかどうかの関数として、第3の新しいパラメータ設定PUND-RE、PUND-F、PUND-Bとして分類されたパラメータ設定PUNDを用いて修正することができる。これらのパラメータは、ユーザのプリファレンスに基づいて異なることができる。しかし、これらは両方共、第1及び第2のパラメータより少ない修正をPにもたらす。
別の代替的手法は、第2のパラメータ設定PNREの代わりに、顔又は背景を有することに対する信頼性が最高であるかどうかの関数として、2つのパラメータ設定PF及びPBを用いることである。一実施形態においては、ピクセルの確率値(例えば、P=pR2)の減少は、背景より顔に対しての方が大きい(PF>PB)。
ステップS17Eにおいて、分類モジュール200が赤目と考慮するパッチに対応するピクセルの確率Pは、1に近い確率値を取得するように上昇させられ、赤目ではないと考慮されるパッチの確率は、0に近い値まで低下させられる。1つの側面においては、分類モジュール200が未決定と考慮するパッチに関連する確率値は、変更されないまま残る。
ここで訓練ステップS16を述べる。分類器モジュールは、検出モジュール/試験モジュールにより、以前に、そのように識別された、可能性のある赤目を含む一群の訓練画像を入力される(ステップS16A)。可能性のある赤目の各々は、一群の観測器により評価され、実際の赤目、顔エラー、及び背景エラーという3つの部類の1つに配置される。各々の可能性のある赤目のこれらの分類は、分類器モジュールに入力される(ステップS16B)。各々の可能性のある赤目に対する局所的な記述子が、次いで、算出される(ステップS16C)。赤目対顔の分類器230は、既知の顔エラーのベクトルから区別する実際の赤目ベクトルの特徴を識別し、これらを用いて、不明の、可能性のあるエラーを赤目でありそうである又は顔エラーでありそうであるとして指定する方法を提供する(ステップS16D)。同様に、赤目対背景の分類器232は、既知の背景エラーのベクトルから区別する実際の赤目ベクトルの特徴を識別し、これらを用いて、不明の、可能性のあるエラーを赤目でありそうである又は背景エラーでありそうであるとして指定する方法を提供する。特徴は、同様なグレーレベルをもつ連続するピクセル群の形状、サイズ、相対的な位置、及び/又は配向を含むことができる。区別できるベクトルの特徴を識別するように、2つの分類器230、232を訓練するための種々の方法が想定される。1つの実施においては、線形支持ベクトル機械(SVM)学習技術を用いて、各々の分類器を訓練する(ステップS16D)。しかし、神経回路網、線形判別分析、k最隣接、ガウス混合モデル又は他の機械学習技術といった他の機械学習技術を用いてもよい。
こうした技術例は、C.J.C.Burgeの「A Tutorial on Support Vector Machines for Pattern Recognition」Data Mining and Knowledge Discovery第2巻、第2号、121−167ページ、(Kluwer Academic Publishers、1998年)、W.Duch、K.Grudzinski、及びG.H.F.Diercksenの「Minimal Distance Neural Methods」Proc.I.J.CNN、1299−1304ページ(1998年)、及び”.Such,R.Adamczak、及びG.H.F.Diercksenの「Distance−based Multilayer Perceptions」CIMCA75−80ページ(Ed.M.Mohammadian、IOS Press、アムステルダム)、Piers、A.M.の「Robust Linear Discriminant Analysis and the Projection Pursuit Approach,Practical Aspects,Developments in Robust Statsitics」International Conference on Robust Statistics ハイデルベルク2001年、317−329ページ(Springer−Verlag)、S.Singh J.F.Haddon、及びM.Markou「Nearest Neighbour Strategies for Image Understanding」Proc.Workshop on Advanced Concepts for Intelligent Vision、Systems(ACIVS’99)、バーデンバーデン、(1999年、8月2から7日)、Richard J.Ponvinelli、Michael T.Johnson、Andrew C. Lindgren、及びJinjin Yeの「Time Series Classification using Gaussian Mixure Models of Reconstructed Phase Spaces」IEEE Transactions on Knowledge and Data Engineering、第16巻、第6号、779−783ページ(2004年6月)。
分類器230、232は、訓練後、N次元空間におけるモデルといったモデルを含んで、ここでは、赤目に対応するパッチが境界空間にあり、顔エラー又は背景エラーのそれぞれに対応するN次元空間の残りから区別される。いずれの新しいパッチもN次元空間と比較されて、これらが境界された赤目空間内に入り、したがって、赤目でありそうなものとして考慮されるかどうかを判断する。
ピクセルのグレーレベルは、M×M行列における各々のピクセルを述べる1つの方法であるが、他のピクセル特徴を用いて、局所的な記述子パッチ及び分類器の種類を生成することができる。異なる特徴は、例えば、上で引用されたMikolajczykにおいて述べられた異なる組織情報を、例えば、John R.Smith及びShi−Fu Changの「VisualSEEk:A Fully Automated Content−Based Image Query System」ACM Multimedia(1996年)で述べられる異なる色情報と組み合わせることができる。
ステップS16Eにおいて、修正パラメータが分類器モジュール200に入力される。分類ステップの結果として、確率(例えば、P=pR2)が修正される程度を求める際に、ユーザのプリファレンスを用いることができる。例えば、訓練ステップS16Fにおいては、パラメータ設定PREを、分類器により指定された、可能性のある赤目領域に、顔エラーであるより赤目でありそうで(PRed eye>PFace)、さらに、背景エラーであるより赤目でありそうである(PRed eye>PBackground)として指定することができる。別のパラメータ設定PNREを、分類器が赤目ではないと判断した領域、すなわち、顔エラーである可能性が高い(PFaceが1に近いか又は所与のしきい値より大きい)領域、又は、背景エラー(PBackgroundが1に近いか又は所与のしきい値より大きい)領域に指定することができる。パラメータ設定は、次いで、ステップS17Eにおいて、分類器モジュールにより確率Pに適用される。
任意的には、訓練の組において補正された画像は、一組の観測器により再検査され、必要に応じて、修正することができる。パラメータ設定PRE及びPNREの異なる値の範囲を適用することができる。観測器は、画像を再検査し、補正された画像が補正されていない画像に対して好ましい画像を識別する。これらの試験から好ましい補正された画像を最ももたらしそうなパラメータ設定PRE及びPNREが識別される(訓練ステップS16F)。パラメータ設定を改良する他の方法を考えることができる。一般に、パラメータ設定PREは、検出モジュールにより出力される確率値を増加させ、パラメータ設定PNREは、検出モジュールにより出力される確率値を減少させる。例えば、確率P(例えば、pR2)は、適切なパラメータ設定により修正することができ、すなわち、
Red eye>PFace及びPRed eye>PBackgroundである場合には、PClass=PREにより修正されたP
Face又はPBackgroundがしきい値の信頼性レベルを上回る場合には、PClass=PNREにより修正されたP
Face>PBackgroundである場合にはPClass=P又はPFにより修正されたP
Figure 0004861806
であり、ここで、PClassは、分類器により出力された確率値である。パラメータ設定PF及びPBは、両方共、Pを変更しないで設定することができる。すなわち、これらのパラメータ設定は、観測器のプリファレンスに基づいて異なる値を有することができるが、いずれにしても、PRE及びPNREの両方が与えるより少ない修正をPにもたらす。パラメータ設定は、乗数である必要はないが、Pを増加させる(PREの場合)又はPを減少させる(PNREの場合)他の関数であってよいことが理解されるべきである。一般に、パラメータ設定PREが適用された場合には、
Figure 0004861806
であり、パラメータ設定PNREが適用された場合には、
Figure 0004861806
である。
用途に応じて、異なるパラメータ又は動作選択点を選択することができる。例えば、修正される画像が顔を含まなさそうであると知っている場合、又は、フラッシュが用いられない場合には、パラメータ設定は、少ない赤目を補正するように調整することができる。すなわち、分類器は、局所的な記述子が、可能性のある領域が顔又は背景エラーではないという高い確度を示した場合においてのみ、赤目対顔又は背景を示すように訓練することができる。
或いは、個々の分類器の出力及びそれらの信頼性尺度のより複雑な組み合わせ(例えば、重み付け平均)を考慮することができる。このことは、検出ステップ(S14)の確率マップと良好に組み合わさる信頼性尺度をもたらし、全体のシステムのソフトな(確率的な)特性を維持することを可能にする。さらに、分類器は、背景における間違った検出より、顔における街上がった検出に対して厳しく罰するように、個々に調整することができる。一実施形態においては、パラメータ設定は、パッチベクトルが赤目である各々の分類器230、232の信頼性の関数として調整される。
訓練ステップの目的は、各々の分類器230、232が、実際の赤目に対して「赤目」(又は重み付け機構が用いられる場合には高い赤目の確率)を正しく指定し、赤目ではない部分に「赤目ではない」(又は低い赤目の確率)を正しく指定し、任意的には、未決定の赤目(又は0.5に近い組み合わされた確率をもつもの)の数を最小にするように訓練することである。分類器は、依然として、ある率のエラーを有することがあるが、これらは、この方法が、分類器モジュール200なしで実行された場合より低いことが理解されるであろう。例えば、分類器230、232は、パッチ210、212が赤目(赤い領域40、216)を含むものとして正しく識別し、パッチ214、216といった顔226又は背景22におけるパッチを無視するように訓練される。
方法に戻ると、次のステップ(ステップS18)は、確率P=>0のPClassを有する各々のピクセルに対する赤目補正を求めることである。用いられる確率Pは、分類ステップS17により修正されるとすることができる。
一実施形態においては、確率Pが高ければ高いほど、ピクセルに適用される補正が大きくなる。補正は、ピクセルの青色成分及び緑色成分を増加させること、及び/又は、ピクセルの赤色成分を減少させることを含むことができる。ピクセルが特定のしきい値より上の確率Pを有する別の実施形態においては、ピクセルの赤色成分がゼロに設定される。
赤目補正が行われるピクセルに対しては、補正は、例えば、当該ピクセルの赤色成分、緑色成分、及び青色成分、並びに、ピクセルが赤目ピクセルであるという確率について、ピクセルの色を考慮することができる。このことは、画像の彩度が補正に影響を与え、周囲区域の彩度をより反映する傾向をもつ補正をもたらすことを可能にする。
例えば、赤色が減少された値redReducedが、緑色値及び青色値の関数であるピクセルに指定される。例えば、赤色が減少された値は、緑色および青色の平均である。
redReduced=(G+B)/2 式21
G値及びB値は同じまま保持される。したがって、例示的なピクセルにおいては、R=220、G=130、B=90、redReduce=1100である。赤目であるピクセルの確率Pを用いて、画像における最終的な赤色値に対する元の赤色値及び赤色が減少された値の相対的な寄与を求める。Pの値が高ければ高いほど、赤色が減少された値に置かれる重み付けが大きくなる。例えば、補正された赤色値Rcorrectedは、以下の式から求めることができる。
Rcorrected=(1−P)*original+P*(redReduced) 式22
したがって、P=1/4に対して、図示ピクセルにおいては、
Rcorrected=3/4*220+1/4*110=192.5=193
赤色値は、このように、最終画像において、220から約193まで減少され、元の緑色値及び青色値は保持される。したがって、修正されたピクセルは、R=193、G=130、B=90である。
別の実施形態においては、赤色値は、P値をパワーに対して上昇させることにより調整される。ピクセルの修正は、このように、以下の式に基づくものとすることができ、
Rcorrected=(1−P^(1/degree))*Roriginal+P^(1/degree)*redReduced 式23
ここで、Roriginalは入力画像の赤色値であり、redReducedはRの赤色が減少された値であり、degreeは、元の値及びredReduced値のそれぞれの重み付けを制御するアルゴリズム・パラメータである。1から約4までの整数値の程度は、一般に、良好な性能を与える。上述の式22においては、程度は1である。さらに、P^(1/degree)は、P自体ではなく、確率であるとして考慮することができ、したがって、式は、
Rcorrected=(1−P))*Roriginal+P*redReduced 式24
評価されている画像が、元の画像の低解像度の画像である場合には、P値が求められた低解像度の画像のピクセルに対応する元の画像におけるピクセルの全てが、この最後にステップにおいて、元の画像における各々の対応するピクセルに対するredReduced対を計算し、Pの同じ対を適用して、これらの対応するピクセルの各々のRcorrectedを求めることにより、補正される。
一実施形態においては、ユーザ入力は、ユーザが赤目補正された画像を視認して、その補正を受け入れるか又は拒否することを可能にする(サブステップS18C)。
確率を求め、補正を適用するための種々のステップは、自動的に画像を評価し、赤目補正を適用するアルゴリズムとしてソフトウェアに組み込むことができる。
分類モジュールは、より大きい補正を適用することにより、実際の赤目の補正を視覚的に改善するものとして示された。ブローチ218におけるように、分類器なしでもたらされることがある背景エラーは、分類器モジュールにより大幅に減少させることができる。分類器モジュールは、さらに、特に、鼻及び唇におけるエラーを排除することにより、顔にある赤目ではないものに対する補正のエラーを減少させる。
画像データベースにおいて例示的な方法を評価する場合には、観測器が望ましくないと考慮したほとんど全てのエラーが排除されることが見出された。さらに、多大な数の場合において、赤目補正が、実質的に改善された。
本方法は、比較的小さいトレイニング・セットを用いる場合であっても、考慮されている領域内のサイズ及びオリエンテーションの変動に対してロバストである。
本発明の分類ステップは、確率的な方法と完全に統合される。この出力は、イエス/ノー決定としてではなく、可能性のある領域に指定された最初の確率を適応させるように用いられる。最後に、ピクセルには確率が指定されるが、ここでは可能性のある値が0又は1だけではなく、全ての中間値が等しく可能である。対照的に、既存の方法は赤目であるか又はそうではないかという困難な決定で終了する。
画像における赤目の自動補正のための例示的な方法のステップを示すフロー図である。 画像の一部及び循環性の確率が指定されるピクセルを取り囲む画像及び領域の概略図である。 赤目の検出における検討区域を示す画像の概略図である。 図1のステップを実行するためのデジタルデバイスの概略図である。 可能性のある赤目領域を取り囲むパッチを識別する画像の概略図である。 図1の方法の例示的な分類器訓練サブステップ及び分類サブステップを示すフロー図である。
符号の説明
100:デジタル画像処理デバイス
102:処理モジュール
104:解像度選択モジュール
106:検出モジュール
108:試験モジュール
110:補正モジュール
200:分類器モジュール

Claims (2)

  1. 画像を補正するためのシステムであって
    デジタル画像における複数のピクセルの各ピクセルついてピクセルが赤目内にある確率を該ピクセルの色の関数として割り当てる検出モジュールと、
    該検出モジュールにより少なくとも赤目内にあるしきい値確率を割り当てられた連続するピクセルの領域を含む前記画像のパッチを分類する分類器モジュールであって、赤目を含む確度を有するパッチを、顔エラー及び背景エラーのうちの少なくとも一方を含む確度を有するパッチから区別する分類器モジュールと、
    分類器モジュールが赤目を含む確度を有するとして識別したパッチ内にある連続するピクセルの領域におけるピクセルに適用する補正を割り当てる補正モジュールと、
    具備し、
    前記分類器モジュールが、
    顔エラーを含む確率を有するパッチから、赤目を含む確率を有するパッチを区別する第1分類器と、
    背景エラーを含む確率を有するパッチから、赤目を含む確率を有するパッチを区別する第2分類器と、
    を含む、
    ことを特徴とするシステム。
  2. コンピュータ処理部を用いて、デジタル画像の複数のピクセルの各ピクセルついて該ピクセルが赤目にある確率を該ピクセルの色の関数として該ピクセルに割り当てるステップと、
    前記コンピュータ処理部により少なくと赤目内にあるしきい値確率を割り当てられた連続するピクセルの領域を含む前記画像のパッチに関して、実際の赤目という部類、顔エラーという部類及び背景エラーという部類を含む3つの部類のうちのいずれか1つの部類に割り当てられた候補赤目を用いて、赤目を含む確率を有するパッチを、顔エラーを含む確率を有するパッチ及び背景エラーを含む確率を有するパッチから区別するように訓練された分類器モジュールを用いて、前記パッチを分類するステップと、
    前記分類器モジュールにより目を含む確率を有するとして識別された前記画像のパッチに関して、前記連続するピクセルの領域におけるピクセルに適用する補正を決定するステップと、
    を含むことを特徴とする画像処理方法。
JP2006336099A 2005-12-20 2006-12-13 赤目の検出及び補正 Expired - Fee Related JP4861806B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/311,991 US7567707B2 (en) 2005-12-20 2005-12-20 Red eye detection and correction
US11/311,991 2005-12-20

Publications (2)

Publication Number Publication Date
JP2007172608A JP2007172608A (ja) 2007-07-05
JP4861806B2 true JP4861806B2 (ja) 2012-01-25

Family

ID=38173549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006336099A Expired - Fee Related JP4861806B2 (ja) 2005-12-20 2006-12-13 赤目の検出及び補正

Country Status (2)

Country Link
US (1) US7567707B2 (ja)
JP (1) JP4861806B2 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630006B2 (en) 1997-10-09 2009-12-08 Fotonation Ireland Limited Detecting red eye filter and apparatus using meta-data
US8254674B2 (en) 2004-10-28 2012-08-28 DigitalOptics Corporation Europe Limited Analyzing partial face regions for red-eye detection in acquired digital images
US7970182B2 (en) 2005-11-18 2011-06-28 Tessera Technologies Ireland Limited Two stage detection for photographic eye artifacts
US20100053367A1 (en) * 2003-08-05 2010-03-04 Fotonation Ireland Limited Partial face tracker for red-eye filter method and apparatus
US8520093B2 (en) * 2003-08-05 2013-08-27 DigitalOptics Corporation Europe Limited Face tracker and partial face tracker for red-eye filter method and apparatus
US9412007B2 (en) * 2003-08-05 2016-08-09 Fotonation Limited Partial face detector red-eye filter method and apparatus
US7599577B2 (en) 2005-11-18 2009-10-06 Fotonation Vision Limited Method and apparatus of correcting hybrid flash artifacts in digital images
US7675652B2 (en) * 2006-02-06 2010-03-09 Microsoft Corporation Correcting eye color in a digital image
JP2010520567A (ja) 2007-03-05 2010-06-10 フォトネーション ビジョン リミテッド 顔の位置および向きを用いた赤目の誤検出フィルタリング
JP4214420B2 (ja) * 2007-03-15 2009-01-28 オムロン株式会社 瞳色補正装置およびプログラム
US8538092B2 (en) * 2007-09-14 2013-09-17 Canon Kabushiki Kaisha Image processing apparatus
US8503818B2 (en) * 2007-09-25 2013-08-06 DigitalOptics Corporation Europe Limited Eye defect detection in international standards organization images
TW200930069A (en) * 2007-12-21 2009-07-01 Altek Corp Method for correcting red-eye
US8212864B2 (en) 2008-01-30 2012-07-03 DigitalOptics Corporation Europe Limited Methods and apparatuses for using image acquisition data to detect and correct image defects
US8433144B2 (en) * 2008-03-27 2013-04-30 Hewlett-Packard Development Company, L.P. Systems and methods for detecting red-eye artifacts
US8175390B2 (en) * 2008-03-28 2012-05-08 Tandent Vision Science, Inc. System and method for illumination invariant image segmentation
US8537409B2 (en) * 2008-10-13 2013-09-17 Xerox Corporation Image summarization by a learning approach
US8320662B2 (en) * 2009-01-07 2012-11-27 National Instruments Corporation Distinguishing colors of illuminated objects using machine vision
US8295637B2 (en) * 2009-01-07 2012-10-23 Seiko Epson Corporation Method of classifying red-eye objects using feature extraction and classifiers
US8611695B1 (en) * 2009-04-27 2013-12-17 Google Inc. Large scale patch search
US8391634B1 (en) 2009-04-28 2013-03-05 Google Inc. Illumination estimation for images
US20130121565A1 (en) * 2009-05-28 2013-05-16 Jue Wang Method and Apparatus for Local Region Selection
JP5456159B2 (ja) * 2009-05-29 2014-03-26 デジタルオプティックス・コーポレイション・ヨーロッパ・リミテッド 背景から前景の頭頂部を分離するための方法および装置
IT1397571B1 (it) * 2009-12-18 2013-01-16 St Microelectronics Srl Metodo ed apparato di filtraggio di artefatti da occhi rossi e/o gialli.
US11393133B2 (en) 2010-06-07 2022-07-19 Affectiva, Inc. Emoji manipulation using machine learning
CN103069435A (zh) * 2010-06-28 2013-04-24 诺基亚公司 用于补偿眼睛色彩缺陷的方法、装置和计算机程序产品
US8971628B2 (en) 2010-07-26 2015-03-03 Fotonation Limited Face detection using division-generated haar-like features for illumination invariance
US8798393B2 (en) 2010-12-01 2014-08-05 Google Inc. Removing illumination variation from images
US8681222B2 (en) * 2010-12-08 2014-03-25 GM Global Technology Operations LLC Adaptation for clear path detection with additional classifiers
JP5757259B2 (ja) * 2012-02-28 2015-07-29 ブラザー工業株式会社 画像処理装置及び画像処理プログラム
US9940545B2 (en) * 2013-09-20 2018-04-10 Change Healthcare Llc Method and apparatus for detecting anatomical elements
US9430829B2 (en) * 2014-01-30 2016-08-30 Case Western Reserve University Automatic detection of mitosis using handcrafted and convolutional neural network features
US9928874B2 (en) 2014-02-05 2018-03-27 Snap Inc. Method for real-time video processing involving changing features of an object in the video
SE538435C2 (en) * 2014-05-14 2016-06-28 Cellavision Ab Method, device and computer program product for determining color transforms between images comprising a plurality of image elements
JP6597632B2 (ja) 2014-11-14 2019-10-30 コニカミノルタ株式会社 測色装置および測色方法
US10116901B2 (en) 2015-03-18 2018-10-30 Avatar Merger Sub II, LLC Background modification in video conferencing
CN108603922A (zh) * 2015-11-29 2018-09-28 阿特瑞斯公司 自动心脏体积分割
US10318845B2 (en) * 2016-04-14 2019-06-11 Research International, Inc. Coupon reader
US10902598B2 (en) 2017-01-27 2021-01-26 Arterys Inc. Automated segmentation utilizing fully convolutional networks
WO2019103912A2 (en) 2017-11-22 2019-05-31 Arterys Inc. Content based image retrieval for lesion analysis
CN111738934B (zh) * 2020-05-15 2024-04-02 西安工程大学 基于mtcnn的红眼自动修复方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5153632A (en) 1988-08-12 1992-10-06 Nikon Corporation Flash exposure apparatus for avoiding red-eye effect
US5202719A (en) 1989-08-04 1993-04-13 Minolta Camera Kabushiki Kaisha Camera having a built-in electronic flash device and a detachable flash device selectively operated to eliminate red-eye phenomena
US5130789A (en) 1989-12-13 1992-07-14 Eastman Kodak Company Localized image recoloring using ellipsoid boundary function
JP3188742B2 (ja) 1992-01-31 2001-07-16 キヤノン株式会社 カメラ
US5432863A (en) 1993-07-19 1995-07-11 Eastman Kodak Company Automated detection and correction of eye color defects due to flash illumination
JP2907120B2 (ja) 1996-05-29 1999-06-21 日本電気株式会社 赤目検出補正装置
JP3684017B2 (ja) * 1997-02-19 2005-08-17 キヤノン株式会社 画像処理装置及び方法
US6009209A (en) 1997-06-27 1999-12-28 Microsoft Corporation Automated removal of red eye effect from a digital image
US6252976B1 (en) * 1997-08-29 2001-06-26 Eastman Kodak Company Computer program product for redeye detection
US6016354A (en) 1997-10-23 2000-01-18 Hewlett-Packard Company Apparatus and a method for reducing red-eye in a digital image
US6278491B1 (en) 1998-01-29 2001-08-21 Hewlett-Packard Company Apparatus and a method for automatically detecting and reducing red-eye in a digital image
JP3590265B2 (ja) 1998-06-11 2004-11-17 富士写真フイルム株式会社 画像処理方法
US6728401B1 (en) 2000-08-17 2004-04-27 Viewahead Technology Red-eye removal using color image processing
US6718051B1 (en) 2000-10-16 2004-04-06 Xerox Corporation Red-eye detection method
EP1229734A1 (en) * 2001-01-31 2002-08-07 GRETAG IMAGING Trading AG Automatic colour defect correction
US6895112B2 (en) 2001-02-13 2005-05-17 Microsoft Corporation Red-eye detection based on red region detection with eye confirmation
US6873743B2 (en) 2001-03-29 2005-03-29 Fotonation Holdings, Llc Method and apparatus for the automatic real-time detection and correction of red-eye defects in batches of digital images or in handheld appliances
EP1288859A1 (de) 2001-09-03 2003-03-05 Agfa-Gevaert AG Verfahren zum automatischen Erkennen von rote-Augen-Defekten in fotografischen Bilddaten
US7289664B2 (en) 2002-01-17 2007-10-30 Fujifilm Corporation Method of detecting and correcting the red eye
US7155058B2 (en) 2002-04-24 2006-12-26 Hewlett-Packard Development Company, L.P. System and method for automatically detecting and correcting red eye
US7116820B2 (en) * 2003-04-28 2006-10-03 Hewlett-Packard Development Company, Lp. Detecting and correcting red-eye in a digital image
US7224850B2 (en) 2003-05-13 2007-05-29 Microsoft Corporation Modification of red-eye-effect in digital image
US7343028B2 (en) * 2003-05-19 2008-03-11 Fujifilm Corporation Method and apparatus for red-eye detection
JP4431949B2 (ja) * 2003-10-27 2010-03-17 ノーリツ鋼機株式会社 赤目補正方法及びこの方法を実施する装置
US7684642B2 (en) * 2004-03-03 2010-03-23 Eastman Kodak Company Correction of redeye defects in images of humans
JP2005310124A (ja) * 2004-03-25 2005-11-04 Fuji Photo Film Co Ltd 赤目検出装置、プログラムおよびプログラムを記録した記録媒体
US7852377B2 (en) * 2004-04-16 2010-12-14 Arcsoft, Inc. Automatic red eye removal

Also Published As

Publication number Publication date
JP2007172608A (ja) 2007-07-05
US20070140556A1 (en) 2007-06-21
US7567707B2 (en) 2009-07-28

Similar Documents

Publication Publication Date Title
JP4861806B2 (ja) 赤目の検出及び補正
JP4529172B2 (ja) デジタル画像における赤目領域の検出方法及び装置
US8320641B2 (en) Method and apparatus for red-eye detection using preview or other reference images
US8290267B2 (en) Detecting redeye defects in digital images
JP4708909B2 (ja) デジタル画像の対象物検出方法および装置並びにプログラム
US7764846B2 (en) Adaptive red eye correction
JP4757559B2 (ja) 被写体の構成要素を検出する装置および方法
US8537251B2 (en) Detecting red eye filter and apparatus using meta-data
JP2020522807A (ja) セルフィーを撮影するためにユーザをガイドするためのシステム及び方法
US7907786B2 (en) Red-eye detection and correction
US8446494B2 (en) Automatic redeye detection based on redeye and facial metric values
US20060204052A1 (en) Method, apparatus, and program for detecting red eye
US20050053279A1 (en) Red-eye detection based on red region detection with eye confirmation
US20090169101A1 (en) Image processing method and apparatus, image sensing apparatus, and program
JP2005092759A (ja) 画像処理装置、画像処理方法、および赤目検出方法ならびにプログラム
Radu et al. A robust sclera segmentation algorithm
Gasparini et al. Automatic red-eye removal for digital photography
Gasparini et al. A review of redeye detection and removal in digital images through patents
Marchesotti et al. Safe red-eye correction plug-in using adaptive methods
Safonov et al. Automatic Red Eye Correction
Ali et al. Automatic detection and correction of red-eye effect
IE20080340U1 (en) Detecting red-eye defects in digital images

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110523

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111107

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees