JP2007517315A - デジタルカラー画像における空の検出 - Google Patents

デジタルカラー画像における空の検出 Download PDF

Info

Publication number
JP2007517315A
JP2007517315A JP2006547121A JP2006547121A JP2007517315A JP 2007517315 A JP2007517315 A JP 2007517315A JP 2006547121 A JP2006547121 A JP 2006547121A JP 2006547121 A JP2006547121 A JP 2006547121A JP 2007517315 A JP2007517315 A JP 2007517315A
Authority
JP
Japan
Prior art keywords
sky
pixel
model
region
empty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006547121A
Other languages
English (en)
Other versions
JP2007517315A5 (ja
JP4559437B2 (ja
Inventor
アンドリュー チャールズ ガラグハー
ジエボ ルオ
ウェイ ハオ
Original Assignee
イーストマン コダック カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン コダック カンパニー filed Critical イーストマン コダック カンパニー
Publication of JP2007517315A publication Critical patent/JP2007517315A/ja
Publication of JP2007517315A5 publication Critical patent/JP2007517315A5/ja
Application granted granted Critical
Publication of JP4559437B2 publication Critical patent/JP4559437B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)

Abstract

色値画素を有するデジタルカラー画像における空を検出する方法は、デジタルカラー画像から初期空領域を表す画素を特定し、特定された空画素に基づいてモデルを作成し、モデルは画素位置を入力とし、色を出力とする数学関数であって、モデルを用いてデジタルカラー画像における初期空領域に含まれていない画素を空と追加して分類する。

Description

本発明はデジタル画像処理に関し、特に画像において空を検出することに関する。
空は、画像においてよく見られる最も重要な素材のひとつである。デジタルカラー画像において、元の景色における空領域と対応する場合、画素や領域は空を表示する。基本的に、地球の大気を示す画像であるときは、画素や領域は空を表す。空を検出することにより、様々な画像の理解、向上、操作の作業を容易にすることができる。空は、景色のジャンル(例えば、屋外風景か屋内風景か、ピクニック風景か会議風景か、都市か景観か、等)として、屋外のイメージを示す強い指標となる(例えば、M. Szummer他、"Indoor-Outdoor Image Classification, "in Proc. IEEE Intl. Workshop on Content-based Access of Image and Video Database, 1998、及びA. Vailaya他、"On Image Classification: City vs.Landscape,"in Proc. IEEE Intl. Workshop on Content-based Access of Image and Video Database, 1998参照)。空に関する情報があれば、例えば「広い空が写っている屋外画像」や「夕焼けの画像」のようなクエリ(queries)を作成することができる(例えば、J. R. Smith他、"Decoding Image Semantics Using Composite RegionTemplates,"in Proc. IEEE Intl. Workshop on Content-based Access of Image and Video Database, 1998参照)。したがって、空を検出することにより、より効率的に内容に基づく画像検索を行うことができる。
画像の方位を見分ける方法として、空とその方位に関する知識があれば、屋外の画像の画像方位を特定することができる。一般的なイメージとは異なり、空領域は常に画像上部にあるとは限らない。さらに、画像の主題を検出する際には、空領域は背景の一部のようであることから、通常除外される。
空の最も顕著な特徴は色であり、空が澄んでいるときは通常淡青色である。このような特徴は画像における空を検出するために利用されてきた。例えば、米国特許第5,889,578号(特許文献1)では、色の手がかり(「淡青色」) を利用して、それ以上の記述なしに空を検出する技術について述べている。
同一出願人による米国特許第5,642,443号(特許文献2)においては、色とテクスチャ(の欠如)から、画像における空と関連した画素を特定する。特に、米国特許第5,642,443号(特許文献2)では、色度領域を複数のセクタに分割している。そして、非定方位の画像の二つの長辺に沿ったサンプル域のある画素を調べる。空色の非対称分布が認められた場合、画像の方位を推定する。写真の全配列の方位は、その配列における個々の画像の推定値に基づいて決定される。米国特許第5,642,443号(特許文献2)に記載の方法が功を奏するためには、十分に大きな特徴群(ほぼ全ての画像において少なくとも80%の成功率となる)、又は比較的小さな特徴群(90%を超える成功率となり、その特徴が全画像の約40%において認められる)が必要である。したがって、特許文献2は、空を検出するためにロバスト法は必要でないことを開示している。
一方、Saber他、"Automatic Image Annotation Using Adaptive Color Classification", CVGIP: Graphical Models and Image Processing, vol.58, pp.115-126, 1996に記載の技術においては、色を分類することで空を検出していた。空の画素は、2Dガウス確率密度関数に従っていると仮定される。したがって、マハラノビス距離に類似した距離関数と、所定の画像に対して決定された適切な閾値とを用いて、空画素を決定している。そして、上記の色分類のみに基づいて画像から抽出した、空や緑、肌が存在するか否かについての情報を用いて、画像の分類及び注釈(例えば、「屋外」「人々」等)を決定する。
全体的な類似のみに基づいて自然の画像を照合することは困難である。したがって、Smith他, supraにおいては、内容に基づく画像検索との関連で、合成領域テンプレート(CRT)を用いて画像のセマンティクスを解読する方法を開発した。この方法においては、色彩領域セグメンテーションによって画像を区分化した後、一般的な5×5グリッドに対して垂直走査及び水平走査を行い、基本的には、領域間に空間的関係を有する5×5マトリクスであるCRTを生成する。既知の画像方向であるとして、画像上方に延在する青い部分は晴天を表すと仮定し、空と雲に相当する領域は、緑と木に相当する領域の上方に位置すると仮定する。これらの仮定は常に有効とは限らないが、上記文献においては、CRTを用いて行ったクエリ、色ヒストグラムやテクスチャは、「夕焼け」や「自然」などのカテゴリに対してははるかに効果的であることが示されている。
同一出願人による米国特許第6,504,951号(Luo他)(特許文献3)においては、青空は水平線の近辺においては彩度が低いように見え、空領域にわたって徐々に変化することが示されている。空領域である可能性のある領域の勾配信号を調べることにより、空を特定している。条件を満たす勾配信号を示す領域が、空と分類される。上述の方法は、特に青空と類似した色を有する他の被写体を除外する上では優れた成果があるが、このアルゴリズムでは、狭い領域では適切な勾配信号を示すのに十分な大きさがないため、狭い空領域(木の枝の間に見える小さな空領域等)を検出できないという問題があった。
米国特許第5,889,578号明細書 米国特許第5,642,443号明細書 米国特許第6,504,951号明細書
本発明の目的は、デジタル画像において、空を検出するための改良された方法を提供することである。
上記の目的を達成するために、本発明は、色値画素を有するデジタルカラー画像における空を検出する方法であって、(a)デジタルカラー画像から初期空領域を表す画素を特定し、(b)特定された空画素に基づいてモデルを作成し、モデルは画素位置を入力とし、色を出力とする数学関数であって、(c)モデルを用いてデジタルカラー画像における初期空領域に含まれていない画素を空と追加分類する、方法を提供する。
本発明によれば、従来技術に比べて、より多くの領域及び画素について、空を表しているものを正確に特定することができる。
以下、本発明の好適な実施の形態について、ソフトウェアプログラムを例にとって説明する。このようなソフトウェアと同等のものをハードウェアでも構成することができることは、当業者にとって自明である。画像操作アルゴリズム及びシステムは公知であるが、以下では、特に、本発明に関する方法の一部を構成する、又はより直接的に協働するアルゴリズム及びシステムについて説明する。ここに含まれる画像信号を生成または別の方法で処理するためのアルゴリズム及びシステムの他の形態や、ハードウェア及び/又はソフトウェアは、以下では特に図示または説明されていないものであっても、システム、アルゴリズム、コンポーネント、エレメントから選択することができる。以下に記載する説明において、全てのソフトウェア実行は従来からなされているものであり、ごく一般的な技術の範囲である。
本発明は、コンピュータハードウェアにより実現することができる。図1に示すように、以下の説明におけるデジタル撮像システムは、撮像素子10、デジタル画像処理部20、画像出力装置30、全体制御コンピュータ40を有する。このシステムは、コンピュータコンソールやペーパープリンタ等の表示装置50を有することができる。さらに、操作のためのキーボードやマウスポインタ等の入力制御装置60を有することができる。本発明は、デジタル画像を生成する複数の撮像素子10に適用可能である。例えば、図1はデジタル現像システムを示していてもよく、この場合、撮像素子10は、景色をカラーのネガフィルムまたは反転フィルム上に取り込む従来の写真用フィルムカメラ、また現像したフィルム上の画像をスキャンして、デジタル画像を生成するフィルムスキャナである。デジタル画像処理部20は、デジタル画像を処理して、所望の出力装置又は媒体上に所望の画像を生成するものである。本発明は、例えばデジタル写真プリンタやソフトコピーディスプレイなど、様々な出力装置30とともに使用することができる。デジタル画像処理部20は、デジタル画像を処理するために使用され、全体の明るさや、色合い、画像構成等を調整し、画像出力装置30から所望の画像が出力されるようにする。本発明は上記の画像処理機能に限らないことは当業者にとって明らかである。
図1に示す全体制御コンピュータ40は、本発明を、例えば、磁気ディスク(フロッピーディスクなど)や磁気テープ等の磁気記憶媒体、光ディスク、光テープ、機械可読バーコード等の光記憶媒体、RAMやROM等の固体電子記憶装置などのコンピュータ読み取り可能な媒体に記憶されたプログラムを含むコンピュータプログラムとして記憶することができる。本発明における関連コンピュータプログラムのインプリメンテーションは、オフラインメモリ装置70として示されたコンピュータプログラムを記憶するために設けられた他の物理機器や物理媒体に記憶することもできる。本発明についての説明の前に、理解を容易にするため、本発明はパーソナルコンピュータ等の周知のコンピュータシステムにおいて使用することが望ましいことに留意されたい。
また、本発明はソフトウェア及び/又はハードウェアの組み合わせによって実現することができ、物理的な接続及び/又は同一の物理領域内に位置する装置に限らない。図1に示す装置の一つまたはそれ以上は、離れた場所に位置し、無線で接続されていても良い。
デジタル画像は、一またはそれ以上のデジタル画像チャネルを有している。各デジタル画像チャネルは、画素の二次元配列である。各画素値は、画素の物理的領域に対応する撮像素子に受光された光の量に関連する。カラー画像の場合、デジタル画像は通例、赤、緑、青のデジタル画像チャネルからなる。動画の場合は、一連のデジタル画像であるとすることができる。当業者にとって自明であるように、本発明は上述の用途のいずれかに用いられるデジタル画像チャネルに適用できるが、これに限らない。デジタル画像チャネルは列方向及び行方向に配置された画素値の二次元配列として説明されているが、本発明は非直線配列に適用しても同様の効果が得られることは勿論である。さらに、これも当業者には自明なこととして、下記においては、デジタル画像処理工程は、元の画素値を処理後の画素値に置き換える工程として記述されているが、元の画素値を保持しながら処理後の画素値を有する新たなデジタル画像を生成する工程としても、機能上は同等である。
図1に示すデジタル画像処理部20は、本発明の方法を実行するようプログラムされており、その詳細が図2に示されている。デジタル原画像102は、様々な色彩表現として撮像素子10(図1)から受け取ることができる。ただし、本発明の最も代表的な例においては、デジタル原画像を、赤、緑、青のデジタル画像チャネルを有するカラーデジタル画像として受け取る。デジタル原画像の画素値は、情景の強度の対数に関連し、各カラーチャネルの各画素値は、12ビットの値0〜4095として表されることが好ましい。さらに、188のコード値毎に、情景の強度の倍加(すなわち、絞り)を表すことが好ましい。例えば、1688値を有する第1の画素は、1500値を有する第2の画素の2倍の情景強度を表す。本発明は、例えば8ビットRGBのような他のコードを用いても正常に機能するが、方程式の定数や関数の形を変更することが必要な場合もある。
デジタル画像102は初期空検出部110に入力され、初期空判断マップ112を出力する。初期空判断マップ112は、その領域や画素が青空を表すという非ゼロ判断を有していると判定された、デジタル画像102の領域又は画素である。領域は、デジタル画像における空間的に接続された画素の集合であって、通常は共通の特性(例えば、同様の画素値)を持つ。好ましくは、初期空判断マップ112は、デジタル画像102と同数の列及び行の画素を有する画像である。初期空判断マップ112の画素数は、画素が青空を表しているという判断または確率を示す。例えば、画素数255は、画素が青空を示すという100%の判断を表し、画素数128は50%の判断を表し、画素数0は画素が青空ではないという確信的な判断を表す。初期空検出部110は米国特許第6,504,951号(Luo他)(特許文献3)に記載されている方法を用いて、初期空判断マップを作成することが好ましい。簡潔に要約すると、この初期空判断マップの作成方法においては、空である可能性のある画素中の連結成分を抽出し、抽出された連結成分のうち、所定のテクスチャ閾値を超えるテクスチャを有する連結成分を除外する。さらに、連結成分の脱飽和傾度を計算し、連結成分の脱飽和傾度と所定の空の脱飽和傾度とを比較することで、画像における正確な空領域を特定する。この米国特許第6,504,951号(特許文献3)記載の方法は、偽陽性検出率が低いという利点があり、これは、次の工程において同様の色を有する他の被写体が含まれるのを防ぐ上で重要である。
初期空判断マップ112は、画像として表される必要はない。例えば、初期空判断マップ112は、デジタル画像102における位置に対応する画素や領域と、それに関連する判断値との表であってもよい。
初期空判断マップ112は、モデル116を初期空判断マップ112における非ゼロ判断を有する少なくとも一の領域の画素色に適合させるモデル適合部114へと送られる。モデル116は、この領域の画素の色値に適合されることが好ましい。好ましいモデル116は、以下のような二次元二次多項式である。
Figure 2007517315
Figure 2007517315
Figure 2007517315
配列表記では
Figure 2007517315
一般的に、晴れ渡った空は画像全体に渡って色の変化が緩く、二次元二次多項式でうまく表すことができる。
モデル116の従属変数(入力)は画素位置x及びyである。モデル係数は, r〜r,g〜g,b〜bである。モデル116の出力は、位置(x,y)における画素の推定画素の色値[R’(x,y),G’(x,y),B’(x,y)]である。係数は、実際の画素値と推定画素色値との平均二乗誤差が最小となるように決定されることが好ましい。このような最小二乗多項式適合法は、公知の技術である。より好ましい方法としては、さらに、初期空判断マップ112における非ゼロ判断を有する少なくとも一の領域から選択されたN個の画素から、バンデルモンド行列を作成する。初期マップが複数の非ゼロ判断領域を有する場合には、最大又は最も確信的な判断を有する領域が、モデル116を構成する領域として選択される。二次多項式としては、バンデルモンド行列は6列N行を有し、各行は、選択された画素の中の一つの位置座標に対応する。
Figure 2007517315
さらに、各色については、配列Aが対応する位置におけるデジタル画像の実際の画素値から次のように決められている。
Figure 2007517315
ここで、C(x,y)は位置(x,y)におけるデジタル画像102の特定のチャネルの値を表す。チャネルCの係数の最小二乗解は、次のように示される。
Figure 2007517315
各色チャネルのモデル誤差は、配列Aと配列V[c (特定チャネルの画素色の概算)との平均二乗偏差の平方根を計算することによっても決定することができる。モデル誤差は、モデルの既知の非ゼロ判断領域に対する適合度に関する。
要約すると、モデル116は画素位置を入力とし、色(モデル期待値)の推定値を出力とする。モデル116(方程式及び係数)は、デジタル画像102から抽出された画素又は領域候補122とともにモデル適用部118に入力される。そして、セグメンテーションによって、空領域候補122を生成する。セグメンテーションは、色彩クラスタ化アルゴリズム(例えば、既知のK平均クラスタ化アルゴリズム)等の既知の技術により行われる。空領域候補122は、米国特許第6,504,951号(特許文献3)に記載されているような連結成分分析を受け、ニューラルネットワークを用いて、これらの空領域候補が典型的な青空の色となるように生成することが望ましい。モデル適用部118は、モデル116を用いて、初期空判断マップ112においては空と分類されていなかった画素を空と追加分類する。モデル適用部118は、空を表していると判断されるデジタル画像102の画素又は領域を示す改良空判断マップ120を出力する。モデル適用部118は、全ての画素又は領域(初期空判断マップ112において元々非ゼロ判断値に対応している画素又は領域を除く)に対する検討が完了するまで、デジタル画像の様々な画素又は領域122に繰り返し適用される。
図3は、モデル適用部118のより詳細な図を示す。モデル適用部118は、デジタル画像102の中から空領域候補又は画素122を検討し、空領域候補又は画素122の色値がモデル116でうまく表されているか、また付加基準を満たしているかを決定する。モデル評価部130は、空領域候補又は画素122の全ての画素位置についてモデル116を評価し、空領域候補又は画素122の色値のモデル期待値132を生成する。モデル判定部134は、デジタル画像102の空領域候補又は画素122の色値がモデル期待値132と十分に類似しているか否かを決定し、分類部136はモデル判定部134と付加基準分析部138との結果を検討し、空領域候補又は画素122を「空」と「空でない」のどちらに分類するかを決定する。
モデル判定部134は、空領域候補又は画素122の実際の色値とモデル期待値132の色値とを検討する。モデル期待値の対応する色値が実際の画素の色値に近い場合は、画素はモデルを満たしているとみなされる。モデル色期待値と各色チャネルの実際の画素色値との違いが、同じ色チャネルモデル誤差のT倍より少ない場合に、モデル色期待値が実際の色に近いとみなされることが好ましく、Tは4であることが好ましい。
付加基準分析部138によって検討される付加基準は、モデルの色推定値の色相である。本発明の方法においては、青空を主な検出対象としている(ただし、変更を加えることで、朝焼けや夕焼けの空等の他の穏やかに変化する空信号を検出するために用いることもできる)。画素が付加基準を満たすためには、モデルの色推定値は青もしくはほぼ青でなければならない(すなわち、R’(x,y)/B’(x,y)がTよりも小さくなければならず、Tは好ましくは0.9である)。当業者にとっては自明であるように、付加基準は、画素又は領域候補122もしくはモデル116自体の色や構成に関連した他の特徴を含んでいても良い。例えば、空は穏やかに変化するため、画素又は領域候補122が領域である場合は、付加基準はこの領域の画素の色値の標準偏差の上限を定めても良い。さらに、考え得る付加基準としては、空領域候補122の大きさ(画素数等)を含んでも良い。例えば、上述の必要条件に加えて、付加基準を満たすためには、領域が少なくともT個画素を有し、Tは好ましくは20であることを必要としても良い。さらには、付加基準を満たすために、少なくともT×100%の空領域候補の画素がモデル判定部134の判断を満たし、Tは好ましくは0.80であることを必要としても良い。
最後に、分類部136は、モデル判定部134と付加基準分析部138との結果を検討し、空領域候補又は画素122を「空」と「空でない」とのどちらに分類するかを決定する。画素又は領域候補122が画素の場合は、付加基準分析部138が付加基準が満たされていることを示し、モデル判定部134もモデル116が適合していることを示しているときは、分類部136は画素を「空」と分類する。
画素又は領域候補122が画素の領域の場合は、分類部136はモデル判定部134の複数の結果を検討しなければならず、その後領域を「空」又は「空でない」と分類する。好ましくは、付加基準分析部138が全ての付加基準が満たされていることを示しているときに、分類部136は領域を「空」と分類する。
分類部136は、改良空判断マップ120を出力する。改良空判断マップ120は、空を表す非ゼロ判断を有する画素及び領域に関する初期空判断マップ112と同一であることが好ましい。改良空判断マップ120はまた、図2のモデル適合部114によってモデル116を生成するために当初用いられていた初期空判断マップ112の非ゼロ判断領域の判断値と同等の(もしくはその関数の)非ゼロ判断値を有する「空」であると、分類部136において判定された画素及び領域を示す。「空でない」と分類された領域又は画素は、改良空判断マップ120においては判断値0で示される。
あるいは、モデル判定部134は、画素又は領域候補が空である可能性を示す確率Pを出力する。確率は、上述のモデル色推定値と実際の各画素の色値との偏差に基づいて決定される。偏差が大きくなるほど、確率は減少する。例えば、領域の全画素について偏差が0である場合、この領域は空であるとして、モデル判定部134は確率P=100%を出力する。RMS(Root Mean Square)平均画素偏差がモデル誤差の3倍である場合、モデル判定部134は、確率P=60%を出力する。その後、分類部136は、モデル判定部134からの確率Pと、付加基準分析部138からの情報とに基づいて、画素又は領域を、「空」もしくは「空でない」と分類する。例えば、分類部136は、確率Pが50%よりも大きい場合(付加基準は満たされているとする)に、領域を「空」と分類する。本実施例においては、画素又は領域が空を表している確率は、各画素のモデル色推定値と実際の色値との差に基づいて指定される。指定された確率は、画素又は領域が空であるか判断するために用いられる。
図4に、デジタル画像処理部20の他の構成を示す。上述したように、初期空検出部110は初期空判断マップ112を出力する。初期空判断マップ112と空領域候補122とは、モデル適合部114に入力される。この例においては、モデル適合部114は2つのモデル116を構築する。第1のモデル116は、図2を参照して説明した初期空判断マップ112における非ゼロ判断領域と関連したモデルである。第2のモデル116は、二次元二次多項式を初期空判断マップにおける非ゼロ判断領域の画素と空領域候補122の画素とに適合させる同様の方法を用いて生成される。これらのモデル116は、モデル分析部140に入力される。モデル分析部140は、第1及び第2のモデルに基づいて、空領域候補122を「空」と「空でない」のどちらに分類するかを決定する。空領域候補は、下記の条件を満たしている場合に、「空」として分類される。
1.初期空判断マップ112における非ゼロ判断領域に属する画素のモデル誤差が、第2のモデルにおいて、第1のモデルに対し、T%(好ましくは、T=50)以下である。
2.第2のモデルの空領域候補のモデル誤差が、第1のモデルの初期空判断マップ112における非ゼロ判断領域に属する画素のモデル適合誤差のT%(好ましくは、T=50)以下である。
3.空領域候補の平均色[Ra Ga Ba]がRa/Ba<T(好ましくは、T=0.9)となる。
モデル分析部140は改良空判断マップ120を出力する。改良空判断マップ120は、空を表す非ゼロ判断を有する画素及び領域に関する初期空判断マップ112と同一であることが好ましい。改良空判断マップ120はまた、図2のモデル適合部114によってモデル116を生成するために当初用いられていた初期空判断マップ112の非ゼロ判断領域の判断値と同等の(もしくはその関数の)非ゼロ判断値を有する「空」であると分類部136において判定された画素及び領域を示す。「空でない」と分類された領域又は画素は、改良空判断マップ120においては判断値0で示される。
図5A〜Cに、本発明の効果を示す。図5Aは、空を含む原画像を表す図である。この画像においては、木々によって、空が空間的に2つの空領域、すなわち小さい領域162と大きな領域160とに分かれている。図5Bは初期空判断マップ112における表示を示す。暗色領域164は、初期に空領域を特定する非ゼロ判断を有する領域である。しかしながら、図5Aにおける空領域162は、青空として典型的な勾配信号を示すのに十分な大きさがないため、正しく空と特定されていない。図5Cは、改良空判断マップ120における表示を示す。改良空判断マップ120においては、暗色領域166及び164が、図5Aに示す原画像二つの空領域160及び162を正しく特定している。
本発明に係る方法は、デジタルカメラ、デジタルプリンタ、パーソナルコンピュータ等において実行することができる。
本発明を実行するのに適したコンピュータシステムを示すブロック図である。 本発明に係る図1のデジタル画像処理部を示すブロック図である。 図2のモデル適用部を示すブロック図である。 図2のデジタル画像処理部の他の実施形態を示す図である。 本発明の効果を説明するための画像例を示す図である。 本発明の効果を説明するための画像例を示す図である。 本発明の効果を説明するための画像例を示す図である。

Claims (13)

  1. 色値画素を有するデジタルカラー画像における空を検出する方法であって、
    (a)前記デジタルカラー画像から初期空領域を表す画素を特定し、
    (b)前記特定された空画素に基づいてモデルを作成し、前記モデルは画素位置を入力とし、色を出力とする数学関数であって、
    (c)前記モデルを用いて、前記デジタルカラー画像における前記初期空領域に含まれていない画素を空として追加分類する、方法。
  2. 請求項1記載の方法において、前記モデルは前記デジタルカラー画像における画素位置に関する二次元多項式である、方法。
  3. 請求項2記載の方法において、前記多項式は二次多項式である、方法。
  4. 請求項1記載の方法において、初期空領域を特定する工程は、さらに、
    (i)空である可能性のある画素の連結成分を抽出し、
    (ii)前記連結成分のうち、所定のテクスチャ閾値を超える閾値を有する連結成分を除外し、
    (iii)前記連結成分の脱飽和傾度を算出し、前記連結成分の前記脱飽和傾度と所定の空の脱飽和傾度とを比較して、前記デジタルカラー画像における正確な空領域を特定する、方法。
  5. 請求項1記載の方法において、前記モデルを用いて画素を空として追加分類する工程は、さらに、
    (i)前記画素位置について、画素の色と前記モデルの推定の色との差を決定し、
    (ii)前記差を用いて、前記画素が空領域であるか決定する、方法。
  6. 請求項1記載の方法において、前記モデルを用いて画素を空として追加分類する工程は、さらに、
    (i)前記画素位置について、画素の色と前記モデルの推定の色との差を決定し、
    (ii)前記差を用いて、前記画素が空を表す確率を指定し、
    (iii)前記指定された確率を用いて、前記画素が空領域であるか決定する、方法。
  7. 請求項5記載の方法において、モデルを適合させる際に、
    (iv)残差を算出し、
    (v)前記差と前記残差との比を算出し、前記比を用いて前記画素が空を表す確率を指定することで、前記差を用いて前記確率を指定する、方法。
  8. 請求項5記載の方法において、前記画素が空である確率を算出する工程は、さらに、
    前記領域における前記画素の「青さ」に関する色特性を算出し、
    前記色特性を用いて、前記画素が空であるか否かを決定する、方法。
  9. 色値画素を有するデジタルカラー画像における空を検出する方法であって、
    (a)前記デジタルカラー画像から初期空領域を表す画素を特定し、
    (b)前記特定された空画素に基づいてモデルを作成し、前記モデルは画素位置を入力とし、色を出力とする数学関数であって、
    (c)前記モデルを用いて、前記デジタルカラー画像における前記初期空領域に含まれていない空領域候補を分類する、方法。
  10. 請求項9記載の方法において、前記モデルは前記デジタルカラー画像における画素位置に関する二次元多項式である、方法。
  11. 請求項10記載の方法において、前記多項式は二次多項式である、方法。
  12. 請求項9記載の方法において、さらに、
    適合度に関するモデル誤差を算出し、
    工程(c)において、前記モデルと前記モデル誤差とを用いて、前記デジタルカラー画像における前記初期空領域に含まれていない空領域候補を分類する、方法。
  13. 請求項9記載の方法において、工程(c)はさらに、
    前記空領域候補の大きさを決定し、
    前記決定した大きさと前記モデルとを用いて、前記デジタルカラー画像における前記空領域候補を分類する、方法。
JP2006547121A 2003-12-29 2004-12-15 デジタルカラー画像における空の検出 Expired - Fee Related JP4559437B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/747,597 US7336819B2 (en) 2003-12-29 2003-12-29 Detection of sky in digital color images
PCT/US2004/041937 WO2005066896A2 (en) 2003-12-29 2004-12-15 Detection of sky in digital color images

Publications (3)

Publication Number Publication Date
JP2007517315A true JP2007517315A (ja) 2007-06-28
JP2007517315A5 JP2007517315A5 (ja) 2007-12-27
JP4559437B2 JP4559437B2 (ja) 2010-10-06

Family

ID=34710817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006547121A Expired - Fee Related JP4559437B2 (ja) 2003-12-29 2004-12-15 デジタルカラー画像における空の検出

Country Status (5)

Country Link
US (1) US7336819B2 (ja)
EP (1) EP1700269B1 (ja)
JP (1) JP4559437B2 (ja)
DE (1) DE602004024233D1 (ja)
WO (1) WO2005066896A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015108947A (ja) * 2013-12-04 2015-06-11 キヤノン株式会社 画像処理装置、その制御方法、および制御プログラム
JP2021528784A (ja) * 2018-07-03 2021-10-21 影石創新科技股▲ふん▼有限公司Arashi Vision Inc. パノラマ画像のスカイフィルタ方法及び携帯端末

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7353034B2 (en) 2005-04-04 2008-04-01 X One, Inc. Location sharing and tracking using mobile phones or other wireless devices
US7742083B2 (en) * 2006-04-13 2010-06-22 Eastman Kodak Company In-camera dud image management
US8135684B2 (en) * 2006-04-13 2012-03-13 Eastman Kodak Company Value index from incomplete data
US8330830B2 (en) * 2006-04-13 2012-12-11 Eastman Kodak Company Camera user input based image value index
US7860320B2 (en) * 2006-06-26 2010-12-28 Eastman Kodak Company Classifying image regions based on picture location
WO2008038224A2 (en) 2006-09-28 2008-04-03 Koninklijke Philips Electronics N.V. Content detection of a part of an image
US20080085055A1 (en) * 2006-10-06 2008-04-10 Cerosaletti Cathleen D Differential cluster ranking for image record access
US20080085032A1 (en) * 2006-10-06 2008-04-10 Cerosaletti Cathleen D Supplying digital images from a collection
ITVA20060079A1 (it) 2006-12-19 2008-06-20 St Microelectronics Srl Metodo di classificazione cromatica di pixel e metodo di miglioramento adattativo di un'immagine a colori
MX2010000931A (es) * 2007-07-25 2010-04-21 Candela Microsystems S Pte Ltd Control de exposici?n para un sistema de formaci?n de im?genes.
US8463053B1 (en) 2008-08-08 2013-06-11 The Research Foundation Of State University Of New York Enhanced max margin learning on multimodal data mining in a multimedia database
US7966024B2 (en) * 2008-09-30 2011-06-21 Microsoft Corporation Virtual skywriting
US8351724B2 (en) * 2009-05-08 2013-01-08 Sharp Laboratories Of America, Inc. Blue sky color detection technique
CN101930533B (zh) * 2009-06-19 2013-11-13 株式会社理光 在图像采集设备中进行天空检测的装置和方法
US20100322513A1 (en) * 2009-06-19 2010-12-23 Sharp Laboratories Of America, Inc. Skin and sky color detection and enhancement system
US8854395B2 (en) * 2009-07-30 2014-10-07 Intellectual Ventures Fund 83 Llc Method for producing artistic image template designs
US8274523B2 (en) 2009-07-30 2012-09-25 Eastman Kodak Company Processing digital templates for image display
US20110029914A1 (en) 2009-07-30 2011-02-03 Whitby Laura R Apparatus for generating artistic image template designs
US8422794B2 (en) 2009-07-30 2013-04-16 Intellectual Ventures Fund 83 Llc System for matching artistic attributes of secondary image and template to a primary image
US20110029562A1 (en) * 2009-07-30 2011-02-03 Whitby Laura R Coordinating user images in an artistic design
US20110029635A1 (en) * 2009-07-30 2011-02-03 Shkurko Eugene I Image capture device with artistic template design
US20110029860A1 (en) * 2009-07-30 2011-02-03 Ptucha Raymond W Artistic digital template for image display
US8538986B2 (en) * 2009-07-30 2013-09-17 Intellectual Ventures Fund 83 Llc System for coordinating user images in an artistic design
US8849853B2 (en) * 2009-07-30 2014-09-30 Intellectual Ventures Fund 83 Llc Method for matching artistic attributes of a template and secondary images to a primary image
US8503767B2 (en) * 2009-09-16 2013-08-06 Microsoft Corporation Textual attribute-based image categorization and search
CN102982336B (zh) * 2011-09-02 2015-11-25 株式会社理光 识别模型生成方法和系统
US9152860B2 (en) * 2013-05-10 2015-10-06 Tantrum Street LLC Methods and apparatus for capturing, processing, training, and detecting patterns using pattern recognition classifiers
US10319035B2 (en) 2013-10-11 2019-06-11 Ccc Information Services Image capturing and automatic labeling system
US9510196B2 (en) 2014-03-17 2016-11-29 Qualcomm Incorporated Method and apparatus for authenticating a user on a mobile device
US11743402B2 (en) 2015-02-13 2023-08-29 Awes.Me, Inc. System and method for photo subject display optimization
JP2016151955A (ja) * 2015-02-18 2016-08-22 キヤノン株式会社 画像処理装置、撮像装置、距離計測装置、および画像処理方法
CN105528575B (zh) * 2015-11-18 2019-03-19 首都师范大学 基于上下文推理的天空检测方法
US9858675B2 (en) * 2016-02-11 2018-01-02 Adobe Systems Incorporated Object segmentation, including sky segmentation
CN106954022B (zh) * 2017-03-08 2019-10-25 Oppo广东移动通信有限公司 图像处理方法、装置及终端
WO2019144287A1 (en) * 2018-01-23 2019-08-01 SZ DJI Technology Co., Ltd. Systems and methods for automatic water surface and sky detection
US11049224B2 (en) * 2018-12-05 2021-06-29 Microsoft Technology Licensing, Llc Automated real-time high dynamic range content review system
WO2023179296A1 (en) * 2022-03-24 2023-09-28 The University Of Hong Kong System and methods for quantifying and calculating window view openness indexes

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099699A (ja) * 1998-09-24 2000-04-07 Dainippon Screen Mfg Co Ltd 画像色処理装置、画像色処理方法および記録媒体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5093869A (en) * 1990-12-26 1992-03-03 Hughes Aircraft Company Pattern recognition apparatus utilizing area linking and region growth techniques
US5889578A (en) * 1993-10-26 1999-03-30 Eastman Kodak Company Method and apparatus for using film scanning information to determine the type and category of an image
US5642443A (en) * 1994-10-12 1997-06-24 Eastman Kodak Company Whole order orientation method and apparatus
US5901245A (en) * 1997-01-23 1999-05-04 Eastman Kodak Company Method and system for detection and characterization of open space in digital images
US6505951B1 (en) * 1999-10-08 2003-01-14 Mauricio H. Lorenzo, Jr. Wall-mountable, battery-operated light-emitting device
US6504951B1 (en) * 1999-11-29 2003-01-07 Eastman Kodak Company Method for detecting sky in images
US6512846B1 (en) * 1999-11-29 2003-01-28 Eastman Kodak Company Determining orientation of images containing blue sky
AUPQ921800A0 (en) * 2000-08-04 2000-08-31 Canon Kabushiki Kaisha A method for automatic segmentation of image data from multiple data sources
US7194134B2 (en) * 2001-01-02 2007-03-20 Microsoft Corporation Hierarchical, probabilistic, localized, semantic image classifier
US6903782B2 (en) * 2001-03-28 2005-06-07 Koninklijke Philips Electronics N.V. System and method for performing segmentation-based enhancements of a video image
US7092573B2 (en) 2001-12-10 2006-08-15 Eastman Kodak Company Method and system for selectively applying enhancement to an image
TWI281126B (en) * 2002-03-19 2007-05-11 Intervideo Digital Technology Image detection method based on region

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099699A (ja) * 1998-09-24 2000-04-07 Dainippon Screen Mfg Co Ltd 画像色処理装置、画像色処理方法および記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015108947A (ja) * 2013-12-04 2015-06-11 キヤノン株式会社 画像処理装置、その制御方法、および制御プログラム
JP2021528784A (ja) * 2018-07-03 2021-10-21 影石創新科技股▲ふん▼有限公司Arashi Vision Inc. パノラマ画像のスカイフィルタ方法及び携帯端末
JP7247236B2 (ja) 2018-07-03 2023-03-28 影石創新科技股▲ふん▼有限公司 パノラマ画像のスカイフィルタ方法及び携帯端末
US11887362B2 (en) 2018-07-03 2024-01-30 Arashi Vision Inc. Sky filter method for panoramic images and portable terminal

Also Published As

Publication number Publication date
DE602004024233D1 (de) 2009-12-31
WO2005066896A3 (en) 2005-10-27
EP1700269A2 (en) 2006-09-13
US7336819B2 (en) 2008-02-26
WO2005066896A2 (en) 2005-07-21
US20050147298A1 (en) 2005-07-07
EP1700269B1 (en) 2009-11-18
JP4559437B2 (ja) 2010-10-06

Similar Documents

Publication Publication Date Title
JP4559437B2 (ja) デジタルカラー画像における空の検出
CN110119728B (zh) 基于多尺度融合语义分割网络的遥感图像云检测方法
JP4477222B2 (ja) 画像中の空を検出する方法
US6985631B2 (en) Systems and methods for automatically detecting a corner in a digitally captured image
CN109684922B (zh) 一种基于卷积神经网络的多模型对成品菜的识别方法
JP6403261B2 (ja) 分類器生成装置、外観検査装置、分類器生成方法、及びプログラム
JP5458905B2 (ja) 画像におけるシャドーの検知装置および検知方法
JP4857287B2 (ja) 画像内の照明光を識別する方法、システム、ならびにコンピュータプログラムを記録した記録媒体
JP5202148B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP4477221B2 (ja) 青い空を含む画像の向きを決定する方法
US6263113B1 (en) Method for detecting a face in a digital image
US20040114829A1 (en) Method and system for detecting and correcting defects in a digital image
JP5556262B2 (ja) 画像属性判別装置、属性判別支援装置、画像属性判別方法、属性判別支援装置の制御方法、および、制御プログラム
Luo et al. A physical model-based approach to detecting sky in photographic images
US20040264741A1 (en) Region detecting method and region detecting apparatus
KR100957716B1 (ko) 가변 피부색 모델을 이용한 피부색 영역 검출 방법
CN108446707B (zh) 基于关键点筛选及dpm确认的遥感图像飞机检测方法
JPH1153525A (ja) 顔器官検出装置及び媒体
US20090257662A1 (en) System and method for image and video search, indexing and object classification
JP2006127024A (ja) 領域分割方法及び装置、画像認識処理装置、プログラム、記録媒体
CN116310826B (zh) 一种基于图神经网络的高分遥感影像林地二级分类方法
JP2004538555A (ja) デジタル画像を分類する方法
CN111444816A (zh) 一种基于Faster RCNN的多尺度密集行人检测方法
JPH11306325A (ja) 対象物検出装置及び対象物検出方法
TWI417796B (zh) Method of recognizing objects in images

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100706

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100722

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees