JP5645842B2 - スケールスペースを使用した画像処理装置及び方法 - Google Patents

スケールスペースを使用した画像処理装置及び方法 Download PDF

Info

Publication number
JP5645842B2
JP5645842B2 JP2011540232A JP2011540232A JP5645842B2 JP 5645842 B2 JP5645842 B2 JP 5645842B2 JP 2011540232 A JP2011540232 A JP 2011540232A JP 2011540232 A JP2011540232 A JP 2011540232A JP 5645842 B2 JP5645842 B2 JP 5645842B2
Authority
JP
Japan
Prior art keywords
image
scale space
code
label
boundary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011540232A
Other languages
English (en)
Other versions
JP2012511760A (ja
Inventor
トーマス エフ. エル−マラギ、
トーマス エフ. エル−マラギ、
リチャード ジェイ. ジェシュテック、
リチャード ジェイ. ジェシュテック、
ディミトリオス アンドルートソス、
ディミトリオス アンドルートソス、
レイモンド ファン、
レイモンド ファン、
サミュエル チョウ、
サミュエル チョウ、
Original Assignee
アイマックス コーポレイション
アイマックス コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アイマックス コーポレイション, アイマックス コーポレイション filed Critical アイマックス コーポレイション
Publication of JP2012511760A publication Critical patent/JP2012511760A/ja
Application granted granted Critical
Publication of JP5645842B2 publication Critical patent/JP5645842B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/155Segmentation; Edge detection involving morphological operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20101Interactive definition of point of interest, landmark or seed

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本開示は一般に画像処理に関し、詳しくは当該画像のスケールスペース表現を使用した画像処理に関する。
関連出願の相互参照
本願は、2008年12月11日に出願された「ロトスコープのためのスケールスペースランダムウォーク」という名称の米国仮特許出願第61/201,531号の優先権を主張する。このすべての内容が本明細書に参照として組み込まれる。
動画等の画像処理は一以上のフレームにおけるオブジェクトの特定を含み得る。オブジェクトは、オブジェクト境界を決定することによって特定される。オブジェクト境界は、ロトスコープを使用して特定することができる。ロトスコープは、動画におけるオブジェクトの境界をデジタル手段を介してフレームごとにトレースすることを含む。ロトスコープは、特殊効果及び他の画像処理を当該画像に適用できるようにするべくデジタルマット(digital mattes)を抽出することができる。特殊効果の例は、一シーンのオブジェクトをコンピュータによって生成された他のオブジェクトに置換すること、一シーンから他シーンへ俳優を合成すること、及び2次元(2D)動画を3次元(3D)動画に変えることを含む。他の画像処理の例は、一の画像シーケンスにおいて一のオブジェクトをトラッキングすること、及び一の左・右目画像シーケンスにおいて一のオブジェクトをトラッキングすることを含む。
ロトスコープは、ブルースクリーン法のような他の技術では許容可能精度範囲内のマット(matte)を生成できない場合に使用することができる。例えば、画像はアーカイブ映像を使用する画像のような複雑な背景を含むことがある。この場合、ブルースクリーン法は許容可能な結果を生成することができない。ロトスコープは労働集約的であり得る。効率化を目的として半自動ロトスコープ技術を使用することができる。かかる技術は、輪郭ベースの方法及びアルファチャンネルアルゴリズムを含む。
輪郭ベースの方法は、一以上のフレームで一輪郭をできる限り正確に特定するユーザを含み得る。当該輪郭は、オブジェクト境界の概算である。エネルギー関数が評価され、アクティブな輪郭が当該概算輪郭に基づいて当該境界に関連付けられる。エネルギー関数は反復によって最小化される。当該オブジェクトまわりの最適な輪郭が生成される。いくつかの輪郭ベースの方法では、ストロークマッチングが行われる。これは、複数のキーフレーム間でどのストロークがオブジェクトの所定輪郭とマッチするかを決定するべくコスト関数を分析することを含む。当該アルゴリズムは、相対的に滑らかな輪郭を出力することができる。また、隣接する複数のフレームでの輪郭間の対応を確立することができる。しかしながら、多くの場合、熟練したユーザが対象オブジェクトを描く必要がある。
アルファチャンネルアルゴリズムは、色の3領域を分析することによってオブジェクトの軟境界を抽出することができる。当該3領域とは、当該オブジェクトに関する前景、当該オブジェクトに関する背景、及び当該オブジェクトの境界に沿った中間領域での前景と背景とのブレンドである。多くの場合、アルファチャンネルアルゴリズムは個々のフレームに適用される。しかしながら、複数シーケンスへの適用も可能である。
アルファチャンネルアルゴリズムは、軟境界だけではなく当該値のアルファ値すなわち透過度も抽出することができる。いくつかのアルファチャンネルアルゴリズムでは、ベイジアンアプローチが適用される。これは、前景及び背景双方の色分布をガウス分布の空間変化集合によってモデル化する。また、最終出力を生成するべく前景色及び背景色を部分的にブレンドすることを仮定する。他のアルファチャンネルアルゴリズムは、クリーンな前景色が一組のクラスタの線形結合であることを仮定して、当該色及びアルファ値を、当該前景及び当該背景における複数対のクラスタを調べることによって計算する。
さらなる他のアルファチャンネルアルゴリズムは:(i)当該クラスタが、赤緑青(RGB)カラースペースにおいて偏長すなわち葉巻型であると仮定することによって、高解像度画像及び画像シーケンスのアルファマットを推定すること;(ii)前景色及び背景色について局所的な滑らかさを仮定することから費用関数を導出し、前景色及び背景色を分析的に削除することによってアルファに関する2次費用関数を得ること;(iii)一画像の当該アルファ値に対する勾配に関する偏微分方程式を導出し、当該方程式の解として当該アルファ値を与える効率的アルゴリズムを記述すること;(iv)自然画像マッティングの問題を、当該マット勾配場を有するポアソン方程式の解法の一つとして定立し、フラッシュ/非フラッシュ画像対を使用してマットを抽出すること(「フラッシュマッティング」と称する);(v)特殊な較正を必要とせずに「オンザフライ」で環境マット構築を与えること;(vi)前景オブジェクト及びアルファマットキャプチャすることに加えて当該オブジェクトがどのように光を屈折及び反射させるかという記述をキャプチャすることによって、及び、環境合成を使用して該前景オブジェクトを新たな環境に配置することによって環境マッティングを行うこと、の一以上を行うことができる。しかしながら、かかるアルファチャンネルアルゴリズムは、ハードセグメンテーションを生成することなくソフトセグメンテーションを生成しようとする。ハードセグメンテーションによれば、正確なセグメンテーションが得られる。
他のロトスコープ技術はランダムウォークである。ランダムウォークは、グラフィカル画像セグメンテーションアルゴリズムである。これは、所定「シード」画素から開始して所定「シンク」画素まで移動するランダムウォーカが、特定の画素と交差する確率を特定しようと試みる。所定基準によれば類似とみなされる複数画素が低いエッジ重みを有するべく画素間のエッジを重み付きとして、当該ウォーカが当該エッジを交差する尤度を高くすることができる。確率は、組み合わせディリクレ問題(combinatorial Dirichlet problem)の解法として決定することができる。ランダムウォークはまた、カラースペースを変換するべく局所保存射影も使用する。これにより、ゆっくり変化する勾配の色のような類似色を一緒にもたらすことができ、非類似色を別個に移動させることができる。しかしながら、ランダムウォークは、ノイズ存在下では画像を明確にセグメント化することができない。その結果、不正確なオブジェクト境界特定となる。
したがって、オブジェクトの境界を効率的かつ正確に特定することができる方法、装置、及びシステムが望まれている。ハードセグメンテーションを生成することができてノイズ存在下でもオブジェクト境界を正確に特定することができる方法、装置、及びシステムも望まれている。
米国特許第6366692(B1)号明細書 欧州特許出願公開第1865460(A1)号明細書 米国特許出願公開第2005/0232488(A1)号明細書 国際公開第99/19828(A2)号明細書 欧州特許出願公開第2003612(A9)号明細書 米国特許出願公開第2009/0324087号明細書
Hong et al., Compact region extraction using weighted pixel linking in a pyramid, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-6, No. 2, pp. 222-229, March 1984 Burt et al., The Laplacian pyramid as a compact image code, IEEE Transactions on Communications, Vol. COM-31, No. 4, April 1983 Changxian et al., Morphological thinning based on image's edges, International Conference on Communication Technology, ICCT'98, pp. SI6-14-1 to SI6-14-5, Oct. 22-24, 1998 Dyer, Multiscale image understanding, Computer Sciences Technical Report #679, December 1986
所定の側面及び実施例が関連するのは、一画像から複数のスケールスペース画像を生成することと、当該スケールスペース画像を使用して当該一画像におけるオブジェクトの境界を特定することとによる画像処理である。スケールスペース画像は、一画像の多重解像度信号表現である。スケールスペース画像は、当該一画像の様々な詳細レベルを表す。オブジェクト境界が特定された画像は、エキシビションの前にさらに処理することができる。例えば、当該画像は動画の2次元画像である。オブジェクト境界を特定することができる。また、当該特定されたオブジェクト境界を使用して2次元(2D)画像を処理し、当該2D画像を3次元(3D)画像に変換することができる。
一実施例では、少なくとも一のオブジェクトを有する一画像が受け取られる。計算装置は、当該一画像から2以上のスケールスペース画像を生成することができる。スケールスペース画像は、ポテンシャルマップを決定するべく使用することができる。ポテンシャルマップは、一画素が当該オブジェクトの一境界内に存在するか又は当該オブジェクトの当該境界外に存在するかの尤度を表すことができる。ポテンシャルマップは、当該オブジェクトの当該境界を特定するべく使用することができる。
いくつかの実施例では、画像はカラーモデルに変換される。カラーモデルは、CIE Lカラースペースであり得る。
いくつかの実施例では、当該画像を2以上のローパスフィルタを使用して一のスケールスペースに変換することによって、スケールスペースが当該画像から生成される。ローパスフィルタはガウシアン(Gaussian)カーネルを含み得る。詳細レベルの差異は、ぼかし度の差異を含み得る。
いくつかの実施例では、(i)2以上のウェーブレットフィルタ又は(ii)エッジ保存分解処理の一を使用して当該画像をスケールスペース変換することによって、スケールスペース画像が当該画像から生成される。
いくつかの実施例では、当該画像の各画素に対して重みを決定するべくスケールスペース画像を使用することができる。各重みは一のリンクに関連付けることができる。当該複数の重みは、当該画素に関連付けられた複数のリンクを決定することによって決定することができる。当該画素に関連付けられた各リンクに対する重みを決定することができる。当該画素に対する複数の重みを形成するべく各リンクに対する重みを集めることができる。
各実施例では、当該画像に対する一のラベルが受け取られる。当該重みから及び当該ラベルを使用して、複数のポテンシャル値を決定することができる。各ポテンシャル値は、関連付けられた一画素が当該オブジェクトの一境界内に存在するか又は当該オブジェクトの当該境界外に存在するかの尤度を表すことができる。ポテンシャルマップは、当該複数のポテンシャル値の幾何平均を決定することによって当該ポテンシャル値から決定することができる。ポテンシャルマップは、当該ポテンシャル値に対する幾何平均を含み得る。
いくつかの実施例では、一のラベルを生成することができる。また、当該ポテンシャルマップを決定するべく一のラベルを使用することができる。当該画像のためのオブジェクトマスクが受け取られる。当該画像のためのオブジェクトマスクから反転オブジェクトマスクが計算される。当該反転オブジェクトマスクから第1距離変換が決定される。当該オブジェクトマスクから第2距離変換が決定される。第1距離変換を使用して当該画像内の前景画素が特定される。第2距離変換を使用して当該画像内の背景画素が特定される。当該特定された前景画素及び当該特定された背景画素に基づいてラベルが生成される。
いくつかの実施例では、初期ポテンシャルマップからラベルが生成される。当該画像のためのオブジェクトマスクが受け取られる。当該画像のためのオブジェクトマスクから反転オブジェクトマスクが計算される。当該反転オブジェクトマスクは、モルフォロジ細線化処理を使用して収縮される。当該画像のためのオブジェクトマスクも、当該モルフォロジ細線化処理を使用して収縮される。当該画像のための収縮された反転オブジェクトマスク及び収縮されたオブジェクトマスクに基づいて初期ラベルが生成される。当該初期ラベルを使用して当該画像のための初期ポテンシャルマップが決定される。当該初期ポテンシャルマップ、収縮された反転オブジェクトマスク、及び収縮されたオブジェクトマスクを使用してラベルが生成される。
いくつかの実施例では、一の画像マスクを生成するべくポテンシャルマップが使用される。当該オブジェクトの一の推定境界を特定する2以上のキーポイントが受け取られる。当該キーポイントに基づいて一のラベルが計算される。当該ラベルに基づいて一の画像セグメントがクロップされる。当該画像セグメントから一のポテンシャルマップが決定される。当該ポテンシャルマップから複数の境界ポイントが生成される。当該境界ポイントを許容不可能として特定するコマンドが受け取られると、複数の新たなキーポイントを使用して第2ポテンシャルマップが計算される。当該境界ポイントを許容可能として特定するコマンドが受け取られると、当該境界ポイントが出力される。当該境界ポイントを使用して画像マスクを生成することができる。
いくつかの実施例では、当該キーポイントの数よりも当該新なたキーポイントの数の方が大きい。さらに、当該キーポイントはいくつかの実施例において、2以上の画像フレームにおける当該オブジェクトの推定境界を特定する。当該境界ポイントは、当該2以上の画像フレーム間に配置された一以上の画像フレームにおける当該オブジェクトの推定境界の一部を特定する。
いくつかの実施例では、複数のキーポイントが2以上の画像フレームにおける当該オブジェクトの推定境界を特定する。新たな複数ポイントの第1組が、当該2以上の画像フレーム間に配置された少なくとも一の画像フレームにおける当該オブジェクトの推定境界の当該一部を特定する。
いくつかの実施例では、コンピュータ可読媒体に格納されたプログラムコードによってポテンシャルマップを決定することができる。
いくつかの実施例では、コンピュータ可読媒体に格納されたスケールスペースエンジンによってポテンシャルマップを決定し、計算装置のプロセッサによってポテンシャルマップを実行することができる。
これらの説明上の実施例は、その理解を補助するための例を与えるべく記載されるものであって、本開示を限定又は定義するべく記載されるものではない。付加的な実施例が詳細な説明に述べられ、さらなる説明が与えられる。様々な実施例の一以上がもたらす利点が、本明細書を精査することにより又は提示される一以上の実施例を実施することによりさらに理解される。
本発明の一実施例に係る一画像を処理するべく使用することができる一のポテンシャルマップを生成するシステムのブロック図である。 本発明の一実施例に係る一画像を処理するための一のポテンシャルマップを生成する方法のフロー図である。 本発明の第2実施例に係る一画像を処理するための一のポテンシャルマップを生成する方法のフロー図である。 本発明の一実施例に係る複数のスケールスペース画像に基づく一画像の一画素に対するグラフの説明である。 本発明の一実施例に係る一のオブジェクトマスクに基づいて一画像から一ラベルを決定する方法のフロー図である。 本発明の第2実施例に係る一のオブジェクトマスクに基づいて一画像から一ラベルを決定する方法のフロー図である。 図7A−7Dは、本発明の一実施例に係る一画像における一のオブジェクトの一境界を決定することの説明である。 本発明の一実施例に係る一のポテンシャルマップを使用して複数のキーポイントに基づく複数のオブジェクト境界ポイントを決定する方法のフロー図である。
所定の側面及び実施例が、一画像からスケールスペース画像を生成することによる画像処理、及び当該スケールスペース画像を使用して当該画像の複数オブジェクトの境界を特定することに関連する。スケールスペース画像は、様々な詳細レベルを有する。特定された複数のオブジェクト境界を有する一画像は、エキシビションの前にさらに処理することができる。例えば、当該画像は一動画の2次元画像であり得る。複数のオブジェクト境界を特定することができ、かつ、当該2次元(2D)画像は、当該特定オブジェクト境界を使用して当該2D画像から3次元(3D)画像へ変換するべく処理することができる。
複数のスケールスペース画像は、一画像の一多重解像度信号表現である。複数のスケールスペース画像は、当該画像をフィルタリングすることによって形成することができる。例えば異なるフィルタカーネルサイズのような様々な特性のフィルタが使用される。様々な特性のフィルタを使用して形成されたスケールスペース画像は、様々な詳細レベルを有し得る。いくつかの実施例では、複数のスケールスペース画像が、異なるサイズを有するガウシアンカーネルによる一画像のたたみ込みによって形成される。複数のスケールスペース画像は複数のレベルに対応することができる。例えば、一スケールスペース画像が、当該画像の一詳細レベルを表すレベルに対応し得る。
いくつかの実施例では、複数のスケールスペース画像が、当該画像を複数回フィルタリングすることによって形成される。異なるサイズのフィルタリングコンポーネントが使用されて、当該画像の「ファインな(fine)」詳細に関連する情報が除去される。当該フィルタリングコンポーネントは、漸次的に大きなサイズを有する複数のローパスフィルタカーネルであり得る。大サイズカーネルフィルタを使用して生成されたスケールスペース画像は、低詳細レベルを含む高レベルスケールスペース画像となり得る。小サイズカーネルフィルタを使用して生成されたスケールスペース画像は、高詳細レベルを含む低レベルスケールスペース画像となる。一実施例では、当該フィルターカーネルは、等長ガウシアンローパスフィルタカーネルであり。これで得られるスケールスペース画像はぼかしを含む様々な特性を有する。
いくつかの実施例では、当該スケールスペース画像は、各画素に対して一の3次元グラフを計算するべく使用することができる。当該画素は、所定数のスケールスペース画像の隣接画素にリンクさせることができる。当該画素と一隣接画素との間の一のリンクには一の重みを関連付けることができる。当該重みの値は、当該画素同士の類似性によって決定することができる。
当該スケールスペース画像は、当該画像のために一のポテンシャルマップを決定するべく使用することができる。例えば、当該3次元グラフを使用して一のポテンシャルマップを計算することができる。一のポテンシャルマップは、当該画像の各画素又は当該画像の一部に対し、当該画素が一のオブジェクトの境界内に存在するか又は当該オブジェクトの境界外に存在するかの尤度を表す一のポテンシャル値を含み得る。当該ポテンシャルマップは、当該画像の処理に使用することができる。例えば、ポテンシャルマップは、一の画像オブジェクトに対して一境界を特定するべく使用することができる。これにより、当該オブジェクトは、とりわけ3Dエキシビションを目的として修正することができる。
いくつかの実施例では、ポテンシャルマップの計算を容易にするべく当該画像のための一のラベルを受け取ることができる。一のラベルによって、一のオブジェクトの複数の境界画素の候補となり得る複数の画像画素を特定することができる。一のラベルを一の境界許容範囲に関連付けることができる。これにより、真のオブジェクト境界画素が当該ラベル内に含まれることが保証される。一のラベルを、曖昧な境界画素情報に基づいて計算することができる。いくつかの実施例では、一のラベルがインタラクティブな手段を使用して人間のオペレータから受け取ることができる。一のラベルの一例は、一のオブジェクトの境界のまわりに引き寄せられて当該境界を包含する一のトライマップである。一のトライマップは、複数の画像画素を3グループに分割する。当該オブジェクトに属する画素(前景)、当該オブジェクトの外側にある画素(背景)、及び、当該前景と当該背景との間にある画素であって、オブジェクト境界画素であり得るが未決定の画素である。当該ラベルを使用して一のポテンシャルマップを計算することができる。
いくつかの実施例では、一のランダムウォークアルゴリズムを複数のスケールスペース画像に適用することによって当該ポテンシャルマップを計算することができる。得られるポテンシャルマップは、一のオブジェクト境界を特定するべく使用される。当該ポテンシャルマップは、ノイズ存在下でのオブジェクト境界特定を向上させるべく、ランダムウォークアルゴリズムとともに使用することができる。
これらの説明上の例は、ここで述べる一般的な論旨を読者に紹介するべく与えられる。開示の概念範囲を制限することを意図していない。以下の節では、図面を参照して様々な付加的な実施例及び例が記載される。図面において、同じ番号は同じ要素を示す。
説明上のシステム実装
図1は、所定実施例に係る一システムを示す。当該システムは、当該画像から生成された複数のスケールスペース画像を使用して一のポテンシャルマップを決定することができ、かつ、当該画像を処理するべく当該ポテンシャルマップを使用することができる。複数の他実施例も利用される。当該システムは、プロセッサ104を有する計算装置102を含む。プロセッサ104は、メモリ106のようなコンピュータ可読媒体に格納されたコードを実行する。当該実行により、計算装置102は、当該画像から生成されたスケールスペース画像を使用してポテンシャルマップを決定する。計算装置102は、データを処理することができ、及び、複数のアクションを行う一組の命令であるコードを実行することができる任意の装置である。計算装置102の例は、デスクトップパーソナルコンピュータ、ラップトップパーソナルコンピュータ、サーバ装置、ハンドヘルド計算装置、及びモバイル装置を含む。
プロセッサ104の例は、マイクロプロセッサ、特定用途向け集積回路(ASIC)、状態機械、又は適切な他のプロセッサを含む。プロセッサ104は、一又は任意数のプロセッサを含む。いくつかの実施例では、プロセッサ104は、1GB以下のVRAMを有するハイエンドグラフィックスカードに関連付けられたグラフィックプロセシングユニット(GPU)を含む。他実施例では、プロセッサ104は、2、4、又はこれ以上のプロセシングユニットを含むマルチコアプロセッサである。マルチコアプロセッサは、単一命令多重データ(SIMD)互換性を含む。例えば、ストリーミングSIMD拡張(SSE)及び3DNow!(登録商標)である。SIMD拡張及びプロセッサの能力を有利に使用するべくLAPACKのような線形代数パッケージを使用することができる。
プロセッサ104は、メモリ106に格納されたコードにバス108を介してアクセスすることができる。メモリ106は、コードを格納することができる任意の有体コンピュータ可読媒体である。メモリ106は、実行可能コードをプロセッサ104に与えることができる電子、磁気、又は光装置を含む。メモリ106の例は、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、フロッピー(登録商標)ディスク、コンパクトディスク、デジタルビデオ装置、磁気ディスク、ASIC、コンフィギュアドプロセッサ、又は、コードを有体的に包含する他の格納装置を含む。バス108は、計算装置102の複数のコンポーネント間でデータを送信することができる任意の装置である。バス108は、一又は複数の装置を含むことができる。
計算装置102は、入出力(I/O)インターフェイス110を介して付加的なコンポーネントとデータを共有することができる。I/Oインターフェイス110は、USBポート、イーサネット(登録商標)ポート、シリアルバスインターフェイス、パラレルバスインターフェイス、ワイヤレス接続インターフェイス、又は、計算装置と他のコンポーネントとの間でデータ送信を可能にできる適切な任意のインターフェイスを含む。付加的なコンポーネントは、ユーザインターフェイス(UI)装置112、ディスプレイ114、及びネットワーク116を含むことができる。UI装置112は、キーボード、マウス装置、タッチスクリーンインターフェイス、又は、ユーザからコマンドを受け取り当該コマンドを計算装置102に与えることができる他の装置を含むことができる。ディスプレイ114は、液晶ディスプレイ(LCD)、プラズマスクリーン、陰極管(CRT)、又は、計算装置102が生成した複数の画像を表示することができる任意の装置を含むことができる。ネットワーク116は、インターネット、イントラネット、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、仮想プライベートネットワーク(VPN)、又は、計算装置102に他の複数のコンポーネントと通信させるのに適切な任意の通信ネットワークを含むことができる。他実施例では、計算装置102は、本発明の様々な実施例に係る様々な方法をオフラインの態様で行うことができるオフライン装置である。
複数の命令を実行可能コードとしてメモリ106に格納できる。当該命令は、任意の適切なコンピュータプログラミング言語で書かれたコードからコンパイラ及び/又はインタープリタにより生成される特定プロセッサ向け命令を含むことができる。当該コンピュータプログラミング言語は例えば、C、C++、C#、ビジュアルベーシック、Java(登録商標)、Python、Perl、JavaScript(登録商標)、及びActionScriptである。当該命令は、画像処理アプリケーション118を含む。画像処理アプリケーション118は、プロセッサ104によって実行されると計算装置102に、当該画像から生成された複数のスケールスペース画像を使用して一のポテンシャルマップを決定させ、及び、当該ポテンシャルマップを使用して当該画像を処理させる。画像処理アプリケーション118はスケールスペースエンジン120を含む。スケールスペースエンジン120は、画像処理アプリケーション118がプロセッサ104によって実行されると、計算装置102に当該画像からスケールスペース画像を生成させる。当該スケールスペース画像からポテンシャルマップが決定され、及び、当該ポテンシャルマップを使用して当該画像が処理される。
この例示のシステム設定は、所定実施例を実装するべく使用することができる潜在的設定を単に説明するために与えられる。もちろん、他の複数の設定も利用することができる。
ポテンシャルマップを生成する例示的方法
複数の画像を処理すべく使用される複数のポテンシャルマップを、本発明の様々な実施例に係る様々な方法を使用して生成することができる。図2は、複数のスケールスペース画像から一のポテンシャルマップを生成する方法の一実施例を示す。図2に示す方法は、図1のシステム設定を参照して記載される。しかしながら、他の複数のシステム実装も可能である。
ブロック202では、画像処理アプリケーション118が一画像を受け取る。当該画像は例えば、一のシーケンスの複数画像である動画の一画像である。いくつかの実施例では、当該画像は一以上のオブジェクトを含む。オブジェクトは、当該画像内で視覚的に表される有体アイテムである。当該画像は、一のRGB(赤緑青)画像であるか、又は、例えばYUV、XYX、若しくはCIE Lカラースペースのような異なるカラースペースにある。
ブロック204では、スケールスペースエンジン120が、当該画像とは異なる詳細レベルを有する複数のスケールスペース画像を生成する。各スケールスペース画像は、生成された他の複数のスケールスペース画像とは異なる詳細レベルを有し得る。スケールスペースエンジン120は、様々な方法を使用して複数のスケールスペース画像を生成することができる。他の方法は、当該画像をフィルタリングするべく異なるカーネルサイズを有する複数のフィルタを使用することを含む。各フィルタは、所定の一詳細レベルを有する一のスケールスペース画像を生成することができる。当該スケールスペース画像は、異なるサイズの複数のフィルタによって生成された他のスケールスペース画像とは異なる。当該フィルタは、ソフトウェアとして実装される。例えば、スケールスペースエンジン120の一部として実装される。他実施例では、当該フィルタは、スケールスペースエンジン120がアクセス又は制御するハードウェアに実装される。
いくつかの実施例では、スケールスペースエンジン120が当該画像をスケールスペースに変換した後に複数のスケールスペースイメージが生成される。例えば複数のウェーブレットフィルタ又は一のエッジ保存分解処理を使用して、一画像をスケールスペースに変換することができる。
ブロック206では、スケールスペースエンジン120は、当該画像のための一のポテンシャルマップを決定するべく当該複数のスケールスペース画像を使用する。一のポテンシャルマップは、当該画像の全画素又は一部の画素に関連付けられた複数のポテンシャル値を含み得る。例えば、一のポテンシャル値は、当該画像の一画素に関連付けることができる。当該ポテンシャル値は、当該関連付けられた画素が当該画像内の一のオブジェクトの一境界内に存在するか又は当該オブジェクトの当該境界外に存在するかの尤度を表すことができる。いくつかの実施例では、一画素に対して一のポテンシャル値が決定される。これは、当該画素と複数の隣接画素との複数のリンクに関連付けられた複数の重みに基づく。当該リンク及び関連付けられた重みは、当該スケールスペース画像を使用して特定可能かつ決定可能である。
ブロック208では、画像処理アプリケーション118が当該ポテンシャルマップを使用して当該画像を処理する。例えば、当該画像処理アプリケーションは、当該ポテンシャルマップを使用して当該画像のための一の画像マスクを生成することができる。当該画像マスクは、当該画像内の複数のオブジェクトを特定するべく使用することができる。いくつかの実施例では、当該画像内のオブジェクトの位置は、当該ポテンシャルマップを使用して当該オブジェクト境界を特定した後に修正することができる。
図3は、複数画像の処理での使用を目的とした複数のポテンシャルマップを生成する一方法の他実施例を示す。図3の方法は、図1のシステム及び図4のグラフィカルな説明を参照して記載される。しかしながら、他の複数の実装も可能である。
ブロック302では、画像処理アプリケーション118が、少なくとも一のオブジェクトを含む一画像を受け取る。画像処理アプリケーション118は、図2のブロック202のように当該画像を受け取ることができる。
ブロック304では、スケールスペースエンジン120が当該画像を一のカラーモデルに変換する。一のカラーモデルへの変換によってスケールスペースエンジン120は、当該画像の複数色を容易に判別できる。いくつかの実施例では、当該画像は一のRGB画像である。当該RGB画像が一のカラーモデルに変換されて、CIE Lカラースペースにある画像となる。
ブロック306では、スケールスペースエンジン120が、当該カラーモデルから少なくとも2のスケールスペース画像を生成する。当該スケールスペース画像は、異なる詳細レベルを有し得る。各スケールスペース画像は、他の複数のスケールスペース画像とは異なる一詳細レベルを有する。複数のスケールスペース画像は、様々な方法を使用して行うことができる。一実施例では、当該画像をフィルタリングして複数のスケールスペース画像を生成するべく、漸次的に大きなサイズを有する複数のガウシアンローパスフィルタ(LPF)カーネルが使用される。複数のガウシアンカーネルを使用することは、特に相対的に大きなサイズの複数フィルタに対して当該画像内に不要なストラクチャが導入されることの防止に役立つ。当該ガウシアンカーネルにより生成されたスケールスペース画像は、異なる量の画像ぼかしを含む異なる詳細レベルを有する。
Nレベルを有するスケールスペースζは、以下のように表すことができる。
Figure 0005645842
ここで、I[x,y]は一の初期画像である。また、
Figure 0005645842
これは、サイズnのガウシアンカーネルである。
スケールスペースζにあるN個のスケールスペース画像から、スケールスペースエンジン120は、一画像の各画素又は当該画像の一部分に対して、3次元グラフを生成することができる。当該グラフは、当該スケールスペース画像の異なるレベルの複数画素間の関係を示すことができる。また、所定レベルの一画素と一隣接画素との間の関係を示すこともできる。
図4は、本発明の一実施例に係る、スケールスペースζから生成されたグラフ402を示す。当該グラフは、複数の異なるレイヤ404a−cを含む。3個のレイヤ404a−cが示されるが、任意数のレイヤが実装可能である。レイヤ404a−cの各レイヤは、当該画像から生成された一のスケールスペース画像に対応する。一のレイヤの各ノードは、一の対応スケールスペース画像内の一画素に対応する。例えば、レイヤ404aは、第1スケールスペース画像に対応し得る。レイヤ404bは第2スケールスペース画像に対応し得る。レイヤ404cは第3スケールスペース画像に対応し得る。
さらに、レイヤ404a−cは、一の高詳細レベルから一の最低詳細レベルまで配列され得る。例えば、レイヤ404aは、第1スケールスペース画像、第2スケールスペース画像、及び第3スケールスペース画像の中で、一のファインな詳細レベルのような最高詳細レベルを有する第1スケールスペース画像に対応し得る。レイヤ404bは、第1スケールスペース画像、第2スケールスペース画像、及び第3スケールスペース画像の中で、一の中程度詳細レベルを有する第2スケールスペース画像に対応し得る。レイヤ404cは、第1スケールスペース画像、第2スケールスペース画像、及び第3スケールスペース画像の中で、コースなレベルとも称される最低詳細レベルを有する第2スケールスペース画像に対応し得る。
図4のグラフ402は、複数画素406を含む一の6接続ストラクチャである。例えば8接続ストラクチャ等のような他のタイプの接続ストラクチャも実装可能である。複数画素406の各画素は一のスケールスペース画像に対応する。また各画素は、同じレイヤ内の4の隣接画素と、高いレイヤ及び低いレイヤからの対応画素とのような、6の対応画素に接続することもできる。接続された画素の各対は、当該接続画素間の一のリンクを有し得る。例えば、リンク410はレイヤ404aの画素408とレイヤ404bの画素406との間に配置される。この配列によれば、各レイヤが他の複数レイヤに影響を与えることができる。これにより、複数の高いレイヤにおいて詳細が保持されるので、複数の低いレイヤにおいてノイズからの影響を制御することができる。
ブロック308では、スケールスペースエンジン120が、当該スケールスペース画像を使用して、当該画像の各画素に対して複数のリンクを決定し、及び各リンクに対する重みを決定する。例えば、図4の各リンクは、一画素と、一隣接画素又は一のポテンシャルマップの他レイヤの一対応画素との接続を表す。当該リンクは複数の重みに関連付けられる。一のリンクに対する一の重みは以下の関係を使用して決定することができる。
Figure 0005645842
ここで、
Figure 0005645842
ブロック310では、スケールスペースエンジン120が複数画素の一のラベルを受け取る。一のラベルが、一画像に対する一オブジェクトの一境界の一推定を表す。いくつかの実施例では、一個人のユーザインターフェイスを介して一のラベルが受け取られる。当該個人は、一オブジェクトの一境界の一推定を特定するべく入力装置を介してコマンドを入力する。他実施例では、スケールスペースエンジン120が一のラベルを受け取るのは、スケールスペースエンジン120が、例えば図5及び6を参照して以下に説明するように、当該ラベルを生成する場合である。当該ラベルは、潜在的に一オブジェクトの一境界となり得る複数画素を特定するべくスケールスペースエンジン120によって使用される。例えば、未決定の複数画素が当該ラベルによって特定された後さらに、当該オブジェクトの当該境界に関連付けられた画素をさらに決定するべく処理される。
ブロック312では、スケールスペースエンジン120が、当該重みから及び当該ラベルを使用して複数のポテンシャル値を決定する。当該ポテンシャル値は、一画素に関連付けることができる。また、当該画素が当該オブジェクトの一境界の内側又は外側に存在する尤度を表すことができる。いくつかの実施例では、当該ラベルは、一のポテンシャル値が決定されることとなる複数画素を特定するべく使用される。一画素に対するポテンシャル値は、以下の関係を使用して決定される。
Figure 0005645842
ここで、
Figure 0005645842
ラプラシアン行列Lは、以下の関係を使用することによって、例えば図4のグラフのような一のグラフの複数の重みGi,jを使用して決定することができる。
Figure 0005645842
重みGi,jは、図4を参照して述べたように決定することができる。
ラプラシアン行列Lは、以下の形式に分解することができる。
Figure 0005645842
ここで、Lは、未決定の複数画素に関連付けられた複数行及び複数列を含むラプラシアン行列の部分行列である。Lは、当該境界画素を含むが当該未決定画素ではない部分行列である。Iは、解に影響を与えないソース画素又はシンク画素として割り当てられる複数画素を表す単位行列である。0は、ゼロのみを含む「ゼロ行列」である。
したがって、以下の関係を使用して複数のポテンシャル値を決定することができる。
Figure 0005645842
当該ポテンシャル値は一のポテンシャルマップを形成し得る。一画素(x,y)に対するポテンシャル値は、P(x,y)として示される。
複数のNレベルスケールスペース画像に基づき当該ポテンシャル値について解いた結果、以下のように表される新たなスケールスペースΠが得られる。
Figure 0005645842
ここで、nは、一のNレベルスケールスペース内の一所定レベルに対する一指標である。P(x,y|n)は、n番目のレベルに対する一のポテンシャルマップである。
ブロック314では、スケールスペースエンジン120が、当該ポテンシャル値から一のポテンシャルマップを決定する。当該ポテンシャル値は、NレベルスケールスペースΠによって表すことができる。
いくつかの実施例では、以下の関係によって表されるように、当該スケールスペースの各レベルにおいて一の幾何平均をとることによって最終ポテンシャルマップP(x,y)が決定される。
Figure 0005645842
いくつかの実施例では、一の幾何平均の代わりに一の算術平均が使用される。しかしながら、当該幾何平均は、一の実際の傾向と比較して不正確な結果となる一の算術平均よりも有効であり得る。いくつかの実施例では、よりファインな複数のスケールスペース画像における詳細結果が保持され、当該コースなスケールスペース画像におけるファジーなエリアが除去される。
さらに、一の幾何平均によって一のポテンシャルマップを得ることができる。当該ポテンシャルマップは、スケールスペースでのレイヤ同士のリンクを介して確立された異なるレベル間の依存性を除去する。
いくつかの実施例では、当該ポテンシャルマップは局所的に滑らかである。例えば、同一又は類似の複数領域は、突然変化することがない一の全体勾配を有する。強いエッジは、突然の勾配変化を含む。当該突然の勾配変化は、かかる強いエッジを特定する補助となり得る。さらに、当該ポテンシャルマップは、当該スケールスペースが高いレベルにある画像において、小さな変動(すなわちノイズ)を除去することができる。
ブロック316では、画像処理アプリケーション118が当該ポテンシャルマップを使用して当該画像のための一の画像マスクを生成することができる。一の画像マスクは、一画像の一表現である。複数の画像オブジェクト境界を特定するべく使用することができる。例えば、当該ポテンシャルマップが使用されて、一のオブジェクトの複数境界画素を特定することができる。一の画像マスクは、当該特定されたオブジェクト境界画素を使用して生成することができる。いくつかの実施例では、スケールスペースエンジン120は、各画素に対する一のデジタル値を決定するべく一のしきい値を使用する。例えば、ポテンシャル値P(x,y)が0.5以上であれば、デジタル値「1」が当該画素に割り当てられる。ポテンシャル値P(x,y)が0.5未満であれば、デジタル値「0」が当該画素に割り当てられる。しきい値0.5は、一画素が前景画素であるか又は背景画素であるかの尤度が同等であることを表す。したがって、0.5超過の確率を有する画素はいずれも前景画素とみなされ、デジタル値「1」によって表される。したがって、0.5未満の確率を有する画素はいずれも背景画素とみなされ、デジタル値「0」によって表される。
ラベルを生成する例示的方法
本発明に係るいくつかの実施例による複数のラベルを、当該画像から生成することができる。例えば、スケールスペースエンジン120は、当該画像のための一のオブジェクトマスクを受け取り、当該オブジェクトマスクを使用して一のラベルを決定する。一のオブジェクトマスクは、一のオブジェクトの境界に関連付けられた複数画素を推定することによる一のオブジェクトの一概算であり得る。これは、境界画素のような曖昧な画素指示を含み得る。スケールスペースエンジン120は一のオブジェクトマスクを受け取ることができる。図5及び6は、ブロック310において一のラベルを、当該ラベルを生成することによって受け取る方法の実施例を示す。一のラベルを生成する実施例は、図1のシステムを参照して記載される。しかしながら、他のシステム実装も可能である。
さらに、図5に示す実施例が、図7A−7Dでの図示を参照して記載される。
ブロック502では、スケールスペースエンジン120が一画像のための一のオブジェクトマスクを受け取る。いくつかの実施例では、当該オブジェクトマスクは、対象オブジェクトよりも大きな画像部分を特定することができる。さらに、一のオブジェクトマスクは、一よりも多くのオブジェクトの輪郭を描くことができる。このためには、当該対象オブジェクトがさらなる処理の前に分離される必要がある。図7Aは、オブジェクト702のための一のオブジェクトマスクの一例を示す。図示のオブジェクト702は、一画像内の一のナシである。当該画像は、白色を使用して表された複数の前景画素と、黒色を使用して表された複数の背景画素とを有する。
ブロック504では、スケールスペースエンジン120が、当該オブジェクトマスクを反転させて一の反転オブジェクトマスクを生成する。一の反転オブジェクトマスクにおいて、背景画素は前景画素となる。逆の場合も同じである。当該オブジェクトマスクは、高い値の画素の値を低く変化させることによって反転することができる。逆の場合も同じである。例えば、図7Aのオブジェクトマスクの反転オブジェクトマスクは、黒色によって指定されて当該オブジェクトを埋め合わせる複数画素と、白色によって指定される他のすべての画素とを含む。
ブロック506では、スケールスペースエンジン120が当該反転オブジェクトマスクに対する一の距離変換を決定する。一の距離変換は、各背景画素に対して、最も近接した境界画素までの距離変換を示す一表現である。図7Bは、オブジェクト702の反転オブジェクトマスクに対する一の距離変換の一例を示す。図7Bでは、オブジェクト702を表す画素が背景画素である。また、一境界画素に最も近い背景画素は、さらに遠くにある当該背景画素よりも暗い。
ブロック508では、スケールスペースエンジン120が当該オブジェクトマスクに対する一の距離変換を決定する。当該オブジェクトマスクに対する一の距離変換は、図7Bの画像の反転のように見える。オブジェクト702を表す画素が前景画素となる。一境界画素に最も近い背景にある画素は、さらに遠くにある当該画素よりも暗い。
ブロック510では、スケールスペースエンジン120が、当該反転オブジェクトマスクに対する距離変換を使用して、当該画像における複数の前景画素を特定する。いくつかの実施例では、当該反転オブジェクトマスクの一画素に対する距離変換の値が、一の境界許容範囲である第1値と比較される。当該画素に対する距離変換の値が、一の境界許容範囲である第1値よりも大きい場合、当該画素は一の前景画素として特定することができる。当該処理は、当該前景画素を特定するべく各画素に対して繰り返される。
ブロック512では、スケールスペースエンジン120が、当該オブジェクトマスクに対する距離変換を使用して、当該画像における複数の背景画素を特定する。当該オブジェクトマスクの一画素に対する距離変換の値が、一の境界許容範囲である第2値と比較され得る。当該画素に対する距離変換の値が、一の境界許容範囲である第2値よりも大きい場合、当該画素は一の背景画素として特定することができる。当該処理は、当該背景画素を特定するべく各画素に対して繰り返される。
ブロック514では、スケールスペースエンジン120が、当該前景画素及び当該背景画素の特定に基づいて一のラベルを生成する。ブロック510において特定された前景画素は、例えば図7Aに示す複数の前景画素の一の部分集合を形成することができる。同様に、ブロック512において特定されて背景画素は、例えば図7Aに示す複数の背景画素の一の部分集合を形成することができる。複数の未決定画素(前景画素又は背景画素として特定されていない複数の画素)が一の未知領域を形成する。スケールスペースエンジン120は当該未知領域を、オブジェクト702のための一のラベルとして特定かつ格納する。図7Cは、オブジェクト702のための一ラベル(黒色で示される)の一例を示す。
許容範囲である第1値及び第2値が、当該ラベルがオブジェクト702の実際の境界を含む程度の大きさとなるように選択される。いくつかの実施例では、第1値及び第2値は当該オブジェクトの境界全体にわたり均一である。他実施例では、第1値及び第2値の一方又は双方が当該オブジェクトの境界全体にわたり均一とはならない。例えば、第1値及び第2値の一方又は双方を変化させることにより、一の変動幅を有する一ラベルを得ることができる。
ブロック516では、スケールスペースエンジン120が当該ラベルを出力する。一のラベルが、対象オブジェクトの境界全体において一の未知領域を画定することができる。一のラベルを使用して、複数の未決定画素のための一のポテンシャルマップを決定することができる。これは、例えば、図3を参照して上述されている。いくつかの実施例では、当該ポテンシャルマップに基づいて一のオブジェクトマスクを生成することができる。当該オブジェクトマスクは、一のオリジナルマスクよりも正確であり得る。いくつかの実施例では、当該ラベルには、当該対象オブジェクトの境界をカバーする帯として当該画像が与えられる。図7Dは、新たなオブジェクトマスクの境界704を有するオブジェクト702を示す。当該新たなオブジェクトマスクは、当該オリジナルマスクの境界706との比較として出力される。当該新たなオブジェクトマスクの境界704は、オブジェクト702の実際の境界を、当該オリジナルマスクの境界706よりも密接に特定する。
いくつかの実施例では、一のオブジェクトマスクから計算される一の初期ラベルから、精度の高いラベルを生成することができる。図6は、一のラベルを生成する一実施例を示す。
ブロック602では、スケールスペースエンジン120が一画像のための一のオブジェクトマスクを受け取る。当該オブジェクトマスクは一画像の一表現である。これは、第1色を有する一のオブジェクトの複数画素(前景画素)と、第2色を有する当該オブジェクト外側の複数画素(背景画素)とを表す。
ブロック604では、スケールスペースエンジン120が当該オブジェクトマスクを反転させる。例えば、当該前景画素を複数の背景画素に反転して第2色で指定することができる。当該背景画素は、第1色を有する複数の前景画素に反転することができる。
ブロック606では、スケールスペースエンジン120が当該反転オブジェクトマスクを収縮させる。反転オブジェクトマスクを収縮させることは、複数のハードな背景制約を決定するべく当該反転オブジェクトマスクをモルフォロジ細線化することを含む。当該背景制約は、当該背景の部分的なスケルトン化を含む。当該ハードな背景制約は、当該マスクにおけるファインな詳細がさらなる処理中に消えることを防止する。いくつかの実施例では、当該ハードな背景制約が複数の背景画素として使用される。
ブロック608では、スケールスペースエンジン120が当該オブジェクトマスクを収縮させる。いくつかの実施例では、当該オブジェクトマスクは、ハードな前景制約を決定するべく当該オブジェクトマスクをモルフォロジ細線化することによって収縮される。当該前景制約は、当該オブジェクトマスクの部分的なスケルトン化を含む。当該ハードな前景制約は、当該マスクにおけるファインな詳細がさらなる処理中に消えることを防止する。当該ハードな前景制約は、複数の前景画素として使用される。
いくつかの実施例では、当該オブジェクトマスクは、細線化の前に当該許容範囲の2倍だけパディング(pad)し、当該許容範囲の2倍だけ細線化し、及びその後当該許容範囲の2倍だけアンパディング(unpad)する。これによりエッジ効果が防止されて、当該未知領域のために複数の制約を計算することが補助される。当該オブジェクトマスク境界の許容範囲内における複数の制約が維持される。
ブロック610では、当該収縮反転マスク及び当該収縮マスクに基づいて、スケールスペースエンジン120が一の初期ラベルを生成する。当該収縮反転マスクは、複数のハードな背景制約によって表される。当該収縮マスクは、複数のハードな前景制約によって表される。当該初期ラベルは、当該オブジェクトマスクのアウトライン及び当該ハードな制約からの、当該画像の未知領域の一推定を表す。いくつかの実施例では、モルフォロジ細線化から得られたハードな制約と当該マスクの境界の一部との組み合わせから、所定の複数前景画素が決定される。この一部は、当該モルフォロジ細線化を介して得られた前景制約から当該許容範囲の少なくとも1/8離れて配置される。当該背景画素は、モルフォロジ細線化を介して決定されたハードな背景制約に加え、当該マスクの境界から当該許容範囲よりも大きく離れて配置された複数画素として特定される。
ブロック612では、スケールスペースエンジン120が当該初期ラベルを使用して一の初期ポテンシャルマップを決定する。例えば、当該初期ポテンシャルマップは、当該初期ラベルを使用することによって、図3のブロック312及び314を参照して上述したのと同じ又は類似の態様で決定される。
ブロック614では、スケールスペースエンジン120が当該初期ポテンシャルマップ、当該収縮反転マスク、及び当該収縮マスクを使用して一の最終ラベルを生成する。当該収縮反転マスク及び当該収縮マスクは,当該ハードな前景制約及び当該ハードな背景制約によって表される。
ブロック616では、スケールスペースエンジン120が当該最終ラベルを出力する。当該最終ラベルは、当該画像のオーバーレイ等によって出力する。いくつかの実施例において、スケールスペースエンジン120は、最終ラベルを出力することによって当該最終ラベルを受け取る。また、スケールスペースエンジン120は、当該最終ラベルを使用して図3を参照して記載したようにさらなる処理を行う。
ポテンシャルマップを使用して画像を処理する例示的方法
本発明に係る様々な実施例に係る複数のポテンシャルマップは、当該画像の処理を向上させて所望の品質及び処理効率を生じさせるべく使用することができる。いくつかの実施例では、複数のポテンシャルマップを使用して複数画像を生成することができる。熟練したユーザのための複数のユーザインターフェイスを必要とする複数の方法で複数画像を処理することができる。例えば、一の方法は、複数画像を処理する一のユーザから受け取った複数入力を有する複数のポテンシャルマップを使用するインタラクティブな方法である。
図8は、一のポテンシャルマップと複数のユーザ入力を使用して複数画像を処理する一の方法の一実施例を示す。図8の方法は、図1に示すシステムを参照して記載される。しかしながら、他の複数の実装も可能である。
ブロック802では、スケールスペースエンジン120が少なくとも一のオブジェクトを有する一画像を受け取る。当該オブジェクトは、実際の一オブジェクトの一表現である。当該画像は、当該オブジェクトとは異なる複数の背景オブジェクトを含み得る。例えば、当該オブジェクトは一の「対象オブジェクト」である。当該背景オブジェクトは、一オブジェクトに関連付けられていない他の複数の背景画素と同じであるとみなされる。
ブロック804では、スケールスペースエンジン120が当該画像から複数のスケールスペース画像を生成する。複数のスケールスペース画像は、例えば図2又は3を参照して記載された方法を使用して生成することができる。
ブロック806では、スケールスペースエンジン120が複数のキーポイントを受け取る。複数のキーポイントは、一オブジェクトの一境界上の複数ポイントである。当該ポイントは、UI装置112を介して一ユーザから受け取られる。例えば、自身にオーバーレイされたラベルを有する画像がディスプレイ114において当該ユーザに対して表示され得る。一ユーザがマウス等の装置を使用して、当該オブジェクトの一境界上に配置された2以上のキーポイントを特定することができる。当該キーポイントは、所定量だけ離間することができる。当該キーポイントは、例えば当該ラベルを細分化等するべく使用される。スケールスペースエンジン120はまた、当該境界内側に関連付けられた領域及び当該境界外側に関連付けられた領域の一の指示を一ユーザから受け取る。
ブロック808では、スケールスペースエンジン120が当該キーポイントに基づいて一のラベルを計算する。一のラベルは、当該キーポイントを接続する一のラインセグメント又は一のスプラインセグメントを推定することによって計算される。一実施例では、当該キーポイント間を補間することによって一のラインセグメント又は一のスプラインセグメントが推定される。当該セグメントに対して一の境界許容範囲値を割り当てることができる。これにより、当該セグメントに沿って延びる一ラベル、及び当該境界許容範囲値と同等な一の幅を有する一ラベルを生成することができる。当該ラベルによってカバーされる領域は、選択された当該境界許容範囲に対する当該値によって決定される。これにより、当該得られたラベルに複数の真の境界画素が含まれることが保証される。当該選択された許容範囲値が当該キーポイント間の距離を超える場合、当該許容範囲値は比例的に低減し得る。スケールスペースエンジン120はまた、複数の前景画素(当該オブジェクトの内側)に関連付けられたラベルの側、及び当該背景画素(当該オブジェクトの外側)に関連付けられたラベルの側を決定することができる。
ブロック810では、スケールスペースエンジン120が当該ラベルに基づいて当該画像から一の画像セグメントをクロップする。例えば、スケールスペースエンジン120は、さらに分析するべく当該画像から当該画像セグメントを隔離することができる。
ブロック812では、スケールスペースエンジン120が一のポテンシャルマップを決定する。当該ポテンシャルマップは、当該画像セグメントから決定することができる。例えば、当該ポテンシャルマップは、図2又は3を参照して記載された一の方法を使用して決定することができる。
ブロック814では、スケールスペースエンジン120が当該ポテンシャルマップから、当該オブジェクトの境界に関連付けられた複数の境界ポイントを計算する。いくつかの実施例では、当該ポテンシャルマップは、当該オブジェクトの境界である尤度が高い複数キーポイント間の複数画素を特定するべく使用される。当該画素は、当該キーポイントと、当該キーポイント間の当該画素が一オブジェクトの境界に関連付けられている尤度を特定するポテンシャルマップとを使用して特定される。
スケールスペースエンジン120は、当該境界ポイントがブロック816において許容可能か否かについて一の指示を受け取ることができる。当該境界ポイントが当該ユーザから見て当該オブジェクトの境界に関連付けられている場合は、当該境界ポイントは許容可能である。当該ポイントのうち一以上が当該ユーザから見て当該オブジェクトの境界に関連付けられていない場合は、当該ポイントは許容不可能である。
スケールスペースエンジン120が、当該ポイントが許容可能ではないとの一指示を受け取る場合、当該処理はブロック806まで戻る。ブロック806では、スケールスペースエンジン120が複数の付加的キーポイントを受け取る。当該付加的キーポイントは、UI装置112を介して一ユーザから特定された一オブジェクトの一境界上の複数ポイントである。例えば、自身にオーバーレイされたラベルを有する画像がディスプレイ114において当該ユーザに対して表示され得る。一ユーザがマウス等のUI装置112を使用して、当該オブジェクトの一境界上に配置された複数の付加的キーポイントを特定することができる。当該付加的キーポイントはブロック806において受け取ることができる。より正確なラベルが、これらの付加的キーポイントに基づいてブロック808において計算される。この処理は、当該境界ポイントがブロック816において許容されたとわかるまで繰り返すことができる。スケールスペースエンジン120が当該境界ポイントが許容可能であるとの一指示を受け取る場合、スケールスペースエンジン120は、さらに処理するべくブロック820において当該境界ポイントを出力する。いくつかの実施例では、当該境界ポイントは、当該画像に当該境界ポイントをオーバーレイすることによってディスプレイ114に出力することができる。
さらなる処理は様々な処理を含み得る。例えば、当該境界ポイントは、当該キーポイント間の画像セグメントのために一のオブジェクトマスクを生成するべく使用することができる。すべてのキーポイント対に対して図8に記載された処理を繰り返すことによって、一の完全なオブジェクトマスクを生成することができる。
複数のポテンシャルマップを使用する他の画像処理方法の例は、(a)一の既存オブジェクト境界の半自動性向上、及び(b)複数の補間フレームにおける複数境界の向上を含む。
一の半自動性向上方法では、一オブジェクトのための一境界が決定されて複数の制御ポイントに関連付けられる。当該制御ポイントは「キーポイント」として扱うことができる。図8を参照して記載された方法を、当該制御ポイント間における画素が正確な複数境界を生成するべく使用することができる。当該境界の各セグメント又はスプラインに対して複数のクロップボックスを生成することができる。各セグメント又はスプラインへのラベル付けを、当該制御ポイントに関連付けるべく設定することができる。各クロップボックスは、他から独立して処理することができる。いくつかの実施例では、当該クロップボックスすべてに対して当該スケールスペース変換が一緒に適用される。当該処理によって、一の置換オブジェクト境界を得ることができる。一のユーザが、オリジナルのオブジェクト境界又は置換オブジェクト境界を選択することができる。
補間フレーム法における複数境界の向上では、複数の補間ポイントを移動することができる。当該補間フレームでは、一オブジェクト境界の各セグメントに対する未知領域を、一補間ポイントのまわりで所定許容範囲だけ重なるように延ばすことができる。当該未知領域の交差は、例えば図8の方法を適用するべく当該未知領域とみなすことができる。複数セグメント境界の境界交差から、前景及び背景画素を決定することができる。例えば、図8の方法を適用した後、当該補間ポイントを、推定境界上のオリジナル位置に最も近い一ポイントまで移動させることができる。これは、一ユーザにより必要に応じてオーバーライド又は修正される。
一般事項
具体的な実施例を参照して本発明を詳細に記載してきたが、当業者であれば上述したことを理解すれば、かかる実施形態の代替、変更、及び均等を容易に作り出すことは明らかである。したがって、本開示は限定ではなく説明を目的として提示されていることを理解すべきであって、一の当業者にとって容易に明らかなように、本発明に対するかかる修正、変形、及び/又は付加を含めることを排除するものではない。

Claims (28)

  1. 一の画像を処理する方法であって、
    実行コードが格納された一の計算装置によって、少なくとも一のオブジェクトを有する一の画像を受け取ることと、
    前記画像から少なくとも2のスケールスペース画像を生成することであって、前記画像は、少なくとも一のオブジェクトを有し、かつ、複数の境界画素の候補となる複数の画素を特定する一のラベルと関連付けられ、前記計算装置は、前記計算装置に前記少なくとも2のスケールスペース画像を生成させるべく構成された一のプロセッサを含み、前記少なくとも2のスケールスペース画像は異なる詳細レベルを有し、かつ、同じサイズであることと、
    前記計算装置が前記少なくとも2のスケールスペース画像を使用して、前記画像の各画素に対し、前記画素に隣接する画素との複数のリンクを有する3次元グラフを決定することと、
    前記計算装置が前記3次元グラフの前記複数のリンクに対して複数の重みを決定することと、
    前記計算装置が前記複数の重みを使用して前記複数の境界画素の候補となる複数の画素の複数のポテンシャル値を決定することであって、各ポテンシャル値は、前記複数の境界画素の候補となる複数の画素の一の関連画素が前記少なくとも一のオブジェクトの境界内に存在するか又は前記少なくとも一のオブジェクトの境界外に存在するかの尤度を表すことと、
    前記計算装置が前記ポテンシャル値を使用して一のポテンシャルマップを決定することと、
    前記計算装置が前記ポテンシャルマップを使用して前記画像を処理することと
    を含む方法。
  2. 前記画像を一のカラーモデルに変換することをさらに含み、
    前記カラーモデルは、CIE Lカラースペースにある前記画像を含む、請求項1に記載の方法。
  3. 前記画像から前記少なくとも2のスケールスペース画像を生成することは、少なくとも2のローパスフィルタを使用して前記画像をスケールスペース変換することを含む、請求項1に記載の方法。
  4. 前記少なくとも2のローパスフィルタはガウシアンカーネルを含み、
    前記異なる詳細レベルは異なるぼかし度を含む、請求項3に記載の方法。
  5. 前記画像から前記少なくとも2のスケールスペース画像を生成することは、少なくとも2のウェーブレットフィルタを使用して前記画像をスケールスペース変換することを含む、請求項1に記載の方法。
  6. 前記画像から前記少なくとも2のスケールスペース画像を生成することは、一のエッジ保存分解処理を使用して前記画像をスケールスペース変換することを含む、請求項1に記載の方法。
  7. 前記3次元グラフの前記複数のリンクに対して前記複数の重みを決定することは、
    一画素に関連付けられた複数のリンクを決定することと、
    前記画素に関連付けられた前記複数のリンクの各リンクに対して一の重みを決定することと、
    前記複数のリンクの各リンクに対する前記重みを集めて前記複数の重みを形成することと
    を含む、請求項1に記載の方法。
  8. 前記ポテンシャル値から前記ポテンシャルマップを決定することは、前記ポテンシャル値に対して一の幾何平均を決定することを含み、
    前記ポテンシャルマップは、前記ポテンシャル値に対する前記幾何平均を含む、請求項1に記載の方法。
  9. 前記少なくとも一のオブジェクトに対し、前記少なくとも一のオブジェクトの複数の境界画素を含む一のラベルを受け取ることをさらに含み、
    前記複数の重みから複数のポテンシャル値を決定することは、前記ラベルを使用して前記ポテンシャル値を決定することを含む、請求項1に記載の方法。
  10. 前記ラベルを生成することをさらに含み、
    前記ラベルを生成することは、
    前記画像のための一のオブジェクトマスクを受け取ることと、
    前記画像のための前記オブジェクトマスクから一の反転オブジェクトマスクを計算することと、
    前記反転オブジェクトマスクから第1距離変換を決定することと、
    前記オブジェクトマスクから第2距離変換を決定することと、
    前記第1距離変換を使用して前記画像における複数の前景画素を特定することと、
    前記第2距離変換を使用して前記画像における複数の背景画素を特定することと、
    前記特定された前景画素と前記特定された背景画素とに基づいて前記ラベルを生成することと
    を含む、請求項1に記載の方法。
  11. 前記ラベルを生成することをさらに含み、
    前記ラベルを生成することは、
    前記画像のための一のオブジェクトマスクを受け取ることと、
    前記画像のための前記オブジェクトマスクから一の反転オブジェクトマスクを計算することと、
    前記反転オブジェクトマスクを収縮することと、
    前記画像のための前記オブジェクトマスクを収縮することと、
    前記収縮された反転オブジェクトマスクに基づいて、かつ、前記画像のための前記収縮されたオブジェクトマスクに基づいて一の初期ラベルを生成することと、
    前記初期ラベルを使用して前記画像のための一の初期ポテンシャルマップを決定することと、
    前記初期ポテンシャルマップ、前記収縮された反転オブジェクトマスク、及び前記収縮されたオブジェクトマスクを使用して前記ラベルを生成することと
    を含む、請求項9に記載の方法。
  12. 前記反転オブジェクトマスクを収縮することは、前記反転オブジェクトマスクにおいてモルフォロジ細線化処理を使用することを含み、
    前記画像のための前記オブジェクトマスクを収縮することは、前記画像のための前記オブジェクトマスクにおいて前記モルフォロジ細線化処理を使用することを含む、請求項11に記載の方法。
  13. 前記ポテンシャルマップを使用して前記画像を処理することは、前記ポテンシャルマップを使用して一の画像マスクを生成することを含む、請求項1に記載の方法。
  14. 前記ポテンシャルマップを使用して前記画像マスクを生成することは、
    前記少なくとも一のオブジェクトの一の推定境界を特定する少なくとも2のキーポイントを受け取ることと、
    前記少なくとも2のキーポイントに基づいて一のラベルを計算することと、
    前記ラベルに基づいて一の画像セグメントをクロップすることと、
    前記画像セグメントから一のポテンシャルマップを決定することと、
    前記ポテンシャルマップから複数の境界ポイントを生成することと、
    前記境界ポイントが許容不可能であることを特定する一のコマンドを受け取ることに応じて複数の新たなキーポイントを使用して第2ポテンシャルマップを計算することと、
    前記境界ポイントが許容可能であることを特定する一のコマンドを受け取ることに応じて前記境界ポイントを出力することと、
    前記境界ポイントを使用して前記画像マスクを生成することと
    を含む、請求項13に記載の方法。
  15. 前記新たなキーポイントの数は、前記少なくとも2のキーポイントの数よりも大きい、請求項14に記載の方法。
  16. 一の画像を処理する計算装置において使用されるプログラムであって、
    前記計算装置は、
    のプロセッサと、
    前記計算装置に一のスケールスペースエンジンを実装させる前記プログラムを格納する一のコンピュータ可読媒体と、
    前記計算装置内部のコンポーネント間のデータ送受信を可能にする一のバスと、
    前記計算装置と外部コンポーネントとのデータ送受信を可能にする一の入出力インターフェイスと、
    を含み、
    前記スケールスペースエンジンは、前記プロセッサが前記バスを介して前記コンピュータ可読媒体にアクセスして前記プログラムを実行することにより、
    前記入出力インターフェイスを介して少なくとも一のオブジェクトを有する一の画像を受け取ることと、
    前記画像から少なくとも2のスケールスペース画像を生成することであって、前記少なくとも2のスケールスペース画像は異なる詳細レベルを有し、かつ、同じサイズであることと、
    前記少なくとも2のスケールスペース画像を使用して、前記画像の各画素に対して複数の重みを決定することであって、前記複数の重みの各重みは一のリンクに関連付けられることと、
    前記少なくとも一のオブジェクトに対し、前記少なくとも一のオブジェクトの複数の境界画素の候補となる画像の画素を特定する一のラベルを受け取ることと、
    前記複数の重み及び前記ラベルを使用して複数のポテンシャル値を決定することであって、各ポテンシャル値は、前記複数の境界画素の候補の一の関連画素が前記少なくとも一のオブジェクトの境界内に存在するか又は前記少なくとも一のオブジェクトの境界外に存在するかの尤度を表すことと、
    前記ポテンシャル値を使用して一のポテンシャルマップを決定することと、
    前記ポテンシャルマップを使用して前記画像を処理する一の画像マスクを生成することと
    を行うべく機能するプログラム
  17. 前記スケールスペースエンジンは、前記計算装置に前記画像を一のカラーモデルに変換させるべく構成され、
    前記カラーモデルは、CIE Lカラースペースにある画像を含む、請求項16に記載のプログラム
  18. 前記スケールスペースエンジンは、(i)少なくとも2のウェーブレットフィルタ、(ii)一のエッジ保存分解処理、又は(iii)少なくとも2のローパスフィルタの一を使用して前記画像をスケールスペース変換することによって、前記画像から前記少なくとも2のスケールスペース画像を生成することを前記計算装置にさせるべく構成される、請求項16に記載のプログラム
  19. 前記スケールスペースエンジンは、前記ポテンシャル値に対する一の幾何平均を決定することによって前記ポテンシャル値から前記ポテンシャルマップを決定することを前記計算装置にさせるべく構成され、
    前記ポテンシャルマップは、前記ポテンシャル値に対する前記幾何平均を含む、請求項16に記載のプログラム
  20. 前記スケールスペースエンジンは、
    前記画像のための一のオブジェクトマスクを受け取ることと、
    前記画像のための前記オブジェクトマスクから一の反転オブジェクトマスクを計算することと、
    前記反転オブジェクトマスクから第1距離変換を決定することと、
    前記オブジェクトマスクから第2距離変換を決定することと、
    前記第1距離変換を使用して前記画像における複数の前景画素を特定することと、
    前記第2距離変換を使用して前記画像における複数の背景画素を特定することと、
    前記特定された前景画素と前記特定された背景画素とに基づいて前記ラベルを生成することと
    によって前記ラベルを生成することを前記計算装置にさせるべく構成される、請求項16に記載のプログラム
  21. 前記スケールスペースエンジンは、前記ラベルを生成することによって前記画像のための前記ラベルを受け取ることを前記計算装置にさせるべく構成され、
    前記スケールスペースエンジンは、
    前記画像のための一のオブジェクトマスクを受け取ることと、
    前記画像のための前記オブジェクトマスクから一の反転オブジェクトマスクを計算することと、
    前記反転オブジェクトマスクを収縮することと、
    前記画像のための前記オブジェクトマスクを収縮することと、
    前記収縮された反転オブジェクトマスクに基づいて、かつ、前記画像のための前記収縮されたオブジェクトマスクに基づいて一の初期ラベルを生成することと、
    前記初期ラベルを使用して前記画像のための一の初期ポテンシャルマップを決定することと、
    前記初期ポテンシャルマップ、前記収縮された反転オブジェクトマスク、及び前記収縮されたオブジェクトマスクを使用して前記ラベルを生成することと
    によって前記ラベルを生成することを前記計算装置にさせるべく構成される、請求項16に記載のプログラム
  22. コンピュータを、少なくとも一のオブジェクトを有する一の画像を、前記少なくとも一のオブジェクトの境界を特定するべく処理する一のスケールスペースエンジンとして機能させるプログラムコードが格納されたコンピュータ可読媒体であって、
    前記プログラムコードは、
    少なくとも一のオブジェクトを有する一の画像を受け取るコードと、
    (i)少なくとも2のウェーブレットフィルタ又は(ii)一のエッジ保存分解処理の一を使用して前記画像をスケールスペース変換することにより前記画像から少なくとも2のスケールスペース画像を生成するコードであって、前記少なくとも2のスケールスペース画像は異なる詳細レベルを有し、かつ、同じサイズであるコードと、
    前記少なくとも2のスケールスペース画像を使用して一のポテンシャルマップを決定するコードと
    前記ポテンシャルマップを使用して前記少なくとも一のオブジェクトの前記境界を特定するコードと
    を含み、
    前記ポテンシャルマップは、複数の画素間のリンクに関連付けられた複数の重みに基づいて、複数の境界画素の候補として一のラベルにより特定される複数の画素のポテンシャル値を表し、
    一のポテンシャル値は、前記複数の境界画素の候補の一画素が前記少なくとも一のオブジェクトの一境界内に存在するか又は前記少なくとも一のオブジェクトの前記境界外に存在するかの尤度を表すコンピュータ可読媒体。
  23. 前記画像を一のカラーモデルに変換するコードをさらに含み、
    前記カラーモデルは、CIE Lカラースペースにある前記画像を含む、請求項22に記載のコンピュータ可読媒体。
  24. 前記少なくとも2のスケールスペース画像を使用して前記ポテンシャルマップを決定するコードは、
    前記少なくとも2のスケールスペース画像を使用して、前記画像の各画素に対して複数の重みを決定するコードであって、前記複数の重みの各重みは一のリンクに関連付けられるコードと、
    記少なくとも一のオブジェクトに対し、前記少なくとも一のオブジェクトの複数の境界画素を含む一のラベルを受け取るコードと、
    前記複数の重み及び前記ラベルを使用して複数のポテンシャル値を決定するコードであって、各ポテンシャル値は、一の関連画素が前記少なくとも一のオブジェクトの境界内に存在するか又は前記少なくとも一のオブジェクトの境界外に存在するかの尤度を表すコードと、
    前記ポテンシャル値から前記ポテンシャルマップを決定するコードと
    を含み、
    前記少なくとも2のスケールスペース画像を使用して、前記画像の各画素に対して複数の重みを決定するコードは、
    一画素に関連付けられた複数のリンクを決定するコードと、
    前記画素に関連付けられた前記複数のリンクの各リンクに対して一の重みを決定するコードと、
    前記複数のリンクの各リンクに対する前記重みを集めて前記複数の重みを形成するコードと
    を含み、
    前記ポテンシャル値を使用して前記ポテンシャルマップを決定するコードは、
    前記ポテンシャル値に対して一の幾何平均を決定するコードを含み、
    前記ポテンシャルマップは、前記ポテンシャル値に対する前記幾何平均を含む、請求項22に記載のコンピュータ可読媒体。
  25. 前記ラベルを生成するコードをさらに含み、
    前記ラベルを生成する前記コードは、
    前記画像のための一のオブジェクトマスクを受け取るコードと、
    前記画像のための前記オブジェクトマスクから一の反転オブジェクトマスクを計算するコードと、
    前記反転オブジェクトマスクから第1距離変換を決定するコードと、
    前記オブジェクトマスクから第2距離変換を決定するコードと、
    前記第1距離変換を使用して前記画像における複数の前景画素を特定するコードと、
    前記第2距離変換を使用して前記画像における複数の背景画素を特定するコードと、
    前記特定された前景画素と前記特定された背景画素とに基づいて前記ラベルを生成するコードと
    を含む、請求項22に記載のコンピュータ可読媒体。
  26. 前記ポテンシャルマップを決定するべく使用される一のラベルを生成するコードをさらに含み、
    前記ラベルを生成する前記コードは、
    前記画像のための一のオブジェクトマスクを受け取るコードと、
    前記画像のための前記オブジェクトマスクから一の反転オブジェクトマスクを計算するコードと、
    一のモルフォロジ細線化処理を使用して前記反転オブジェクトマスクを収縮するコードと、
    前記モルフォロジ細線化処理を使用して前記画像のための前記オブジェクトマスクを収縮するコードと、
    前記収縮された反転オブジェクトマスクに基づいて、かつ、前記画像のための前記収縮されたオブジェクトマスクに基づいて一の初期ラベルを生成するコードと、
    前記初期ラベルを使用して前記画像のための一の初期ポテンシャルマップを決定するコードと、
    前記初期ポテンシャルマップ、前記収縮された反転オブジェクトマスク、及び前記収縮されたオブジェクトマスクを使用して前記ラベルを生成することと
    を含む、請求項22に記載のコンピュータ可読媒体。
  27. 前記ポテンシャルマップを使用して前記少なくとも一のオブジェクトの前記境界を特定するコードは前記ポテンシャルマップを使用して一の画像マスクを生成するコードを含み、
    前記ポテンシャルマップを使用して前記画像マスクを生成する前記コードは、
    前記少なくとも一のオブジェクトの一の推定境界を特定する少なくとも2のキーポイントを受け取るプログラムコードと、
    前記少なくとも2のキーポイントに基づいて一のラベルを計算するプログラムコードと、
    前記ラベルに基づいて一の画像セグメントをクロップするプログラムコードと、
    前記画像セグメントから一のポテンシャルマップを決定するプログラムコードと、
    前記ポテンシャルマップから複数の境界ポイントを生成するプログラムコードと、
    前記境界ポイントが許容不可能であることを特定する一のコマンドを受け取ることに応じて複数の新たなキーポイントを使用して第2ポテンシャルマップを計算するプログラムコードと、
    前記境界ポイントが許容可能であることを特定する一のコマンドを受け取ることに応じて前記境界ポイントを出力するプログラムコードと、
    前記境界ポイントから前記画像マスクを生成するプログラムコードと
    を含み、
    前記新たなキーポイントの数は、前記少なくとも2のキーポイントの数よりも大きい、請求項22に記載のコンピュータ可読媒体。
  28. 一の画像を処理する方法であって、
    実行コードが格納された一の計算装置によって、少なくとも一のオブジェクトを有する一の画像を受け取ることと、
    前記計算装置が前記画像から少なくとも2のスケールスペース画像を生成することであって、前記計算装置は、前記計算装置に前記少なくとも2のスケールスペース画像を生成させるべく構成された一のプロセッサを含み、前記少なくとも2のスケールスペース画像は異なる詳細レベルを有し、かつ、同じサイズであることと、
    前記計算装置が前記少なくとも2のスケールスペース画像と、一のラベルにより特定される複数の境界画素の候補の複数のポテンシャル値を使用して、前記ポテンシャル値の幾何平均を決定することにより一のポテンシャルマップを決定することと
    前記計算装置が前記ポテンシャルマップを使用して前記少なくとも一のオブジェクトの前記境界を特定することと
    を含み、
    前記ポテンシャルマップは、前記ポテンシャル値の前記幾何平均を含み、
    前記ポテンシャル値は、複数の画素間のリンクに関連付けられた複数の重みに基づき、
    前記ポテンシャル値は、前記画像の前記複数の境界画素の候補が前記少なくとも一のオブジェクトの境界内に存在するか又は前記少なくとも一のオブジェクトの境界外に存在するかの尤度を表す方法。
JP2011540232A 2008-12-11 2009-12-11 スケールスペースを使用した画像処理装置及び方法 Expired - Fee Related JP5645842B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US20153108P 2008-12-11 2008-12-11
US61/201,531 2008-12-11
PCT/IB2009/007723 WO2010067191A1 (en) 2008-12-11 2009-12-11 Devices and methods for processing images using scale space

Publications (2)

Publication Number Publication Date
JP2012511760A JP2012511760A (ja) 2012-05-24
JP5645842B2 true JP5645842B2 (ja) 2014-12-24

Family

ID=42242394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011540232A Expired - Fee Related JP5645842B2 (ja) 2008-12-11 2009-12-11 スケールスペースを使用した画像処理装置及び方法

Country Status (6)

Country Link
US (1) US8705867B2 (ja)
EP (1) EP2374107B1 (ja)
JP (1) JP5645842B2 (ja)
CN (1) CN102246204B (ja)
CA (1) CA2745380C (ja)
WO (1) WO2010067191A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8391594B1 (en) * 2009-05-28 2013-03-05 Adobe Systems Incorporated Method and apparatus for generating variable-width border masks
KR20120004203A (ko) * 2010-07-06 2012-01-12 삼성전자주식회사 디스플레이 방법 및 장치
WO2014102798A1 (en) * 2012-12-31 2014-07-03 Given Imaging Ltd. System and method for displaying an image stream
CN103177446B (zh) * 2013-03-13 2016-03-30 北京航空航天大学 基于邻域和非邻域平滑先验的图像前景精准提取方法
KR20140137738A (ko) * 2013-05-23 2014-12-03 삼성전자주식회사 이미지 디스플레이 방법, 이미지 디스플레이 장치 및 기록 매체
US9934555B1 (en) * 2014-03-20 2018-04-03 Amazon Technologies, Inc. Processing an image to reduce rendering artifacts
KR101624801B1 (ko) * 2014-10-15 2016-05-26 포항공과대학교 산학협력단 전경 물체 추출을 위한 매팅 방법 및 이를 수행하는 장치
US10356420B2 (en) 2014-11-16 2019-07-16 Lg Electronics Inc. Video signal processing method using graph based transform and device therefor
US9547907B2 (en) 2014-12-15 2017-01-17 Intel Corporation Image segmentation using color and depth information
US9569667B1 (en) * 2015-05-04 2017-02-14 Exelis Inc Cloud resilient algorithm for coastline registration
WO2016179830A1 (en) * 2015-05-14 2016-11-17 Intel Corporation Fast mrf energy optimization for solving scene labeling problems
KR101724338B1 (ko) * 2015-09-15 2017-04-07 전자부품연구원 강인한 영역 분리 방법 및 이를 적용한 시스템
ITUB20153724A1 (it) * 2015-09-18 2017-03-18 Sisvel Tech S R L Metodi e apparati per codificare e decodificare immagini o flussi video digitali
US10152780B2 (en) 2015-11-02 2018-12-11 Cognex Corporation System and method for finding lines in an image with a vision system
US10937168B2 (en) 2015-11-02 2021-03-02 Cognex Corporation System and method for finding and classifying lines in an image with a vision system
KR20180042733A (ko) * 2016-10-18 2018-04-26 삼성전자주식회사 영상 처리 장치 및 방법
US10026014B2 (en) * 2016-10-26 2018-07-17 Nxp Usa, Inc. Method and apparatus for data set classification based on generator features
US10249044B2 (en) * 2016-12-30 2019-04-02 Facebook, Inc. Image segmentation with touch interaction
US11004207B2 (en) * 2017-12-06 2021-05-11 Blueprint Reality Inc. Multi-modal data fusion for scene segmentation
US11195283B2 (en) * 2019-07-15 2021-12-07 Google Llc Video background substraction using depth
CN110503704B (zh) * 2019-08-27 2023-07-21 北京迈格威科技有限公司 三分图的构造方法、装置和电子设备
CN111724441A (zh) * 2020-05-28 2020-09-29 上海商汤智能科技有限公司 图像标注方法及装置、电子设备及存储介质
CN112085726B (zh) * 2020-09-16 2024-03-22 杭州爱科科技股份有限公司 皮料识别方法、装置、系统及计算机可读存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0692772A1 (fr) * 1994-07-12 1996-01-17 Laboratoires D'electronique Philips S.A.S. Procédé et dispositif pour détecter des points clés situés sur le contour d'un objet
US6005978A (en) 1996-02-07 1999-12-21 Cognex Corporation Robust search for image features across image sequences exhibiting non-uniform changes in brightness
AU1099899A (en) * 1997-10-15 1999-05-03 Electric Planet, Inc. Method and apparatus for performing a clean background subtraction
US6366692B1 (en) * 1998-03-30 2002-04-02 Intel Corporation Median computation-based integrated color interpolation and color space conversion methodology from 8-bit bayer pattern RGB color space to 24-bit CIE XYZ color space
US6400831B2 (en) * 1998-04-02 2002-06-04 Microsoft Corporation Semantic video object segmentation and tracking
US6717698B1 (en) * 2000-02-02 2004-04-06 Eastman Kodak Company Tone scale processing based on image modulation activity
US7349922B2 (en) * 2001-11-14 2008-03-25 Yeda Research And Development Co. Ltd. Method and apparatus for data clustering including segmentation and boundary detection
US7856136B2 (en) * 2004-04-14 2010-12-21 Drvision Technologies Llc Analysis of patterns among objects of a plurality of classes
US7831094B2 (en) * 2004-04-27 2010-11-09 Honda Motor Co., Ltd. Simultaneous localization and mapping using multiple view feature descriptors
JP5352942B2 (ja) * 2005-03-31 2013-11-27 株式会社ニコン 画像処理方法、画像処理プログラム、および画像処理装置
EP1865460B1 (en) * 2005-03-31 2011-05-04 Nikon Corporation Image processing method
EP1748389A1 (en) * 2005-07-28 2007-01-31 Microsoft Corporation Image blending
EP2003612A4 (en) * 2006-03-31 2010-10-13 Nikon Corp IMAGE PROCESSING
JP5256582B2 (ja) 2006-03-31 2013-08-07 株式会社ニコン 画像処理方法、画像処理プログラム、および画像処理装置
JP4999163B2 (ja) * 2006-04-17 2012-08-15 富士フイルム株式会社 画像処理方法および装置ならびにプログラム
US8260048B2 (en) * 2007-11-14 2012-09-04 Exelis Inc. Segmentation-based image processing system
US8233716B2 (en) * 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated System and method for finding stable keypoints in a picture image using localized scale space properties

Also Published As

Publication number Publication date
EP2374107B1 (en) 2020-07-08
WO2010067191A1 (en) 2010-06-17
JP2012511760A (ja) 2012-05-24
CN102246204B (zh) 2015-04-29
US20110229024A1 (en) 2011-09-22
CA2745380A1 (en) 2010-06-17
CA2745380C (en) 2018-07-17
EP2374107A4 (en) 2016-11-16
CN102246204A (zh) 2011-11-16
EP2374107A1 (en) 2011-10-12
US8705867B2 (en) 2014-04-22

Similar Documents

Publication Publication Date Title
JP5645842B2 (ja) スケールスペースを使用した画像処理装置及び方法
Wu et al. Fast end-to-end trainable guided filter
Niklaus et al. Video frame interpolation via adaptive convolution
Li et al. Fast guided global interpolation for depth and motion
Guo et al. LIME: Low-light image enhancement via illumination map estimation
Yin et al. A novel image-dehazing network with a parallel attention block
Qi et al. Geonet++: Iterative geometric neural network with edge-aware refinement for joint depth and surface normal estimation
Min et al. Fast global image smoothing based on weighted least squares
Lu et al. Deep texture and structure aware filtering network for image smoothing
Zhang et al. Video dehazing with spatial and temporal coherence
Guo et al. Single image dehazing based on fusion strategy
KR102311796B1 (ko) 지역적 신체영역 정보를 이용한 휴먼 모션 디블러링 방법 및 장치
Weiss et al. Learning adaptive sampling and reconstruction for volume visualization
JP2012515982A (ja) コンピュータグラフィックスのためのスムージングされたローカルヒストグラムフィルタ
Wang et al. Super-resolution of multi-observed RGB-D images based on nonlocal regression and total variation
Luvizon et al. Adaptive multiplane image generation from a single internet picture
CN116051593A (zh) 服装图像提取方法及其装置、设备、介质、产品
Wang et al. Perception-guided multi-channel visual feature fusion for image retargeting
Wei et al. Joint contour filtering
Tsuji et al. Non-guided depth completion with adversarial networks
Yoon et al. GAN-based shadow removal using context information
Shaharabany et al. End-to-end segmentation of medical images via patch-wise polygons prediction
Jung et al. Intensity-guided edge-preserving depth upsampling through weighted L0 gradient minimization
Xu et al. An edge guided coarse-to-fine generative network for image outpainting
Amirkolaee et al. Monocular depth estimation with geometrical guidance using a multi-level convolutional neural network

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121010

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131128

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140805

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141104

R150 Certificate of patent or registration of utility model

Ref document number: 5645842

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees