JP5607079B2 - 前景−背景制約伝播に基づくビデオマッティング - Google Patents

前景−背景制約伝播に基づくビデオマッティング Download PDF

Info

Publication number
JP5607079B2
JP5607079B2 JP2011550117A JP2011550117A JP5607079B2 JP 5607079 B2 JP5607079 B2 JP 5607079B2 JP 2011550117 A JP2011550117 A JP 2011550117A JP 2011550117 A JP2011550117 A JP 2011550117A JP 5607079 B2 JP5607079 B2 JP 5607079B2
Authority
JP
Japan
Prior art keywords
background
foreground
generating
mat
constraint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011550117A
Other languages
English (en)
Other versions
JP2012517647A5 (ja
JP2012517647A (ja
Inventor
バガヴァッティ シタラム
ルラッチ ジョアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2012517647A publication Critical patent/JP2012517647A/ja
Publication of JP2012517647A5 publication Critical patent/JP2012517647A5/ja
Application granted granted Critical
Publication of JP5607079B2 publication Critical patent/JP5607079B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/003Reconstruction from projections, e.g. tomography
    • G06T11/006Inverse problem, transformation from projection-space into object-space, e.g. transform methods, back-projection, algebraic methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/80Creating or modifying a manually drawn or painted image using a manual input device, e.g. mouse, light pen, direction keys on keyboard
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/174Segmentation; Edge detection involving the use of two or more images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20096Interactive definition of curve of interest

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Studio Circuits (AREA)

Description

本発明は一般に、デジタル映像処理に関し、特にビデオ映像のためのマッティング方法及び装置に関する。
画像マッティングは、人によるいくつかのガイダンスで、画像から1つの対象を抽出する処理である。画像マッティングは、前景及び背景の領域を区分するために、通常は少数のスクリブル(scribble)の態様で、限定されたユーザ入力に依拠するインタラクティブな処理であり得る。以下、「前景」は抽出されるべき対象を意味し、それに対して「背景」は画像中の全てを意味する。
ビデオマッティングは、画像マッティングを拡張したものであり、ビデオの一続きの場面から動いている対象を抽出することを目的としている。また、ビデオマッティングは、ビデオ処理デバイス(ビデオエンコーダを含む)において用いられることができる。例えば、自動マット抽出は、1つのビデオシーン(例えば、空の領域)内の特定の領域を識別するために用いられることができ、与えられた処理のみをその領域に適用することができる(例えば、デバンディング、又は、誤った輪郭の除去)。また、マット抽出は、対象探知、及び対象追跡アルゴリズムを導くために用いられることができる。例えば、マット抽出技術は、サッカービデオ内の芝生領域(すなわち競技場)を探知するために用いられることができ、ボール追跡アルゴリズム内で探知範囲を制限するために用いることができる。
動画作成、及びテレビにおいて、マットは、前景と背景とを合成して最終的な画像とするために用いられている。クロマキー(ブルースクリーン)技術は、俳優を新しい背景にマッティングするために広く用いられている方法である。多くの従来技術は、画像キャプチャ処理の間において管理された環境に依存している。しかしながら、デジタル画像においては、ピクセルを直接処理することができ、したがって、人によるいくつかの指令によって前景対象を現在画像からマットアウトできるようになる。デジタル画像マッティングは、前景対象を抽出するため、及びおそらくはいくつかの対象を最終画像に組み立てるために、多くの画像及びビデオ編集アプリケーションにおいて用いられる。
上述のように、画像マッティングは、通常、例えばユーザが前景領域及び可能性として背景領域をマーキングするなどのいくつかの入力を与えるインタラクティブな処理である。マーキングをより簡単にすれば、処理はよりユーザフレンドリーになる。使用をより簡単にするインターフェースの中には、ユーザが前景領域及び背景領域をデジタルブラシマーキングによりいくつかのスクリブルを配置することも含まれる(図2A)。画像マッティング処理は、ユーザ入力に従って画像情報を用いる前景対象の境界を決定する。
いくつかの画像マッティング方法においては、ユーザは、通常手書きによる、トライマップと称されるおおよその区分を与える。この場合、各ピクセルは、前景、背景、又は無名のピクセルに分類される(Berman他による米国特許第6,135,345「選択された対象を囲んでいる背景を画像から除去するための包括的な方法」、及びY.Y.Chuang他、「デジタルマッティングへのベイジアンアプローチ」 Proc. IEEE Conf. on Computer Vision Pattern Recognition, 2001を参照)。他の方法においては、よりユーザフレンドリーなスクリブルベースのインタラクションが用いられる。当該インタラクションにおいては、ユーザがデジタルブラシを用いて数本のスクリブル線を配置して、前景領域と背景領域とを区分する(J.Wang他、「統合された画像区分及びマッティングのためのインタラクティブな最適化アプローチ」 Proc. IEEE Conf. on Computer Vision Pattern Recognition, 2005、及びA.Levin他、「自然な画像マッティングのための閉形解」IEEE Trans. on Pattern Analysis and Machine Intelligence, vol.30, no.2, pp.228-242, Feb 2008を参照)。
上記の全ての方法においては、ユーザ入力は、前景を単一の画像からマッティングアウトするために与えられる。ビデオマッティングは、動いている背景対象を含み得るという意味で、より困難な問題である。この場合、あるフレームのためのユーザ入力が、後続のフレームのために不正確となり得る。更に、ビデオ内の各フレームのための入力を与えることをユーザに要求する多大な労力を要することになる。
Chuang他によって提案されたビデオマッティング方法においては、トライマップは、ビデオ内のいくつかのキーフレームの各々のために与えられる。トライマップは、前景及び背景のオプティカルフローを用いて他のフレーム間に差し挟まれる(Y.Y.Chuang他、「複雑なシーンのビデオマッティング」、ACM Transactions on Graphics, vol.21, no.3, pp.243-248, 2002を参照)。しかしながら、オプティカルフローに基づく差し挟みは、穏やかな動きのレベルの場合でさえ、時間を要し、ノイズに敏感であり、信頼性が低い。更に、ユーザにより提供されるスクリブルによるオプティカルフローに基づく差し挟みの場合には、当該スクリブルが時間切れにより途切れるという結果になってしまう。Apostoloff他は、エッジにおける時空密度を課すことによってトライマップがフレームからフレームに潜在的に伝播されると述べている(N.E.Apostoloff他、「学習された画像先行を用いたベイジアンビデオマッティング」、Proc. IEEE Conf. on Computer Vision Pattern Recognition, 2004)。しかしながら、この方法の複雑さは、元の画像とアルファマットとの間の時空エッジ密度の強調のために本質的なものである。
本発明の原理に従う例示の実施例において、方法は、最初のフレームのためにユーザによって提供された前景−背景制約情報を後続のフレームに伝播させるために記載されている。それによって、ユーザの最小限のインタラクティブでビデオストリーム内の動いている前景対象を抽出する。ビデオマッティングは、最初のフレームに関するユーザ入力(例えば、スクリブル)が、各フレームについて見積もられたマットを用いて後続のフレームに伝播されて実行される。あるフレームのマットは、次のフレームのマットを見積もるために用いられる前景−背景のおおよその区分に到達するために処理される。各フレームにおいては、伝播された入力は、対応するマットを見積もるために画像マッティング法によって用いられる。当該マットは、当該入力を当該次のフレーム等に伝播させるために用いられる処理順内に存在する。
上記を考慮して、発明の詳細な説明から明確にされるように、他の実施例及び構成も本発明の原理内に存在することが可能である。
本発明の実施例に従う装置及び/又は方法のいくつかの実施例が、例としてのみ、本明細書に記載され、添付図面に示されている。
フレームワイズマッティング方法又は装置の一例のブロック図である。 インタラクティブ画像マッティング処理を説明する図であって、図2Aは前景が白色のスクリブルでマーキングされ、背景が黒色のスクリブルでマーキングされた画像又はビデオを示す図である。 図2Aに関して抽出されたマット又は不透明な背景を示す図である。 抽出された前景画像を示す図である。 新しい背景画像に合成された前景画像を示す図である。 前景−背景制約伝播方法のフロー図である。 図3の方法に関連する実例の画像を示す図である。 図3の方法に関連する実例の画像を示す図である。 図3の方法に関連する実例の画像を示す図である。 図3の方法に関連する実例の画像を示す図である。 図3の方法に関連する実例の画像を示す図である。 図3の方法に関連する実例の画像を示す図である。 本発明の例示のシステムの実施例のブロック図である。
本発明の概念は別として、図に示された構成要素は広く知られており詳細には説明されない。例えば、本発明の概念は別として、広く知られたデジタル画像処理は当然のものであり、本明細書には詳述されない。また、本発明の実施例は、ハードウェア及びソフトウェアの様々な組合せを用いて実装され得ることに留意すべきである。最後に、図面内の同様の符号は同様の構成を示している。
一般的に、画像マッティング方法は、前景画像Fと背景画像Bの合成である入力画像Iを処理する。ithピクセルの色は、前景Fiの色及び輝度と背景Biの色及び輝度とに対応するものの線形合成であると考えられる。
Figure 0005607079
ここで、αiは、ithピクセルの前景の不透明度であり、0≦α≦1の範囲である。等式(1)の右辺の全ての量について既知であるとは限らない。したがって、3チャンネルカラー画像について、3つの等式と画像の各ピクセルについて既知でない7つの要素とがある。これは制約問題であるので、いくつかのユーザ入力が良好なマットを抽出するために要求される。この目的のための典型的なユーザ入力は、例えば図2Aに示されるように、前景領域及び背景領域をマーキングするデジタルブラシで少数のスクリブルを配置することを含み得る。図2Aにおいては、白色のスクリブルが前景領域を示し、黒色のスクリブルが背景領域を示している。ユーザ入力が与えられると、前景画像F、背景画像B、及びアルファマット(単に「マット」とも称する)αが見積もられる。
図1は、フレームワイズマッティング方法又は装置の一例のブロック図であり、前景が画像マッティングブロック110を用いるフレームバイフレームベースで抽出される。図1に示されるように、時刻tにおけるフレームについては、画像マッティングブロック110は、フレームtのためのユーザによる入力に基づく前景−背景(F−B)制約ct、又は制約伝播ブロック120を介して前のフレームのためのユーザ入力から伝播された前景−背景(F−B)制約ctに基づく関連するアルファマットαtを生成する。フレームtにおいて、制約ctは、前景領域及び背景領域を指定するユーザから与えられる入力によって決定される。前景としてマークされた全てのピクセルはα=1を有し、背景としてマークされた全てのピクセルはα=0を有する。
図1を参照すると、ctはフレームtのF−B制約を示す。ithピクセルについてのctは以下のようになる。
Figure 0005607079
画像マッティング方法110は、ct i=1のピクセルのための制約αt i=1、及びct i=0のピクセルのための制約αt i=0を定める。ここで、αt iは、フレームtにおけるithピクセルのアルファ値を示す。図2Bは、図2Aにおいてユーザにより与えられたスクリブル(ct)に基づくフレームtのために得られたマット(αt)を示す図である。図2Cは、抽出された前景対象を示す図である。図2Dは、マッティングの適用を示すものであり、抽出された前景対象が新しい背景画像に合成されている。
例示の実施例においては、マッティングブロック110は、A.Levin他、「自然な画像マッティングのための閉形解」(IEEE Trans. on Pattern Analysis and Machine Intelligence, vol.30, no.2, pp.228-242, Feb 2008)に記載されたマッティング技術のとおりに実装されることができる。A.Levin他のマッティング技術は、いくつかの制約の下でのアルファマットにおける2次コスト関数を最小化する。いずれかの好ましいマッティング技術がこの目的のために用いられ得る。
ビデオストリームにおける後続の各フレームについては、前景−背景制約は、制約伝播ブロック120を介して前のフレームからユーザ入力制約を伝播させることにより得られることができる。あるフレームから次のフレームへの前景−背景制約を伝播させるための例示の方法が以下に記載されている。
図3は、あるフレームから次のフレームへの前景−背景制約の伝播の例示の方法300のフロー図であり、かかる例示の方法が図3に示されている。図4A〜図4Fは、方法300に関連する実例画像を示している。以下により詳細に記載されているように、方法300は、時刻t+1でのF−B制約を見積もるためにフレームtでアルファマットを用いる。制約(例えばスクリブル又はトライマップ)を直接伝播させる代わりに、当該方法は、フレームt+1のために制約を生成するためにtでマットを用いる。換言すれば、フレームtからのマット(αt)を用いてフレームt+1のためのF−B制約(ct+1)が得られる。
図3に示されるように、連続するフレームの最初のフレームのための、すなわち時刻tのフレームのためのアルファマットαt iが、例えば図1のマッティング方法から供給される。方法300は、前景制約伝播処理310と背景制約伝播処理320とを含む。
各ピクセルのためのアルファ値αt iは[0,1]の範囲内にある。ここで、αt i=1は、ピクセルiが完全に前景に属することを意味する。そのアルファ値が高い程、ピクセルの前景構成要素が大きくなる。ステップ311においては、以下のようなバイナリ領域βtを生成するためにアルファ値が閾値τfgと比較される閾値制御が実行される。
Figure 0005607079
したがって、閾値制御は、高い前景構成要素でピクセルを分離する。図4Aは、閾値制御ステップ311の結果を図示している。図4Aは、図2Bに示されるアルファマットαtを閾値制御することによって得られたバイナリ領域βtを示している。様々な例示の実施例において、閾値τfgの値は0.5〜0.9の範囲内にある。
ステップ312においては、閾値制御ステップにおいて生成されたバイナリ領域βt上でモルフォロジ収縮処理が実行される。
Figure 0005607079
ここで、FE(.)はモルフォロジ収縮演算子を示し、E(s)はスケールsの構成要素を示している。一例を挙げれば、E(5)は、5ピクセルの半径を有する円形である。当該構成要素は、例えば四角形等の好ましい形状とし得るが、例えば円形などの等方性の形状が好ましい。構成要素のスケールは、前景と背景との間の所望の分離、及び前景のサイズ及び/又は背景のサイズに基づいて好適に選択され、前景のピクセル及び/又は背景のピクセルの過度の収縮を回避する。
仮に閾値制御ステップ311において生成される前景領域が、削除される場合、又はモルフォロジ収縮ステップ312において予め定められた最小サイズ(例えばビューワーによって知覚されないほど小さいサイズ)よりも小さい前景領域に減少される程小さい場合には、モルフォロジ収縮ステップ312はスキップされることに留意する。
図4Bには、ステップ312におけるバイナリ領域βtのモルフォロジ収縮の結果得られる領域γtが図示されている。図4Bにおいては、前景制約は、白色のピクセルによって示されている。前景としてマークされた領域の収縮によって、例え前景(及び/又は背景)が一定量動いたとしても、収縮動作はフレームt+1における前景内にあるこれらの領域を確定する。構成要素E(.)のスケールsfgは、前景の動きの度合い及び/又は背景の動きの度合いに基づいて選択されることができる。
フレームt+1のための前景制約は、ステップ313において、γt i=1の場合にはct+1 iとして定義される。仮にγt i=0の場合には、ct+1 iは未だ定義されない。ct+1 iは、以下に記載されているように処理内の他の時点において背景として設定され得るし、未定義のままとなり得ることに留意する。
背景伝播処理320においては、背景制約は、既に決定された前景制約γt i(図4B)
に基づいて決定される。各ピクセルのために、より低いアルファ値(αt i)がより高い背景構成要素を示している。(1−αt i)上の閾値を適用することにより、背景ピクセルが分離され得る。しかしながら、背景制約されたピクセルが前景から遠く離れた位置にあることは、背景制約されたピクセルと前景制約されたピクセルとの間の「ぼやけた領域」を増加させ、不正確な前景抽出を生じさせ得るので望ましくない。このバランスを達成するために、標準化された距離変換がステップ321において、以下の式により決定される。
Figure 0005607079
ここで、d(i,j)はピクセルiとjとの間の空間的距離であり、Jはγt j=1での全てのピクセルjの一組すなわちJ={j|γt j=1}であり、Hはフレームの高さであり、Wはフレームの幅である。
ステップ321において決定された距離変換を用いて、ステップ322において各ピクセルiの背景スコアがアルファマット及び標準化された距離変換の反転又は補完の重み付けされた組合せとして決定される。
Figure 0005607079
例示の実施例においては、重みwは0.8の値を有している。様々な例示の実施例において、重みwは0.5〜0.9の範囲を有する。
等式(6)の重み付けされた組合せは、低いα値を有し且つ前景ピクセルの近くに位置するピクセルのために、より高い背景スコアをもたらす。図4Cには、ステップ322において決定された背景スコアδtが図示されている。図4Cに現れるピクセルが明るい程、その背景スコアが高くなる。
ステップ322において決定された背景スコアは、ステップ323において閾値制御を受ける。当該制御においては、背景スコア領域δtは、以下のようなバイナリ領域λtを生成するために閾値と比較される。
Figure 0005607079
ここで、τbgは予め設定された背景スコア閾値である。閾値τbgの例示の範囲は0.5〜0.9である。
ステップ323において生成されたバイナリ領域λtは、ステップ324においてモルフォロジ収縮される。
Figure 0005607079
ここで、FE(.)はモルフォロジ収縮演算子を示し、E(s)はスケールsの構成要素を示している。様々な形状及びサイズの構成要素の変化は、上述のように用いられることができる。図4Dには、ステップ324においてバイナリ領域λtのモルフォロジ収縮の結果得られた領域ωtが図示されている。図4Dにおける白色のピクセルは背景制約ピクセルを示している。背景としてマークされた領域を収縮することにより、収縮動作は、例え前景(及び/又は背景)が一定量動いたとしても、これらの領域がフレームt+1における前景の外側にあることを確かなものにする。
仮に閾値制御ステップ323において生成される背景領域が、削除される場合又は、モルフォロジ収縮ステップ324において予め定められた最小サイズ(例えばビューワーによって知覚されないほど小さいサイズ)よりも小さい背景領域に減少される程小さい場合には、モルフォロジ収縮ステップ324はスキップされることに留意する。
最後に、ステップ325において、フレームt+1のための背景制約が、ωt i=1の場合にct+1 i=0として決定される。0又は1に設定されていないct+1 iは未定義のままである。すなわち、そのようなピクセルは未知の制約を有する。
図4Eには、フレームt+1のための伝播された前景−背景制約が図示されている。ここでは、白色は前景制約(ct+1 i=1)を示し、黒色は背景制約(ct+1 i=0)を示している。図4Fには、伝播制約を用いてフレームt+1から抽出されたマットαt+1が示されている。マットαt+1は、図1のマッティング方法110を用いて生成されることができる。このマットは、フレームt+2等のために制約を生成するために用いられる処理順内に存在する。
例示の方法は、例えば相関関係ベースのテンプレートマッチング又は視覚フローのような動き見積もり方法の複雑さを回避し、動きレベルの範囲に亘って信頼性を保って動作する。
前景−背景制約をあるフレームから次のフレームに伝播させる方法の例示の実施例においては、例えば現在フレームにおける前景対象の領域及びその配色などの先行情報が次のフレームのためのF−B制約を生成するために用いられる。パラメータτfg、τbg、sfg、sbg、及びwの全て又は一部組合せは、正確なマットを抽出するために先行情報に基づいて自動的に調整されることができる。この処理は、マットが先行情報によって課された制約を満たすまで反復して実行されることができる。例示の実施例においては、総当たり処理は、各パラメータ及び先行情報を満たす最良値の組合せの選択のために、複数の値を、好ましくは予め定められた範囲内において、試みることを含む。一例として、先行情報が前景領域を含む実施例を考える。仮に、例えば上述の処理によって決定された前景制約領域が大き過ぎた場合、パラメータτfg及びsfgを増加することができる。この結果、前景制約ピクセルがより少なくなる。これらのパラメータは、先行制約が満たされるまで調整されることができる。
図5は、本発明の構成に関する例示のシステム500のブロック図である。システム500は、アルファマット、F−B制約を生成し、及び/又はビデオストリームからのマッティングを実行するために用いられることができる。システム500は、フレーム取得部510と、デジタルビデオ編集部520と、を含む。フレーム取得部510は、本発明を構成するデジタルビデオ編集部520による処理のために、ビデオストリームの1つ又は2つ以上のフレームを捕捉する。デジタルビデオ編集部520は、プロセッサ521と、メモリ522と、I/O523と、を含む。例示の実施例においては、デジタルビデオ編集部520は、上述の制約伝播及び/又はマッティングを実行するためにメモリ522にロードされたソフトウェアを実行する汎用コンピュータとして実装され得る。
上述のように、上記は本発明の原理を単に説明したものであり、したがって、本明細書に明示されていなくとも、当業者は本発明の基本構成の意図及び範囲内において本発明の構成を具現化する多くの代替的な構成を工夫することができると考えられる。例えば、別個の機能要素として説明されている場合であっても、これらの機能要素は、1つの又は2つ以上の集積回路(IC)として具現化され得る。同様に、別個の要素として説明されている場合であっても、その要素のいくつか又は全ては、蓄積されたプログラムによって制御されるプロセッサ、例えばデジタル信号プロセッサ又は汎用プロセサとして実装され得る。プロセッサは、関連付けられたソフトウェア、例えば、対応する1つ又は2つ以上のステップを実行し、ソフトウェアは様々な好ましい記憶媒体に実装され得る。更に、本発明の原理は、様々な種類の有線及び無線の通信システム、例えば地上放送、衛星通信、ワイヤレスフィデリティ(Wi−Fi)、携帯電話等に適用できる。実際に、本発明の概念は、据え置きの又はモバイルの受信器にも適用できる。したがって、説明した実施例について多くの変形がなされ得るし、その他の構成が本発明の意図及び範囲から逸脱しない範囲で工夫され得ると考えられる。
付記1.
ビデオストリームのための前景制約及び背景制約を決定する、コンピュータに実装された方法であって、
ある1つのビデオフレームのための前景制約及び背景制約を受け入れるステップと、
前記前景制約及び背景制約を用いて前記ビデオフレームのためのマットを生成するステップと、
前記マットを用いて後続ビデオフレームのための前景制約を生成するステップと、
前記マットを用いて前記後続ビデオフレームのための背景制約を生成するステップと、
を含むことを特徴とする方法。
付記2.
前記ビデオフレームのため前記前景制約及び背景制約は、ユーザ入力を介して受け入れられることを特徴とする付記1に記載の方法。
付記3.
前記後続ビデオフレームのための前景制約を生成するステップは、
前記マット上で閾値制御を実行してバイナリ領域を生成するステップを含むことを特徴とする付記1に記載の方法。
付記4.
前記後続ビデオフレームのための前景制約を生成するステップは、
前記バイナリ領域上でモルフォロジ収縮制御を実行するステップを含むことを特徴とする付記3に記載の方法。
付記5.
前記後続ビデオフレームのための背景制約を生成するステップは、
前記マットを用いて背景スコア領域を生成するステップと、
前記背景スコア領域上で閾値制御を実行してバイナリ領域を生成するステップと、を含むことを特徴とする付記1に記載の方法。
付記6.
前記後続ビデオフレームのための背景制約を生成するステップは、
前記バイナリ領域上でモルフォロジ収縮制御を実行するステップを含むことを特徴とする付記5に記載の方法。
付記7.
前記背景スコア領域は、前記ビデオフレームの複数のピクセルのための背景スコアを含み、あるピクセルのための前記背景スコアは、前景ピクセルの近くの前記ピクセルに直接的に関連付けられていることを特徴とする付記5に記載の方法。
付記8.
前記背景スコア領域は、前記ビデオフレームの複数のピクセルのための背景スコアを含み、あるピクセルのための前記背景スコアは、前記マットにおける前記ピクセルのための対応する値に反転して関連付けられていることを特徴とする付記5に記載の方法。
付記9.
前記背景スコア領域を生成するステップは、
前記前景制約から距離変換を生成するステップと、
前記マットの反転と前記距離変換の反転との重み付けされた組合せを生成するステップと、を含むことを特徴とする付記5に記載の方法。
付記10.
前記重み付けされた組合せを生成するステップは、重みwにより前記マットの反転を重み付けし、重み1−wにより前記距離変換の反転を重み付けするステップを含み、0.5≦w≦0.9であることを特徴とする付記9に記載の方法。
付記11.
コンピュータ読み出し可能な媒体に記憶されたコンピュータプログラムであって、前記プログラムは、コンピュータに
ある1つのビデオフレームのための前景制約及び背景制約を受け入れるステップと、
前記前景制約及び背景制約を用いて前記ビデオフレームのためのマットを生成するステップと、
前記マットを用いて後続ビデオフレームのための前景制約を生成するステップと、
前記マットを用いて前記後続ビデオフレームのための背景制約を生成するステップと
を実行させることにより、ビデオストリームのための前景制約及び背景制約を決定させることを特徴とするコンピュータプログラム。
付記12.
前記ビデオフレームのため前記前景制約及び背景制約は、ユーザ入力を介して受け入れられることを特徴とする付記11に記載のコンピュータプログラム。
付記13.
前記後続ビデオフレームのための前景制約を生成するステップは、
前記マット上で閾値制御を実行してバイナリ領域を生成するステップを含むことを特徴とする付記12に記載のコンピュータプログラム。
付記14.
前記後続ビデオフレームのための前景制約を生成するステップは、
前記バイナリ領域上でモルフォロジ収縮制御を実行するステップを含むことを特徴とする付記13に記載のコンピュータプログラム。
付記15.
前記後続ビデオフレームのための背景制約を生成するステップは、
前記マットを用いて背景スコア領域を生成するステップと、
前記背景スコア領域上で閾値制御を実行してバイナリ領域を生成するステップと、を含むことを特徴とする付記11に記載のコンピュータプログラム。
付記16.
前記後続ビデオフレームのための背景制約を生成するステップは、
前記バイナリ領域上でモルフォロジ収縮制御を実行するステップを含むことを特徴とする付記15に記載のコンピュータプログラム。
付記17.
前記背景スコア領域は、前記ビデオフレームの複数のピクセルのための背景スコアを含み、あるピクセルのための前記背景スコアは、前景ピクセルの近くの前記ピクセルに直接的に関連付けられていることを特徴とする付記15に記載のコンピュータプログラム。
付記18.
前記背景スコア領域は、前記ビデオフレームの複数のピクセルのための背景スコアを含み、あるピクセルのための前記背景スコアは、前記マットにおける前記ピクセルのための対応する値に反転して関連付けられていることを特徴とする付記15に記載のコンピュータプログラム。
付記19.
前記背景スコア領域を生成するステップは、
前記前景制約から距離変換を生成するステップと、
前記マットの反転と前記距離変換の反転との重み付けされた組合せを生成するステップと、を含むことを特徴とする付記15に記載のコンピュータプログラム。
付記20.
前記重み付けされた組合せを生成するステップは、重みwによって前記マットの反転を重み付けし、重み1−wによって前記距離変換の反転を重み付けするステップを含み、0.5≦w≦0.9であることを特徴とする付記19に記載のコンピュータプログラム。

Claims (16)

  1. ビデオストリームのための前景制約及び背景制約を決定する、コンピュータ実方法であって、
    デオフレームのための前景制約及び背景制約を、ユーザ入力を介して受け入れるステップと、
    前記前景制約及び背景制約を用いて、フレームtにおいて前記ビデオフレームのためのマットを生成するステップと、
    前記マットを用いて、フレームt+1において後続ビデオフレームのための前景制約を生成するステップと、
    前記マットを用いて、フレームt+1において前記後続ビデオフレームのための背景制約を生成するステップであって、前記後続ビデオフレームのための背景制約を生成するステップは、
    前記マットを用いて背景スコア領域を生成するステップと、
    前記背景スコア領域上で閾値制御を実行してバイナリ領域を生成するステップと、を含む、ステップと、
    を含む、前記方法。
  2. 前記後続ビデオフレームのための前景制約を生成するステップは、
    前記マット上で閾値制御を実行してバイナリ領域を生成するステップを含む請求項1に記載の方法。
  3. 前記後続ビデオフレームのための前景制約を生成するステップは、
    前記バイナリ領域上でモルフォロジ収縮制御を実行するステップを含む請求項に記載の方法。
  4. 前記後続ビデオフレームのための背景制約を生成するステップは、
    前記バイナリ領域上でモルフォロジ収縮制御を実行するステップを含む請求項に記載の方法。
  5. 前記背景スコア領域は、前記ビデオフレームの複数のピクセルのための背景スコアを含み、あるピクセルのための前記背景スコアは、前景ピクセルの前記ピクセル近くに直接的に関連付けられている請求項に記載の方法。
  6. 前記背景スコア領域は、前記ビデオフレームの複数のピクセルのための背景スコアを含み、あるピクセルのための前記背景スコアは、前記マットにおける前記ピクセルのための対応する値に反転して関連付けられている請求項に記載の方法。
  7. 前記背景スコア領域を生成するステップは、
    前記前景制約から距離変換を生成するステップと、
    前記マットの反転と前記距離変換の転との重み付けされた組合せを生成するステップと、を含む請求項に記載の方法。
  8. 前記重み付けされた組合せを生成するステップは、重みwによる前記マットの前記転、および、重み1−wによる前記距離変換の前記転を重み付けするステップであって、0.5≦w≦0.9である、ステップを含む、請求項に記載の方法。
  9. メモリにコンピュータ命令を有するデジタルビデオ編集装置であって、前記コンピュータ命令は実行時に前記デジタルビデオ編集装置に、
    デオフレームのための前景制約及び背景制約を、ユーザ入力を介して受け入れるステップと、
    前記前景制約及び背景制約を用いて、フレームtにおいて前記ビデオフレームのためのマットを生成するステップと、
    前記マットを用いて、フレームt+1において後続ビデオフレームのための前景制約を生成するステップと、
    前記マットを用いて、フレームt+1において前記後続ビデオフレームのための背景制約を生成するステップであって、前記後続ビデオフレームのための背景制約を生成するステップは、
    前記マットを用いて背景スコア領域を生成するステップと、
    前記背景スコア領域上で閾値制御を実行してバイナリ領域を生成するステップと、を含む、ステップ
    を実行させることにより、ビデオストリームのための前景制約及び背景制約を決定する、前記デジタルビデオ編集装置
  10. 前記後続ビデオフレームのための前景制約を生成するステップは、
    前記マット上で閾値制御を実行してバイナリ領域を生成するステップを含む請求項に記載のデジタルビデオ編集装置
  11. 前記後続ビデオフレームのための前景制約を生成するステップは、
    前記バイナリ領域上でモルフォロジ収縮制御を実行するステップを含む請求項10に記載のデジタルビデオ編集装置
  12. 前記後続ビデオフレームのための背景制約を生成するステップは、
    前記バイナリ領域上でモルフォロジ収縮制御を実行するステップを含む請求項に記載のデジタルビデオ編集装置
  13. 前記背景スコア領域は、前記ビデオフレームの複数のピクセルのための背景スコアを含み、あるピクセルのための前記背景スコアは、前景ピクセルの前記ピクセル近くに直接的に関連付けられている請求項に記載のデジタルビデオ編集装置
  14. 前記背景スコア領域は、前記ビデオフレームの複数のピクセルのための背景スコアを含み、あるピクセルのための前記背景スコアは、前記マットにおける前記ピクセルのための対応する値に反転して関連付けられている請求項に記載のデジタルビデオ編集装置
  15. 前記背景スコア領域を生成するステップは、
    前記前景制約から距離変換を生成するステップと、
    前記マットの反転と前記距離変換の転との重み付けされた組合せを生成するステップと、を含む請求項に記載のデジタルビデオ編集装置
  16. 前記重み付けされた組合せを生成するステップは、重みwによる前記マットの前記転、および、重み1−wによる前記距離変換の前記転を重み付けするステップであって、0.5≦w≦0.9である、ステップを含む、請求項15に記載のデジタルビデオ編集装置
JP2011550117A 2009-02-10 2010-01-05 前景−背景制約伝播に基づくビデオマッティング Expired - Fee Related JP5607079B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US20726109P 2009-02-10 2009-02-10
US61/207,261 2009-02-10
PCT/US2010/000009 WO2010093408A1 (en) 2009-02-10 2010-01-05 Video matting based on foreground-background constraint propagation

Publications (3)

Publication Number Publication Date
JP2012517647A JP2012517647A (ja) 2012-08-02
JP2012517647A5 JP2012517647A5 (ja) 2014-05-29
JP5607079B2 true JP5607079B2 (ja) 2014-10-15

Family

ID=42562016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011550117A Expired - Fee Related JP5607079B2 (ja) 2009-02-10 2010-01-05 前景−背景制約伝播に基づくビデオマッティング

Country Status (7)

Country Link
US (1) US8611728B2 (ja)
EP (1) EP2396748A4 (ja)
JP (1) JP5607079B2 (ja)
KR (1) KR101670282B1 (ja)
CN (1) CN102388391B (ja)
BR (1) BRPI1008024A2 (ja)
WO (1) WO2010093408A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8625888B2 (en) 2010-07-21 2014-01-07 Microsoft Corporation Variable kernel size image matting
US8386964B2 (en) * 2010-07-21 2013-02-26 Microsoft Corporation Interactive image matting
US20120162412A1 (en) * 2010-12-22 2012-06-28 Electronics And Telecommunications Research Institute Image matting apparatus using multiple cameras and method of generating alpha maps
US9153031B2 (en) * 2011-06-22 2015-10-06 Microsoft Technology Licensing, Llc Modifying video regions using mobile device input
CN102289847A (zh) * 2011-08-02 2011-12-21 浙江大学 一种用于视频对象快速提取的交互方法
CN102395008A (zh) * 2011-11-21 2012-03-28 深圳市茁壮网络股份有限公司 一种色键处理方法
WO2013086137A1 (en) 2011-12-06 2013-06-13 1-800 Contacts, Inc. Systems and methods for obtaining a pupillary distance measurement using a mobile computing device
US9202281B2 (en) 2012-03-17 2015-12-01 Sony Corporation Integrated interactive segmentation with spatial constraint for digital image analysis
US9286715B2 (en) 2012-05-23 2016-03-15 Glasses.Com Inc. Systems and methods for adjusting a virtual try-on
US9483853B2 (en) 2012-05-23 2016-11-01 Glasses.Com Inc. Systems and methods to display rendered images
US9378584B2 (en) 2012-05-23 2016-06-28 Glasses.Com Inc. Systems and methods for rendering virtual try-on products
US8792718B2 (en) * 2012-06-29 2014-07-29 Adobe Systems Incorporated Temporal matte filter for video matting
US9111353B2 (en) * 2012-06-29 2015-08-18 Behavioral Recognition Systems, Inc. Adaptive illuminance filter in a video analysis system
US8897562B2 (en) 2012-06-29 2014-11-25 Adobe Systems Incorporated Adaptive trimap propagation for video matting
JP5994493B2 (ja) * 2012-08-31 2016-09-21 カシオ計算機株式会社 動画像前景切抜き装置、方法、およびプログラム
CN103024294B (zh) * 2012-09-20 2016-04-27 深圳市茁壮网络股份有限公司 色键实现方法和装置
JP2014071666A (ja) * 2012-09-28 2014-04-21 Dainippon Printing Co Ltd 画像処理装置、画像処理方法、及びプログラム
US9330718B2 (en) 2013-02-20 2016-05-03 Intel Corporation Techniques for adding interactive features to videos
CN103997687B (zh) * 2013-02-20 2017-07-28 英特尔公司 用于向视频增加交互特征的方法及装置
CN103400386B (zh) * 2013-07-30 2016-08-31 清华大学深圳研究生院 一种用于视频中的交互式图像处理方法
CN108495051B (zh) 2013-08-09 2021-07-06 热成像雷达有限责任公司 采用多个虚拟设备分析热像数据的方法和将深度值与图像像素进行关联的方法
CN103581571B (zh) * 2013-11-22 2017-02-22 北京中科大洋科技发展股份有限公司 一种基于色彩三要素的视频抠像方法
CN104933694A (zh) * 2014-03-17 2015-09-23 华为技术有限公司 前后景分割的方法及设备
CN103942794B (zh) * 2014-04-16 2016-08-31 南京大学 一种基于置信度的图像协同抠图方法
JP6547744B2 (ja) * 2014-06-03 2019-07-24 日本電気株式会社 画像処理システム、画像処理方法及びプログラム
EP2983132A1 (en) * 2014-08-08 2016-02-10 Thomson Licensing Method and apparatus for determining a sequence of transitions
US9449395B2 (en) 2014-09-15 2016-09-20 Winbond Electronics Corp. Methods and systems for image matting and foreground estimation based on hierarchical graphs
KR101624801B1 (ko) 2014-10-15 2016-05-26 포항공과대학교 산학협력단 전경 물체 추출을 위한 매팅 방법 및 이를 수행하는 장치
CN104504745B (zh) * 2015-01-16 2018-05-25 成都品果科技有限公司 一种基于图像分割和抠图的证件照生成方法
WO2016160794A1 (en) * 2015-03-31 2016-10-06 Thermal Imaging Radar, LLC Setting different background model sensitivities by user defined regions and background filters
CN105120185B (zh) * 2015-08-27 2018-05-04 新奥特(北京)视频技术有限公司 一种视频图像抠像方法与装置
US10275892B2 (en) * 2016-06-09 2019-04-30 Google Llc Multi-view scene segmentation and propagation
US10380741B2 (en) * 2016-12-07 2019-08-13 Samsung Electronics Co., Ltd System and method for a deep learning machine for object detection
CN106875406B (zh) * 2017-01-24 2020-04-14 北京航空航天大学 图像引导的视频语义对象分割方法及装置
JP6709761B2 (ja) * 2017-08-16 2020-06-17 日本電信電話株式会社 画像処理装置、画像処理方法及び画像処理プログラム
US10574886B2 (en) 2017-11-02 2020-02-25 Thermal Imaging Radar, LLC Generating panoramic video for video management systems
US11049289B2 (en) 2019-01-10 2021-06-29 General Electric Company Systems and methods to semi-automatically segment a 3D medical image using a real-time edge-aware brush
US11601605B2 (en) 2019-11-22 2023-03-07 Thermal Imaging Radar, LLC Thermal imaging camera device
CN113253890B (zh) * 2021-04-02 2022-12-30 中南大学 视频人像抠图方法、系统和介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134345A (en) 1998-08-28 2000-10-17 Ultimatte Corporation Comprehensive method for removing from an image the background surrounding a selected subject
US7606417B2 (en) * 2004-08-16 2009-10-20 Fotonation Vision Limited Foreground/background segmentation in digital images with differential exposure calculations
US7580556B2 (en) * 2004-01-26 2009-08-25 Drvision Technologies Llc Image region partitioning using pre-labeled regions
US7508990B2 (en) * 2004-07-30 2009-03-24 Euclid Discoveries, Llc Apparatus and method for processing video data
US7599555B2 (en) * 2005-03-29 2009-10-06 Mitsubishi Electric Research Laboratories, Inc. System and method for image matting
US8351713B2 (en) * 2007-02-20 2013-01-08 Microsoft Corporation Drag-and-drop pasting for seamless image composition

Also Published As

Publication number Publication date
US8611728B2 (en) 2013-12-17
KR20110124222A (ko) 2011-11-16
US20110293247A1 (en) 2011-12-01
KR101670282B1 (ko) 2016-10-28
EP2396748A1 (en) 2011-12-21
BRPI1008024A2 (pt) 2016-03-15
EP2396748A4 (en) 2012-05-30
CN102388391A (zh) 2012-03-21
WO2010093408A1 (en) 2010-08-19
JP2012517647A (ja) 2012-08-02
CN102388391B (zh) 2014-01-22

Similar Documents

Publication Publication Date Title
JP5607079B2 (ja) 前景−背景制約伝播に基づくビデオマッティング
US8861881B2 (en) Image processing apparatus, method thereof, program, and image capturing apparatus
EP3108379B1 (en) Image editing techniques for a device
Xu et al. Cast shadow detection in video segmentation
US20200258196A1 (en) Image processing apparatus, image processing method, and storage medium
CN110832541A (zh) 图像处理装置和方法
JP6924932B2 (ja) 移動体追跡方法、移動体追跡装置、およびプログラム
US20150071532A1 (en) Image processing device, computer-readable recording medium, and image processing method
Qian et al. Video background replacement without a blue screen
WO2009030596A1 (en) Method for non-photorealistic rendering
EP2709063A1 (en) Image processing device, computer-readable recording medium, and image processing method
JP3731952B2 (ja) 動画像検索用情報生成装置
US7477761B2 (en) Image processing apparatus and method, and image-capturing apparatus
US8311269B2 (en) Blocker image identification apparatus and method
JP2002522836A (ja) 静止画像生成方法および装置
US7181080B2 (en) Image processing apparatus and method, and image pickup apparatus
CN111583357A (zh) 一种基于matlab系统的物体运动图像捕捉合成方法
KR101195978B1 (ko) 동영상에 포함된 오브젝트를 처리하는 방법 및 장치
US20220398704A1 (en) Intelligent Portrait Photography Enhancement System
Koochari et al. Exemplar-based video inpainting with large patches
CN112085025B (zh) 物体分割方法、装置、设备
Liang et al. Video2Cartoon: A system for converting broadcast soccer video into 3D cartoon animation
JP2014229092A (ja) 画像処理装置、画像処理方法、および、そのプログラム
JP2012104053A (ja) 背景差分処理装置、背景差分処理方法及びコンピュータプログラム
CN117710868B (zh) 一种对实时视频目标的优化提取系统及方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131015

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140114

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140121

A524 Written submission of copy of amendment under section 19 (pct)

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20140411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140729

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140827

R150 Certificate of patent or registration of utility model

Ref document number: 5607079

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees