JP2007257623A - あるシーンについて取得されたビデオのアルファマットを求める方法およびシステム - Google Patents

あるシーンについて取得されたビデオのアルファマットを求める方法およびシステム Download PDF

Info

Publication number
JP2007257623A
JP2007257623A JP2007037988A JP2007037988A JP2007257623A JP 2007257623 A JP2007257623 A JP 2007257623A JP 2007037988 A JP2007037988 A JP 2007037988A JP 2007037988 A JP2007037988 A JP 2007037988A JP 2007257623 A JP2007257623 A JP 2007257623A
Authority
JP
Japan
Prior art keywords
foreground
pixels
var
labeled
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007037988A
Other languages
English (en)
Inventor
Wojciech Matusik
ウォーチエック・マトゥシック
Shmuel Avidan
シュミュエル・アビダン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/388,499 external-priority patent/US7420590B2/en
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2007257623A publication Critical patent/JP2007257623A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

【課題】ビデオのアルファマットを求める方法およびシステムが提示される。
【解決手段】一組のビデオがカメラアレイにより取得される。アレイ内の中央に位置するカメラが基準カメラとして指定され、基準ビデオを取得する。一組のビデオから前景奥行き面が選択される。各画像の画素強度の分散からtrimapが求められる。背景としてラベル付けされた画素および前景としてラベル付けされた画素の強度の分散がtrimapにおいて未知としてラベル付けされた画素に外挿される。背景としてラベル付けされた画素の強度の平均が、未知としてラベル付けされた画素に外挿されて、基準ビデオのアルファマットが求められる。
【選択図】図1

Description

本発明は、包括的には画像処理に関し、特にビデオマッティングに関する。
画像の効率的で高品質な合成は、特殊効果業界における重要なタスクである。通常、映画シーンは、前景と背景との2つの異なるレイヤから合成され、各レイヤは、コンピュータにより生成されるかまたは実際のものであることができ、異なる場所で撮影され得る。多くの場合、ソースビデオの前景の内容が合成ビデオの前景レイヤとして用いられるが、これには、ソースビデオ中の前景と背景との分割が必要である。
画像を前景と背景とに分割するプロセスは、アルファマットの「抜き出し(pulling)」すなわち「マッティング」と呼ばれる。アルファマットを抜き出す最も一般的な方法は、青または緑の背景の前で俳優を撮影するブルースクリーンマッティングである。ブルースクリーンマッティングの限界は、スタジオまたは同様に制御された環境でしか使用できず、自然の屋内または屋外セッティングでは使用できないということである。
自然なビデオマッティングとは、自然な環境で取得されたビデオからアルファマットを抜き出すことをいう。単一のビデオストリームを用いる場合、マット抽出の問題は、いくつかの未知項、すなわち、アルファ(α)、RGB前景(FRGB)、RGB背景(BRGB)の等式として提示することができる。各画素におけるRGBのビデオフレームIは、次のように表される。
RGB=αFRGB+(1−α)BRGB (1)
単一の画像を用いる場合、この問題は、過分に制約不足である。
最初のマッティングの方法およびシステムは、およそ50年前に記載されている。ブルースクリーンマッティングは、SmithおよびBlinn著「Blue screen matting」(Proceedings of the 23rd Annual Conference on Computer Graphics and Interactive Techniques, pp. 259-268, ACM Press, 1996)によって形式化された。SmithおよびBlinnは、前景を2つの異なる背景に対して撮影することにより、アルファおよび背景色の両方に対してロバストなソリューションが得られることを示した。この方法は、より複雑な光輸送効果、例えば、屈折も扱うように拡張されている。しかし、それらの方法は、能動的な照明および複数の画像の取得を必要とする。
ベイズ理論に基づく(Bayesian)マッティングは、当初、静的シーン用に開発された。これは、低周波数の背景およびユーザにより指定されるtrimapを仮定する。概して、trimapは、前景としてラベル付けされた画素と、背景としてラベル付けされた画素と、未知としてラベル付けされた画素とを含む。マッティングは、未知の画素が正確にラベル付けされることを必要とする。
この方法は、後にビデオに拡張された。しかし、trimapは、依然として、キーフレームについて手作業で指定される必要がある。別の拡張では、3Dシーンの幾何形状を再構成するためにマルチカメラシステムが用いられている。高品質のアルファマットが奥行きの不連続点において求められる。
ポアソンマッティングは、アルファマッティングを、マット勾配場のポアソン方程式を解くものとして位置付ける。これは、アルファに直接作用するのではなく、導出された測定値に作用し、従来は静止画に作用し、いくらかのユーザによる介入を必要とし、1つのフレームを処理するのに数分を要する。
自然なシーンのビデオマッティングは、Wang他著「Interactive video cutout」(ACM Transactions on Graphics, August 2005)およびLi他著「Video object cut and paste」(ACM Transactions on Graphics, August 2005)に記載されている。Wang他は、このタスクを達成するために、効率的なユーザインタフェースを提供することに焦点を当てているが、Li他は、新規の3Dグラフカットアルゴリズムを用いてから、手動で精緻化を行い、アルファマッティングのためのデータを準備する。
別の方法は、共通の投影中心を共有するが、被写界深度および焦点面の異なる3つのビデオストリームを用いて自然なビデオストリームのためのアルファマットを求める(McGuire他著「Defocus Video Matting」(ACM Transactions on Graphics, August 2005))。McGuire他の方法は、自動的であるが、この方法のランニングタイムは、1フレームにつき何分もかかる。さらに、前景物体にフォーカスが合っていなければならない。
他の方法は、制限付き(bounded)再構成およびグラフカットを考慮する。Wexler他著「Bayesian estimation of layers from multiple images」(Proceedings of 7th European Conference on Computer Vision (ECCV)、およびKolmogorov他著「Bi-layer segmentation of binocular stereo video」(Proceedings of CVPR05, 2005))を参照願いたい。Wexler他は、ベイズ理論に基づくフレームワークにおける問題を提起し、制限付き再構成、α分布および空間的一貫性を含むいくつかの異なる従来方法(priors)を検討する。Wexler他は、そのシステムのリアルタイムな側面を記載していない。一方で、Kolmogorov他は、アルファマッティングに焦点を当てておらず、むしろ、ステレオビデオに対してグラフカットを使用して前景と背景との分割を行うリアルタイムシステムを記載している。
カメラアレイは、コンピュータグラフィックスおよびコンピュータビジョンにおける様々な用途に用いられてきた。概略は、Wilburn他著「High performance imaging using large camera arrays」(ACM Transactions on Graphics, vol. 24, no. 3, pp. 765-776, 2005)を参照願いたい。
本発明の実施の形態は、カメラアレイを用いた高品質の自然なビデオマッティングを提供する。
本システムは、前景にフォーカスした合成開口画像を生成することにより、自然なシーンに存在する高周波数を取得する。これにより、前景から再投影される画素の分散が低減する一方で、背景から再投影される画素の分散が増加する。
本方法は、分散測定値を直接扱い、これらの統計値を用いてtrimapを構築し、このtrimapをその後アルファマットにアップグレードする。プロセス全体が完全に自動的であり、合成開口画像のためのオートフォーカス方法と、trimapおよびアルファマットを求めるための自動方法とを含む。
本方法は、効率的であり、1画素当たりのランニングタイムがカメラの台数に対して直線性を有する。本システムは、数フレーム毎秒で動作し、高品質なアルファマットをリアルタイムに近いレートで、能動的な照明または特別な背景を用いずに求めることができる。
本発明は、カメラアレイを用いた自然なビデオマッティングの問題を解決する。この解決策は、自然なシーンが高周波の細部を含むという事実に依存する。本発明では、カメラからの画像を合成によりリフォーカスして、中央の基準カメラのビューと位置合わせされ、かつ前景物体にフォーカスした合成開口画像を構築する。合成開口画像は、前景の基準面に位置合わせされた画像の平均値を取ることにより計算される。本発明では、また、再位置合わせされた画像の分散を計算する。画像は、前景にフォーカスしているため、前景物体の画素の分散値は、背景のそれよりも遥かに低い。これにより、分散画像が生じ、この分散画像は、次に2重しきい値処理されてtrimapが得られ、このtrimapは、アルファマットの計算に用いられる。このプロセスは、従来方法と対照的に、完全に自動的である。
平均および分散の測定値に依存することにより、本発明では、背景の奥行きの計算または3Dシーンの再構築という難しい問題を回避する。本発明は、画素強度値を直接扱う代わりに、画素強度分散を扱うアップグレードされたマッティング方程式を用いてアルファマットを計算する。この結果は、高速で自動的であり、任意の複雑な背景シーンを扱うことができる。本発明の方法の付加的な利点は、1画素当たりのランニングタイムがカメラの台数に比例することである。
図1は、本発明の一実施形態による方法100を示す。図2は、本発明の一実施形態によるシステム200を示す。方法100およびシステム200は、アルファマット(α)108およびアルファを乗算した前景(αF)109を求める。方法100は、プロセッサ220において実行される命令に従って動作する。
本方法およびシステムに対する入力は、カメラアレイ210(例えば、8台のカメラ)により取得されるシーン102の一組のビデオ101である。1台の実質的に中央に位置するカメラが、基準カメラ(RC)211として指定される。アルファマットは、この基準カメラ211により取得される基準ビデオ103について求められる。
前景奥行き面111を選択した(110)後、本方法は、trimap121を求める(120)。概して、trimapは、前景としてラベル付けされた画素と、背景としてラベル付けされた画素と、未知としてラベル付けされた画素とを含む。マッティングは、未知の画素が正確にラベル付けされることを必要とする。正確にラベル付けされたtrimapは、その後、アルファマット108となる。
従来技術と対照的に、trimapは、自動的に、すなわち、ユーザとの対話なしに求められる。また、本方法は、画像測定値の高次の統計値、すなわち、分散132を用いる。高次の統計値は、trimapの未知の領域131に外挿される(130)。未知の領域は、前景または背景であり得る画素を含む。目標は、未知の画素を確実に前景または背景としてラベル付けすることである。
従来技術の方法の中には、測定値を未知の領域に外挿するものもあるが、これらの方法は、画素強度値を直接外挿し、シーンの内容に関して限定した仮定を行う。分散の外挿は、限定度が遥かに低い。
具体的には、本発明の方法は、以下のように行われる。前景奥行き面111を自動的に選択する(110)。画素分散に基づいてtrimap121を求める(120)。背景領域および前景領域からの分散132をtrimap121の未知の領域131に外挿する(130)。平均141を背景から未知の領域131に外挿し(140)、α108およびαF109を求める(150)。
本発明では、8台のBasler社製カメラから成る線形アレイを用いる。各カメラの解像度は、640×480画素である。カメラは、外部ハードウェアトリガを有し、最高30フレーム毎秒で同期されたビデオを提供することができる。全てのカメラが、3GHzプロセッサ220に接続される。
従来のコンピュータビジョン方法を用いて、本発明のカメラアレイの外部パラメータおよび内部パラメータを幾何学的に較正する。本発明のカメラの投影中心は、一直線状に配置される。さらに、本発明では、全てのカメラ面を修正するホモグラフィを求める。本発明では、マクベスカラーチェッカーを全てのカメラが観測可能なようにシーンに配置することにより、基本色の較正を行う。本発明では、各カメラのカラーチェッカーの画像が基準カメラ211のそれに合うように、各カメラの色変換を計算する。本発明は、また、分散推定値、ひいてはtrimap121およびアルファマット108の品質を大幅に高めるビネッティング較正を行う。
本方法は、リアルタイムで行われる場合、QVGA画像を数フレーム毎秒で処理することができる。オフラインモードでは、高画質なVGAの結果が約1フレーム毎秒で生成される。2つのモード間の違いは、その探索段階にある。
具体的には、オフラインモードでは、全ての画素について奥行き探索を行うが、オンラインモードでは、分散を1つの奥行き面のみについて計算し、前景が平面でないことによる高分散を除去し、次に、奥行き探索をtrimapの未知の領域の画素のみについて行う。
方法100は、合成開口画像、分散画像、およびtrimapを前景奥行き面111について求める。
前景の奥行きを自動的に選択
本発明では、合成リフォーカシングを用いて前景奥行き面111を選択する(110)。本発明は、空間において平面を掃引し、画像中の事前に定義された三角形内の分散が最小化される最も近い奥行きを選択することにより、前景の奥行きを自動的に選択する。分散が小さい場合、その奥行き面において、いくつかの特徴が位置合わせされる。前景物体は、画像の様々な部分にある可能性があるため、本発明では、そのような三角形をいくつか定義し、分散の最も小さい三角形を選択する。「手動フォーカス」は、ユーザが必要なときに自動フォーカスを無効にできるようにする。
本発明は、ユーザがシーンを通して合成焦点面を対話によりスライドさせることにより、前景の奥行きを選択することを可能にする。合成開口画像は、リアルタイムで表示され、前景物体が最も良くフォーカスされる平面をユーザが選択できるようにする。本発明者らは、この方法が、前景の奥行きを選択するために比較的単純で直感的であることを見出した。本発明のカメラアレイの手法の利点は、本発明のシステムが、方法100を数回、パス毎に異なる前景奥行き面を用いて行って複数の奥行き面を求めることにより、複数の前景物体を処理できることである。
自動的trimap算出
従来のマッティング方程式は、画素毎のものである。したがって、本発明では、全ての画像について、各シーン点の分散を求める。本発明では、画像Iにおいてシーン全体を取得するため、近くのシーン点を用いて前景Fおよび背景Bの分散を近似しなければならない。
trimapにおいて未知としてラベル付けされた各点について、本発明では、それに最も近い前景点および背景点の分散を用いて、var(F)およびvar(B)を推定する。本発明では、次に、アルファマットを後述のように求めることができる。
trimapは、過去において、アルファマット問題を解くための1ステップとして用いられてきたが、ユーザによって対話により供給されるものであり、本発明のシステムのように、自動的に計算されるものではないと見なされることが多かった。
本発明では、各カラーチャネルの分散を計算し、全ての画素のこのベクトルの大きさを取ることにより、trimapの構築を開始する。次に、本発明では、2重しきい値処理および膨張処理を用いてtrimapを計算する。具体的には、本発明では、低いしきい値を用いてbimap(すなわち、前景の画素対未知の画素のラベル化)を計算する。
本発明では、膨張処理およびよい高いしきい値の組み合わせを用いて未知の領域を求める。すなわち、高分散画素が前景としてラベル付けされた画素の隣に位置する場合、その画素は、前景(すなわち、鏡面性(specularity))部分として見なされる。一方、比較的低分散の画素が前景から遠く離れている場合、その画素は、背景として分類される。この空間分析と強度分析との組み合わせは、高品質なtrimapを確実に構築することを可能にする。
本発明では、前景物体は、全体が指定された前景面上にあると仮定する。しかし、平面は、前景物体の奥行きの大まかな近似でしかない場合が多い。非平面の前景物体を扱うために、本発明では、奥行き値の局所探索を行い、奥行きの不確かさを考慮に入れる。この探索は、前景基準面の近くの小さな奥行き範囲にわたって平面を掃引し、その範囲にわたって画素毎に最小分散値を記憶することによって行われる。これにより、フォーカスを画素毎にわずかに自動調節することができる。
細部
所与の時刻について、本発明では、シーンのn個(例えば8個)の画像を有する。本発明では、所与のシーン点(画素)pの以下のマッティング方程式を考慮する。
I=1,・・・,nについて
{I(p)=α(p)F(p)+(1−α(p))B(p)} 、(2)
ここで、I(p)は、画像iにおいて記録された点pの実際の強度情報に対応する。F(p)およびB(p)は、pの透明度の関数として混合されて所与のI(p)を与える前景および背景の値であり、α(p)は、この透明度の値である。本明細書では、pという表記を可能な場所ではどこでも省略して読み易さを高める。全ての画素について異なるFを指定することは、鏡面性等のビューに依存する効果を許容することを意味する。しかし、本発明では、点の透明度は、ビューに依存すると仮定する。したがって、αは、全ての画像にわたって固定である。
本発明では、{I(p)}、{F(p)}、{B(p)}をそれぞれ、ランダム変数I、F、およびBをサンプリングする際に考慮し、これらの変数を用いてマッティング方程式を書き換える。
I=αF+(1−α)B (3)
本発明では、これらのランダム変数を用いてαおよびαFを解き、これを、I、F、およびBの二次モーメント(すなわち分散)を用いてαを解き、IおよびBの一次モーメント(すなわち、平均)を用いてαFを解くことによって行う。本発明では、Fの平均を用いないことに留意願いたい。
本発明の方法の第3のステップ130および第4のステップ140が前景および背景としてラベル付けされた画素からの画像測定値を未知の画素に外挿することを思い起こされたい。前景物体の平均画素値を外挿し、平均統計値のみを用いてアルファマットを解くこともできるが、これは、前景物体が低周波数のアルベドを有するものと仮定し(非常に限定された仮定である)、一方で、分散の外挿は、低周波数アルベドおよび高周波数アルベドの両方を有する物体を可能にする。これは、重要な点であり、本発明のシステムおよび方法の利点の1つである。
具体的には、pを考慮中のシーン点とし、pおよびpを、trimapにおいて、それぞれ前景および背景としてラベル付けされた、基準画像(すなわち、中央のカメラ211からの画像)の横線上の最も近い点として示す。本発明では、以下の式(4)〜(6)の近似を行う。
Figure 2007257623
画像I、I、およびIについて図3に示すように、これらの近似は、以下の2つの仮定を行う。最も近い背景点pの一次統計値および二次統計値(例えば平均および分散)は、そのシーン点pが対比して観察される対応する背景色の統計値と同じである。これは、大体において、カメラ中心から点pおよびpを通る光線は、必ずしも同じ順番ではないものの、同様の背景点と交差するため、もっともらしい仮定である。
サンプルの順序は、分散の推定がサンプルの順番に対して不変であるため、この場合には、無関係である。実際には、背景が前景物体から大きく離れており、pとpとの間の距離が小さいため、これらの2点を通る光線束は、大きく重なる。最も近い前景点pの二次統計値は、シーン点pの二次統計値と同じである。これは、シーン点およびそれに最も近い前景点のビューに依存しない特性(例えばアルベド)は、全く異なる可能性があるが、それらのビューに依存する特性(例えば反射光レベル)は、同じであると言うことに等しい。
シーン点pについて全てのカメラにわたり観測される値が2つの統計的に独立した変数(すなわち、前景および背景)の固定された一次結合であると仮定すると、従来のマッティング方程式をランダム変数I、FおよびBに関して、
I=αF+(1−α)B (7)
のように書き換えることができ、これらの変数の分散を次のように表すことができる。
var(I)=var[αF+(1−α)B] (8)
BおよびFが統計的に独立していると仮定すると、次式が成り立つ。
var(I)=var[αF+(1−α)B]、
={[(αF+(1−α)B)−{F+(1−α)B}]}、
={[α(F−{F})+(1−α)(B−{B})]}、
=α{(F−{F})}+(1−α){(B−{B})}、
=αvar(F)+(1−α)var(B) (9)
ここで、これらの式中の{X}は、Xの平均値を表す。BおよびFが統計的に独立しているという仮定は、式(9)の3行目から4行目への移行部分に示され、ここで、項α(1−α)(F−{F})(B−{B})は、ゼロに等しいものと仮定される。αを求めるために、αの二次方程式を解かなければならない。
[var(F)+var(B)]α−2var(B)α
+[var(B)−var(I)]=0 (10)
この二次方程式の解は、次のようになる。
α=(var(B)±√Δ)/(var(F)+var(B)) (11)
ここで、Δは、下式(12)である。
Δ=var(I)[var(F)+var(B)]−var(F)var(B)
(12)
この方程式は、放物線として図式で表すことができる。この方程式の最小値は、
αmin=(var(B))/(var(B)+var(F)) (13)
において到達し、これは、縦軸x=αminに沿って対称である。var(F)=var(B)である場合、常に2つの有効解があり、この方程式のみに基づいて曖昧さを解消することはできない。
幸いにも、実際には、この放物線は、大きく右にシフトしている。これは、var(B)が、通常は、var(F)よりも数桁大きいためである。したがって、2つの場合がある。var(I)≧var(F)である場合、解は
(var(B)±√Δ)/(var(F)+var(B))>1
となり、無効な解となる。
var(I)<var(F)である場合、放物線の幅(すなわち2つの解の間の距離)は、次式によって与えられる。
(2var(F))/(var(B)+var(F))
これは、非常に小さいため、αminは、いずれにも良好な近似として機能することができる。
具体的には、本発明では、次式(14)を用いてαを評価する。
Figure 2007257623
本発明のシーンが拡散である、すなわちvar(F)=0であると仮定した場合、この方程式に曖昧さはない。
Figure 2007257623
αを回復した後、次式(16)を用いてαFを回復する。
Figure 2007257623
ここで、I( ̄)は、全ての画像における対応する画素値の平均を示し、これは、実際には、合成開口画像における画素値である(ただし( ̄)は、()の前の記号の上に ̄が付された記号を意味する)。値αは、式(14)から回復され、B( ̄)は、背景画素値の平均である。結果を改善するために、本発明では、中央の基準カメラ211から取得された画像に最も高い重みをかけ、中央から遠く離れたカメラほど重みを減らして背景色の加重平均を求める。
本発明では、アルファが固定されており、ビューに依存しないと仮定する。実際には、多くの物体について当てはまるが、物体によっては、ビューに依存したアルファを示すものもある。最も一般的には、これは、自己遮蔽によるものである。自己遮蔽は、合成によりリフォーカスされた画像において画素について高い分散を生じる。これにより、不正確なアルファ値が生じる。本発明のカメラについて、狭いベースラインを用いることにより、これらの誤差は、制限される。背景が前景から数メートルのところにある場合、0.5メートルのベースラインが良好に機能する。また、ビューに依存した効果を保存するように設計されたカメラ毎の重み項を用いることにより、これらの誤差を低減することができる。基準ビューにより近いカメラをより重く重み付けすることにより、自己遮蔽の効果を制限することができる。
本発明は、また、光照射野のエイリアシングにより制限される。実際には、本発明者らは、エイリアシングによる誤差が、背景の画素の測定値についてのみ顕著であることを見出した。エイリアシングは、合成によりデータをリフォーカスすると周期的なテクスチャが位置合わせされることにより分散測定値を不正確にする。これにより、背景画素は、非ゼロのアルファを持つようになる。これらの問題を軽減することのできる改良がいくつかある。第1は、より多くのカメラを用いることである。本発明者らは、本発明の方法が、大きく密なカメラアレイを用いて良好に働くと信じている。少数のカメラを用いる場合でも、様々なカメラ分布によりエイリアシングアーティファクトを低減することができる。例えば、カメラは、中心の基準カメラに向かって集中させることができる。2Dアレイを用いる場合、本システムは、水平方向および垂直方向の両方で生じる背景色の変動から利益を得る。さらに、ほとんどの背景構造は、水平方向および垂直方向であるため、斜め方向の十字配置を用いることは、これらの特徴を合成によりリフォーカスされる画像において最大限に広げるために有利であり得る。
本発明では、また、背景の分散が統計的に独立しており、前景の分散よりも数桁大きいと仮定する。これは、ほとんどのシーンに当てはまる。実際には、非常に反射率の高い表面でさえ、背景の分散よりも数桁小さいvar(F)を有する。本発明のシーンでは、var(F)は、およそ数百以下であり、var(B)は、数千以上である。これらの単位は、およそ8ビットRGBレベルの二乗、すなわち0〜255である。
しかし、背景の分散が小さい場合、入力は、既知の背景値において取られる1つのカメラ入力に低減される。この場合、本発明では、ブルースクリーンマッティングまたはベイズ理論に基づくマッティング、または両技法を統一的に結合したもの等の既存の方法を用いることができる。
低分散の背景の場合、1画素につき4つの未知数αおよびαFがあり、3つの線形制約しかないため、問題は、制約不足であることに留意する。背景の色が分かっており、かつ背景が低周波数であることが分かっていたとしても、さらなる仮定(例えば、前景色またはアルファおよび前景の空間周波数に関する仮定)を行うことによって問題を解くことは可能である。本発明では、式(9)を、より高次の統計値に一般化することができる。これは、有用な拡張である。より一般的には、本発明では、マットを抜き出すために、平均および分散だけでなく、分布を考慮することができる。分布の平均および分散を推定するには、8台のカメラで十分であり得るが、上述したエイリアシングの問題のために、分布を明示的にモデル化するためには十分でない。しかし、例えば、100台のカメラから成るカメラアレイを用いれば、本発明の方法を、より高度な分布モデルを用いるように拡張することが可能である。
本発明の一実施形態による、アルファマットを抽出するフロー図である。 本発明の一実施形態による、アルファマットを抽出するシステムのブロック図である。 本発明の一実施形態による、前景面においてラベル付けすべき点の概略図である。

Claims (14)

  1. あるシーンについて取得されたビデオのアルファマットを求める方法であって、
    各カメラにより取得されるビデオが1つずつあり、各ビデオは画像シーケンスを含み、各画像は画素を含み、中央に位置するカメラが、指定される基準ビデオを取得するように構成される基準カメラとして指定され、カメラアレイによって取得された一組のビデオから前景奥行き面を選択することと、
    各画像中の画素の強度の分散から、前景としてラベル付けされた画素と、背景としてラベル付けされた画素と、未知としてラベル付けされた画素とを含むtrimapを求めることと、
    前記背景としてラベル付けされた画素および前記前景としてラベル付けされた画素の前記強度の分散を前記未知としてラベル付けされた画素に外挿することと、
    前記基準ビデオのアルファマットを求めるために、前記背景としてラベル付けされた画素の前記強度の平均を前記未知としてラベル付けされた画素に外挿することと
    を含むあるシーンについて取得されたビデオのアルファマットを求める方法。
  2. 前記カメラアレイは、線形アレイである請求項1に記載の方法。
  3. 前記一組のビデオが取得される間に該ビデオを同期することをさらに含む請求項1に記載の方法。
  4. 前記カメラアレイの外部パラメータおよび内部パラメータを幾何学的に較正することをさらに含む請求項1に記載の方法。
  5. 前記前景奥行き面は、前記画像中の事前に定義された三角形内の画素の分散が最小化される最も近い奥行きとなるように選択される請求項1に記載の方法。
  6. 複数の前景奥行き面が選択される請求項1に記載の方法。
  7. 前記前景奥行き面は、対話により選択される請求項1に記載の方法。
  8. 高分散画素が前記前景としてラベル付けされた画素の比較的近くに位置する場合、該高分散画素は、前記前景の部分であると見なされ、低分散画素が該前景から比較的遠くにある場合、該低分散画素は、前記背景の部分として見なされる請求項1に記載の方法。
  9. 各画像I中の前記画素の前記分散は、var(I)であり、前記前景としてラベル付けされた画素の前記分散は、var(F)であり、前記背景としてラベル付けされた画素の前記分散は、var(B)であり、前記アルファマットは、
    α=(var(B)±√Δ)/(var(F)+var(B))
    であり、ここで、
    Δ=var(I)[var(F)+var(B)]−var(F)var(B)
    である請求項1に記載の方法。
  10. αFは、
    Figure 2007257623
    であり、ここで、
    Figure 2007257623
    は、全ての画像中の対応する画素値の平均を示し、
    Figure 2007257623
    は、前記背景としてラベル付けされた画素の平均であり、Fは、前景画像である請求項9に記載の方法。
  11. 前記強度は、重み付けされる請求項1に記載の方法。
  12. 前記カメラアレイは、実質的に2Dの同一平面上にある構成で配置される請求項1に記載の方法。
  13. 前記前景奥行き面は、合成開口画像を用いて選択される請求項1に記載の方法。
  14. あるシーンについて取得されたビデオのアルファマットを求めるシステムであって、
    各カメラにより取得されるビデオが1つずつあり、各ビデオは画像シーケンスを含み、各画像は画素を含み、中央に位置するカメラが、指定される基準ビデオを取得するように構成される基準カメラとして指定され、カメラアレイによって取得された一組のビデオから前景奥行き面を選択する手段と、
    各画像中の画素の強度の分散から、前景としてラベル付けされた画素と、背景としてラベル付けされた画素と、未知としてラベル付けされた画素とを含むtrimapを求める手段と、
    前記背景としてラベル付けされた画素および前記前景としてラベル付けされた画素の前記強度の分散を前記未知としてラベル付けされた画素に外挿する手段と、
    前記基準ビデオのアルファマットを求めるために、前記背景としてラベル付けされた画素の前記強度の平均を前記未知としてラベル付けされた画素に外挿する手段と
    を備えるあるシーンについて取得されたビデオのアルファマットを求めるシステム。
JP2007037988A 2006-03-24 2007-02-19 あるシーンについて取得されたビデオのアルファマットを求める方法およびシステム Withdrawn JP2007257623A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/388,499 US7420590B2 (en) 2005-09-29 2006-03-24 Video matting using camera arrays

Publications (1)

Publication Number Publication Date
JP2007257623A true JP2007257623A (ja) 2007-10-04

Family

ID=38631750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007037988A Withdrawn JP2007257623A (ja) 2006-03-24 2007-02-19 あるシーンについて取得されたビデオのアルファマットを求める方法およびシステム

Country Status (1)

Country Link
JP (1) JP2007257623A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039999A (ja) * 2008-08-08 2010-02-18 Toyota Motor Corp 画像セグメンテーション方法、プログラムおよび装置
WO2010107235A2 (ko) * 2009-03-16 2010-09-23 광주과학기술원 다시점 영상 처리 방법 및 장치
JP2014106647A (ja) * 2012-11-26 2014-06-09 Canon Inc 画像処理装置、画像処理方法、及びプログラム
CN110930321A (zh) * 2019-11-06 2020-03-27 杭州恩玖软件有限公司 一种能够自动选取目标区域的蓝/绿幕数字图像抠取方法
CN112801896A (zh) * 2021-01-19 2021-05-14 西安理工大学 基于前景提取的逆光图像增强方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001052177A (ja) * 1999-08-11 2001-02-23 Univ Waseda 画像処理装置および画像処理方法
JP2006012161A (ja) * 2004-06-28 2006-01-12 Microsoft Corp 対話式視点ビデオシステムおよびプロセス

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001052177A (ja) * 1999-08-11 2001-02-23 Univ Waseda 画像処理装置および画像処理方法
JP2006012161A (ja) * 2004-06-28 2006-01-12 Microsoft Corp 対話式視点ビデオシステムおよびプロセス

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039999A (ja) * 2008-08-08 2010-02-18 Toyota Motor Corp 画像セグメンテーション方法、プログラムおよび装置
WO2010107235A2 (ko) * 2009-03-16 2010-09-23 광주과학기술원 다시점 영상 처리 방법 및 장치
KR100989435B1 (ko) 2009-03-16 2010-10-26 광주과학기술원 다시점 영상 처리 방법 및 장치
WO2010107235A3 (ko) * 2009-03-16 2011-01-20 광주과학기술원 다시점 영상 처리 방법 및 장치
JP2014106647A (ja) * 2012-11-26 2014-06-09 Canon Inc 画像処理装置、画像処理方法、及びプログラム
CN110930321A (zh) * 2019-11-06 2020-03-27 杭州恩玖软件有限公司 一种能够自动选取目标区域的蓝/绿幕数字图像抠取方法
CN112801896A (zh) * 2021-01-19 2021-05-14 西安理工大学 基于前景提取的逆光图像增强方法
CN112801896B (zh) * 2021-01-19 2024-02-09 西安理工大学 基于前景提取的逆光图像增强方法

Similar Documents

Publication Publication Date Title
US7420590B2 (en) Video matting using camera arrays
US10679361B2 (en) Multi-view rotoscope contour propagation
US9911200B2 (en) Determining diffuse image component values for use in rendering an image
US7602990B2 (en) Matting using camera arrays
Joshi et al. Natural video matting using camera arrays
Gastal et al. Shared sampling for real‐time alpha matting
Munoz et al. BSSRDF estimation from single images
US20060221248A1 (en) System and method for image matting
Yuan et al. Image haze removal via reference retrieval and scene prior
US20120257815A1 (en) Method and apparatus for analyzing stereoscopic or multi-view images
US7609327B2 (en) Polarization difference matting using a screen configured to reflect polarized light
US20120307023A1 (en) Disparity distribution estimation for 3d tv
CN110352592A (zh) 成像设备和成像方法以及图像处理设备和图像处理方法
Xu et al. Correction of clipped pixels in color images
JP2007257623A (ja) あるシーンについて取得されたビデオのアルファマットを求める方法およびシステム
CN114697623A (zh) 投影面选取和投影图像校正方法、装置、投影仪及介质
US20180342075A1 (en) Multi-view back-projection to a light-field
Zhang et al. Interactive stereoscopic video conversion
Sarkar et al. LitNeRF: Intrinsic Radiance Decomposition for High-Quality View Synthesis and Relighting of Faces
Croci et al. A framework for quality control in cinematic VR based on Voronoi patches and saliency
Ziegler et al. Multi-camera system for depth based visual effects and compositing
Evers‐Senne et al. Image based interactive rendering with view dependent geometry
Ha et al. Progressive acquisition of svbrdf and shape in motion
Jorissen et al. Multi-camera epipolar plane image feature detection for robust view synthesis
US20230419524A1 (en) Apparatus and method for processing a depth map

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110905

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20111226