JP2014194797A - オプティカルフローの決定のためのデジタル処理方法およびシステム - Google Patents

オプティカルフローの決定のためのデジタル処理方法およびシステム Download PDF

Info

Publication number
JP2014194797A
JP2014194797A JP2014096424A JP2014096424A JP2014194797A JP 2014194797 A JP2014194797 A JP 2014194797A JP 2014096424 A JP2014096424 A JP 2014096424A JP 2014096424 A JP2014096424 A JP 2014096424A JP 2014194797 A JP2014194797 A JP 2014194797A
Authority
JP
Japan
Prior art keywords
optical flow
pyramid
image
flow field
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014096424A
Other languages
English (en)
Other versions
JP5861949B2 (ja
Inventor
L Gaddy William
ガディ,ウィリアム,エル.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INNOVATIVE TECHNOLOGIES DISTRIBUTORS LLC
Original Assignee
INNOVATIVE TECHNOLOGIES DISTRIBUTORS LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INNOVATIVE TECHNOLOGIES DISTRIBUTORS LLC filed Critical INNOVATIVE TECHNOLOGIES DISTRIBUTORS LLC
Publication of JP2014194797A publication Critical patent/JP2014194797A/ja
Application granted granted Critical
Publication of JP5861949B2 publication Critical patent/JP5861949B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/207Analysis of motion for motion estimation over a hierarchy of resolutions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/12Systems in which the television signal is transmitted via one channel or a plurality of parallel channels, the bandwidth of each channel being less than the bandwidth of the television signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/269Analysis of motion using gradient-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

【課題】画像の対の間のオプティカルフロー場を決定するための方法およびシステムが開示される。
【解決手段】非オクターブ・ピラミッド係数を使用して、画像の対の各々が画像ピラミッドに分解される。分解された画像の対における画素の明るさの勾配が一定であるという仮定の下に、分解された画像の対は、最初のピラミッド・スケールで、二次導関数表現に変換される。二次導関数画像表現の離散時間導関数が推定される。生のオプティカルフロー場を発生させるために、オプティカルフロー推定処理が離散時間導関数に適用される。生のオプティカルフロー場は、非オクターブ・ピラミッド係数によってスケーリングされる。最後のオプティカルフロー場を発生させるために、すべてのピラミッド・スケールが訪問されるまで、画像の対に対して、別のピラミッド・スケールで、上記のステップが繰り返され、時空間勾配推定は、以前の生のオプティカルフロー推定によってワープされる。
【選択図】図1

Description

関連出願の相互参照
本出願は、全体として参照によりその開示が本明細書に組み込まれている、2008年10月15日に出願した米国仮特許出願第61/105,515号の権利を主張するものである。
本発明は一般にデジタル画像処理に関し、より詳細には、画像の対の間のオプティカルフロー場(optical flow field)の自動決定のための方法およびシステムに関する。
特にビデオフレームおよび/またはフィールドのシーケンスについて、2つの画像の間のオプティカルフロー場を決定することは、符号化、フレームレート変換、ノイズリダクション、その他など、多数の高価値ビデオ処理タスクにおいて、しばしば遭遇するステップである。オプティカルフローを計算するための既知の方法は、いくつかの障害に遭遇する。多数の方法は、低い正確度を欠点として有し、動きベクトルは実際の動きを反映しない場合があり、他のものは精度を欠き、動きベクトルが、制限された領域内の単一画素、または、画素の特定の小部分程度の精度に制限され、さらに他のものは、密度の欠如を欠点として有し、単一動きベクトルは、画素毎ではなく、画像の全体の領域またはブロックについてのみ使用可能である場合がある。加えて、広く様々な計算およびメモリ帯域幅コストが、これらの方法のうち、全部ではないとしても多数に生じる。
既存の方法は、大まかに3つのカテゴリに分類される場合があり、すなわち(1)ブロックベースのマッチング、(2)位相ベースの推定、および(3)勾配ベースの推定である。ブロックベースのマッチング方法は、それらの比較的小さい複雑性および直観性のため、ビデオ符号化および他のリアルタイムタスクにおいてしばしば使用される。しかし、ブロックベースのマッチング方法は、ブロック探索の範囲によって、ダイナミックレンジが制限され、ブロック探索の細かさによって精度が制限され、サブピクセルレベルで画素値をサンプルするために使用された補間器の正確度が制限され、「開口問題(aperture problem)」として知られるものにより、正確度が制限される。勾配に沿ってテクスチャまたはエッジ差のないブロック間の十分な差の欠如により、ブロックマッチング法が誤った動きベクトルを推定するとき、「開口問題」は発生し、その結果、大域的最小ではなく局所的最小での動きベクトルとなる。従来技術のブロックベースのオプティカルフローおよび動き推定法は、開口問題を欠点として有し、開口問題は、探索の深度および幅を、網羅的探索のものから低減するために、マルチスケールまたは他の技術を使用することによって、探索の複雑性を低減しようと試みるブロックベースの方法において、さらに悪化される。多数のブロックベースの方法は、オプティカルフロー推定の絶対的な(または粗いものでさえ)正確度を必要としないことによって、開口問題を回避する。このような方法は、観察中の2つのフレームの間の動き補償ステップにおいてオプティカルフロー場を適用した後に残された、残りの差のみを符号化する。結果として、動き補償ブロックベースの方法は、低減された正確度という犠牲を払って、ビデオ符号化の分野において幅広い応用を見出している。
位相ベースの動き推定技術は、「The Engineer’s Guide to Motion Compensation」、John Watkinson著、1994年、Snell & Wilcox Ltd.、23〜38頁に記載された位相ベースの動き推定方法など、比較的正確、精密で、実質的に雑音免疫のオプティカルフローを計算するために採用されている。しかし、位相ベースの動き推定は、周波数領域において行われ、その中で計算された位相情報に従って動作し、したがって、入力画像が2D周波数領域に変換されることを必要とし、ビデオのためには非常に計算的に高価な処理である。計算効率を向上させようとして、ある他の位相ベースの動き推定処理は、ガボールベースの方向に基づいた変換フィルタリングなど、変換のタイプを大域的から局所的へと変更することによって、フーリエベースの位相計算に基づいた処理を超えて漸進的な改善を示している。残念ながら、これらの技術はなお、比較的、大きいフィルタバンクを各画素に順次適用することを含み、結果として高いメモリ帯域幅要件となり、相対的な全体の計算の複雑性およびメモリ帯域幅の要件がわずかに減少するのみである。勾配ベースの推定は、米国特許第5,627,905号で教示されたような、FLIR(前方監視赤外線)目標捕捉/拒絶のためのオブジェクト・セグメンテーション、および、ThanakornおよびSakchaicharoenkul、「MCFI−based animation tweening algorithm for 2D parametric motion flow/optical flow」、Machine Graphics & Vision International Journal、v.15 n.1、29〜49頁、2006年1月で教示されたような、スローモーションおよびフレームレート変換効果のための時間補間ビデオフレーム(「トゥイーン・フレーム」)の計算を含む、いくつかのオフラインおよびリアルタイムの応用例において採用されている。B.K.P.HornおよびB.G.Schunck、「Determining optical flow」、Artificial Intelligence、vol.17、185〜203頁、1981年(以下「HornおよびSchunck」)、ならびに、Lucas,B.D.およびKanade T.、1981年、「An iterative image registration technique with an application to stereo vision」、Proceedings of Imaging understanding workshop、121〜130頁(以下「LucasおよびKanade」)で教示された、古典的なオプティカルフロー法は、画素毎に密なオプティカルフロー場を発生させるが、単一画素より大きい大きさの動きベクトルを、信頼性を有して生成することはできず、ひどい雑音、オブジェクト・オクルージョン、および、複雑な非並進運動の存在下で、矛盾したフロー場を欠点として有する。米国特許第5,680,487号に記載の方法およびシステムは、マルチスケール法を使用することによって、単一画素の制限を克服するが、雑音および/またはオクルージョンの存在下でロバストではない。勾配ベースの推定のさらなる改善は、米国特許第6,345,106号において教示され、ここでは、推定処理の数学的安定性を確かめるために、あらゆる画素に関連付けられた構造テンソルの固有解析(eigen analysis)を介して、各画素の周囲の勾配領域に固有システム解析が適用される。これは、計算された結果を選択的に受け入れるか、または拒否するために使用される場合がある、信頼値の計算を可能にし、それにより、雑音に対する、かつ、開口問題に対するロバスト性を増す。
勾配ベースの推定のもう1つの改善は、Nagel,H.−H.およびEnkelmann,W.、「An investigation of smoothness constraints for the estimation of displacement vector fields from image sequences」、IEEE trans.Pattern Anal.Mach.Intell.、1986年9月、8、565〜593頁(以下、「NagelおよびEnkelmann」)において教示されたように、シーンおよびオブジェクトのライティングにおける変化に対する計算のロバスト性を増すために、検査中の実際の勾配を推定するために、明るさ(「明るさの恒常性(brightness−constancy)の仮定」)ではなく、二次導関数(「勾配の不変性(gradient−constancy)の仮定」)を使用することである。NagelおよびEnkelmannによって使用された手法の欠点は、スケーリングおよび回転など、複雑な動きモデル下で、勾配の不変性の制約が違反されることである。加えて、NagelおよびEnkelmannの方式下での離散空間時空間微分(discrete−space spatio−temporal derivatives)の推定は、エラーのない実装を問題のあるものにすることが判明している。
前述の従来技術のオプティカルフロー法は、雑音およびオクルージョンの存在下で数学的不安定性を欠点として有し、推定処理の残りが依存する実際の時空間勾配計算の、無矛盾に適用された、しかし大変粗い近似(解析中の実際のサンプル位置でのサンプル値を完全に無視する、中心差分法など)によって、さらに損なわれる。これらの粗い近似は、初期推定処理における不要な誤りにつながり、さらなる複雑性というかなりの犠牲を払ってすべてが実施された、さらに不完全なヒューリスティックス、閾値または制約に基づいて、後続の段階に強制的に推定値をクリーンアップまたは拒否させるものである。
前述の従来技術のオプティカルフロー法は、(1)高い計算複雑性、(2)数値的不安定性による雑音感受性、(3)あるフレームから他のフレームへの画素のオクルージョンを補償できないこと、(4)制限された動きの範囲、(5)シーン内の、または、シーン内のオブジェクトのライティングの変化による明るさの変化の存在下で、フロー場を正確に計算できないこと、および/または(6)離散サンプリングされた勾配場のモデルにおける不正確または不適切な仮定による、正確度の問題、の問題のうち、1つまたは複数をさらに欠点として有する。
米国仮特許出願第61/105,515号 米国特許第5,627,905号 米国特許第5,680,487号 米国特許第6,345,106号
「The Engineer’s Guide to Motion Compensation」、John Watkinson著、1994年、Snell & Wilcox Ltd.、23〜38頁 ThanakornおよびSakchaicharoenkul、「MCFI−based animation tweening algorithm for 2D parametric motion flow/optical flow」、Machine Graphics & Vision International Journal、v.15 n.1、29〜49頁、2006年1月 B.K.P.HornおよびB.G.Schunck、「Determining optical flow」、Artificial Intelligence、vol.17、185〜203頁、1981年 Lucas,B.D.およびKanade T.、1981年、「An iterative image registration technique with an application to stereo vision」、Proceedings of Imaging understanding workshop、121〜130頁 Nagel,H.−H.およびEnkelmann,W.、「An investigation of smoothness constraints for the estimation of displacement vector fields from image sequences」、IEEE trans.Pattern Anal.Mach.Intell.、1986年9月、8、565〜593頁 Shibata,M.、Yanagisawa,T.、「A study of optimal angle of color vector for optical flow extraction」、SICE、2007 Annual Conference、vol.、no.、2518〜2523頁、2007年9月17〜20日 Kennedy,H.L.2007.Gradient Operators for the Determination of Optical Flow.In Proceedings of the 9th Biennial Conference of the Australian Pattern Recognition Society on Digital Image Computing Techniques and Applications(2007年12月03〜05日).DICTA.IEEE Computer Society、Washington,DC、346〜351 Christmas,W.J.、「Spatial Filtering Requirements for Gradient−Based Optical Flow Measurement」、Centre for Vision, Speech and Signal Processing University of Surrey、Guildford GU2 5XH,UK
したがって、変化するシーンおよびオブジェクトのライティング、複雑な動き、ならびに、オブジェクト・オクルージョンを含む、雑音の多いビデオ画像に操作を加えるためにより適している、正確で、精密で、計算複雑性が比較的低いデジタルオプティカルフロー推定方法およびシステムの必要性がある。
画像の対の間のオプティカルフロー場を決定するための方法およびシステムであって、(a)非オクターブ・ピラミッド係数(non−octave pyramid factor)を使用して、画像の対の各々を画像ピラミッドに分解するステップ、(b)分解された画像の対における画素の明るさの勾配が一定であるという仮定の下に、分解された画像の対を、最初のピラミッド・スケール(pyramid scale)で、二次導関数表現に変換するステップ、(c)二次導関数画像表現の離散時間導関数(discrete−time derivatives)を推定するステップ、(d)生のオプティカルフロー場(raw optical flow field)を発生させるために、オプティカルフロー推定処理を離散時間導関数に適用するステップ、(e)生のオプティカルフロー場を、非オクターブ・ピラミッド係数によってスケーリングするステップ、および(f)最後のオプティカルフロー場を発生させるために、すべてのピラミッド・スケールが訪問されるまで、画像の対に対して、別のピラミッド・スケールで、ステップ(b)〜(e)を繰り返すステップを備え、ステップ(c)における時空間勾配推定は、以前の生のオプティカルフロー推定によってワープされる方法およびシステムを提供することによって、上記の問題への対処がなされ、技術的解決法が当技術分野において得られる。
本発明の一実施形態によれば、この方法は、(g)二次導関数画像表現を、色空間からスカラー色距離空間(scalar color−distance space)へ変換するステップをさらに備える場合がある。ステップ(g)は、色距離(color−distances)のベクトル減算のラプラシアンを使用して実装される場合がある。ラプラシアン演算子は、二次導関数画像表現のすべての色チャネルの強度に別々に適用される場合がある。非オクターブ・ピラミッド係数は、1.5と2.0の間になるように選択される。
本発明の一実施形態によれば、最初のピラミッド・スケールは、最低解像度のピラミッド・スケールである場合があり、別のピラミッド・スケールは、次のより高い解像度のピラミッド・スケールである。ステップ(c)は、時空間勾配推定方法を使用して実施される場合がある。オプティカルフロー推定処理は、最小二乗適合法を採用する場合がある。
本発明の一実施形態によれば、この方法は、最高解像度のピラミッド・スケールが幅および高さの整数画像サイズに移ることを保証するために、バイリニア補間を介したプレスケーリング(pre−scaling)・ステップを採用するステップをさらに備える場合がある。この方法は、非線形の区分線形制約(piecewise−linearity constraint)をオプティカルフロー場に課す、少なくとも1つの非線形フィルタにより、生のオプティカルフロー場を処理するステップをさらに備える場合がある。少なくとも1つの非線形フィルタは、非線形ローパス、平滑化、および統計的正則化フィルタのうち少なくとも1つであり、全変動最小化(total variation minimization)(L1およびL2ノルム)フィルタ、異方性拡散フィルタ、局所的画像構造に反応する楕円ステアラブル・フィルタ(elliptic steerable filter)、および、カーネル回帰フィルタのうち、少なくとも1つである場合がある。
本発明の一実施形態によれば、この方法は、画素サンプル毎に、生のオプティカルフロー場の逆の無矛盾性(inverse consistency)をチェックするために、複数画素動き補償および差分二乗和(sum−of−square−differences)計算を、生のオプティカルフロー場において行うことを採用するステップをさらに備える場合がある。この方法は、後続のより低い解像度のピラミッド・スケールで、1.5と2.0の間で非オクターブ(2.0)ピラミッド・スケーリング係数(pyramid scaling factor)を選択するためのフィードバック機構を提供するために、2D構造テンソル固有システム解析(2D structure tensor eigensystem analysis)を離散時間導関数に適用するステップをさらに備える場合がある。2D構造テンソル固有システム解析中に、他のピラミッド・スケールを超える単一のピラミッド・スケールについて、閾値画素割合(threshold percentage of pixels)を下回る小さい固有値に遭遇するとき、後続のピラミッド・スケールのうち少なくとも1つについて、より細かいピラミッド・スケールが使用される。
生のオプティカルフロー場は、逆の順序で処理される。動きベクトルは、画像の対のうち第2の画像を、ロバートのクロス・コンフィギュレーション(Robert’s Cross configuration)の5つ以上の位置においてサンプルするために使用される。本発明の一実施形態によれば、この方法は、単一画素アウトライア(single−pixel outliers)を除去するために、すべてのピラミッド・スケールについての生のオプティカルフロー場を、(非線形)3x3メジアンフィルタ演算によって処理し、フィルタされた生のオプティカルフロー場を、L2ノルム全変動演算子(L2 norm total variation operator)により、可変数の反復の間、処理するステップをさらに備える場合がある。
本発明は、添付の図面と共に考察された、以下に提示された例示的実施形態の詳細な説明から、より容易に明らかになるであろう。
本発明の一実施形態による、画像の対の間のオプティカルフロー場を計算するための例示的ステップを例示する処理流れ図を示す図である。 2次元のラプラシアン演算子の離散時間近似を示す図である。 1次元の離散時間中心差分演算子(discrete−time central−difference operator)を示す図である。 2次元の離散時間中心差分演算子を示す図である。 本発明の一実施形態による、3次元のサンプリング領域の時空間キューブ(space−time cube)の図である。 本発明の一実施形態による、図4Aの時空間キューブを使用する推定勾配法(estimated gradient method)を示す図である。 本発明の一実施形態による、図4Aの時空間キューブを使用する推定勾配法(estimated gradient method)を示す図である。 本発明の一実施形態による、図4Aの時空間キューブを使用する推定勾配法(estimated gradient method)を示す図である。 本発明の一実施形態による、図4Aの時空間キューブを使用する推定勾配法(estimated gradient method)を示す図である。 本発明の一実施形態による、画像の対の間のオプティカルフロー場を計算するためのシステムを示す図である。
添付の図面は本発明の概念を例示するためのものであり、縮尺通りのものではない場合があることを理解されたい。
図1は、本発明の一実施形態による、画像の対の間のオプティカルフロー場を計算するための例示的ステップを例示する処理流れ図を示す。ステップ10で、画像の対の各々は画像ピラミッドに分解される。画像ピラミッドを生成する処理では、いくつかの線形および/または非線形フィルタのうち少なくとも1つが、分解された画像の対に適用される場合がある。後の推定ステップが大域的最小ではなく局所的最小で固定される問題を低減し、それにより、「開口問題」として知られるものを防ぐために、画像ピラミッドは、1レベルにつき1オクターブ未満の任意のスケーリング係数を使用して分解される場合がある。ステップ12で、明るさの勾配(または、別法として、明るさの二次導関数)が一定であると仮定される、という仮定の下に、最低解像度の画像ピラミッド・スケールで、分解された画像の対は二次導関数表現に変換される。ステップ14で、画像の対の二次導関数表現は、色空間からスカラー色距離空間へ変換される。ステップ16で、二次導関数画像表現の離散時間導関数を推定するために、時空間勾配推定方法が使用される。ステップ18で、後続のピラミッド・スケールで、1.5と2.0の間で非オクターブ(2.0)ピラミッド・スケーリング係数を選択するためのフィードバック機構を提供するために、2D構造テンソル固有システム解析が離散時間導関数に適用される。ステップ20で、生のオプティカルフロー場を発生させるために、既知の制約ベースのオプティカルフロー推定処理が、最小二乗適合法を使用して、離散時間導関数に適用される。ステップ22で、画素サンプル毎に、制約ベースのオプティカルフロー推定計算の逆の無矛盾性をさらにチェックするために、複数画素動き補償ステップおよび差分二乗和計算が、生のオプティカルフロー場において行われる。ステップ24で、結果として生じる生のオプティカルフロー場計算は、非線形の、雑音に対してロバストな区分線形制約をフロー場に効率的に課す複合効果を有する、非線形フィルタリングステップによって、さらに処理される。ある実施形態では、非線形フィルタは、雑音に対する感受性を低減し、オプティカルフロー推定の正確度および精度を向上させる、さらなる統計的制約を効率的に課すための、統計的正則化フィルタである。ステップ26で、オプティカルフロー場は、非オクターブ・ピラミッド係数で乗算され、空間的にスケーリングされ、次のより高い解像度のピラミッド・スケールへ伝播され、そこで、ステップ28で、時空間勾配計算は、以前のオプティカルフロー推定によって動き補償(ワープ)される。最後のオプティカルフロー場を発生させるために、ピラミッド・スケールのすべてが訪問されるまで、ステップ12〜28が、各後続のピラミッド・スケールに対して繰り返される。
本発明の目的は、2つの画像の時空間勾配から正確なオプティカルフロー場を提供することである。HornおよびSchunck、ならびに、LucasおよびKanadeで概略が述べられた、勾配ベースのオプティカルフローモデルで例示されたように、オブジェクトのシーン/セットの2つの任意の画像サンプルの間のオプティカルフロー場の決定は、複数の解を有するか、解をまったく有さないか、または、解の無限遠(infinity of solutions)を有する場合がある、不良設定逆問題(ill−posed inverse problem)である。不良設定逆問題を制約するには、1つまたは複数の制約が必要である。従来技術で採用されている周知の制約は、「明るさの恒常性の仮定」であり、動きにもかかわらず、2つのサンプルされた画像におけるオブジェクトの明るさは一定のままであると仮定する。サンプルされた画像におけるオブジェクトの表現は、式1によって記述される。
I(x,y,t)=オブジェクト(x+ut,y+vt) (1)
ただし、x、yおよびtは、観察された光照射野の連続領域時空間位置であり、Iは、x、yおよびtによって指定された位置のオブジェクトの強度または輝度であり、uおよびvは、オブジェクトの並進運動を記述するベクトルを表す。明るさの恒常性の仮定に基づく拘束方程式が、偏導関数に関して、式2で示される。
[∂I(x,y,t)/∂x]・u+[∂I(x,y,t)/∂y]・v+[∂I/(x,y,t)/∂t]=0 (2)
ライティングがある画像時間サンプル点から他のものへと変化した2つの画像のセットについて、または、2つの画像サンプル時間の間で、オブジェクトがライトから、影にされた領域へと移動するとき、「明るさの恒常性の仮定」は崩れる。異なるが関連した制約は、NagelおよびEnkelmannにおいて記載されたような「勾配の不変性の制約」であり、「明るさの恒常性の仮定」のように、所与のオブジェクトについての定数を仮定するが、一定であると仮定されている動きに対するオブジェクトの明るさの代わりに、以下の式3に示すように、明るさの勾配(または、別法として、明るさの二次導関数)が一定であると仮定され、ただし、この二次導関数は、図2に例示するような(離散時間)ラプラシアン演算子∇の適用により近似される場合がある。
[∂L(x,y,t)/∂x]・u+[∂L(x,y,t)/∂y]・v+[∂L/(x,y,t)/∂t]=0 (3)
bmw
L(x,y,t)=∇(I(x,y,t))
式3における「勾配の不変性の制約」の使用は、動きにもかかわらず、周囲のライティング変化の状況においてさえ、オプティカルフローを決定するために比較中である2つの画像におけるオブジェクトの相対的なエッジの輝度強度およびテクスチャ特徴の強度関係が一定のままであると仮定する効果を有する。この手法は、入力画像の各々を、図2に例示するように、ラプラシアン演算子∇の離散近似により畳み込み、次いで、離散領域内で、元の画像強度サンプルの代わりに、畳み込まれた画像サンプル上に、同じ勾配推定処理を適用することによって、離散領域において近似される場合がある。
画像サンプルの明るさまたは輝度の二次導関数は、色値自体を導入することによって、より具体的かつ選択的にされる場合があるのに対して、従来技術の手法は、典型的には、式4のある近い変分のように、単一の輝度/強度スカラー値を計算するために、カラー画像からのRGBまたはYUV値を備える3ベクトルのドット積を使用することである。
I(x,y,t)=[0.30,0.59,0.11]・[I(x,y,t),I(x,y,t),I(x,y,t)] (4)
これは、RGBまたはYUV3ベクトルを単一のスカラー値に縮小することによって、この問題を簡素化する(また、元の仮定である、明るさに関して入力データを提示する)が、クロミナンスが輝度に加えて提供する場合があるいかなる潜在的情報をも無視する。例えば、深緑色画素は、より明るい青色画素と数学的に区別不可能となる。ある応用例では、この差は無視してよい場合があるが、他の応用例では、小さい差が重大となる場合がある。
本発明の一実施形態によれば、色距離関数Dが、式5において、2つのRGB(またはYUV)3ベクトルサンプルIおよびIの間で定義される。
RGB(x,y,t,x,y,t)=I(x,y,t)−I(x,y,t) (5)
ただし、式5における減算は、R上の減算のベクトルの向きにおける意味である。色距離関数Dは、3次元の色キューブ内の2つの3ベクトル色の間の距離の大きさを効果的に定義することは、当業者には理解されよう。色距離関数Dを使用する利点は、なお単一のスカラー値に縮小しながら、輝度に加えて、クロミナンス/色を追加の制約として導入することである。大部分のオブジェクトが固有の明るさにおいて変化する場合、これらは固有の色および明るさを変更しないと仮定することは、妥当である。加えて、ビデオおよび画像処理システムに共通している、多数の同時代のGPUおよびDSPハードウェア・プラットフォームは、このタイプの演算を、単一クロックサイクルの原始的なマシン命令として実装する。
加えて、CIE76、または、より最近では、CIEDE2000で定義されたものなど、より精密な色差測定および方法もまた使用される場合があり、これらは参照により本明細書に組み込まれており、計算を、DSPおよびGPU計算に適している、容易にベクトル化された演算に縮小する場合があることは、当業者には理解されよう。色差の採用のわずかな副産物は、明るさにおける変化が、負(より薄暗くなる)または正(より明るくなる)の値に関して直観的に表される場合があるが、色ベクトルについての同時に生ずる概念は直観的ではなく、実際には任意であることである。選択されたマッピングは理想的には、所与の画像において起こり得る色の範囲の50%を、より小さい/負のスカラーマップされた(scalar mapped)値として、また、他の50%を、より大きい/正の値として、重みを加え、大部分の画像およびビデオについて、できる限り均一な分布にするようになる。この全体の手法は、Shibata,M.、Yanagisawa,T.、「A study of optimal angle of color vector for optical flow extraction」、SICE、2007 Annual Conference、vol.、no.、2518〜2523頁、2007年9月17〜20日において前もって論じられているが、好ましい実施形態のために選択されたマッピングは単に、0.0から1.0に正規化された、現在の画素のUおよびVを備える2ベクトルの角度を計算することである。
好ましい実施形態は、ライティングおよび照明の変化に対するロバスト性についての強度のラプラシアンを使用することに関して、NagelおよびEnkelmannにおいて見出されたものと類似の技術を採用する場合がある。好ましい実施形態では、色距離のベクトル減算のラプラシアンが、強度−差のラプラシアンの代わりに採用される場合がある。この組み合わせを実践するために、好ましい実施形態では、式6に示すように、RGB色空間内か、YUV色空間内かにかかわらず、ラプラシアン演算子が画像のすべての「色」チャネルの強度に別々に適用される。
(x,y,t)=∇(I(x,y,t)) (6)
(x,y,t)=∇(I(x,y,t))
(x,y,t)=∇(I(x,y,t))
拘束方程式(複数可)はこのとき、したがって、式7のそれになる。
[∂L(x,y,t)/∂x]・u+[∂L(x,y,t)/∂y]・v+[∂L(x,y,t)/∂t]=0
...
[∂L(x,y,t)/∂x]・u+[∂L(x,y,t)/∂y]・v+[∂L(x,y,t)/∂t]=0
...
[∂L(x,y,t)/∂x]・u+[∂L(x,y,t)/∂y]・v+[∂L(x,y,t)/∂t]=0
色制約の、二次導関数仮定との組み合わせは、色変化自体ではなく、色値変化の加速度のみが考慮されることを意味し、等しい仮定の輝度強度の赤みを帯びた色から緑色を帯びた色へ変化するオブジェクトの周囲のライティングは、制約に逆らうものではないという意味では、オブジェクトの実際の動きによる可能性がより高いことは、当業者にはさらに理解されよう。強度に加えて、色の追加の情報の組み込みは、評価アパーチャの制限されたサイズの問題、および、解の劣決定性に関連する問題により、そうでなければ区別ができない勾配を区別する助けとなる。
前述の偏導関数の基礎となる時空間勾配の離散領域近似(discrete−domain approximation)を構築するとき、サンプリング位置および重み付け係数をモデル化する最善の方法を見出すことが望ましい。解決する必要のある1つの例示的問題は、無矛盾の局所性、上記で開示された近似を保証すること(例えば、dI/dx勾配近似が、同じ空間サンプリング位置内で、dI/dy勾配近似として行われることを保証すること)である。オプティカルフローの正確度は特に、これらの近似の小さい変動に対して敏感である。この主題への完全な処置のために、Kennedy,H.L.2007.Gradient Operators for the Determination of Optical Flow.In Proceedings of the 9th Biennial Conference of the Australian Pattern Recognition Society on Digital Image Computing Techniques and Applications(2007年12月03〜05日).DICTA.IEEE Computer Society、Washington,DC、346〜351、および、Christmas,W.J.、「Spatial Filtering Requirements for Gradient−Based Optical Flow Measurement」、Centre for Vision, Speech and Signal Processing University of Surrey、Guildford GU2 5XH,UKにおいて見出された教示は、有益である。
一例として、1次元について、図3Aにおいて例示された、しばしば適用される中心差分演算子を考察する。勾配の測定の局所性は、局所的に0に中心があるように見なされる場合があるが、位置0自体におけるサンプルされた情報は、完全に無視される。また、x軸に沿った前方差分は、y軸に沿った前方差分と共に考察されるとき、図3Bに示すように2次元を使用して空間的勾配を推定する。無矛盾に局所的な勾配計算を提供するため、本発明の別の態様によれば、離散サンプリングされた時空間勾配場は特に、図4Aに示された8画素時空間領域について、式8に示すように、画素サンプルの強度、
Figure 2014194797
または、別法として、式9に示すように、画素サンプルのラプラシアンの前述の色距離、
Figure 2014194797
の、一連の近似離散領域偏微分としてモデル化される。
式8および9の勾配計算は、あらゆる近似された偏微分計算において、2×2×2の時空間画素領域のあらゆる画素を含めることによって、無矛盾の局所性を補償し、可能性のある正の2分の1画素の空間サンプリング・バイアス、および、4分の1画素の時間サンプリング・バイアス(すなわち、上記で表されたような勾配は、LRGB(0.0,0.0,0.0)ではなく、位置LRGB(0.5,0.5,0.25)で測定されると言われる)のために、従来技術では回避されたストラテジである。この時空間バイアスは、前述の推定勾配法を利用する後のステップにおいて扱われる限り、回避される場合がある。実際に、式9の勾配推定方法は、図4B〜4Eに示すように、信号雑音および第1種不連続(first−order discontinuities)の存在下で安定している。
式9で表されたような前述の勾配を計算する方法は、例えば、時空間勾配計算によって包含された領域の1画素範囲内で、局所的動きベクトルを計算するためにのみ使用される場合がある限りにおいて、有用である。また、このような計算の局所性を拡大する(オプティカルフローに限定されず、ブロックマッチング、および多数の他の応用例も)目的で周知であるのは、計算が疎密スケール上で評価される疎密(coarse−to−fine)ストラテジを実装し、次には、最後のスケールに達するまで、以前のスケールの計算の結果を次のスケールへ伝播させることを目的とした、マルチスケール画像ピラミッドの使用である。
オプティカルフロー推定の特殊な場合では、従来技術の疎密ストラテジは、画像ピラミッドを作成する形式を取り、そこで、周波数エイリアシング、および、元の高さおよび幅の半分の画像を作成する(1オクターブ空間デシメーション)後続の空間内デシメーション(decimation−in−space)(典型的には、0次または1次補間)を防ぐために、ソース画像は、ガウス演算子を近似する畳み込みによりローパスフィルタされ、この処理は、固定数のスケールについて繰り返され、以前のスケールが後続のスケールのための入力を提供する。次いで、オプティカルフロー計算は、最高スケール(最小または最低解像度のピラミッド画像)で行われ、そこで、そのスケールについて、結果として生じるオプティカルフローの大きさのベクトルuおよびv成分は、2で乗算される。それらの結果は、次のスケールの画像をワープさせるために使用され、残りのオプティカルフローが計算され、その結果は、次のスケールをワープさせるために使用される、などとなる。最後のスケールに達するとき、十分に有用な、非局所的なオプティカルフロー場が作成されている。
残念ながら、従来技術の2X疎密手法は、従来技術のブロックマッチング法について以前に開示された2X疎密「マルチスケール」手法を使用することによって直面する欠点に類似した、著しい欠点を有し、すなわち、真の、大域的最小の代わりに、問題を良設定にするために使用されるどのような制約にも従って、特定のスケールでの計算が、局所的最小上に固定する場合があることである。
本発明は、2つの重要な改善を有する画像ピラミッドを利用し、すなわち、最初に、本発明は、画像ピラミッドの作成のために、非線形、非ガウス、ローパス、平滑化、または、統計的正則化フィルタを採用し、限定ではないが、全変動最小化(L1およびL2ノルム)フィルタ、異方性拡散フィルタ、局所的画像構造に反応する楕円ステアラブル・フィルタ、カーネル回帰フィルタ、および、他の非線形フィルタが含まれる。線形フィルタリングは主として、画像がデシメートされるとき、空間周波数エイリアシング・アーチファクトを低減するために使用される。このような非線形フィルタリング動作は、雑音に対するロバスト性、および、後のステップの運動境界の周囲の性能を改善する場合がある。より詳細には、本発明の一実施形態によれば、ガウス演算子と共にL2ノルム全変動フィルタの単一の反復が、各スケールについて使用される場合があり、雑音感度特性における著しい改善を示すものである。
第2の改善は、本発明の一実施形態によれば、2.0以外のピラミッド生成係数の使用である。2.0以外のピラミッド生成係数は、ひどい雑音障害および強い1次勾配を有する画像の対を処理するために必要とされる。ピラミッド生成係数が整数のスカラー値2から、より小さい、1.0より大きい実数のスカラー値へと減少するにつれて、局所的最小の固定の問題はだんだん顕著でなくなる(特に、係数が1.0に近づくにつれて、メモリストレージ、帯域幅、および、計算複雑性を著しく犠牲にして)。本発明の一実施形態によれば、1.5と2.0の間の任意のピラミッド係数が使用される場合がある。局所的最小の問題は、スケーリング係数がそれぞれ1.75から1.5へと減少するにつれて、徐々に顕著でなくなるが、雑音に対する感度が犠牲になる。好ましい係数1.75では、追加のメモリストレージ要件、および、計算複雑性の要件は、5レベルのピラミッドのための係数2.0に対してよりも、約13%大きく増す場合があるが、細かさにおいて25%の改善があり、粗いスケールの局所的最小上で固定されるようになる可能性において、比較的大幅な、付随する減少があり、それにより、複雑性対正確度の良い兼ね合いを表すものである。多数の従来技術の手法は、この特定の問題を反復改良の解法により解決し、これらの解法は、所与のスケールで、そのような前述の雑音障害のあるソースに対して、好ましい実施形態の13%の代わりに、10,000%も計算複雑性を増す場合があることに留意されたい。さらに他の手法は、後に非線形の後処理要件、または、統計的な正則化要件を課し(再度、反復の、著しい付随コストを伴う)、所与の画像位置において完全に使用不可能なオプティカルフロー場の結果となる場合がある、構造解析を介して、この問題を、所与の画像位置で完全に解決不可能であると特徴付ける。
非整数ピラミッド値の使用は、非整数サンプリング位置のために、所与のスケールの(1)画像ピラミッド値、および(2)後続の動きベクトル場の両方の反復バイリニア補間が必要とされる場合がある状況の可能性を増す場合があることは、当業者には理解されよう。0次補間が必要とされる場合があるが、0次補間を使用する利点は、大部分のDSPおよびGPUプラットフォームにおける非2X画像ピラミッドの使用と比較されるときに生じる、著しい推定誤りを上回るものではない。画像値の1次補間は、GPUプラットフォームにおいてハードウェア・プリミティブ(hardware primitive)として提供される場合があるが、これは、DSPまたはFPGAシステムでは、(少なくとも、効率的には)そうではない場合がある。このため、好ましい実施形態によれば、最初のスケール(最初の、最高の、解像度)が(W’,H’)の整数画像サイズに移り、それにより、式10におけるように、N個のスケールの深度に対して画像ピラミッドを適用するとき、反復のサンプル間補間の必要性を著しく減らすことを保証するために、バイリニア補間を介したプレスケーリング・ステップが使用される場合がある(または、キュービックまたはバイキュービックなど、より高次のスケーリング演算子)。
W’=フロア(floor)(W/N)×ピラミッド_係数
H’=フロア(W/N)×ピラミッド_係数 (10)
最後のスケールの結果として生じるオプティカルフロー場は、その大きさが、通常の2.0の代わりに、式10の幅および高さ係数の逆数で乗算されており、また、1オクターブ・デシメーションの代わりに、同じ逆の非整数の幅および高さ係数に従って、空間的にスケーリングされている。
偏導関数を使用するオプティカルフロー計算の不良設定性を低減することが望ましく、所与の偏導関数の次元に対する単一の計算は、潜在的適合値(potentially fit values)の連続線形範囲を与えるのみである。これらの偏導関数を単一解に縮小するために、多数の周囲のサンプル値の偏導関数がグループ化され(個々に、劣決定の解を形成する)、最小二乗適合が適用される場合がある。このために、好ましい実施形態では、勾配計算が、式8および9で描かれたように画素サンプル毎に、式11に例示されるように画素サンプルの周囲の3x3領域に対して適用される。
Figure 2014194797
式10では、重み関数が、中心にある勾配に向けて計算にバイアスをかけ、離れているものにより少ない重みを加える。本発明の好ましい実施形態では、式11における重み関数は、式12に従って定義される。
重み(n,m)={0.125,0.75,0.125}×{0.125,0.75,0.125} (12)
数学的に安定した結果に達するために必要とされる情報は、なお欠けている場合がある。解析中の全体の領域は、実質的に同じ勾配値を有する場合があり、または、より厳しい場合、数値的に安定した推定を得るための勾配はない。他の状況では、解析中の領域は単一の顕著な垂直勾配を有し、その場合には、領域を評価するとき、主な勾配特徴の法線に垂直な動きがたとえ存在する場合、そのような動きを除いて、いかなる動きベクトル成分も決定することはできない。
本発明の一実施形態によれば、解析中の画像の対の領域の周囲の勾配特徴を表す2次元の構造テンソルが、式13のように採用される場合がある。
Figure 2014194797
各構造テンソルの2次元の固有システム解析により、評価中の現在の領域を、第1の、強い勾配を有する(最大固有値の大きさは、第2のものより著しく大きい)、強いテクスチャ成分を有する(両方の固有値が大きい)、または、同次かつ等方性である(両方の固有値が小さい)として特徴付けることができる。現在のGPUおよびDSPハードウェア上で、テーブル・ルックアップのためにメモリ読み取りを行うことは、メモリ・フェッチ・スケジューリングおよびレイテンシのために、明確な平方根計算を行うことよりも潜在的に高価である。したがって、本発明の一実施形態によれば、固有値の直接計算が採用される。本発明の好ましい実施形態では、前述の構造テンソルの2つの固有値の直接計算は、式14の形式を取る。
Figure 2014194797
加えて、好ましい実施形態によれば、使用するために最適なピラミッド・スケール係数(1.5から2.0に及ぶ)の決定は、前述の構造テンソル固有システム解析の無矛盾性、局所性および数値的安定性についての情報を組み込む、フィードバック機構によって指示される。具体的には、他のスケールを超える所与の単一のスケールについて、閾値画素割合を下回る小さい固有値(または、ゼロに近づく行列式)(典型的には、いずれかの所与の画像内の画素サンプルの10%を超えるものについて、統計的に逸脱した、小さい固有値として定義される)によって示された、劣決定性(under−determination)または数値的不安定性が優勢であることは、より細かいピラミッド・スケールが使用されるべきであるという確かなしるしである。本発明の好ましい実施形態では、この条件にフラグが立てられた状況における、後続のピラミッド・レベルについての、後続のオプティカルフローの評価は、1.75から、1.666、最終的には1.5へと進む、「格下げされた」ピラミッド係数を使用する場合がある。
ある状況では、各スケールについて計算されたオプティカルフロー場は、解析中の画像のいくつかのエリアがいかなる有用なオプティカルフロー情報もまったく提供しない場合がある(すなわち、1つまたは複数の式の分母がゼロに近づくか、またはゼロとなる)という点において、数値的不安定性によって損なわれる場合がある。例えば、動いているオブジェクトの中心が均一的に色付けされ、そのオブジェクトが、生成された画像ピラミッドによる評価の最大スケールによって与えられるアパーチャより大きい場合、そのようなオブジェクトの中心は、オブジェクトの残りと矛盾のない動きベクトルを示さないようになり、その理由は、分母の小さいサイズを使用する除算は、オプティカルフロー計算方法を実装するデジタルシステムの精度限界に近づくからである。勾配ベースのオプティカルフロー法は、オクルージョン境界に直面しているとき、矛盾した結果を欠点として有する場合がある(例えば、前景オブジェクトが、静止した背景に対して移動するにつれて、いくつかの背景画素は運動境界の前でオクルードされ、他のものは、オブジェクトの反対側で示される)。加えて、精度限界は、後続のスケールについての後の段階の評価ステップにおいて、不安定性を課す場合がある。
運動境界における、および、オクルージョンを含む画像の領域内の、数学的安定性に関連する問題に対処するため、本発明のある実施形態は、オプティカルフローを逆に(例えば、第1のフレームが第2のフレームであるかのように、および、逆もまた同じ)処理する場合がある。知覚できる動きの存在下で、順方向および逆方向のオプティカルフロー計算は共に、類似の大きさであるが、180度反対方向(すなわち、「可逆性の制約」)を有する動きベクトルの結果となるべきである。計算された動きベクトルは、好ましい実施形態によれば、構成画像の元のRGBまたはYUV値の差分二乗和の合計を決定するために(すなわち、「動き補償SSD制約」)、現在のスケールの第2の画像を5つ以上の位置において、すなわち、ロバートのクロス・コンフィギュレーションにおいて、サンプルするために使用される。3x3画素、5x5画素、その他など、他のサンプリング・エリア/サイズが可能であるが、5サンプルのロバートのクロス・コンフィギュレーションが経済的妥協を表すことは、当業者には理解されよう。可逆性の制約が満たされないか、または、動き補償SSD制約が満たされない場合、現在のスケールについての残りの評価は、(0,0)にリセットされ、動きベクトルの以前のスケール(複数可)評価は、不変のまま保たれる。
前述の潜在的な数学的安定性の問題にさらに対処するため、生のオプティカルフロー場推定の各ピラミッド・スケールについてのある後処理ステップは、後続のピラミッド・スケールの計算の正確度および精度を向上させ、それにより、最終結果の正確度および精度を向上させる場合がある。形式的な意味では、これは一般に、上記で開示された明るさまたは勾配の不変性の制約への追加として、モデル化される。多くの場合、これらの追加の制約は、生のオプティカルフロー場についての平滑性の仮定または区分的不変性(piecewise constancy)の仮定の形式を取る。本発明の好ましい実施形態によれば、すべてのスケールについての生のオプティカルフロー場出力は最初に、単一の(非線形)3x3メジアンフィルタ演算によって、単一画素アウトライアを除去するように処理される。メジアンフィルタ演算の後で、L2ノルム全変動演算子が、ユーザにより供給された設定に応じて、可変数の反復(典型的には、1〜3反復)の間、生のオプティカルフロー場推定に対して実行される。文字通り、所与の全変動最小化が、2D離散サンプリングされた空間において、L1ノルム(区分的不変性)の意味で意図されるか、L2ノルム(区分的線形性)の意味で意図されるかについては、かなりの矛盾がある。明確にするため、本発明の好ましい実施形態では、L2ノルムTV演算子が使用され、単一反復について、式15の形式を取る。
Figure 2014194797
TV=0
ただし、式15のIは、前述の非線形処理の後で、生のオプティカルフロー場推定からの動きベクトル場の画像サンプルとして解釈される。この手法の利点は、オプティカルフロー場の本来の計算から後処理ステップを分離するL2ノルム全変動の制約と共に非線形統計的演算(メジアンなど)の使用を可能とし、それにより、並列処理のためのさらなる機会を与えることである。
図5は、本発明の一実施形態による、画像の対の間のオプティカルフロー場を計算するためのシステムを示す。限定しない例として、システム510は、デジタル化されたビデオまたは静止画像を、1つまたは複数のスチールまたはビデオカメラなど、1つまたは複数の画像取り込みデバイス512から受信する。システム510はまた、デジタルビデオ取り込みシステム514およびコンピューティング・プラットフォーム516を含む場合もある。デジタルビデオ取り込みシステム514は、デジタルビデオのストリームを処理し、または、アナログビデオをデジタルビデオへ、コンピューティング・プラットフォーム516によって処理することができる形式に変換する。デジタルビデオ取り込みシステム514は、スタンドアロンのハードウェア、または、コンピューティング・プラットフォーム516に直接プラグインすることができるファイヤワイヤ・カードなど、カードである場合がある。本発明の一実施形態によれば、画像取り込みデバイス512は、無線リンク(例えば、航空機と地上局の間)、および、デジタルデータリンク(例えば、イーサネット、地上局とコンピューティング・プラットフォーム516の間)など、異種データリンクを介して、ビデオ取り込みシステム514/コンピューティング・プラットフォーム516とインタフェースを取る場合がある。コンピューティング・プラットフォーム516は、ビデオデータストリーム524によって、1つまたは複数のプロセッサ520を介して、または直接、コンピュータ可読媒体526に供給される、バスシステム522を含む、1つまたは複数のプロセッサ520を備える、パーソナル・コンピュータまたはワーク・ステーション(例えば、Pentium−M 1.8GHz PC−104以上)を含む場合がある。別法として、コンピューティング・プラットフォーム516は、FPGAまたはASICに実装されたグラフィック処理装置(GPU)またはデジタル信号プロセッサ(DSP)など、集積回路として、または集積回路の一部として実装される場合がある。
コンピュータ可読媒体526はまた、WindowsまたはLinuxオペレーティング・システムなど、任意選択のオペレーティング・システムを含む、1つまたは複数のプロセッサ520によって実行されるシステム510の命令を格納するために使用される場合もある。コンピュータ可読媒体526はさらに、1つまたは複数のデータベースにおいて、本発明のビデオクリップの格納および検索のために使用される場合がある。コンピュータ可読媒体526は、RAMメモリなど、揮発性メモリ、ならびに、フラッシュメモリ、光ディスク(複数可)および/またはハードディスク(複数可)など、不揮発性メモリの組み合わせを含む場合がある。処理されたビデオデータストリーム528の一部は、後のモニタ530への出力のために、コンピュータ可読媒体526に一時的に格納される場合がある。モニタ530は、処理されたビデオデータストリーム/静止画像を表示する場合がある。モニタ530は、解析者によって興味のあるオブジェクトを選択するための、キーボード532およびマウス534を備える場合がある。
本発明は、オプティカルフローを計算する従来技術の方法に勝るいくつかの利点を有する。正確で、密な、オプティカルフロー場は、入力画像に存在する定常および非定常雑音の厳しい条件下でさえ、大きいアーチファクトおよび障害なしに生成される。この処理は、同時代の、市販用の、大量に市場に出されたコンピュータ・ハードウェア上で、30fpsの標準精細度および高精細度の放送解像度ビデオのために、リアルタイムを超えて行うために十分効率的であり、リアルタイムシーン解析、写真測量法、およびメトログラフィ(metrography)のための、改善されたビデオコーダ効率、超解像度ベースのスケーリング、動き補償デインターレーシングおよびフレームレート変換、深度マップ(depth−map)推定、ならびに、オブジェクト・セグメンテーションを含む、密なオプティカルフローのための新しい応用を広げるものである。
例示的実施形態は、単に本発明を例示するものであり、上記の実施形態の多数の変形形態は、本発明の範囲から逸脱することなく、当業者によって考案されてもよいことを理解されたい。したがって、すべてのそのような変形形態は、以下の特許請求の範囲およびそれらの均等物の範囲内に含まれることが意図される。

Claims (34)

  1. 画像の対の間のオプティカルフロー場を決定するための方法であって、
    (a)前記画像の対の各々を画像ピラミッドに分解するステップ、
    (b)前記分解された画像の対における画素の明るさの勾配が一定であるという仮定の下に、前記分解された画像の対を、最初のピラミッド・スケールで、二次導関数表現に変換するステップ、
    (c)前記二次導関数画像表現の離散時間導関数を推定するステップ、
    (d)生のオプティカルフロー場を発生させるために、オプティカルフロー推定処理を前記離散時間導関数に適用するステップ、
    (e)前記生のオプティカルフロー場をスケーリングするステップ、および
    (f)最後のオプティカルフロー場を発生させるために、すべてのピラミッド・スケールが訪問されるまで、前記画像の対に対して、別のピラミッド・スケールで、ステップ(b)〜(e)を繰り返すステップを備え、ステップ(b)における前記分解された画像の対の各々は、以前にスケールされたオプティカルフロー推定において推定された動きベクトルを用いてワープされる方法。
  2. (g)前記二次導関数画像表現を、色空間からスカラー色距離空間へ変換するステップをさらに備える、請求項1に記載の方法。
  3. ステップ(g)は、色距離のベクトル減算のラプラシアンを使用して実装される、請求項2に記載の方法。
  4. ラプラシアン演算子は、前記二次導関数画像表現のすべての色チャネルの強度に別々に適用される、請求項3に記載の方法。
  5. 最高解像度のピラミッド・スケールが(W’,H’)の整数画像サイズに移ることを保証するために、バイリニア補間を介したプレスケーリング・ステップを採用することをさらに備え、W’およびH’は、
    W’=フロア(W/N)×ピラミッド_係数
    H’=フロア(W/N)×ピラミッド_係数
    によって与えられる、請求項1に記載の方法。
  6. 前記最初のピラミッド・スケールは、最低解像度のピラミッド・スケールであり、別のピラミッド・スケールは、次のより高い解像度のピラミッド・スケールである、請求項1に記載の方法。
  7. ステップ(c)は、時空間勾配推定方法を使用して実施される、請求項1に記載の方法。
  8. 前記オプティカルフロー推定処理は、最小二乗適合法を採用する、請求項1に記載の方法。
  9. 非線形の区分線形制約を前記オプティカルフロー場に課す、少なくとも1つの非線形フィルタにより、前記生のオプティカルフロー場を処理するステップをさらに備える、請求項1に記載の方法。
  10. 前記少なくとも1つの非線形フィルタは、全変動最小化(L1およびL2ノルム)フィルタ、異方性拡散フィルタ、局所的画像構造に反応する楕円ステアラブル・フィルタ、および、カーネル回帰フィルタのうち、少なくとも1つである、請求項9に記載の方法。
  11. 画素サンプル毎に、前記生のオプティカルフロー場の逆の無矛盾性をチェックするために、複数画素動き補償および差分二乗和計算を、前記生のオプティカルフロー場において行うステップをさらに備える、請求項1に記載の方法。
  12. 後続のより低い解像度のピラミッド・スケールで、ピラミッド・スケーリング係数を選択するためのフィードバック機構を提供するために、2D構造テンソル固有システム解析を前記離散時間導関数に適用するステップをさらに備える、請求項1に記載の方法。
  13. 前記2D構造テンソル固有システム解析中に、他のピラミッド・スケールを超える単一のピラミッド・スケールについて、閾値画素割合を下回る小さい固有値に遭遇するとき、
    前記後続のピラミッド・スケールのうち少なくとも1つについて、より細かいピラミッド・スケールが使用される、請求項12に記載の方法。
  14. 前記生のオプティカルフロー場は逆の順序で処理される、請求項1に記載の方法。
  15. 動きベクトルは、前記画像の対のうち第2の画像を、ロバートのクロス・コンフィギュレーションの5つ以上の位置においてサンプルするために使用される、請求項14に記載の方法。
  16. 単一画素アウトライアを除去するために、すべてのピラミッド・スケールについての前記生のオプティカルフロー場を、(非線形)3x3メジアンフィルタ演算によって処理し、前記フィルタされた生のオプティカルフロー場を、L2ノルム全変動演算子により、可変数の反復の間、処理するステップをさらに備える、請求項1に記載の方法。
  17. 処理システムによりアクセスする場合に以下のステップにより前記処理システムに動作を行わさせる指示を含む非一時的コンピュータ可読記憶媒体であって、
    (a)前記画像の対の各々を画像ピラミッドに分解すること、
    (b)前記分解された画像の対における画素の明るさの勾配が一定であるという仮定の下に、前記分解された画像の対を、最初のピラミッド・スケールで、二次導関数表現に変換すること、
    (c)前記二次導関数画像表現の離散時間導関数を推定すること、
    (d)生のオプティカルフロー場を発生させるために、オプティカルフロー推定処理を前記離散時間導関数に適用すること、
    (e)前記生のオプティカルフロー場をスケーリングすること、および
    (f)最後のオプティカルフロー場を発生させるために、すべてのピラミッド・スケールが訪問されるまで、前記画像の対に対して、別のピラミッド・スケールで、ステップ(b)〜(e)を繰り返すことを行うためのコードを備え、ステップ(b)における前記分解された画像の対の各々は、以前にスケールされたオプティカルフロー推定において推定された動きベクトルを用いてワープされる、非一時的コンピュータ可読記憶媒体。
  18. 画像対の間のオプティカルフロー場を決定する方法であって、前記方法は、
    (a)前記画像の対の各々を画像ピラミッドに分解すること、
    (b)前記分解された画像の対における画素の明るさの勾配が一定であるという仮定の下に、前記分解された画像の対を、最初のピラミッド・スケールで、二次導関数表現に変換すること、
    (c)前記二次導関数画像表現の離散時間導関数を推定すること、
    (d)生のオプティカルフロー場を発生させるために、オプティカルフロー推定処理を前記離散時間導関数に適用すること、
    (e)前記生のオプティカルフロー場をスケーリングすること、および
    (f)最後のオプティカルフロー場を発生させるために、すべてのピラミッド・スケールが訪問されるまで、前記画像の対に対して、別のピラミッド・スケールで、ステップ(b)〜(e)を繰り返すことを行うためのコードを備え、ステップ(b)における前記分解された画像の対の各々は、以前にスケールされたオプティカルフロー推定において推定された動きベクトルを用いてワープされる、方法。
  19. (g)前記二次導関数画像表現を、色空間からスカラー色距離空間へ変換するためのステップをさらに備える、請求項18に記載の方法。
  20. (g)は、色距離のベクトル減算のラプラシアンを使用して実装される、請求項19に記載の方法。
  21. 前記ラプラシアンオペレータが前記二次導関数画像表現の全色チャネルへ別々に適用される、請求項20に記載の方法。
  22. 最高解像度のピラミッド・スケールが(W’,H’)の整数画像サイズに移ることを保証するために、バイリニア補間を介したプレスケーリング・ステップを採用することをさらに備え、W’およびH’は、
    W’=フロア(W/N)×ピラミッド_係数
    H’=フロア(W/N)×ピラミッド_係数
    によって与えられる、請求項18に記載の方法。
  23. 前記最初のピラミッド・スケールは、最低解像度のピラミッド・スケールであり、別のピラミッド・スケールは、次のより高い解像度のピラミッド・スケールである、請求項18に記載の方法。
  24. ステップ(c)は、時空間勾配推定方法を使用して実施される、請求項18に記載の方法。
  25. 前記オプティカルフロー推定処理は、最小二乗適合法を採用する、請求項18に記載の方法。
  26. 非線形の区分線形制約を前記オプティカルフロー場に課す、少なくとも1つの非線形フィルタにより、前記生のオプティカルフロー場を処理するステップをさらに備える、請求項18に記載の方法。
  27. 前記少なくとも1つの非線形フィルタは、全変動最小化(L1およびL2ノルム)フィルタ、異方性拡散フィルタ、局所的画像構造に反応する楕円ステアラブル・フィルタ、および、カーネル回帰フィルタのうち、少なくとも1つである、請求項26に記載の方法。
  28. 画素サンプル毎に、前記生のオプティカルフロー場の逆の無矛盾性をチェックするために、複数画素動き補償および差分二乗和計算を、前記生のオプティカルフロー場において行うステップをさらに備える、請求項18に記載の方法。
  29. 後続のより低い解像度のピラミッド・スケールで、ピラミッド・スケーリング係数を選択するためのフィードバック機構を提供するために、2D構造テンソル固有システム解析を前記離散時間導関数に適用するステップをさらに備える、請求項18に記載の方法。
  30. 前記2D構造テンソル固有システム解析中に、他のピラミッド・スケールを超える単一のピラミッド・スケールについて、閾値画素割合を下回る小さい固有値に遭遇するとき、前記後続のピラミッド・スケールのうち少なくとも1つについて、より細かいピラミッド・スケールが使用される、請求項29に記載の方法。
  31. 前記生のオプティカルフロー場は逆の順序で処理される、請求項18に記載の方法。
  32. 動きベクトルは、前記画像の対のうち第2の画像を、ロバートのクロス・コンフィギュレーションの5つ以上の位置においてサンプルするために使用される、請求項31に記載の方法。
  33. 単一画素アウトライアを除去するために、すべてのピラミッド・スケールについての前記生のオプティカルフロー場を、(非線形)3x3メジアンフィルタ演算によって処理し、前記フィルタされた生のオプティカルフロー場を、L2ノルム全変動演算子により、可変数の反復の間、処理するステップをさらに備える、請求項18に記載の方法。
  34. 処理システムによりアクセスする場合に以下のステップにより前記処理システムに動作を行わさせる指示を含む非一時的コンピュータ可読記憶媒体であって、
    (a)前記画像の対の各々を画像ピラミッドに分解すること、
    (b)前記分解された画像の対における画素の明るさの勾配が一定であるという仮定の下に、前記分解された画像の対を、最初のピラミッド・スケールで、二次導関数表現に変換すること、
    (c)前記二次導関数画像表現の離散時間導関数を推定すること、
    (d)生のオプティカルフロー場を発生させるために、オプティカルフロー推定処理を前記離散時間導関数に適用すること、
    (e)前記生のオプティカルフロー場をスケーリングすること、および
    (f)最後のオプティカルフロー場を発生させるために、すべてのピラミッド・スケールが訪問されるまで、前記画像の対に対して、別のピラミッド・スケールで、ステップ(b)〜(e)を繰り返すことを行うためのコードを備え、ステップ(b)における前記分解された画像の対の各々は、以前にスケールされたオプティカルフロー推定において推定された動きベクトルを用いて動き補償される、非一時的コンピュータ可読記憶媒体。
JP2014096424A 2008-10-15 2014-05-08 オプティカルフローの決定のためのデジタル処理方法およびシステム Expired - Fee Related JP5861949B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10551508P 2008-10-15 2008-10-15
US61/105,515 2008-10-15

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011532112A Division JP5547739B2 (ja) 2008-10-15 2009-09-08 オプティカルフローの決定のためのデジタル処理方法およびシステム

Publications (2)

Publication Number Publication Date
JP2014194797A true JP2014194797A (ja) 2014-10-09
JP5861949B2 JP5861949B2 (ja) 2016-02-16

Family

ID=42106823

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011532112A Expired - Fee Related JP5547739B2 (ja) 2008-10-15 2009-09-08 オプティカルフローの決定のためのデジタル処理方法およびシステム
JP2014096424A Expired - Fee Related JP5861949B2 (ja) 2008-10-15 2014-05-08 オプティカルフローの決定のためのデジタル処理方法およびシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011532112A Expired - Fee Related JP5547739B2 (ja) 2008-10-15 2009-09-08 オプティカルフローの決定のためのデジタル処理方法およびシステム

Country Status (6)

Country Link
US (3) US8355534B2 (ja)
JP (2) JP5547739B2 (ja)
KR (1) KR101498532B1 (ja)
GB (1) GB2476397B (ja)
HK (1) HK1159291A1 (ja)
WO (1) WO2010044963A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112041887A (zh) * 2018-04-24 2020-12-04 斯纳普公司 高效的并行光流算法和gpu实现
JP7487423B2 (ja) 2021-03-19 2024-05-20 クアルコム,インコーポレイテッド 学習されたビデオ圧縮のためのマルチスケールオプティカルフロー

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2289235A4 (en) * 2008-05-20 2011-12-28 Pelican Imaging Corp RECORDING AND PROCESSING IMAGES BY MONOLITHIC CAMERA ARRANGEMENT WITH HETEROGENIC IMAGE TRANSFORMER
US8866920B2 (en) 2008-05-20 2014-10-21 Pelican Imaging Corporation Capturing and processing of images using monolithic camera array with heterogeneous imagers
US11792538B2 (en) 2008-05-20 2023-10-17 Adeia Imaging Llc Capturing and processing of images including occlusions focused on an image sensor by a lens stack array
US8355534B2 (en) * 2008-10-15 2013-01-15 Spinella Ip Holdings, Inc. Digital processing method and system for determination of optical flow
US8559671B2 (en) * 2008-12-18 2013-10-15 The Regents Of The University Of California Training-free generic object detection in 2-D and 3-D using locally adaptive regression kernels
WO2010098160A1 (ja) * 2009-02-24 2010-09-02 国立大学法人 九州工業大学 物体運動推定装置、物体運動推定方法、プログラム及び記録媒体
JP5161845B2 (ja) * 2009-07-31 2013-03-13 富士フイルム株式会社 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム
WO2011063347A2 (en) 2009-11-20 2011-05-26 Pelican Imaging Corporation Capturing and processing of images using monolithic camera array with heterogeneous imagers
US8928793B2 (en) 2010-05-12 2015-01-06 Pelican Imaging Corporation Imager array interfaces
FR2961601B1 (fr) * 2010-06-22 2012-07-27 Parrot Procede d'evaluation de la vitesse horizontale d'un drone, notamment d'un drone apte au vol stationnaire autopilote
US8451384B2 (en) 2010-07-08 2013-05-28 Spinella Ip Holdings, Inc. System and method for shot change detection in a video sequence
US8878950B2 (en) 2010-12-14 2014-11-04 Pelican Imaging Corporation Systems and methods for synthesizing high resolution images using super-resolution processes
JP5801598B2 (ja) * 2011-05-09 2015-10-28 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
JP5843474B2 (ja) * 2011-05-09 2016-01-13 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
WO2012155119A1 (en) 2011-05-11 2012-11-15 Pelican Imaging Corporation Systems and methods for transmitting and receiving array camera image data
US8553943B2 (en) 2011-06-14 2013-10-08 Qualcomm Incorporated Content-adaptive systems, methods and apparatus for determining optical flow
EP2724255B1 (en) * 2011-06-27 2020-12-09 Yissum Research Development Company of The Hebrew University of Jerusalem Ltd. Applying rapid numerical approximation of convolutions with filters for image processing purposes
US20130265459A1 (en) 2011-06-28 2013-10-10 Pelican Imaging Corporation Optical arrangements for use with an array camera
WO2013043761A1 (en) 2011-09-19 2013-03-28 Pelican Imaging Corporation Determining depth from multiple views of a scene that include aliasing using hypothesized fusion
KR102002165B1 (ko) 2011-09-28 2019-07-25 포토내이션 리미티드 라이트 필드 이미지 파일의 인코딩 및 디코딩을 위한 시스템 및 방법
US9412206B2 (en) 2012-02-21 2016-08-09 Pelican Imaging Corporation Systems and methods for the manipulation of captured light field image data
US20140063314A1 (en) * 2012-02-28 2014-03-06 Aswin C Sankaranarayanan System And Method Of Video Compressive Sensing For Spatial-Multiplexing Cameras
US9210392B2 (en) 2012-05-01 2015-12-08 Pelican Imaging Coporation Camera modules patterned with pi filter groups
US8942452B2 (en) * 2012-05-18 2015-01-27 Kabushiki Kaisha Toshiba Apparatus and method for smoothing random event data obtained from a Positron Emission Tomography scanner
CN104508681B (zh) 2012-06-28 2018-10-30 Fotonation开曼有限公司 用于检测有缺陷的相机阵列、光学器件阵列和传感器的系统及方法
US20140002674A1 (en) 2012-06-30 2014-01-02 Pelican Imaging Corporation Systems and Methods for Manufacturing Camera Modules Using Active Alignment of Lens Stack Arrays and Sensors
CN104662589B (zh) 2012-08-21 2017-08-04 派力肯影像公司 用于使用阵列照相机捕捉的图像中的视差检测和校正的系统和方法
EP2888698A4 (en) 2012-08-23 2016-06-29 Pelican Imaging Corp PROPERTY-BASED HIGH-RESOLUTION MOTION ESTIMATION FROM LOW-RESOLUTION IMAGES RECORDED WITH AN ARRAY SOURCE
WO2014043641A1 (en) 2012-09-14 2014-03-20 Pelican Imaging Corporation Systems and methods for correcting user identified artifacts in light field images
WO2014052974A2 (en) 2012-09-28 2014-04-03 Pelican Imaging Corporation Generating images from light fields utilizing virtual viewpoints
WO2014078443A1 (en) 2012-11-13 2014-05-22 Pelican Imaging Corporation Systems and methods for array camera focal plane control
US9008363B1 (en) 2013-01-02 2015-04-14 Google Inc. System and method for computing optical flow
WO2014130849A1 (en) 2013-02-21 2014-08-28 Pelican Imaging Corporation Generating compressed light field representation data
US9374512B2 (en) 2013-02-24 2016-06-21 Pelican Imaging Corporation Thin form factor computational array cameras and modular array cameras
WO2014138695A1 (en) 2013-03-08 2014-09-12 Pelican Imaging Corporation Systems and methods for measuring scene information while capturing images using array cameras
US8866912B2 (en) 2013-03-10 2014-10-21 Pelican Imaging Corporation System and methods for calibration of an array camera using a single captured image
US9521416B1 (en) 2013-03-11 2016-12-13 Kip Peli P1 Lp Systems and methods for image data compression
US9888194B2 (en) 2013-03-13 2018-02-06 Fotonation Cayman Limited Array camera architecture implementing quantum film image sensors
US9106784B2 (en) 2013-03-13 2015-08-11 Pelican Imaging Corporation Systems and methods for controlling aliasing in images captured by an array camera for use in super-resolution processing
WO2014164550A2 (en) 2013-03-13 2014-10-09 Pelican Imaging Corporation System and methods for calibration of an array camera
US9519972B2 (en) 2013-03-13 2016-12-13 Kip Peli P1 Lp Systems and methods for synthesizing images from image data captured by an array camera using restricted depth of field depth maps in which depth estimation precision varies
US9100586B2 (en) 2013-03-14 2015-08-04 Pelican Imaging Corporation Systems and methods for photometric normalization in array cameras
US9578259B2 (en) 2013-03-14 2017-02-21 Fotonation Cayman Limited Systems and methods for reducing motion blur in images or video in ultra low light with array cameras
US9445003B1 (en) 2013-03-15 2016-09-13 Pelican Imaging Corporation Systems and methods for synthesizing high resolution images using image deconvolution based on motion and depth information
US9497429B2 (en) 2013-03-15 2016-11-15 Pelican Imaging Corporation Extended color processing on pelican array cameras
US9633442B2 (en) 2013-03-15 2017-04-25 Fotonation Cayman Limited Array cameras including an array camera module augmented with a separate camera
US10122993B2 (en) 2013-03-15 2018-11-06 Fotonation Limited Autofocus system for a conventional camera that uses depth information from an array camera
EP2973476A4 (en) 2013-03-15 2017-01-18 Pelican Imaging Corporation Systems and methods for stereo imaging with camera arrays
WO2014150856A1 (en) 2013-03-15 2014-09-25 Pelican Imaging Corporation Array camera implementing quantum dot color filters
WO2014191329A1 (en) * 2013-05-28 2014-12-04 Thomson Licensing Image edits propagation to underlying video sequence via dense motion fields
WO2015048694A2 (en) 2013-09-27 2015-04-02 Pelican Imaging Corporation Systems and methods for depth-assisted perspective distortion correction
EP3066690A4 (en) 2013-11-07 2017-04-05 Pelican Imaging Corporation Methods of manufacturing array camera modules incorporating independently aligned lens stacks
US10119808B2 (en) 2013-11-18 2018-11-06 Fotonation Limited Systems and methods for estimating depth from projected texture using camera arrays
WO2015081279A1 (en) 2013-11-26 2015-06-04 Pelican Imaging Corporation Array camera configurations incorporating multiple constituent array cameras
CN104680551B (zh) * 2013-11-29 2017-11-21 展讯通信(天津)有限公司 一种基于肤色检测的跟踪方法及装置
CN104680552B (zh) * 2013-11-29 2017-11-21 展讯通信(天津)有限公司 一种基于肤色检测的跟踪方法及装置
CN104680122B (zh) * 2013-11-29 2019-03-19 展讯通信(天津)有限公司 一种基于肤色检测的跟踪方法及装置
WO2015134996A1 (en) 2014-03-07 2015-09-11 Pelican Imaging Corporation System and methods for depth regularization and semiautomatic interactive matting using rgb-d images
US9247117B2 (en) 2014-04-07 2016-01-26 Pelican Imaging Corporation Systems and methods for correcting for warpage of a sensor array in an array camera module by introducing warpage into a focal plane of a lens stack array
US9521319B2 (en) 2014-06-18 2016-12-13 Pelican Imaging Corporation Array cameras and array camera modules including spectral filters disposed outside of a constituent image sensor
US9836831B1 (en) * 2014-07-30 2017-12-05 Google Inc. Simulating long-exposure images
EP3001685A1 (en) * 2014-09-24 2016-03-30 Thomson Licensing Method and apparatus for estimating absolute motion values in image sequences
EP3201877B1 (en) 2014-09-29 2018-12-19 Fotonation Cayman Limited Systems and methods for dynamic calibration of array cameras
US9942474B2 (en) 2015-04-17 2018-04-10 Fotonation Cayman Limited Systems and methods for performing high speed video capture and depth estimation using array cameras
AU2015202937A1 (en) * 2015-05-29 2016-12-15 Canon Kabushiki Kaisha Systems and methods for registration of images
US10074151B2 (en) * 2015-09-30 2018-09-11 Intel Corporation Dense optical flow acceleration
US10755380B2 (en) 2015-11-11 2020-08-25 Texas Instruments Incorporated Down scaling images in a computer vision system
JP6838918B2 (ja) * 2015-11-24 2021-03-03 キヤノン株式会社 画像データ処理装置及び方法
US10268901B2 (en) * 2015-12-04 2019-04-23 Texas Instruments Incorporated Quasi-parametric optical flow estimation
US10089788B2 (en) 2016-05-25 2018-10-02 Google Llc Light-field viewpoint and pixel culling for a head mounted display device
JP6854629B2 (ja) * 2016-11-24 2021-04-07 キヤノン株式会社 画像処理装置、画像処理方法
US10235763B2 (en) 2016-12-01 2019-03-19 Google Llc Determining optical flow
US10424069B2 (en) 2017-04-07 2019-09-24 Nvidia Corporation System and method for optical flow estimation
CN116708829A (zh) 2017-04-24 2023-09-05 Sk电信有限公司 编解码视频数据的装置、发送编码视频数据比特流的方法
US10482618B2 (en) 2017-08-21 2019-11-19 Fotonation Limited Systems and methods for hybrid depth regularization
US10977809B2 (en) 2017-12-11 2021-04-13 Dolby Laboratories Licensing Corporation Detecting motion dragging artifacts for dynamic adjustment of frame rate conversion settings
CN108040217B (zh) * 2017-12-20 2020-01-24 深圳岚锋创视网络科技有限公司 一种视频解码的方法、装置及相机
CN109756690B (zh) * 2018-12-21 2020-11-20 西北工业大学 基于特征级别光流的轻量级视频插值方法
WO2021055585A1 (en) 2019-09-17 2021-03-25 Boston Polarimetrics, Inc. Systems and methods for surface modeling using polarization cues
MX2022004163A (es) 2019-10-07 2022-07-19 Boston Polarimetrics Inc Sistemas y metodos para la deteccion de estandares de superficie con polarizacion.
US11176682B2 (en) * 2019-11-27 2021-11-16 Nvidia Corporation Enhanced optical flow estimation using a varied scan order
MX2022005289A (es) 2019-11-30 2022-08-08 Boston Polarimetrics Inc Sistemas y metodos para segmentacion de objetos transparentes usando se?ales de polarizacion.
WO2021154386A1 (en) 2020-01-29 2021-08-05 Boston Polarimetrics, Inc. Systems and methods for characterizing object pose detection and measurement systems
US11797863B2 (en) 2020-01-30 2023-10-24 Intrinsic Innovation Llc Systems and methods for synthesizing data for training statistical models on different imaging modalities including polarized images
WO2021243088A1 (en) 2020-05-27 2021-12-02 Boston Polarimetrics, Inc. Multi-aperture polarization optical systems using beam splitters
CN112381860B (zh) * 2020-11-21 2023-04-11 西安交通大学 一种旋转叶片动频测量的无标记计算机视觉方法
CN112446179B (zh) * 2020-12-10 2024-05-14 华中科技大学 一种基于变分光流模型的流体速度测量方法
US11290658B1 (en) 2021-04-15 2022-03-29 Boston Polarimetrics, Inc. Systems and methods for camera exposure control
US11954886B2 (en) 2021-04-15 2024-04-09 Intrinsic Innovation Llc Systems and methods for six-degree of freedom pose estimation of deformable objects
US11689813B2 (en) 2021-07-01 2023-06-27 Intrinsic Innovation Llc Systems and methods for high dynamic range imaging using crossed polarizers
CN114581493A (zh) * 2022-03-04 2022-06-03 三星电子(中国)研发中心 双向光流估计方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06168329A (ja) * 1992-11-27 1994-06-14 Mitsubishi Electric Corp オプティカルフロー演算回路
JP2001222707A (ja) * 2000-02-08 2001-08-17 Sanyo Electric Co Ltd 中間画像合成方法、中間画像合成装置、中間画像合成プログラムを記録した記録媒体
JP2005128619A (ja) * 2003-10-21 2005-05-19 Konica Minolta Holdings Inc 物体計測装置、物体計測方法、およびプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680487A (en) * 1991-12-23 1997-10-21 Texas Instruments Incorporated System and method for determining optical flow
US5500904A (en) * 1992-04-22 1996-03-19 Texas Instruments Incorporated System and method for indicating a change between images
US5627905A (en) * 1994-12-12 1997-05-06 Lockheed Martin Tactical Defense Systems Optical flow detection system
GB2311182A (en) * 1996-03-13 1997-09-17 Innovision Plc Improved gradient based motion estimation
JPH09261490A (ja) * 1996-03-22 1997-10-03 Minolta Co Ltd 画像形成装置
US6847737B1 (en) * 1998-03-13 2005-01-25 University Of Houston System Methods for performing DAF data filtering and padding
JP3960694B2 (ja) * 1998-10-26 2007-08-15 富士通株式会社 色信号変換方法、色信号変換装置、記録媒体、デバイスドライバ及び色変換テーブル
EP1438839A1 (en) * 2001-10-08 2004-07-21 Koninklijke Philips Electronics N.V. Device and method for motion estimation
JP4138345B2 (ja) * 2002-03-22 2008-08-27 セイコーエプソン株式会社 画像処理装置および画像出力装置
US7558320B2 (en) * 2003-06-13 2009-07-07 Microsoft Corporation Quality control in frame interpolation with motion analysis
US7408986B2 (en) * 2003-06-13 2008-08-05 Microsoft Corporation Increasing motion smoothness using frame interpolation with motion analysis
US20070126932A1 (en) * 2005-12-05 2007-06-07 Kiran Bhat Systems and methods for utilizing idle display area
US8355534B2 (en) * 2008-10-15 2013-01-15 Spinella Ip Holdings, Inc. Digital processing method and system for determination of optical flow

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06168329A (ja) * 1992-11-27 1994-06-14 Mitsubishi Electric Corp オプティカルフロー演算回路
JP2001222707A (ja) * 2000-02-08 2001-08-17 Sanyo Electric Co Ltd 中間画像合成方法、中間画像合成装置、中間画像合成プログラムを記録した記録媒体
JP2005128619A (ja) * 2003-10-21 2005-05-19 Konica Minolta Holdings Inc 物体計測装置、物体計測方法、およびプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200600060012; 安達 栄輔,堀口 進: '"多重解像度解析を用いたオプティカルフロー推定の検討"' 情報処理学会論文誌 Vol.46, No.6, 20050615, p.1501-1511, 社団法人情報処理学会 *
JPN6015004297; 安達 栄輔,堀口 進: '"多重解像度解析を用いたオプティカルフロー推定の検討"' 情報処理学会論文誌 Vol.46, No.6, 20050615, p.1501-1511, 社団法人情報処理学会 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112041887A (zh) * 2018-04-24 2020-12-04 斯纳普公司 高效的并行光流算法和gpu实现
KR20210002578A (ko) * 2018-04-24 2021-01-08 스냅 인코포레이티드 효율적인 병렬 광학 흐름 알고리즘 및 gpu 구현
KR102545642B1 (ko) 2018-04-24 2023-06-21 스냅 인코포레이티드 효율적인 병렬 광학 흐름 알고리즘 및 gpu 구현
KR20230093076A (ko) * 2018-04-24 2023-06-26 스냅 인코포레이티드 효율적인 병렬 광학 흐름 알고리즘 및 gpu 구현
US11783448B2 (en) 2018-04-24 2023-10-10 Snap Inc. Efficient parallel optical flow algorithm and GPU implementation
KR102655540B1 (ko) 2018-04-24 2024-04-09 스냅 인코포레이티드 효율적인 병렬 광학 흐름 알고리즘 및 gpu 구현
JP7487423B2 (ja) 2021-03-19 2024-05-20 クアルコム,インコーポレイテッド 学習されたビデオ圧縮のためのマルチスケールオプティカルフロー

Also Published As

Publication number Publication date
US20130101178A1 (en) 2013-04-25
WO2010044963A1 (en) 2010-04-22
US8355534B2 (en) 2013-01-15
HK1159291A1 (en) 2012-07-27
KR101498532B1 (ko) 2015-03-04
GB201101399D0 (en) 2011-03-09
US20130259317A1 (en) 2013-10-03
US20100124361A1 (en) 2010-05-20
JP2012506092A (ja) 2012-03-08
GB2476397A (en) 2011-06-22
KR20110111362A (ko) 2011-10-11
GB2476397B (en) 2014-04-30
US8712095B2 (en) 2014-04-29
JP5547739B2 (ja) 2014-07-16
JP5861949B2 (ja) 2016-02-16
US8483438B2 (en) 2013-07-09

Similar Documents

Publication Publication Date Title
JP5861949B2 (ja) オプティカルフローの決定のためのデジタル処理方法およびシステム
Takeda et al. Super-resolution without explicit subpixel motion estimation
Papenberg et al. Highly accurate optic flow computation with theoretically justified warping
US20120219229A1 (en) Image enhancement apparatus and method
Wasza et al. Real-time preprocessing for dense 3-D range imaging on the GPU: defect interpolation, bilateral temporal averaging and guided filtering
Sellent et al. Motion field estimation from alternate exposure images
Unger et al. A convex approach for variational super-resolution
Al Ismaeil et al. Enhancement of dynamic depth scenes by upsampling for precise super-resolution (UP-SR)
GB2510709A (en) Determining an optical flow field between a pair of images by warping spatiotemporal gradient estimations
Sadaghiani et al. Image interpolation based on 2D-DWT with novel regularity-preserving algorithm using RLS adaptive filters
Bouzari An improved regularization method for artifact rejection in image super-resolution
Sim et al. Robust reweighted MAP motion estimation
Malczewski et al. Super resolution for multimedia, image, and video processing applications
Choi et al. Discrete and continuous optimizations for depth image super-resolution
Telea et al. A variational approach to joint denoising, edge detection and motion estimation
Guðmundsson et al. TOF-CCD image fusion using complex wavelets
Xiang et al. Real-time spatial and depth upsampling for range data
Balure et al. Depth image super-resolution: a review and wavelet perspective
Metwalli et al. Combining superresolution and fusion methods for sharpening misrsat-1 data
Khan et al. Comparison of reconstruction and example-based super-resolution
Jaiswal et al. Recent Developments in Super Resolution
Lukeš Super-Resolution Methods for Digital Image and Video Processing
Le et al. A super-resolution imaging method based on dense subpixel-accurate motion fields
Laveau et al. Structuring Elements Following the Optical Flow: Combining Morphology and Motion
Li et al. Spatio-Temporal Consistency in Depth Video Enhancement

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140827

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140827

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150205

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150501

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150526

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150925

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20151020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151112

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20151203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20151203

R150 Certificate of patent or registration of utility model

Ref document number: 5861949

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees