JP2016514867A - 動き推定の方法及び装置 - Google Patents

動き推定の方法及び装置 Download PDF

Info

Publication number
JP2016514867A
JP2016514867A JP2016503618A JP2016503618A JP2016514867A JP 2016514867 A JP2016514867 A JP 2016514867A JP 2016503618 A JP2016503618 A JP 2016503618A JP 2016503618 A JP2016503618 A JP 2016503618A JP 2016514867 A JP2016514867 A JP 2016514867A
Authority
JP
Japan
Prior art keywords
image
target
frame
region
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016503618A
Other languages
English (en)
Other versions
JP6022734B2 (ja
Inventor
ペトロネル ビギオイ
ペトロネル ビギオイ
ピーター コーコラン
ピーター コーコラン
ピョートル ステック
ピョートル ステック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fotonation Ltd
Original Assignee
DigitalOptics Corp Europe Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DigitalOptics Corp Europe Ltd filed Critical DigitalOptics Corp Europe Ltd
Publication of JP2016514867A publication Critical patent/JP2016514867A/ja
Application granted granted Critical
Publication of JP6022734B2 publication Critical patent/JP6022734B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6811Motion detection based on the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6812Motion detection based on additional sensors, e.g. acceleration sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • G06T2207/20012Locally adaptive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20068Projection on vertical or horizontal image axis

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

所与の場面の一対の画像フレーム間での動きを推定する方法は、画像フレームの各々についてそれぞれのインテグラル画像を計算するステップと、各フレーム内で少なくとも1つの対応する対象領域を選択するステップとを含む。各対象領域について、各インテグラル画像からのインテグラル画像プロファイルが計算され、各プロファイルは要素の配列を含み、各要素はフレームに関する対象領域の連続したスワスからのピクセル輝度の合計を含む。インテグラル画像プロファイルは、一対のフレーム間の対象領域の相対変位を判定するために相関付けられる。引き続いて分割された対象領域について、推定された動きの要求された階層が提供されるまで繰り返す前に、各対象領域は更に複数の対象領域に分割される。【選択図】図8

Description

本発明は、動き推定の方法及び装置に関する。
WO2008/151802号(参照:FN−174)及びWO2011/069698号(参照:FN−352)には、映像シーケンス内のそれぞれの画像フレームに関するプロファイルを相関付けて画像フレーム間の相対的な動き、即ち、カメラの動き又は被写体の動きのいずれかを含む動きを判定する方法が開示されている。しかし、フレーム間での動きの全体的な大きさを提供する方法の用途は限定される。
したがって、画像シーケンスのブロック又は領域内の全体的な動き及び局部的な動きの両方を示す情報を提供することが有用となり得る。一連の映像フレーム内の局部ブロックの動きを求める階層的手法を使用する多くの動き推定の方法が存在する。
一般的には、次の2種類の手法がある。
・ピラミッドの各レベルがその前のレベルのダウンスケールバージョンである、所謂ガウス型ピラミッドに画像を分解する、例えば米国特許第6459822号に開示されているような画像ピラミッド。レベル間のスケーリング係数は、通常、2である。対応するブロック間の変位は、ブロック間のピクセル値を相関付けることにより求めることができる。画像ピラミッドを記憶するために必要なメモリ量を別にしても、この方式では、たとえ小さな探索半径を採用したとしても処理が計算集約的となる。
・画像の大きさはオリジナルのままでも探索の繰り返しの度に探索ブロックが小さくなり、また探索半径も縮小されることでより高精度の推定が可能となる、可変ブロックサイズ。この手法の問題は、画像ピクセルに複数回アクセスしなければならず、各繰り返しの数値的な複雑性が高いことである。
米国特許第8200020B1号には、ソース画像からソースタイルを選択するコンピューティング装置が開示されている。コンピューティング装置は、ソースタイルから第1の矩形形状及び第2の矩形形状を選択することができる。コンピューティング装置は、第1及び第2の矩形形状に基づいてソース形状ベクトルを計算することができる。コンピューティング装置はまた、対象画像の探索エリア及び探索エリア内のターゲットタイルを選択することもできる。コンピューティング装置は、ターゲットタイルに基づいて、ターゲット形状ベクトルを計算することができる。コンピューティング装置は、ソース形状ベクトルとターゲット形状ベクトルとの差が誤差閾値未満であることを判定し、この判定に基づいて、ソース画像と対象画像との間のマッピングを更に判定することができる。次に、コンピューティング装置は、ソース画像にマッピングを適用して変換されたソース画像を生成することができる。
米国特許第6809758号には、隣接するフレーム間の動きベクトル場を計算するステップと、動きベクトル場の水平及び垂直成分から動きベクトルヒストグラムを形成するステップと、動きベクトルヒストグラムに閾値を適用して閾値処理された動きベクトルヒストグラムを作成するステップと、閾値処理された動きベクトルヒストグラムから平均水平動き成分及び平均垂直動き成分を生成するステップと、多数のフレームにわたって平均水平動き成分及び平均垂直動き成分をフィルタリングしてフレームの各々について不要な水平及び垂直動き成分を同定するステップと、対応する水平方向及び垂直方向の不要な動きに従って各フレームをシフトすることにより、画像シーケンスを安定化するステップとを含む、一連の連続フレームを使用して形成された動き画像を安定化する方法が開示されている。
本発明の第1の態様によれば、請求項1に記載の所与の場面の一対の画像フレーム間での動きを推定する方法が提供される。
本発明のこの態様は、各画像フレームから導出されるインテグラル画像を採用して画像領域の階層の多数のレベルにおける画像フレーム間での相対的な動きを判定する。対応する領域間での動きは、画像相関法を直接使用してではなく、インテグラル画像プロファイルによって求められる。インテグラル画像プロファイルは、画像内の対象領域からの列内又は行内の全ピクセルの輝度の合計を包含する線形配列である。対応する領域からのインテグラル画像プロファイルは、領域間の変位を求めるために相関付けられる。
既述のように、埋め込みアプリケーションでは、画像を数回ダウンスケーリングし、ピラミッド即ち階層内にダウンスケーリングされたすべてのレベルを保存することは実現困難である。更に、階層内のこれらダウンスケーリングされた画像レベルから構築されたプロファイルは、不要なメモリトラフィックを発生させるであろうと考えられる。この問題は、階層内の各レベルについて必要に応じてサンプリングされるフレーム毎の単一インテグラル画像を使用して階層変位マップを生成することにより効果的に解決される。
実施形態において、例えば、基底レベルでは画像は16×16の領域に分割されており、そのすぐ上位のレベルは8×8の領域を有し、その上は4×4を有するというように、階層のレベルが下がる毎に領域の数が増加するように、階層レベルの各々が1つ以上の領域に分割される。いくつかの実施形態において、各レベルがその上位のレベルの2倍の解像度でサンプリングされることで、引き続いてより局部化される画像領域について更により微細な動きの推定が提供されるように、インテグラル画像情報のサンプリングがスケーリングされる。
本発明の実施形態はピラミッド内の各ブロックに関するインテグラルプロファイルの構築を最適化するので、メモリ量及びメモリ帯域幅の要件を最小限に抑えると共に計算複雑性を低減する階層的動き推定を実行する効率的な方法を提供する。
第2の態様によれば、請求項18及び19の各々に記載の所与の場面の一対の画像フレーム間での動きを推定する方法が提供される。
これらの方法は、単一の対象領域のサブブロックへの細分化及びインテグラル画像プロファイルの再構築を必要とせずに、この単一の対象領域内の複数の動きを検出する。これらの方法は、2つの対応する対象領域間の誤差関数の極小値を利用し、更には対象領域内に包含される被写体間の近似境界を設定するように試みる。
第3の態様によれば、請求項21に記載の所与の場面の一対の画像フレーム間での動きを推定する方法が提供される。
機器に内蔵の動きセンサに基づいた動きの初期推測を使用してピラミッドの最上部で動き推定を開始する代わりに、この方法を使用すれば、動き推定は、階層のルートレベルよりも1つ以上下位のレベルで開始される。
また、上記で言及した本発明の態様を実行するために構成された画像処理装置及びコンピュータプログラム製品も提供される。
ここで、例として、添付の図面を参照しながら本発明の実施形態について説明する。
本発明の一実施形態に係る動き推定を実行するように構成された画像処理装置のブロック図である。 本発明の一実施形態に係る動き推定の方法を概略図示したフロー図である。 図2の方法の第1の繰り返しに関するインテグラル画像プロファイルを生成するために使用されるインテグラル画像ピクセルの図である。 基準画像(R)に対して変位した対象画像(T)の図である。 図4に示したような一対の変位した画像に関する例示的なインテグラル画像プロファイルの図である。 図2の方法の第2の繰り返しで変位した対象領域(ROI)である。 図2の方法の第2の繰り返しにおける基準画像(R)の左上及び左下のROIに関するインテグラル画像プロファイルを構築するために必要なピクセルの図である。 図2の方法の第3の繰り返しで変位した対象領域(ROI)の図である。 補間されたインテグラル画像プロファイルの図である。 平均絶対誤差(MAE)に基づくプロファイル間のサブピクセル単位の変位の計算の図である。 平均絶対誤差(MAE)に基づくプロファイル間のサブピクセル単位の変位の計算の図である。 画像フレームのかなりの部分を占める被写体の図である。 図12の画像に関する極小値を含むMAEを示すプロファイルの図である。 図2の方法により生成された動きベクトルの変位マトリックスの図である。 全体的な変換マトリックスの計算に使用するマトリックスからベクトルを選択する方法の図である。 図15の方法によって生成された図14のマトリックスに関する選択マスクの図である。 対象領域の階層のあるレベルから次のレベルへの不均一な細分化の図である。 対象領域の階層のあるレベルから次のレベルへの不均一な細分化の図である。 対象領域の階層のあるレベルから次のレベルへの不均一な細分化の図である。
ここで図1を参照すると、本発明の一実施形態に係る動き推定を実行するための画像処理装置10が図式的に示されている。この装置はバス12を含み、バスは機能処理モジュール14〜22(バスの下方に図示)がメモリ24〜28(バスの上方に図示)から情報を読み出し、これらに書き込むことを可能とする。モジュール14〜22は、内部処理を容易にするためのローカルメモリを組み込むことができることに注目すべきである。
画像フレームは、ダウンサンプラ(DS)14を介して画像センサ(図示せず)から取得される。ダウンサンプラ14は、例えば、Fujitsuが提供しているタイプのガウス型ダウンサンプラであってもよい。ダウンサンプリングされた画像がインテグラル画像(II)生成器(GEN)14に供給され、この生成器がIIをメモリ24に書き込む。インテグラル画像の計算については周知であるが、これは、P.Viola及びM.Jonesによって「Rapid Object Detection using a Boosted Cascade of Simple Features」,Computer Vision and Pattern Recognition,2001,Volume 1の中で最初に開示された。インテグラル画像は、一般的には、WO2008/018887号(参照:FN−143)内で開示されているような、画像内の顔などの被写体の同定に使用される。理解されるであろうとおり、インテグラル画像を提供するためには、オリジナル画像の輝度バージョンのみが必要である。したがって、画像のグレースケールバージョンでもよく、又は、例えば、RGB、LAB、YCCなどの多平面画像フォーマットの任意の単一平面であってもよい。
下記により詳細に説明するように、階層登録エンジン(hierarchical registration engine)(HRE)18がメモリ24から一対のフレームに関するインテグラル画像情報を読み出し、その画像の対について変位マップ26を生成する。
次に、アプリケーションプログラムを実行中のCPUモジュール20が、連続した画像フレームの変位マップ26を使用して、例えば、WO2014/005783号(参照:FN−384)に記載されているタイプのグラフィックス歪みエンジン(DGE)22が映像シーケンス内の画像の安定化処理を提供するために必要とする、設定情報28を提供することができる。
見て取ることができるであろうとおり、HREモジュール18は、映像フレームを直接使用するのではなく、画像フレームのダウンサンプリングされた表現から計算されたインテグラル画像情報を使用する。HREモジュール18は、メモリ24内の2つのフレームに関するインテグラル画像情報をバッファリングし、1組の画像情報を基準フレームのために使用し、基準フレームに対する対象フレーム内の対象領域(ROI)の変位を計算する必要がある。より詳細に後述するように、いくつかの実施形態において、基準フレームは、対象フレームに先行し、次に対象フレームに後続するように、対象フレームと時間的に交互になることができる。
図2を参照すると、HREモジュール18は、階層のレベル毎に対象領域の動きベクトルを求めるために階層的探索を実行する。これは粗密探索法であり、まず、最大のサブサンプリング間隔で完全な画像フレームのインテグラル画像情報について探索を実行する。次に、フレームを複数の領域に分割し、個々の領域内の局部的な動きの初期的な推測として完全なフレームの動き推定を使用し、これを全階層にわたって繰り返す。
このように、モジュール18は、ステップ30で完全な画像フレームで開始し、ステップ32で、メモリ内に取り込んだインテグラル画像データ24に基づいて基準フレーム(R)及び対象フレーム(T)の各々のインテグラル画像プロファイルを構築する。インテグラル画像プロファイルとは、画像内の対象領域の対応する(探索の方向により)列又は行のスワス内の全ピクセルの輝度の合計を各要素内に包含する配列のことである。インテグラル画像プロファイルは、必要であれば元の汎用メモリ内に再度書き込むこともできるが、一般的には、HREモジュール18内にローカルに記憶される。
図3を参照すると、通常、階層の所与の対象領域に関するインテグラル画像プロファイルを計算するステップは、ROIの第1の行に沿ってインテグラル画像をサブサンプリングするステップと、これらの値R1-xを、ROIの最後の行に沿ってサブサンプリングされたこれらの値R2-xから減算するステップとを含み、各スワスの左上の隅を示す最上行の値及び右下の隅を示す最下行の値が、インテグラル画像プロファイル内の値を提供する。図3に示す階層の最上レベルにおいて、R1-1=0のとき、第1の列のプロファイルの値は単にR2-1であり、次の列のプロファイルの値は単にR2-2−R2-1であるというように、画像の幅全域にわたって同様に続く。よって、階層の最上レベルにおけるインテグラル画像プロファイルを生成するためには、このレベルのインテグラル画像情報の最下行のみをサンプリングすればよい。(垂直方向の変位の判定にも同様の手法が適用される。)
図4は水平方向及び垂直方向に変位した一対の画像T、Rを示しており、図5はこれらの画像に関する水平インテグラル画像プロファイルT、Rを示している。これらのインテグラル画像プロファイルは、基準フレームからの対象フレームの変位を判定するために容易に相関付けることができる。(ここでも、垂直変位を求めるために同様の動作が実行されるが、この場合、プロファイルは、画像の行を合計することによって構築される。)
図2の実施形態において、階層の各レベルは直下に位置するレベルの解像度の1/2でサンプリングされ、階層の最上レベルでは全体画像は最も粗いバージョンであり、最下レベルでは最も細密なバージョンとなる。このように、ステップ38では、階層のあるレベルで求められた(インテグラル画像サンプル内の)動きが2倍され、その下のレベルにとっての初期推定として設定され、局部的な動きがない場合の公称誤差は各々の方向において±1サンプルである。
水平方向及び垂直方向の変位を示す1つの動きベクトルのみが生成されるかもしれない階層の開始レベルには適用されないものの、いくつかの実施形態において、動きベクトルのマトリックスが生成される(図14)階層のより下位のレベルでは、異常値の影響を低減するために、ステップ38でマトリックスにローパスフィルタを適用することができる。
一次元について見てみると、あるレベルからの変位値A〜Dの行がアップスケーリングされて次のレベルの初期変位値a〜hの行を生成する。
A B C D
a b c d e f g h
フィルタリングを伴わない簡単なアップスケーリングについて、初期変位値は以下のパターンを用いて計算することができる。
b=(3*A+B)/4
c=(A+3*B)/4
d=(3*B+C)/4
e=(B+3*C)/4など。
フィルタリングするためには、出力値に簡易ガウス型カーネル[1 2 1]を適用することができ、a、b、cなどの計算の代替として、交互に繰り返す以下の2つのケースの最終カーネルがある。
c’=(5*A+10*B+C)/16
d’=(A+10*B+5*C)/16
但し、c’及びd’はローパスフィルタ通過後の値である。上記の計算に用いられる乗算は、例えば、5*A=(A<<2)+Aなどのようにビットシフト及び加算に容易に分解することができ、この種のフィルタは一切の乗算を用いずに実施できるので、ハードウェアの実施上非常に好都合である。(列方向の動きベクトルの処理にも同様の原理が適用される。)
この実施形態において、階層の次のレベルに移行するときに図2のステップ34で各ROIが4つの新しいROIに分割される。ここでも、細分化の程度は様々であることができ、可変又は不均一な大きさのROIを伴って動的であることさえできる。
図6は、この方法の第1の繰り返し後のROIのレイアウトを示しており、基準フレーム(R)が右側に、対象フレーム(T)が左側に示されている。この段階では、階層の最上位レベルに関するインテグラル画像情報の解析に基づいて判定される単一のベクトルに基づいて動きが生成されるので、ステップ36で4つすべてのROIが同じ動きでイニシャライズ又は初期設定される。このように、対象画像(T)の対象領域の画像情報は、階層内のより高位の前のレベルで判定された動きに従って基準画像(R)のサンプルに対してシフトしたサンプルから取り出される。
ここでも、基準画像に対する対象画像のプロファイル及び変位は、ステップ32において、図6に示した4つの対象領域の各々について判定される。図7に図示されるように、インテグラル画像のプロファイルは、画像の4つの領域の各々の最上行及び最下行に沿ってインテグラル画像の点をサンプリングすることによって構築される。しかし、対象画像の変位した領域のインテグラル画像情報が、階層内のより高位レベルからの現在の領域と境界を接する対象領域について検出される変位に従ってシフトした位置からサンプリングされることが重要である。
対象画像及び基準画像の各領域に関するインテグラル画像のプロファイルが構築された後、ステップ38、34、及び36で階層の次のレベルについて処理を繰り返す前に、ステップ32において第2のレベルに関する動きを再度判定することができる。
図8に誇張して示したように、処理が階層を通じて進捗していくと、ROIの動き推定はもはや規則的ではなくなる。図示のように、対象画像内の1つのROIの動きは別のROIの動きとは無関係であるかもしれず、このことは、移動する被写体を含む場面について特に当てはまる。
このように、例示的な一実施において、インテグラル画像情報は、階層内の最上層についてサブサンプリングされ、このように、オリジナルのインテグラル画像の解像度と比較して4倍ダウンスケーリングされる。水平方向のインテグラル画像のプロファイルを計算するためには、インテグラル画像の最下ラインから4ピクセル毎にサンプリングされる。連続したサンプル間の差を計算することにより、インテグラル画像プロファイルの値が取得される。オリジナルの640×480のフレームサイズについて、ピラミッドの最上レベルは画像毎に160個の値を必要とするであろうと考えられる。
ピラミッドのすぐ下のレベルからのブロックは、必要なプロファイルを計算するために、インテグラル画像からピクセルの2ライン毎にサンプリングする必要がある。例えば、オリジナルの画像の解像度の50%でインテグラル画像の左下の4分の1区画からのプロファイルを計算するためには、図7に示すように、L0及びL1の2つのラインから2つ毎のピクセルがインテグラル画像から読み出される。このように、640×480の画像について、ROI当たり最大320ピクセルまでのインテグラル画像情報が必要であるが、これでも従来の方法が必要とする帯域幅の60分の1で済む。
既述のように、垂直方向の変位の判定についても類似の方法ですべての計算が実行される。
プロファイルを構築するためのこの方法は、対象画像内の画像ブロックの任意の位置について可能であり、一切の追加的な処理を必要とせずにオリジナルの画像の任意の整数のダウンスケーリング係数に直接対応する。
図2を再度参照すると、この方法が階層の最下位レベルについて処理(この場合は、3度目の繰り返しにおいて対象フレーム及び基準フレームに関するインテグラル画像の各ピクセルがサンプリングされる)を完了した後に、ステップ40でサブピクセル単位の変位を判定することもまた可能である。
サブピクセル単位の精度でプロファイルを位置合わせすることにより、例えば、低解像度の画像情報(例えば、VGA)で高解像度(例えば、フルHD)の画像内での精密な動きを判定することができる。
サブピクセル単位のシフトを求めるためには、オリジナルのサンプリング間隔間のピクセルの値を判定するために、対象領域のインテグラル画像のプロファイルのうちの1つが補間される。一実施において、三次スプライン補間法が採用される。図9は、実線プロファイルを提供するために補間された第1のプロファイルからのオリジナルのサンプル(円)を示している。0.5ピクセル分シフトした第2のプロファイルからのサンプルがX印として示されている。変位(誤差)が、X印によって表示された値とこれらに対応する位置で取られた青色線の値との間の平均絶対誤差(MAE)として計算される。計算時間を節約するために、青色線からのすべての値が計算されるわけではない。2つのプロファイル間の誤差を評価しなければならない位置でのみ関数が評価される。
MAEが極小値を有するサブピクセル単位のシフトを求めるために、二等分探索が採用される。図10は、プロファイル間の変位によって誤差がどのように変化するかを示している。0でマーキングされた点が、最大1ピクセルまでに位置合わせされたプロファイルの初期の位置である。探索範囲の±0.5である初期ステップで探索が開始される。これらの位置で評価された誤差の値が比較され、現在位置がより小さな誤差の位置に移動される。
必要な正確度を規定する一定の繰り返し回数、動作が繰り返される。ピクセルの正確度1/256を達成するためには、8回の繰り返しが使用される。図11には探索の最後のステップが示されており、これによりプロファイル間の変位が0.7ピクセルと0.71ピクセルとの間の大きさであると判定される。
上記に説明したように、画像階層の上位レベルについて判定された動きが下位レベルのROIに関する初期推測として使用される。しかし、このことは、誤った初期設定及び回復不能な推定誤差を招く可能性があり、小さな探索半径が採用される場合、即ち、設定された最大許容変位がこのような誤差を受容するには小さすぎる場合には殊更である。このような問題が発生する典型的なケースは、カメラの視野内に高速で動く大きな被写体が存在する場合である。被写体が映像フレームの半分未満を占める場合、プロファイルの相関の極小値が場面の背景の動きを示す。このような、撮像された場面内で被写体が背景とは異なる方向に移動している状況を図12に示す。
この状況では、階層内の最上位レベルに関する動きの単一の変位の大きさは、背景の動きのみを反映するであろうと考えられる。この動きは、ROI1〜4として示された領域を包含するピラミッドの次のレベルに関する初期推測として設定されるであろうと考えられる。これによりROI1及び3について妥当な初期設定が提供されるであろうと考えられる一方で、背景の変位を使用することによりROI2及び4については誤った初期設定がもたらされるであろうと考えられる。更には、この誤差は階層内のより下位のすべてのレベルの、ROI2及び4から派生するすべての領域にもまた波及するであろうと考えられる。
図13は、図12の画像の階層の最上位レベルに関するインテグラル画像のプロファイルに関するMAE関数を図示している。上記のサブピクセル解像度の例に示すように、この関数は、プロファイルのうちの1つをその他のプロファイルに対してシフトさせ、プロファイルの変位した要素間の平均絶対誤差を計算することにより計算される。図10及び11の例とは異なり、この場合は、関数は極小値に加えて大域的最小値を包含している。大域的最小値は最も支配的な動きを反映するが、極小値は、この場合は被写体の動きを反映している。
極小値の位置の分だけシフトされたプロファイルの絶対差を計算することにより、移動する被写体の位置が示される。これにより、プロファイルのどの部分が場面のどの被写体に属するかが示される。これにより、図2のステップ32のような単一のプロファイル相関から複数の動きの値を返すことが可能となり、その結果、階層内のより下位のレベルにあるブロックの初期設定をより正確にすることができる。
図12の例について再度考察すると、今度は、ピラミッドの最上位レベルのプロファイルの右側部分内の動きが左側部分とは異なる動きを反映していることが分かる。このように、図6に図示した、4つのROIの各々に同一の初期変位値が提供されている例とは異なり、ROI2及び4は今度はより適切な変位値で初期設定することができる。
この手法は非インテグラル画像に基づく用途にもまた適用可能であることが理解されるであろう。
同様に、移動する被写体の範囲を知ることにより、階層内のあるレベルからそのすぐ下のレベルへの対象領域の不均一な分割が可能となる。
図17を参照すると、被写体(O)が領域の中心に向かって背景(B)に対して移動している対象領域(ROI)が図示されている。図18は、このような対象領域内の水平方向の変位を判定した典型的な2つのインテグラルプロファイルを示している。
図19は、水平変位対プロファイルに沿った誤差値を図示した二次元マップである。水平次元がプロファイルの長さであり、垂直次元が変位量である。黒色の左上及び右下の隅はプロファイルの非重畳部に起因しており、考慮する必要はない。特定の変位に関して形成された最小誤差(L)の線があることが観察でき、この線は、形状制約を伴う線形若しくは二次計画法のような何らかの制約を受けた最適化手法か、又はスネーク法若しくはレベルセット法のような動的輪郭法によって求めることができる。
線Lの垂直位置が変位を示す。この線がほぼ水平である箇所は移動する被写体又は背景を表しており、線の傾斜している区画は不確定なエリアを表している。この例では、図17中の対象領域の細分化点H1、H2を求めるためにこの2つの傾斜している区画が使用される。ここでも、図17中の細分化点V1を提供するために、垂直方向の動き及び細分化が同様にして求められる。このように、この場合では、階層内のより下位のレベルの対象領域が3つの水平領域及び2つの垂直領域に分割される。
この手法は非インテグラル画像に基づく用途にもまた適用可能であることが理解されるであろう。
上述した実施形態の多くの変型が可能である。例えば、今日のモバイル機器のほとんどは、加速度計及び/又はジャイロスコープなどの動きセンサを備えており、これらを使用してフレーム間でのカメラの変位を検出することができる。これらの機器の正確度には限界があるので、一般的には、サブピクセル単位の精度での動きの測定はできない。
しかし、内蔵の動きセンサは、探索のための初期推測を提供することで階層内のすべてのレベルでの動きを計算する必要を回避することにより、図2の実施形態に採用されている画像階層に必要なレベルの数を減少させるための、又はまさに階層内の任意のレベルにおける背景のカメラモーションの初期推定を提供するための良い方法を提供することができる。
したがって、カメラの幾何学的配置を知り、かつカメラの動きセンサからの測定値を有していれば、所与の正確度までのセンサ平面内の動きを計算することが可能である。したがって、例えば、図2に図示した実施形態から最上位レベルの変位量の計算を省略することができ、かつ、センサの測定値から計算される動きを、例えば図6に示した、第2のレベル(及び場合によっては後続のレベル)の初期推測として使用することができる。このことは、移動する被写体であるにもかかわらず全体的な動きを保証するか、又は確認する上で役に立つ。このことは、実際のカメラモーションの大きさを提供することによりカメラフレーム内で動いている被写体の影響を除外する上で役立つので、映像の安定化のために特に有用である。
反対に、図2に図示した手法を動きセンサの情報と組み合わせるという考えは、動きセンサを単独で使用した場合にはできない、動きの大きさのサブピクセル単位の正確度を提供する。
動きセンサを補足するために必要な階層のレベルの数は、画像の大きさ及びセンサの正確度に依存する。例えば、センサが+/−3ピクセルの正確度を提供できる場合、各レベルで+/−2ピクセルの探索半径を有する少なくとも2つの階層レベルが必要となる。
この手法は非インテグラル画像に基づく用途にもまた適用可能であることが理解されるであろう。
図2のステップ40では、HREモジュール18によって図14に図示したような(各々が潜在的にサブピクセル単位の正確度で局部的な水平変位及び垂直変位を示す)局部的な動きベクトルを含む変位マトリックスが提供され、これらをメモリ26に書き込むことができる。
しかし、2つの連続した映像フレーム間の変位を示す局部的な動きベクトルのマトリックスを有することは、信頼性の高い映像安定性を提供するために十分ではないかもしれない。GDE22のようなモジュールがこのような安定性を提供するためには、通常、任意の2つのフレーム間の幾何学的変換が判定されるであろうと考えられる。これは、例えば、マトリックス、四元数、又はSRT変換などの任意の形態で表すことができる。これも既述のように、このような変換の使用の詳細は、WO2014/005783号(参照:FN−384)に見ることができる。
図14に示すような動きベクトルのマトリックスから幾何学的変換を得るためには、最小二乗法又はそれと等価の手法を使用することができる。変位マトリックスがガウス分布に従う比較的小さな測定誤差を包含しているのであれば、この手法で十分であろう。ただ生憎、このような例はまずあり得ない。動きベクトルはいろいろな形で無効となり得る。例えば、これらは、カメラモーションではなく移動する被写体の局部的な動きを包含している場合もあり、又は撮像されている場面の詳細の不足、若しくは相関処理と干渉する反復パターンの故に誤りを含んでいる可能性がある。したがって、場面内のROIについて判定される生の変位マトリクス情報をそのまま使用して幾何学的変換を提供すると、好ましくない結果を招きやすいであろうと考えられる。
ベクトル集合から異常値を排除して最も蓋然性の高い一貫性のある動きを形成するベクトルのみを残す、Vision Research Lab社のRANSACなどの方法を使用することが可能である。このようなベクトルが選択された後、最小二乗法又はその等価物を使用して残りのベクトルから最終的な幾何学的変換を推定することができる。しかし、RANSACのような方法は計算集約的であり、モバイル機器のプロセッサにかなりの負荷をかける可能性がある。RANSACのその他の欠点は以下のとおりである。
・不明数及び変動数の反復を繰り返すので、プロセッサの負荷が高く、かつ予測不能となる可能性がある。
・確率的なので、同一のベクトル集合について、連続して2回実行したときにわずかに異なる結果を出す可能性がある。
本発明の実施形態は、下記に説明するように、予測可能な実行時間で、かつ再現可能な結果を提供することにより、マトリックス推定の計算複雑性を数桁の単位で低減する。
図15を参照すると、図14からの動きベクトルの値は、ステップ150で、まず整数値に量子化される。量子化のレベルは、所望の正確度及びフレーム内での予期される動きの範囲に依存する。最も簡易な場合では、量子化は整数値に四捨五入することができるが、その他の量子化ビンを使用することもできる。
ステップ152で、コンパラグラム(comparagram)が構築される。これは、各次元がそれぞれ水平方向及び垂直方向の量子化された動きを表す二次元ヒストグラムであり、コンパラグラムビンの値は、水平及び垂直の両方向の量子化された動きの値が同じであるベクトルの度数を示す。
ステップ154で、コンパラグラム内の最大ビン値が求められる。ステップ156で、最大値の位置が、隣接したビンの値のシードの値に対する類似性に基づいてこれら隣接ビンを接続して領域を拡大させるためのシードとなる。
ステップ158で、変位マトリックス内のマーキングされたビンに分類されるすべての動きベクトルが、動き推定のために選択される。ステップ160で、標準最小二乗法を使用して最終的な動き推定を実行することができる。図14のマトリックスに関して選択的に抽出されたベクトルをマスキングするステップを図15に示す。これは、より合理化された決定論的な処理リソースを採用しているにもかかわらず、例えばRANSACが提供する結果よりも好ましい。
上記に開示した実施形態の更なる変型が可能であることが理解されるであろう。
例えば、図8を参照すると、基準画像について、インテグラル画像の値は、画像内の対象領域の境界からのみ必要であることが分かるであろう。したがって、本発明のいくつかの実施形態において、1つおきの取得画像について縮小インテグラル画像(RII)がメモリに記憶される。必要なインテグラル画像プロファイルは図8のRHSに図示した境界と一致するサンプルから構築できることが分かっているので、このような画像の各々が基準画像として使用される。一方、対象領域に使用される境界は、図8のLHSについて見て取ることができるように、階層内のより高位のレベルについて計算される変位に基づいて変化するので、1つおきの対象画像について完全なIIが記憶される。
勿論、顔検出装置(図示せず)などその他の処理モジュールによって完全なインテグラル画像を使用することもでき、WO2008/018887号(参照:FN−143)に開示されているように、このような検出装置はすべてのフレームについてインテグラル画像を常に必要とするわけではない。したがって、RIIを採用している本発明の実施形態は、既に顔検出を実行しているかもしれない機器に必ずしもより大きな処理の負担を強いるわけではない。
いずれにせよ、RIIを使用しているとき、生成器16はメモリ24に、完全なインテグラル画像(フレームN)及び縮小II(フレームN+1)を、次にII(フレームN+2)及びRII(フレームN+3)を交互に書き込む。
HREモジュール18はメモリ24からのII(N)及びRII(N+1)を使用してフレームN+1の変位マップを生成し、次にメモリ24からのRII(N+1)及びII(N+2)を使用してフレームN+2の変位マップを生成する。
既述のように、図示した実施形態はレベルを経る毎に領域を2分割するものの、実施形態の変型では、2分割以外の細分化並びに不均一な細分化を使用することができることが理解されるであろう。
任意のスケーリング係数を可能とするためにはインテグラル画像からの補間値を読み出す必要があるであろうと考えられ、これにより複雑性が増し、帯域幅の利得が低下するであろうと考えられるが、にもかかわらず、このような実施は標準的な手法よりも良好に機能するであろうと考えられることが注目される。

Claims (24)

  1. 所与の場面の一対の画像フレーム間での動きを推定する方法であって、
    a)前記画像フレームの各々についてそれぞれのインテグラル画像を計算するステップと、
    b)各フレーム内で少なくとも1つの対応する対象領域を選択するステップと、
    c)各対象領域について、
    i.各インテグラル画像からのインテグラル画像プロファイルを計算するステップであって、各プロファイルは要素の配列を含み、各要素は前記フレームに関する前記対象領域の連続したスワスからのピクセル輝度の合計を含むものである、ステップと、
    ii.前記インテグラル画像プロファイルを相関付けて前記一対のフレーム間の前記対象領域の相対変位を判定する相関付けステップと、
    iii.各対象領域を複数の更なる対象領域に分割する分割ステップと、
    引き続いて分割された対象領域に関して、推定された動きの要求された階層が提供されるまでステップc)を繰り返すステップと、
    を含む、方法。
  2. ステップb)が、対象領域として完全な画像フレームを初期に選択するステップを含む、請求項1に記載の方法。
  3. インテグラル画像プロファイルを計算する前記ステップが、前記階層の第1の選択されたレベルにおいて前記インテグラル画像を第1のサブサンプリング間隔でサブサンプリングするステップと、ステップc)の各繰り返しについて、前記インテグラル画像を引き続いてより小さなサブサンプリング間隔でサブサンプリングするステップと、を含む、請求項1に記載の方法。
  4. 前記分割ステップが、各領域を水平方向及び垂直方向に整数の個数の対象領域に分割するステップを含む、請求項1に記載の方法。
  5. 前記画像フレームのうちの第1の画像フレームを基準フレームとして、及び前記画像フレームのうちの第2の画像フレームを対象フレームとして指定するステップを含み、
    前記方法は、前記階層のあるレベルにおける前記対象フレームの前記分割された領域を、前記階層内のより高位のレベルにおける前記分割された対象領域に対応する対象領域について判定された相対変位に従って変位させるステップを更に含む、請求項1に記載の方法。
  6. 前記階層内の最下位レベルにおいて前記インテグラル画像の各ピクセルをサンプリングするステップを含む、請求項3に記載の方法。
  7. 前記階層内の最下位レベルにおける前記画像フレームの各々について前記インテグラル画像プロファイルを補間して、前記階層の前記最下位レベルにおける対象領域についてサブピクセル単位の変位の大きさを提供するステップを更に含む、請求項6に記載の方法。
  8. 前記変位させるステップは、前記相関付けステップが前記対象領域内の複数の変位を判定することに応じて、前記対象画像内の前記分割された対象領域を前記複数の変位に従って異なるように変位させる、請求項5に記載の方法。
  9. 前記分割ステップは、前記相関付けステップが前記対象領域内の複数の変位を判定することに応じて、前記対象領域の不均一分割を決定して、前記不均一分割に従って前記対象領域を異なるように分割する、請求項5に記載の方法。
  10. 対象フレームについてフルサイズのインテグラル画像を計算するステップ、及び、基準フレームについて縮小サイズのインテグラル画像を計算するステップを含み、
    前記縮小サイズのインテグラル画像は、前記階層内の対象領域の境界に対応する前記画像フレームのピクセルに関するインテグラル画像データのみを含む、請求項5に記載の方法。
  11. 前記基準フレームが前記対象フレームに対して交互に先行し後続するように、一連の画像フレームから前記基準フレーム及び対象フレームを選択するステップを含む、請求項10に記載の方法。
  12. カメラの動きセンサから前記一対の画像フレーム間でのカメラの動きの大きさを受信するステップを更に含み、
    前記選択するステップは、前記画像内の複数の領域を選択するステップを含み、前記対象フレーム内の少なくとも1つの対象領域が前記カメラの動きの大きさに従って変位する、請求項5に記載の方法。
  13. 前記階層内の最下位レベルにおける対象領域について判定される動きベクトルの配列に基づいて前記一対のフレームの相対的な動きを示す幾何学的変換を生成するステップを含む、請求項1に記載の方法。
  14. 前記生成するステップの前に前記動きベクトルをフィルタリングして動きベクトルの異常値を除去するステップを含む、請求項13に記載の方法。
  15. ステップc)の各繰り返しについて、前記サブサンプリングの間隔が半分にされる、請求項3に記載の方法。
  16. 前記整数が2である、請求項4に記載の方法。
  17. 前記変位が垂直変位及び水平変位の一方又は両方を含む、請求項1に記載の方法。
  18. 所与の場面の一対の画像フレーム間での動きを推定する方法であって、
    a)各フレーム内で少なくとも1つの対応する対象領域を選択するステップと、
    b)各対象領域について、
    i.前記対象領域に関する画像情報を相関付けて前記一対のフレーム間の前記対象領域の相対変位を判定する相関付けステップと、
    ii.各対象領域を複数の更なる対象領域に分割する分割ステップであって、前記分割ステップは、前記相関付けステップが前記対象領域内の複数の変位を判定することに応じて、前記対象領域の不均一分割を決定して、前記不均一分割に従って前記対象領域を異なるように分割する、前記分割ステップと、
    引き続いて分割された対象領域に関して、推定された動きの要求された階層が提供されるまでステップb)を繰り返すステップと、
    を含む、方法。
  19. 所与の場面の一対の画像フレーム間での動きを推定する方法であって、
    a)前記画像フレームのうちの第1の画像フレームを基準フレームとして、及び前記画像フレームのうちの第2の画像フレームを対象フレームとして指定するステップと、
    b)各フレーム内で少なくとも1つの対応する対象領域を選択するステップと、
    c)各対象領域について、
    i.前記対象領域に関する画像情報を相関付けて前記一対のフレーム間の前記対象領域の相対変位を判定する相関付けステップと、
    ii.各対象領域を複数の更なる対象領域に分割する分割ステップと、
    iii.前記階層のあるレベルにおける前記対象フレームの前記分割された領域を、前記階層内のより高位のレベルにおける前記分割された対象領域に対応する対象領域について判定された相対変位に従って変位させるステップであって、前記変位させるステップは、前記相関付けステップが前記対象領域内の複数の変位を判定することに応じて、前記対象画像内の前記分割された対象領域を前記複数の変位に従って異なるように変位させる、ステップと、
    引き続いて分割された対象領域に関して、推定された動きの要求された階層が提供されるまでステップc)を繰り返すステップと、
    を含む、方法。
  20. 前記分割ステップは、前記相関付けステップが前記対象領域内の複数の変位を判定することに応じて、前記対象領域の不均一分割を判定して、前記不均一分割に従って前記対象領域を異なるように分割する、請求項19に記載の方法。
  21. 所与の場面の一対の画像フレーム間での動きを推定する方法であって、
    a)カメラの動きセンサから前記一対の画像フレーム間のカメラの動きの大きさを受信するステップと、
    b)前記画像フレームのうちの第1の画像フレームを基準フレームとして、及び前記画像フレームのうちの第2の画像フレームを対象フレームとして指定するステップと、
    c)各フレーム内で複数の対象領域を選択するステップと、
    d)前記対象フレーム内の前記対象領域のうちの少なくとも1つを前記カメラの動きの大きさに従って変位させるステップと、
    e)各対象領域について、
    i.前記対象領域に関する画像情報を相関付けて前記一対のフレーム間の前記対象領域の相対変位を判定する相関付けステップと、
    ii.前記対象領域を複数の更なる対象領域に分割する分割ステップと、
    引き続いて分割された対象領域について、推定された動きの要求された階層が提供されるまでステップe)を繰り返すステップと、
    を含む、方法。
  22. ある場面の一連の画像フレームを取得し、請求項1〜21のいずれかの方法に従って、前記場面の一対の画像フレーム間での動きを推定するように構成された画像処理装置。
  23. デジタルカメラ、ビデオカメラ、カメラフォン、又はカメラを使用可能なタブレット機器のうちのいずれか1つを備えた、請求項22に記載の画像処理装置。
  24. 画像処理装置に請求項1〜21のいずれか一項のステップを実行させるように構成された、コンピュータ可読媒体上に記憶されたコンピュータ可読命令を備えたコンピュータプログラム製品。
JP2016503618A 2013-03-18 2014-03-14 動き推定の方法及び装置 Active JP6022734B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361803115P 2013-03-18 2013-03-18
US61/803,115 2013-03-18
PCT/EP2014/055125 WO2014146983A2 (en) 2013-03-18 2014-03-14 A method and apparatus for motion estimation

Publications (2)

Publication Number Publication Date
JP2016514867A true JP2016514867A (ja) 2016-05-23
JP6022734B2 JP6022734B2 (ja) 2016-11-09

Family

ID=50289660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016503618A Active JP6022734B2 (ja) 2013-03-18 2014-03-14 動き推定の方法及び装置

Country Status (6)

Country Link
US (2) US10229504B2 (ja)
EP (2) EP2983136B1 (ja)
JP (1) JP6022734B2 (ja)
KR (1) KR101613176B1 (ja)
CN (2) CN107248168A (ja)
WO (1) WO2014146983A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019184587A (ja) * 2018-03-30 2019-10-24 キヤノン株式会社 視差算出装置、視差算出方法及び視差算出装置の制御プログラム
JP2020533719A (ja) * 2017-09-12 2020-11-19 ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツングRobert Bosch Gmbh 画像の評価のための方法および装置、運転支援方法、ならびに運転装置
KR20220078832A (ko) * 2020-12-04 2022-06-13 포항공과대학교 산학협력단 신경망 모델 기반 비디오의 움직임 특징 정보 추출 방법 및 분석장치

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8498695B2 (en) 2006-12-22 2013-07-30 Novadaq Technologies Inc. Imaging system with a single color image sensor for simultaneous fluorescence and color video endoscopy
WO2016083002A1 (en) 2014-11-28 2016-06-02 Fotonation Limited A method for producing a histogram of oriented gradients
EP3573020B1 (en) 2015-04-30 2020-11-11 FotoNation Limited A method and apparatus for producing a video stream
WO2017054941A1 (en) 2015-09-30 2017-04-06 Fotonation Limited A method and system for tracking an object
KR102407624B1 (ko) * 2015-10-06 2022-06-10 삼성전자주식회사 전자 장치의 영상 처리 방법 및 그 전자 장치
JP6743137B2 (ja) 2015-11-13 2020-08-19 ノバダック テクノロジーズ ユーエルシー ターゲットの照明およびイメージングのためのシステムおよび方法
US11477382B2 (en) * 2016-02-19 2022-10-18 Fotonation Limited Method of stabilizing a sequence of images
CN108702450B (zh) 2016-02-19 2020-10-27 快图有限公司 用于图像捕获设备的相机模块
US10869645B2 (en) * 2016-06-14 2020-12-22 Stryker European Operations Limited Methods and systems for adaptive imaging for low light signal enhancement in medical visualization
US10334152B2 (en) 2016-08-08 2019-06-25 Fotonation Limited Image acquisition device and method for determining a focus position based on sharpness
US10148943B2 (en) 2016-08-08 2018-12-04 Fotonation Limited Image acquisition device and method based on a sharpness measure and an image acquistion parameter
US10097757B1 (en) 2017-03-24 2018-10-09 Fotonation Limited Method for determining bias in an inertial measurement unit of an image acquisition device
CN107071421B (zh) * 2017-05-23 2019-11-22 北京理工大学 一种结合视频稳定的视频编码方法
FR3069688A1 (fr) * 2017-07-25 2019-02-01 Parrot Drones Dispositif electronique et procede d'estimation d'un deplacement d'une scene observee par un drone, appareil electronique de calcul d'une vitesse sol du drone, drone et programme d'ordinateur associes
CN107707913B (zh) * 2017-09-29 2019-12-17 福州大学 快速视频编码中防帧内误差传递方法
US10360662B2 (en) 2017-10-16 2019-07-23 Omnivision Technologies, Inc. Alignment of multiple camera images by matching projected one dimensional image profiles
US10499867B2 (en) 2018-01-08 2019-12-10 Shenzhen Keya Medical Technology Corporation Method, storage medium, and system for analyzing image sequences of periodic physiological activities
US11786202B2 (en) 2018-01-08 2023-10-17 Shenzhen Keya Medical Technology Corporation Method, system, and medium for analyzing image sequence of periodic physiological activity
US10726522B2 (en) 2018-01-24 2020-07-28 Fotonation Limited Method and system for correcting a distorted input image
US11037316B2 (en) * 2018-03-30 2021-06-15 Canon Kabushiki Kaisha Parallax calculation apparatus, parallax calculation method, and control program of parallax calculation apparatus
US11151731B2 (en) 2019-08-06 2021-10-19 Samsung Electronics Co., Ltd. Apparatus and method for efficient regularized image alignment for multi-frame fusion
CN114503541A (zh) * 2019-08-06 2022-05-13 三星电子株式会社 用于多帧融合的有效率的正则化图像对准的装置和方法
US10983363B2 (en) 2019-09-19 2021-04-20 Fotonation Limited Method for stabilizing a camera frame of a video sequence
EP3985957B1 (en) * 2020-10-14 2022-11-30 Axis AB Method and system for motion segmentation
US11425412B1 (en) * 2020-11-10 2022-08-23 Amazon Technologies, Inc. Motion cues for video encoding
US11610338B2 (en) 2021-03-26 2023-03-21 Fotonation Limited Method of controlling a camera
CN113536570B (zh) * 2021-07-16 2022-09-27 中国石油大学(北京) 一种应力参数计算方法、装置、系统及计算机设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002518897A (ja) * 1998-06-09 2002-06-25 ソニー エレクトロニクス インク ブロック整合法及び統合投射法を用いた階層的動き評価処理及び装置
WO2012066866A1 (ja) * 2010-11-17 2012-05-24 三菱電機株式会社 動きベクトル検出装置、動きベクトル検出方法、フレーム補間装置及びフレーム補間方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6459822B1 (en) 1998-08-26 2002-10-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Video image stabilization and registration
US6809758B1 (en) 1999-12-29 2004-10-26 Eastman Kodak Company Automated stabilization method for digital image sequences
KR20020018566A (ko) * 2000-09-01 2002-03-08 액티브 올가닉스 인코포레이티드 모노-아실-(리소)-글리세롤인지질로 국소 활성의 효능을강화하는 방법 및 이의 용도
US9160897B2 (en) 2007-06-14 2015-10-13 Fotonation Limited Fast motion estimation method
US7616836B2 (en) * 2004-05-25 2009-11-10 Siemens Medical Solutions Usa, Inc. Method and system for motion compensation in a temporal sequence of images
US7440008B2 (en) * 2004-06-15 2008-10-21 Corel Tw Corp. Video stabilization method
US7315631B1 (en) 2006-08-11 2008-01-01 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US20070237514A1 (en) * 2006-04-06 2007-10-11 Eastman Kodak Company Varying camera self-determination based on subject motion
US8059915B2 (en) * 2006-11-20 2011-11-15 Videosurf, Inc. Apparatus for and method of robust motion estimation using line averages
US8098889B2 (en) * 2007-01-18 2012-01-17 Siemens Corporation System and method for vehicle detection and tracking
KR101354899B1 (ko) * 2007-08-29 2014-01-27 삼성전자주식회사 파노라마 사진 촬영 방법
KR101522985B1 (ko) * 2008-10-31 2015-05-27 삼성전자주식회사 영상처리 장치 및 방법
US10080006B2 (en) * 2009-12-11 2018-09-18 Fotonation Limited Stereoscopic (3D) panorama creation on handheld device
EP2545411B1 (en) 2009-12-11 2014-02-12 DigitalOptics Corporation Europe Limited Panorama imaging
CN101951464A (zh) * 2010-05-19 2011-01-19 上海稳像信息技术有限公司 基于积分图特征块匹配的实时视频稳像方法
JP2013020527A (ja) * 2011-07-13 2013-01-31 Sony Corp 画像処理装置および方法、並びにプログラム
GB201116566D0 (en) * 2011-09-26 2011-11-09 Skype Ltd Video stabilisation
CN102957869B (zh) * 2011-09-26 2016-08-17 斯凯普公司 视频稳定
US8200020B1 (en) 2011-11-28 2012-06-12 Google Inc. Robust image alignment using block sums
US8928730B2 (en) 2012-07-03 2015-01-06 DigitalOptics Corporation Europe Limited Method and system for correcting a distorted input image
CN102801982B (zh) * 2012-09-07 2015-03-18 浙江外国语学院 一种应用于视频压缩且基于块积分的快速运动估计方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002518897A (ja) * 1998-06-09 2002-06-25 ソニー エレクトロニクス インク ブロック整合法及び統合投射法を用いた階層的動き評価処理及び装置
WO2012066866A1 (ja) * 2010-11-17 2012-05-24 三菱電機株式会社 動きベクトル検出装置、動きベクトル検出方法、フレーム補間装置及びフレーム補間方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6016011790; NGUYEN, Viet Anh, TAN, Yap-Peng: 'Fast Block-Based Motion Estimation Using Integral Frames' IEEE SIGNAL PROCESSING LETTERS VOL.11, NO.9, 200409, 第744頁-第747頁, IEEE *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020533719A (ja) * 2017-09-12 2020-11-19 ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツングRobert Bosch Gmbh 画像の評価のための方法および装置、運転支援方法、ならびに運転装置
JP7117383B2 (ja) 2017-09-12 2022-08-12 ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング 画像の評価のための方法および装置、運転支援方法、ならびに運転装置
US11443521B2 (en) 2017-09-12 2022-09-13 Robert Bosch Gmbh Method and device for evaluating images, operational assistance method and operating device
JP2019184587A (ja) * 2018-03-30 2019-10-24 キヤノン株式会社 視差算出装置、視差算出方法及び視差算出装置の制御プログラム
JP7344660B2 (ja) 2018-03-30 2023-09-14 キヤノン株式会社 視差算出装置、視差算出方法及び視差算出装置の制御プログラム
KR20220078832A (ko) * 2020-12-04 2022-06-13 포항공과대학교 산학협력단 신경망 모델 기반 비디오의 움직임 특징 정보 추출 방법 및 분석장치
KR102524823B1 (ko) 2020-12-04 2023-04-21 포항공과대학교 산학협력단 신경망 모델 기반 비디오의 움직임 특징 정보 추출 방법 및 분석장치

Also Published As

Publication number Publication date
EP2983136B1 (en) 2017-11-22
US20160035104A1 (en) 2016-02-04
US10229504B2 (en) 2019-03-12
KR101613176B1 (ko) 2016-04-29
EP2983136A2 (en) 2016-02-10
EP2826022B1 (en) 2015-10-21
CN105051785A (zh) 2015-11-11
EP2983136A3 (en) 2016-07-13
WO2014146983A2 (en) 2014-09-25
EP2826022A2 (en) 2015-01-21
US20190273867A1 (en) 2019-09-05
CN105051785B (zh) 2017-07-04
KR20150119395A (ko) 2015-10-23
WO2014146983A3 (en) 2014-11-13
US10587806B2 (en) 2020-03-10
JP6022734B2 (ja) 2016-11-09
CN107248168A (zh) 2017-10-13

Similar Documents

Publication Publication Date Title
US10587806B2 (en) Method and apparatus for motion estimation
US9681150B2 (en) Optical flow determination using pyramidal block matching
US8036494B2 (en) Enhancing image resolution
US8098963B2 (en) Resolution conversion apparatus, method and program
US10621446B2 (en) Handling perspective magnification in optical flow processing
US8098962B2 (en) Signal processing method, apparatus, and program
US10818018B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
Huang et al. Efficient random saliency map detection
KR20150027291A (ko) 광류 추적 방법 및 장치
US8385732B2 (en) Image stabilization
EP2400461A1 (en) Image processing system, image processing method, and image processing program
CN114926514B (zh) 一种事件图像与rgb图像的配准方法及装置
JP2016164709A (ja) 画像処理装置、撮像装置および画像処理プログラム
CN112784828B (zh) 基于方向梯度直方图的图像检测方法、装置、计算机设备
CN115797194A (zh) 图像降噪方法、装置、电子设备、存储介质和程序产品
JP6116271B2 (ja) 特徴量算出装置、方法及びプログラム
JP2018010359A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2002170111A (ja) 画像合成装置、画像合成方法および画像合成プログラムを記録した記録媒体
KR101644411B1 (ko) 고해상도 이미지 복원 장치 및 그 방법
US20230334820A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
Ousguine et al. A new image interpolation using laplacian operator
JP4767313B2 (ja) 画像処理装置、方法およびプログラム
US8867843B2 (en) Method of image denoising and method of generating motion vector data structure thereof
CN116156075A (zh) 视频中目标相对运动预测方法、装置和计算机设备
Shruthi et al. VLSI Implementation of Edge-Oriented Image Scaling Architecture

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161005

R150 Certificate of patent or registration of utility model

Ref document number: 6022734

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250