JP4651385B2 - 非線形の複数の動きモデル及び移動境界を抽出する方法及び装置 - Google Patents
非線形の複数の動きモデル及び移動境界を抽出する方法及び装置 Download PDFInfo
- Publication number
- JP4651385B2 JP4651385B2 JP2004551854A JP2004551854A JP4651385B2 JP 4651385 B2 JP4651385 B2 JP 4651385B2 JP 2004551854 A JP2004551854 A JP 2004551854A JP 2004551854 A JP2004551854 A JP 2004551854A JP 4651385 B2 JP4651385 B2 JP 4651385B2
- Authority
- JP
- Japan
- Prior art keywords
- motion
- frame
- pixels
- boundary
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000033001 locomotion Effects 0.000 title claims description 255
- 238000000034 method Methods 0.000 title description 25
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 13
- 238000003672 processing method Methods 0.000 claims 9
- 230000006870 function Effects 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/207—Analysis of motion for motion estimation over a hierarchy of resolutions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/215—Motion-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/223—Analysis of motion using block-matching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/521—Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
- H04N19/543—Motion estimation other than block-based using regions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/553—Motion estimation dealing with occlusions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/12—Systems in which the television signal is transmitted via one channel or a plurality of parallel channels, the bandwidth of each channel being less than the bandwidth of the television signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Description
本発明の実施形態をより迅速かつ完全に理解できるようにするために、標準的な動きモデルの概要を説明する。動き推定においてよく用いられている標準的な動きモデルは、アフィン近似射影モデル(affine model)であり、以下の式で表される。
本発明の実施形態は、移動物体の境界の複数の動き及び推定を説明するモデルを含んでいる。過去及び未来の動き推定が使用される。これは、時間変数t’(t’=−1:過去のフレームに基づく動き推定、t’=0:未来のフレームに基づく動き推定)を使用することを含んでいる。2つの動きについてのモデル(より一般的に事例については後述する)は、以下の式によって表される。
最初に、上述した最後の2つの式を検討する。これらの式は、2つの動きをモデル化したものであり、1つは6パラメータのアフィン動き(affine motion)であり、もう1つは6パラメータのアフィン動きである。
混合状態は、領域1の重さ(1+t’)及び領域2の重さ−t’として定義することができ、ここで、t’∈(−1,0)である(時間が動き領域/領域を参照する)。本発明の一実施形態においては、w自体は、モデル中で動的に変化することができる。そして、システムは、境界の幅/粗さを特徴付ける値wを当然のことながら選択し、境界レイヤ内のどの画素が2つの領域の混合であるのかを判定する。
細い境界を有する2つの(純)領域を手際よく抽出するための本発明の一実施形態においては、動きパラメータの推定段階中は、wは固定されており、小さい。例えば、幅パラメータはw=1/3に固定されており、(図5に示すような)連続的に細くなるインタフェース幅を使用して、再推定が行われる。境界の推定値を制御及びリファインするために、モデルの非線形関数F(s)及びwの縮小が使用される。インタフェース幅が縮小するにつれて、境界から離れた画素がその参照フレームに関して「凍結状態」になる。(s=−0.5により決定される)境界の近傍の画素だけが、その時間変数を変化させ(すなわち、他方の参照フレームに移動し)、したがって、境界を修正することを許容される。
本発明の一実施形態においては、動きモデルパラメータの推定は予測誤差の最小化から得られる。
各画素について、予測が過去のフレームと未来のフレームとの線形組合せであることに注意されたい。簡単な双一次時間補間を使用することができる。モデルパラメータの推定は、多分解能レイヤ(multiple resolution layers)を使用する最急降下アルゴリズムから得ることができる(後述する)。
(2)未来のフレームに関して初期化された動きパラメータ
(3)セット(1)及び(2)からのパラメータの平均
一実施形態においては、各セットについて、インタフェースパラメータは
g=h=α=β=0;
i=−0.075、−0.5、−0.25
となるように選ばれる。したがって、ほとんどの場合はi=−0.5のセット1又は2で十分であるかもしれないのであるが、合計で9つの初期条件が使用される。下記のシーケンス1〜7については、幅パラメータはw=1/3に固定されたままである。
(オリジナル画像の大幅な縮小から得られた)1/16サイズ画像について、ブロックマッチング(BM)が対応動きブロック内の小さなブロックに対して行われる。初期条件セット1については、BMが過去に関して、セット2については、BMが未来に関して行われる。次に、最小2乗法(LS)を使用して、動ベクトルのセットがモデルパラメータにマッピングされる。これにより、初期条件セット1及び2についてのパラメータの初期セット(a,b,c,d,e,f)が得られる。パラメータ(a’,b’,c’,d’,e’,f’)は0に初期化される。第3初期条件セットについては、セット1及び2からのパラメータの平均が使用される。
レイヤ射影:
動きモデルの幾つかの実施例がここに示してある。第1のセットの実施例においては、動きモデルは、2つの動きを含む領域(80×80ブロック)に適用された。実施例については、オリジナル画像は左側に示され、右側の画像は、2つの領域への複数の動き領域の分割を示している。暗い領域は過去のフレームを参照しており、白い領域は未来のフレームを参照している。図5で検討し、示したように、各実施例において、過去/未来領域への分割が遮蔽効果の最小化と相反しないことに注意されたい。
下記の実施例においては、物体の周囲の大きな領域が80×80ブロックに分割された。この領域は、標準的な種類の動きの分割(アフィン近似射影動きモデル及びk平均クラスタリング)から得られたものであるが、移動物体の領域を識別するラベルと十分に付けられないブロック(大きな予測誤差及び/又は高いひずみ分類を有するブロック)を伴っている。次に、本発明の実施形態の新規な動きモデルが、移動物体の周囲の大きな領域を含む80×80ブロックのセットに適用された。実施例4が図10に示してあり、ここでは、細い黒い線1002は、新規な動きモデルを使用した境界の位置の推定である。
本発明の別の実施形態においては、ビデオ符号化が新規な動きモデルを使用することができる。上述のモデルは、2つの動きを説明する能力を有することから、大きな領域に適用することができる。前に検討した実施例においては、80×80ブロックが使用された。新規な動きモデルは、異なる動き及び境界情報を「コンパクトに」表示するものと見なすことができる。例えば、本発明の一実施形態においては、このモデルは17のパラメータを有し、例えば80×80ブロックにおいて(704×484画像において)使用された場合は、約900の動きパラメータが存在する。これは、動きフィールド及び幾つかの移動境界の位置を抽出するためにデコーダが必要とする全ての情報を含んでいる。これを、非常に簡単な標準16×16ブロックマッチングアルゴリズム(明示的移動境界情報を含まない2つの平行移動パラメータ)が必要とする約2662のパラメータと比較されたい。
上述のように、これまでの検討は、本発明の実施形態を分かりにくくしないように、主として2つの動きを中心としたものであった。本発明の他の実施形態は任意の数の動き(M)を説明することができ、上述の実施例及び実施形態を拡張するために適用することができる。
事例と対応させるために、重み付け関数の正規化、
上述のモデルは前に実現された事例に還元される(式(1)を参照)。2つの参照フレームは、{t1 ref}=−1(過去)及び{t2 ref}=0(未来)である。アフィン動きベクトルの前方の因子は
は1つだけであり、幅変数wも1つである。非線形時間式は
3つの動きについての実施例が図12に示してある。ここでは、画像領域1300内の3つの「動き」は、静止前景である中間領域、及び矢印のように移動する他の2つの領域である。2つの非交差境界は直線で示されている。
Claims (14)
- フレームのビデオシーケンス内で生じる入力フレームの動きブロックに対応する動き予測エラーを受信するステップであって、受信される動き予測エラーが単一の動きモデルに関連している、前記動き予測エラーを受信するステップと、
対応する受信された動き予測エラーが所定の基準を満足する場合に、動きブロックを選択するステップと、
第1の参照フレーム及び第2の参照フレームに関連する前記選択された動きブロックの画素に対して複数の動き予測エラーを算出するステップであって、前記入力フレーム、前記第1の参照フレーム及び前記第2の参照フレームは前記ビデオシーケンスの異なるフレームである、前記複数の動き予測エラーを算出するステップと、
前記選択された動きブロックに対する前記複数の動き予測エラーの各々の値を最小化する画素領域の構成を決定するステップであって、前記構成が同様の第1の動きを有し前記第1の参照フレームに関して予測される第1の領域の画素及び同様の第2の動きを有し前記第2の参照フレームに関して予測される第2の領域の画素を備え、前記第1の参照フレームが過去フレームであり、前記第2の参照フレームが未来フレームである、前記決定するステップと、
前記構成から前記選択された動きブロックに対する複数の動きモデルを導出するステップと、
前記選択された動きブロックに対して前記複数の動きモデルを用いると共に前記入力フレームのその他の動きブロックに対して前記単一の動きモデルを用いて前記入力フレームを符号化するステップと、を備えたコンピュータ処理方法。 - 前記複数の動きモデルを導出するステップは、前記第1及び第2の領域の共通部分であるように前記ビデオシーケンスの移動物体の境界を推定するステップを備えた請求項1に記載のコンピュータ処理方法。
- 前記構成は、さらに、前記第1及び第2の参照フレームの組み合わせから予測される画素の混合領域を含んでおり、
前記境界を推定するステップは、単一の参照フレームから予測される画素の領域内にあるように前記混合領域の画素を変更することを備えた請求項2に記載のコンピュータ処理方法。 - 前記境界を推定するステップは、さらに、
時間変数t’=F(s)=−0.5であり、F(s)が非線形関数であり、sが境界モデルB(x、y)であり、x及びyが画素座標であり、t’=−1が過去のフレームに関して予測される画素に対するものであり、t’=0が未来のフレームに関して予測される画素に対するものであり、t’∈(−1、0)が混合領域における画素に対するものである場合に、混合領域における画素を識別することを備えている請求項3に記載のコンピュータ処理方法。 - 前記複数の動き予測エラーを算出するステップは、
ここで、x及びyは、前記入力フレームの画素の位置を示し、x’及びy’は、参照フレームの対応する画素の位置を示し、t’=−1は過去のフレームに関して予測される画素に対するものであり、t’=0は未来のフレームに関して予測される画素に対するものであり、
過去のフレームに関して予測される画素に対する動きベクトルは、
未来のフレームに関して予測される画素に対する動きベクトルは、
- 前記フレームの画素は、前記過去及び未来のフレームの両方に対して前記動きベクトルを与えることによって予測される請求項7に記載のコンピュータ処理方法。
- 前記参照フレームは、前記ビデオシーケンス内の前記入力フレームに関して過去のフレーム及び未来のフレームからなるグループから選択される請求項1に記載のコンピュータ処理方法。
- フレームのビデオシーケンス内で生じる入力フレームの動きブロックに対応する動き予測エラーを受信する論理であって、受信される動き予測エラーが単一の動きモデルに関連している、前記動き予測エラーを受信する論理と、
対応する受信された動き予測エラーが所定の基準を満足する場合に、動きブロックを選択するための論理と、
第1の参照フレーム及び第2の参照フレームに関連する前記選択された動きブロックの画素に対して複数の動き予測エラーを算出する論理であって、前記入力フレーム、前記第1の参照フレーム及び前記第2の参照フレームは前記ビデオシーケンスの異なるフレームである、前記複数の動き予測エラーを算出する論理と、
前記選択された動きブロックに対する前記複数の動き予測エラーの各々の値を最小化する構成を決定する論理であって、前記構成が同様の第1の動きを有し前記第1の参照フレームに関して予測される第1の領域の画素及び同様の第1の動きを有し前記第2の参照フレームに関して予測される第2の領域の画素を備え、前記第1の参照フレームが過去フレームであり、前記第2の参照フレームが未来フレームである、前記決定する論理と、
前記構成から前記選択された動きブロックに対する複数の動きモデルを導出する論理と、
前記選択された動きブロックに対して前記複数の動きモデルを用いると共に前記入力フレームのその他の動きブロックに対して前記単一の動きモデルを用いて前記入力フレームを符号化する論理と、を備えたシステム。 - 前記複数の動きモデルを導出する論理は、さらに、前記第1及び第2の領域の共通部分であるように前記ビデオシーケンスの移動物体の境界を推定する請求項10に記載のシステム。
- 前記構成は、さらに、
前記第1及び第2の参照フレームの組み合わせから予測される画素の混合領域を含んでおり、
前記複数の動きモデルを導出する論理は、さらに、前記境界を推定するときに単一の参照フレームから予測される画素の領域内にあるように前記混合領域の画素を変更する請求項11に記載のシステム。 - 前記参照フレームは、前記ビデオシーケンス内の前記入力フレームに関して過去のフレーム及び未来のフレームからなるグループから選択される請求項10に記載のシステム。
- 前記複数の動きモデル及び前記単一の動きモデルの両方に応じてビデオシーケンスを復号化する論理をさらに備えている請求項10に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/291,989 US20040091047A1 (en) | 2002-11-11 | 2002-11-11 | Method and apparatus for nonlinear multiple motion model and moving boundary extraction |
PCT/US2003/035512 WO2004044842A2 (en) | 2002-11-11 | 2003-11-06 | Method and apparatus for nonlinear multiple motion model and moving boundary extraction |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006505870A JP2006505870A (ja) | 2006-02-16 |
JP4651385B2 true JP4651385B2 (ja) | 2011-03-16 |
Family
ID=32229341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004551854A Expired - Fee Related JP4651385B2 (ja) | 2002-11-11 | 2003-11-06 | 非線形の複数の動きモデル及び移動境界を抽出する方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (2) | US20040091047A1 (ja) |
EP (1) | EP1561347A4 (ja) |
JP (1) | JP4651385B2 (ja) |
KR (1) | KR101021409B1 (ja) |
CN (2) | CN1711776A (ja) |
AU (1) | AU2003290644A1 (ja) |
WO (1) | WO2004044842A2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7095786B1 (en) | 2003-01-11 | 2006-08-22 | Neo Magic Corp. | Object tracking using adaptive block-size matching along object boundary and frame-skipping when object motion is low |
US7957466B2 (en) * | 2005-09-16 | 2011-06-07 | Sony Corporation | Adaptive area of influence filter for moving object boundaries |
US8340185B2 (en) * | 2006-06-27 | 2012-12-25 | Marvell World Trade Ltd. | Systems and methods for a motion compensated picture rate converter |
US7783118B2 (en) * | 2006-07-13 | 2010-08-24 | Seiko Epson Corporation | Method and apparatus for determining motion in images |
CN101502119B (zh) | 2006-08-02 | 2012-05-23 | 汤姆逊许可公司 | 用于视频编码的自适应几何分割方法和设备 |
US8923400B1 (en) * | 2007-02-16 | 2014-12-30 | Geo Semiconductor Inc | Method and/or apparatus for multiple pass digital image stabilization |
US8238428B2 (en) * | 2007-04-17 | 2012-08-07 | Qualcomm Incorporated | Pixel-by-pixel weighting for intra-frame coding |
US20090174812A1 (en) * | 2007-07-06 | 2009-07-09 | Texas Instruments Incorporated | Motion-compressed temporal interpolation |
US20090052532A1 (en) * | 2007-08-24 | 2009-02-26 | Simon Robinson | Automatically identifying edges of moving objects |
US8861603B2 (en) * | 2007-08-28 | 2014-10-14 | Samsung Electronics Co., Ltd. | System and method for motion vector collection based on K-means clustering for motion compensated interpolation of digital video |
WO2009032255A2 (en) * | 2007-09-04 | 2009-03-12 | The Regents Of The University Of California | Hierarchical motion vector processing method, software and devices |
US8208552B2 (en) * | 2008-01-25 | 2012-06-26 | Mediatek Inc. | Method, video encoder, and integrated circuit for detecting non-rigid body motion |
US8059908B2 (en) * | 2008-04-29 | 2011-11-15 | Sony Corporation | Adaptive area of influence filter for irregular spatial sub-sampled images |
US8055087B2 (en) * | 2008-04-29 | 2011-11-08 | Sony Corporation | Sample level variation for spatial sub-sampled images |
US8059909B2 (en) * | 2008-04-29 | 2011-11-15 | Sony Corporation | Adaptive generation of irregular spatial sub-sampling for images |
KR101502362B1 (ko) | 2008-10-10 | 2015-03-13 | 삼성전자주식회사 | 영상처리 장치 및 방법 |
FR2940492A1 (fr) * | 2008-12-19 | 2010-06-25 | Thomson Licensing | Procede d'estimation de mouvement multi-resolutions |
JP5606625B2 (ja) * | 2010-07-21 | 2014-10-15 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ビデオ符号化のための高度な動きモデルを使った参照処理 |
JP2013048717A (ja) * | 2011-08-31 | 2013-03-14 | Sony Corp | 画像処理装置及び方法、記録媒体、並びにプログラム |
EP2805306B1 (en) * | 2012-01-19 | 2016-01-06 | Thomson Licensing | Method and device for generating a motion field for a video sequence |
EP2826021A4 (en) | 2012-03-15 | 2016-04-27 | Intel Corp | HIERARCHICAL MOTION ESTIMATION EMPLOYING NON-LINEAR SCALING AND AN ADAPTIVE SOURCE BLOCK SIZE |
CN104253650B (zh) * | 2013-06-27 | 2016-12-28 | 富士通株式会社 | 信道内非线性损伤的估计装置及方法 |
US9508026B2 (en) * | 2014-07-01 | 2016-11-29 | Irida Labs S.A. | System and a method for camera motion analysis and understanding from a video sequence |
US10306229B2 (en) | 2015-01-26 | 2019-05-28 | Qualcomm Incorporated | Enhanced multiple transforms for prediction residual |
CN104661031B (zh) | 2015-02-16 | 2017-12-22 | 华为技术有限公司 | 用于视频图像编码和解码的方法、编码设备和解码设备 |
US10623774B2 (en) | 2016-03-22 | 2020-04-14 | Qualcomm Incorporated | Constrained block-level optimization and signaling for video coding tools |
CN106384361B (zh) * | 2016-09-14 | 2019-06-14 | 西安理工大学 | 多视环境中基于水平集函数演化的非刚性目标场景流估计方法 |
US11323748B2 (en) | 2018-12-19 | 2022-05-03 | Qualcomm Incorporated | Tree-based transform unit (TU) partition for video coding |
CN110139100B (zh) * | 2019-05-16 | 2021-07-06 | 东莞职业技术学院 | 多图像运动估计的扩展块匹配及运动矢量估计算法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0799603A (ja) * | 1992-09-18 | 1995-04-11 | Sony Corp | ビデオ信号符号化方法及び装置、ビデオ信号復号化方法及び装置、又はビデオ信号記録メディア |
JPH08223577A (ja) * | 1994-12-12 | 1996-08-30 | Sony Corp | 動画像符号化方法及び装置、並びに動画像復号方法及び装置 |
JPH08249472A (ja) * | 1995-03-15 | 1996-09-27 | Toshiba Corp | 移動物体検知装置及び移動物体検知方法 |
US6400831B2 (en) * | 1998-04-02 | 2002-06-04 | Microsoft Corporation | Semantic video object segmentation and tracking |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0322956B1 (en) | 1987-12-22 | 1994-08-03 | Koninklijke Philips Electronics N.V. | Video encoding and decoding using an adpative filter |
JP3679426B2 (ja) | 1993-03-15 | 2005-08-03 | マサチューセッツ・インスティチュート・オブ・テクノロジー | 画像データを符号化して夫々がコヒーレントな動きの領域を表わす複数の層とそれら層に付随する動きパラメータとにするシステム |
JP3929492B2 (ja) | 1995-10-25 | 2007-06-13 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | セグメント化画像符号化方法及びシステム並びにその復号化方法及びシステム |
KR970025184A (ko) | 1995-10-26 | 1997-05-30 | 김광호 | 예측매크로블럭 변환을 이용한 동화상 복호기 |
US5778097A (en) | 1996-03-07 | 1998-07-07 | Intel Corporation | Table-driven bi-directional motion estimation using scratch area and offset valves |
AU5501296A (en) | 1996-04-19 | 1997-11-12 | Nokia Mobile Phones Limited | Video encoder and decoder using motion-based segmentation and merging |
JP3876392B2 (ja) | 1996-04-26 | 2007-01-31 | 富士通株式会社 | 動きベクトル探索方法 |
US5991447A (en) | 1997-03-07 | 1999-11-23 | General Instrument Corporation | Prediction and coding of bi-directionally predicted video object planes for interlaced digital video |
US6249548B1 (en) | 1998-07-10 | 2001-06-19 | U.S. Phillips Corporation | Motion vector processing |
US6658059B1 (en) * | 1999-01-15 | 2003-12-02 | Digital Video Express, L.P. | Motion field modeling and estimation using motion transform |
US6665423B1 (en) * | 2000-01-27 | 2003-12-16 | Eastman Kodak Company | Method and system for object-oriented motion-based video description |
KR100415266B1 (ko) * | 2000-05-11 | 2004-01-16 | 가부시끼가이샤 도시바 | 물체영역정보 기술방법과 물체영역정보 생성장치 및 기록매체 |
US6731799B1 (en) * | 2000-06-01 | 2004-05-04 | University Of Washington | Object segmentation with background extraction and moving boundary techniques |
US7092550B2 (en) * | 2001-12-12 | 2006-08-15 | Sony Corporation | Implementation of hough transform and its application in video motion analysis |
BR0304545A (pt) | 2002-01-14 | 2004-11-03 | Nokia Corp | Método de codificação das imagens em uma sequência de vìdeo digital para fornecer os dados de vìdeo codificados, codificador de vìdeo, método de decodificação dos dados indicativos de uma sequência de vìdeo digital, decodificador de vìdeo, e, sistema de decodificação de vìdeo |
US6646578B1 (en) | 2002-11-22 | 2003-11-11 | Ub Video Inc. | Context adaptive variable length decoding system and method |
-
2002
- 2002-11-11 US US10/291,989 patent/US20040091047A1/en not_active Abandoned
-
2003
- 2003-11-06 AU AU2003290644A patent/AU2003290644A1/en not_active Abandoned
- 2003-11-06 KR KR1020057008406A patent/KR101021409B1/ko active IP Right Grant
- 2003-11-06 CN CNA2003801030216A patent/CN1711776A/zh active Pending
- 2003-11-06 EP EP03783225A patent/EP1561347A4/en not_active Withdrawn
- 2003-11-06 CN CN2008100883165A patent/CN101257632B/zh not_active Expired - Fee Related
- 2003-11-06 WO PCT/US2003/035512 patent/WO2004044842A2/en active Application Filing
- 2003-11-06 JP JP2004551854A patent/JP4651385B2/ja not_active Expired - Fee Related
-
2005
- 2005-05-09 US US11/125,422 patent/US7751479B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0799603A (ja) * | 1992-09-18 | 1995-04-11 | Sony Corp | ビデオ信号符号化方法及び装置、ビデオ信号復号化方法及び装置、又はビデオ信号記録メディア |
JPH08223577A (ja) * | 1994-12-12 | 1996-08-30 | Sony Corp | 動画像符号化方法及び装置、並びに動画像復号方法及び装置 |
JPH08249472A (ja) * | 1995-03-15 | 1996-09-27 | Toshiba Corp | 移動物体検知装置及び移動物体検知方法 |
US6400831B2 (en) * | 1998-04-02 | 2002-06-04 | Microsoft Corporation | Semantic video object segmentation and tracking |
Also Published As
Publication number | Publication date |
---|---|
CN101257632A (zh) | 2008-09-03 |
WO2004044842A2 (en) | 2004-05-27 |
CN1711776A (zh) | 2005-12-21 |
JP2006505870A (ja) | 2006-02-16 |
US7751479B2 (en) | 2010-07-06 |
US20050213660A1 (en) | 2005-09-29 |
KR20050072139A (ko) | 2005-07-08 |
WO2004044842A3 (en) | 2005-02-03 |
EP1561347A2 (en) | 2005-08-10 |
AU2003290644A1 (en) | 2004-06-03 |
KR101021409B1 (ko) | 2011-03-14 |
EP1561347A4 (en) | 2009-03-18 |
AU2003290644A8 (en) | 2004-06-03 |
US20040091047A1 (en) | 2004-05-13 |
CN101257632B (zh) | 2011-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4651385B2 (ja) | 非線形の複数の動きモデル及び移動境界を抽出する方法及び装置 | |
Wexler et al. | Space-time completion of video | |
Wexler et al. | Space-time video completion | |
US6438275B1 (en) | Method for motion compensated frame rate upsampling based on piecewise affine warping | |
JP4740657B2 (ja) | カラーセグメンテーションに基づくステレオ3次元再構成システムおよびプロセス | |
US8897562B2 (en) | Adaptive trimap propagation for video matting | |
US8792718B2 (en) | Temporal matte filter for video matting | |
US8102428B2 (en) | Content-aware video stabilization | |
US7573478B2 (en) | Multi-image-frame sprite recognition in animated sequences | |
JPH10285602A (ja) | 映像データをエンコードするための動的なスプライト | |
US20130071041A1 (en) | High-Quality Denoising of an Image Sequence | |
US20140126818A1 (en) | Method of occlusion-based background motion estimation | |
EP1014303A1 (en) | Object boundary detection using a constrained viterbi search | |
US9317928B2 (en) | Detecting and tracking point features with primary colors | |
Cao et al. | UniFaceGAN: a unified framework for temporally consistent facial video editing | |
US20060098886A1 (en) | Efficient predictive image parameter estimation | |
Lee et al. | Fast 3D video stabilization using ROI-based warping | |
US20070076978A1 (en) | Moving image generating apparatus, moving image generating method and program therefor | |
CN112085842A (zh) | 深度值确定方法及装置、电子设备和存储介质 | |
CN106780365B (zh) | 一种基于异构计算的图像去抖动系统 | |
Koochari et al. | Exemplar-based video inpainting with large patches | |
JPH09200763A (ja) | 動画像符号化における動き補償方法 | |
JP2980810B2 (ja) | 動きベクトル探索方法と装置 | |
JPH0837664A (ja) | 動画像符号化/復号化装置 | |
JP2934151B2 (ja) | 動きベクトル探索方法と装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061006 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20080528 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20080528 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090803 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091104 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100419 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100720 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101115 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4651385 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131224 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |