JP4921780B2 - Method and apparatus for motion prediction - Google Patents
Method and apparatus for motion prediction Download PDFInfo
- Publication number
- JP4921780B2 JP4921780B2 JP2005344110A JP2005344110A JP4921780B2 JP 4921780 B2 JP4921780 B2 JP 4921780B2 JP 2005344110 A JP2005344110 A JP 2005344110A JP 2005344110 A JP2005344110 A JP 2005344110A JP 4921780 B2 JP4921780 B2 JP 4921780B2
- Authority
- JP
- Japan
- Prior art keywords
- candidate set
- layer
- candidate
- local search
- search unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/53—Multi-resolution motion estimation; Hierarchical motion estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Description
本発明は、動き予測の方法および装置、さらに詳細には、動きベクトル予測のための階層的探索を用いる方法およびその装置に関する。 The present invention relates to a motion prediction method and apparatus, and more particularly, to a method and apparatus using a hierarchical search for motion vector prediction.
動き予測は、ビデオ圧縮エンコーダにおける計算量に関してもっとも複雑な計算エリアであり、さらに圧縮結果にもっとも影響を与えるものである。したがって、計算量およびメモリ利用量を低下させるために提案された多数の高速アルゴリズムがあり、これにより十分な圧縮品位が維持される。 Motion prediction is the most complicated calculation area regarding the calculation amount in the video compression encoder, and has the most influence on the compression result. Thus, there are a number of fast algorithms proposed to reduce computational complexity and memory usage, thereby maintaining sufficient compression quality.
さまざまな高速アルゴリズムの中で、階層的探索は、計算量とメモリ使用量との両方を効果的に減少させるアルゴリズムである。階層的探索法は、図1のフロー図で示されているとおり、J.H.リー[1]により提案されたものであり、可変ブロックが生成できる。 Among various fast algorithms, hierarchical search is an algorithm that effectively reduces both computational complexity and memory usage. As shown in the flow diagram of FIG. H. This is proposed by Lee [1] and can generate variable blocks.
図1を参照すると、まず、ステップ101および102において、原フレームデータ111および基準フレームデータ112に対して低帯域フィルタリングおよびサブサンプリングが行われ、これにより3つの異なる解像度層が得られる。これらの層は、原解像度層、中間解像度層、低解像度層である。ここで、原解像度層には原フレームデータ111および基準フレームデータ112が含まれ、中間解像度層にはステップ101で生成されるデータが含まれ、低解像度層にはステップ102で生成されるデータが含まれる。
Referring to FIG. 1, first, in
その後、ステップ103において、低解像度層に対して広範囲探索が行われ、これにより3つの動きベクトルが得られる。これらのベクトルは、2つの最適動きベクトルと、ビデオ基準から得られた1つの予測動きベクトルである。その後、ステップ104において、中間解像度層に対して局所探索が行われる。ここで、上述の低解像度層および中間解像度層に対して行われる両探索において、16×16のブロックサイズが用いられる。最後に、ステップ105において、中間解像度層から得られる動きベクトルに近接する原解像度層に対して局所探索が行われる。一方、16×16の原ブロックは8×8の4つの小さなブロックに分割される。さらに最終的に、最適ブロックモードおよび動きベクトル113が選択される。この方法の欠点としては、小さなブロックの動きベクトルが非常に小さな範囲に限られるということである。このため、小さなブロック間の物理的動きベクトルがそれぞれ大きく離れているような場合に効果的な予測ができない。
Thereafter, in step 103, a wide range search is performed on the low resolution layer, thereby obtaining three motion vectors. These vectors are two optimal motion vectors and one predicted motion vector obtained from the video reference. Thereafter, in
したがって、本発明の目的は動き予測のための方法を提供することである。このような方法を用いて、計算量が少なくメモリ使用量も小さいという利点が維持され、最適な可変ブロックモードおよび動きベクトルが正確に予測できる。 Accordingly, it is an object of the present invention to provide a method for motion estimation. By using such a method, the advantage that the calculation amount is small and the memory usage amount is small is maintained, and the optimum variable block mode and motion vector can be accurately predicted.
本発明の他の目的は、動き予測のための装置を提供することである。この装置により可変ブロック動きベクトルの高効率組合せをもたらすことができる。 Another object of the present invention is to provide an apparatus for motion estimation. This device can provide a highly efficient combination of variable block motion vectors.
上述の目的、その他を達成するため、本発明は動き予測方法を提供する。この方法は以下のステップを含む:
(a)階層的データ構造を形成するために原フレームデータおよび基準フレームデータを用い、この階層的データ構造がN個の層を含むステップであって、N番目の層が原フレームデータおよび基準フレームデータを含み、残りのi番目の層が原フレームデータおよび基準フレームデータから生成されたデータを含み、i番目の層の画像解像度が(i+1)番目の層の画像解像度よりも低く、ここでNが2以上の正の整数であり、1≦i<Nであることを特徴とするステップと;
(b)1番目の層上にあるマクロブロックの複数候補セットのコストに応じてこの候補セットから少なくとも1つの候補セットを選択し、この選択された候補セットを2番目の層に与えるステップであって、候補セットのおのおのがマクロブロックの可変ブロックモードと、この可変ブロックモードのブロックのおのおのの動きベクトルとのセットであることを特徴とするステップと;
(c)Nが2より大きい場合に2番目の層から始まって2≦i<Nの順番で各i番目の層に対して以下の2つのサブステップを順次実施するステップであって、このサブステップが:
(c1)(i−1)番目の層でもたらされる候補セットに基づいて局所探索を行うサブステップと;
(c2)局所探索後に候補セットのコストに応じて局所探索から得られた候補セットから少なくとも1つの候補セットを選択し、選択された候補セットを(i+1)番目の層にもたらすサブステップであるステップと;
(d)N番目の層に対して以下の2つのサブステップを実施するステップであって、このサブステップが:
(d1)(N−1)番目の層でもたらされる候補セットに基づいて局所探索を行うサブステップと;
(d2)局所探索後に候補セットのコストに応じて局所探索から得られた候補セットから1つの候補セットを選択するサブステップであるステップ。
In order to achieve the above object and others, the present invention provides a motion estimation method. This method includes the following steps:
(A) using original frame data and reference frame data to form a hierarchical data structure, the hierarchical data structure including N layers, wherein the Nth layer is the original frame data and the reference frame And the remaining i th layer contains data generated from the original frame data and the reference frame data, and the image resolution of the i th layer is lower than the image resolution of the (i + 1) th layer, where N Is a positive integer greater than or equal to 2 and 1 ≦ i <N;
(B) selecting at least one candidate set from the candidate sets according to the cost of a plurality of candidate sets of macroblocks on the first layer, and providing the selected candidate set to the second layer. Each of the candidate sets is a set of a variable block mode of the macroblock and a motion vector of each block of the variable block mode;
(C) When N is larger than 2, the following two sub-steps are sequentially performed on each i-th layer in the order of 2 ≦ i <N starting from the second layer. The steps are:
(C1) a substep of performing a local search based on the candidate set provided in the (i-1) th layer;
(C2) A step that is a sub-step of selecting at least one candidate set from candidate sets obtained from the local search according to the cost of the candidate set after the local search and bringing the selected candidate set to the (i + 1) th layer When;
(D) performing the following two substeps for the Nth layer, which substeps:
(D1) a substep of performing a local search based on the candidate set provided in the (N-1) th layer;
(D2) A step that is a sub-step of selecting one candidate set from the candidate sets obtained from the local search according to the cost of the candidate set after the local search.
本発明の1つの実施例による動き予測方法において、各i番目の層の全データが、(i+1)番目の層に対して低帯域フィルタリングおよびサブサンプリングを行うことで生成される。 In the motion estimation method according to an embodiment of the present invention, all data of each i-th layer is generated by performing low-band filtering and sub-sampling on the (i + 1) -th layer.
本発明の1つの実施例による動き予測方法において、ステップ(c1)あるいは(d1)がさらに以下のサブステップ:候補セットの1つから複数の導出された候補セットを導出し、この導出された候補セットを次のステップの選択に追加するサブステップであって、導出された候補セットのおのおのおよび上述の候補セットが同一の可変ブロックモードをもつが、動きベクトルは異なることを特徴とするサブステップを含む。 In the motion estimation method according to one embodiment of the present invention, step (c1) or (d1) further derives a plurality of derived candidate sets from one of the following sub-steps: candidate set, and the derived candidates A sub-step of adding a set to the selection of the next step, characterized in that each of the derived candidate sets and the above-mentioned candidate set have the same variable block mode but different motion vectors Including.
本発明の1つの実施例による動き予測方法において、ステップ(c1)あるいは(d1)がさらに以下のサブステップ:候補セットの1つから複数の導出された並行候補セットを導出し、この導出された候補セットを次のステップの選択に追加するサブステップであって、導出された候補セットのおのおのの可変ブロックモードが、上述の候補セットの可変ブロックモードを分割することから得られる結果であることを特徴とするサブステップを含む。 In the motion estimation method according to one embodiment of the present invention, step (c1) or (d1) further derives a plurality of derived parallel candidate sets from one of the following sub-steps: A sub-step of adding the candidate set to the selection of the next step, wherein each variable block mode of the derived candidate set is a result obtained from dividing the variable block mode of the candidate set described above. Includes characteristic sub-steps.
本発明の他の観点により、本発明はさらに動き予測装置を提供するが、この装置は層発生器、全文対象探索ユニット、最終探索ユニットを含む。ここで、層発生器は、原フレームデータおよび基準フレームデータを用いて階層的データ構造を形成する。階層的データ構造は2つの層を含み、ここで、2番目の層は原フレームデータおよび基準フレームデータを含み、1番目の層は原フレームデータおよび基準フレームデータに基づいて生成されたデータを含み、1番目の層の画像解像度は2番目の層の画像解像度よりも低い。全文対象探索ユニットは、上述の候補セットのコストに応じて1番目の層のマクロブロックの複数の候補セットから選択された少なくとも1つの候補セットをもたらす。最終探索ユニットは、全文対象探索ユニットにより与えられた候補セットに基づいて2番目の層に対して局所探索を行い、局所探索後に候補セットのコストに応じた局所探索で得られた候補セットから候補セットを選択する。 In accordance with another aspect of the present invention, the present invention further provides a motion prediction apparatus, which includes a layer generator, a full text object search unit, and a final search unit. Here, the layer generator forms a hierarchical data structure using the original frame data and the reference frame data. The hierarchical data structure includes two layers, where the second layer includes original frame data and reference frame data, and the first layer includes data generated based on the original frame data and reference frame data. The image resolution of the first layer is lower than the image resolution of the second layer. The full text object search unit yields at least one candidate set selected from a plurality of candidate sets of macroblocks in the first layer according to the cost of the candidate set described above. The final search unit performs a local search on the second layer based on the candidate set given by the full-text target search unit, and candidates from the candidate set obtained by the local search according to the cost of the candidate set after the local search Select a set.
本発明の他の観点により、本発明はさらに、動き予測装置を提供するが、この装置は層発生器、全文対象探索ユニット、N−2個の局所探索ユニットおよび最終探索ユニットを含み、ここでNは2よりも大きな正の整数である。ここで、層発生器は、原フレームデータおよび基準フレームデータを用いて階層的データ構造を形成する。階層的データ構造はN個の層を含み、ここで、N番目の層は原フレームデータおよび基準フレームデータを含み、残りのi番目の層は原フレームデータおよび基準フレームデータに基づいて生成されたデータを含み、i番目の層の画像解像度は(i+1)番目の層の画像解像度よりも低く、ここでiは整数であり、1≦i<Nである。全文対象探索ユニットは、上述の候補セットのコストに応じて1番目の層のマクロブロックの複数の候補セットから選択された少なくとも1つの候補セットをもたらす。N−2個の局所探索ユニットの内、1番目の局所探索ユニットが2番目の層に対応して全文対象探索ユニットにより与えられる候補セットを受け入れ、k番目の局所探索ユニットが(k+1)番目の層に対応して(k−1)番目の局所探索ユニットにより与えられる少なくとも1つの候補セットを受け入れ、ここでkは整数であり、1≦k≦N−2である。さらに、各局所探索ユニットは、受け入れられた候補セットに基づき、対応する層に対して局所探索を行い、局所探索後に候補セットのコストに応じた局所探索で得られた候補セットから少なくとも1つの候補セットをもたらす。最終探索ユニットは、(N−2)番目の局所探索ユニットにより与えられた候補セットに基づいてN番目の層に対して局所探索を行い、局所探索後に候補セットのコストに応じた局所探索で得られた候補セットから1つの候補セットを選択する。 In accordance with another aspect of the present invention, the present invention further provides a motion estimation apparatus, which includes a layer generator, a full text object search unit, N-2 local search units, and a final search unit, where N is a positive integer greater than 2. Here, the layer generator forms a hierarchical data structure using the original frame data and the reference frame data. The hierarchical data structure includes N layers, where the Nth layer includes original frame data and reference frame data, and the remaining i th layer is generated based on the original frame data and reference frame data. Including data, the image resolution of the i-th layer is lower than the image resolution of the (i + 1) -th layer, where i is an integer and 1 ≦ i <N. The full text object search unit yields at least one candidate set selected from a plurality of candidate sets of macroblocks in the first layer according to the cost of the candidate set described above. Of the N-2 local search units, the first local search unit accepts the candidate set given by the full-text target search unit corresponding to the second layer, and the kth local search unit is the (k + 1) th Accept at least one candidate set given by the (k−1) th local search unit corresponding to the layer, where k is an integer and 1 ≦ k ≦ N−2. Further, each local search unit performs a local search on the corresponding layer based on the accepted candidate set, and at least one candidate from the candidate set obtained by the local search according to the cost of the candidate set after the local search Bring the set. The final search unit performs a local search for the Nth layer based on the candidate set given by the (N-2) th local search unit, and obtains the local search according to the cost of the candidate set after the local search. One candidate set is selected from the obtained candidate sets.
添付の図面は、本発明の理解をさらに深めるためのものであり、本仕様書に組み込まれ、その一部を構成するものである。これらの図面は本発明の実施例を示すものであり、説明とあわせて本発明の原理を説明する一助となるものである。 The accompanying drawings are included to provide a further understanding of the invention and are incorporated in and constitute a part of this specification. These drawings show embodiments of the present invention, and together with the description, help to explain the principle of the present invention.
本発明において、最適ブロックモードは、低解像度の1番目の層に対する分割を可能にし、高解像度の層に対して局所探索が行われ、これによりこのブロックをさらに分解することができる。本発明によりさらに柔軟性がもたらされることから、計算量が少なくメモリ使用量も小さいという利点が維持され、最適な可変ブロックモードおよび動きベクトルが正確に予測できる。 In the present invention, the optimal block mode allows partitioning for the low resolution first layer, and a local search is performed for the high resolution layer, which can further decompose this block. Further flexibility is provided by the present invention, so that the advantage of less computation and less memory usage is maintained, and the optimal variable block mode and motion vector can be predicted accurately.
本発明の1つの実施例による動き予測方法は、これ以降、図2を参照しながらさらに詳しく説明される。図2は、ステップ210から始まる本実施例のフロー図である。
The motion prediction method according to one embodiment of the present invention will now be described in more detail with reference to FIG. FIG. 2 is a flowchart of this embodiment starting from
まず、ステップ210において、N層の階層的データ構造は、原フレームデータおよび基準フレームデータを含み、ここでNは2以上の正の整数である。ここで、N番目の層は原フレームデータおよび基準フレームデータで構成され、残りのi番目の層のデータは、(i+1)番目の層のデータに対して低帯域フィルタリングおよびサブサンプリングを行うことで全て生成されるものであり、ここでiは整数であり、1≦i<Nである。上述の説明から、N番目の層は最大画像解像度の原解像度層であり、この解像度は、最低解像度の1番目の層まで層を追う毎に小さくなることがわかる。
First, in
その後、ステップ220において、最低解像度の1番目の層に対して全文対象探索が行われ、これはまた、上述の候補セットのコストに応じてマクロブロックの複数候補セットから少なくとも1つの候補セットを選択するステップと、選択された候補セットを2番目の層に与えるステップとを含む広範囲探索として知られている。ここで、候補セットのおのおのは、上述のマクロブロックの可変ブロックモードと、この可変ブロックモードのブロックのおのおのの動きベクトルとのセットである。さらに、候補セットはビデオ圧縮エンコーダに対して最終的に与えられるデータ構造である。
Thereafter, in
上述の選択方法に関して、全般として、この方法では各候補に対するコストをまず計算し、その後、このコストを比較してさらに選択を行い、例えば、この方法では、最小量のある値のコストを選択する、あるいは特定の所定値よりもコストの小さな候補セットを選択する。このようにコスト計算およびさらに選択を行う方法は通常の当業者にとってよく知られた従来技術であるため、ここでは詳細を省略する。 With respect to the selection method described above, in general, the method first calculates the cost for each candidate, then compares this cost to make further selections, for example, the method selects the cost of a value with a minimum amount. Alternatively, a candidate set having a cost lower than a specific predetermined value is selected. Since the cost calculation and further selection method are conventional techniques well known to those skilled in the art, details are omitted here.
ステップ220においてマクロブロックの動きベクトルだけを選択するのではなく、このマクロブロックの可変ブロックモードも選択するという点が従来技術と異なる。言い換えると、ステップ220において全マクロブロックを残しておくことが可能である、すなわち複数の小さなブロックに分解し、これらのブロックをさらに2番目の層に与えることが可能である。物理的適用を考慮するため、マクロブロックを小さなブロックに分解する際に、この小さいブロックのサイズが小さすぎるためにマクロブロックを分解したくない場合、小さなブロックの候補セットコストが選択されないよう適切に調整することができる。当然ながら、コスト調整はまた、他の形式の候補セットの選択を避けるために用いることができる。
In
それに続くステップには異なる2つのオプションがあり、このオプションはステップ210の階層的データ構造に基づいて選択される。Nが2に等しい場合、このプロセスはステップ240に進むが、ここでN番目の層に対して最終探索が行われ、Nが2より大きければ、このプロセスはまずステップ230に進むが、ここで2番目の層と(N−1)番目の層間で各層に対して局所探索が行われ、その後、このプロセスはステップ240に進む。
Subsequent steps have two different options, which are selected based on the hierarchical data structure of
上で述べたとおり、Nが2より大きければ、このプロセスはまずステップ230に進み、ここで(i−1)番目の層で与えられる候補セットに応じて2番目の層から各i番目の層に対して局所探索が行われ、ここで2≦i<Nであり、その後、局所探索後に候補セットのコストに応じて局所探索から得られた候補セットから少なくとも1つの候補セットが選択され、選択された候補セットが(i+1)番目の層に与えられる。 As stated above, if N is greater than 2, the process first proceeds to step 230 where each i th layer from the second layer depends on the candidate set given by the (i−1) th layer. A local search is performed, where 2 ≦ i <N, and then after the local search, at least one candidate set is selected from the candidate sets obtained from the local search according to the cost of the candidate set and selected The candidate set is given to the (i + 1) th layer.
上述の局所探索において、i番目の層の高解像度のデータは、動きベクトルの再予測と、さらに選択を行うためにコストを再計算するため、(i−1)番目の層で与えられる候補セットとともに用いられる。局所探索において、導出された複数候補セットが1つの候補セットから導出され、選択に合わされる。例えば、これらのセットは同一の可変ブロックモードをもつが、動きベクトルが異なる。その他の場合、(i−1)番目の層で与えられる可変ブロックモードがさらに分割される。最適の圧縮品位を達成するため、全て可能性のある選択肢が独立した候補セットとして導出され、(i+1)番目の層の選択に合わされる。ステップ220と同じく、特定の候補セットあるいは複数候補セットのコストがステップ230で調整され、これによりフィルタリング結果が修正される。
In the local search described above, the i-th layer high-resolution data is used as a candidate set given by the (i-1) -th layer in order to re-predict the motion vector and recalculate the cost for further selection. Used with. In the local search, a plurality of derived candidate sets are derived from one candidate set and matched to the selection. For example, these sets have the same variable block mode but different motion vectors. In other cases, the variable block mode given in the (i-1) th layer is further divided. In order to achieve optimal compression quality, all possible choices are derived as independent candidate sets and matched to the selection of the (i + 1) th layer. Similar to step 220, the cost of a particular candidate set or multiple candidate sets is adjusted in
最後のステップ240はステップ220(ここでNは2に等しい)あるいはステップ230(ここでNは2より大きい)に続くものである。ステップ240において、(N−1)番目の層により与えられる候補セットに基づいて原解像度をもつN番目の層に対して局所探索がまず行われ、その後、局所探索後に候補セットのコストに応じた局所探索で得られた候補セットから1つの候補セットが選択される。
The
実際には、ステップ240はステップ230に類似しており、これら2つのステップ間の主な違いは、局所探索が行われる層が同一ではなく、ステップ240においてビデオ圧縮エンコーダの入力として1つの候補セットだけが最終的に選択されるという点である。さらに、ステップ240で行われる局所探索により、導出された候補セットを選択することができ、局所探索から得られるコストが調整可能であり、これにより特定の候補セットあるいは複数の候補セットが選択されることを避けることができる。
In practice,
上述の動き予測方法に加えて、本発明はさらに、動き予測装置を提供するが、この装置は動き予測方法を具現化するものである。図3は、本発明の他の実施例による動き予測装置300の概略図である。動き予測装置300は図2に示される動き予測方法を具現化するものであるが、ここでNは2に等しい。
In addition to the motion estimation method described above, the present invention further provides a motion prediction device, which embodies the motion prediction method. FIG. 3 is a schematic diagram of a
図3で示すとおり、動き予測装置300は層発生器301、全文対象探索ユニット302、最終探索ユニット303を含む。ここで、層発生器301は、原フレームデータ311および基準フレームデータ312を用いて、ステップ210で示すとおり、階層的データ構造を形成する。しかし、本実施例の階層的データ構造では、低解像度の1番目の層と原解像度の2番目の層の2つの層だけを含む。さらに、全文対象探索ユニット302では、ステップ220で全文対象探索と同一の全文対象探索を1番目の層に対して行い、最終探索ユニット303に対して少なくとも1つの候補セットをもたらす。その後、最終探索ユニット303が、ステップ240で最終探索と同一の最終探索を上述の候補セットに対して行い、これにより最適候補セット313を選択する。
As shown in FIG. 3, the
図4は、本発明の他の実施例による動き予測装置400の概略図である。動き予測装置400は図2に示される動き予測方法を具現化するものであるが、ここでNは2より大きい。
FIG. 4 is a schematic diagram of a
図4で示されるとおり、動き予測装置400は層発生器401、全文対象探索ユニット402、N−2個の局所探索ユニット(2つの局所探索ユニット403および404だけが図4で示されている)、最終探索ユニット405を含む。ここで、層発生器401は、原フレームデータ411および基準フレームデータ412を用いて、ステップ210で示すとおり、N層の階層的データ構造を形成し、ここでNは2より大きい。さらに、全文対象探索ユニット402では、ステップ220で階層的データ構造の1番目の層に対して全文対象探索と同一の全文対象探索を行い、N−2個の局所探索ユニットの1番目の局所探索ユニットに対して少なくとも1つの候補セットをもたらす。
As shown in FIG. 4, the
動き予測装置400のN−2個の局所探索ユニットに関して、1番目の局所探索ユニット403が階層的データ構造の2番目の層に対応して全文対象探索ユニット402により与えられる候補セットを受け入れる。それに続くk番目の局所探索ユニットは(k+1)番目の層に対応し、(k−1)番目の局所探索ユニットでもたらされる候補セットを受け入れるが、ここでkは整数であり、1≦k≦N−2である。さらに、局所探索ユニットのおのおのはステップ230の局所探索と同一の方法で、受け入れられた候補セットに基づく対応層に対して局所探索を行い、これにより少なくとも1つの候補セットを選択する。
For the N-2 local search units of the
上述の探索および選択の後、最終探索ユニット405はステップ240の局所探索と同一の方法で、最終局所探索ユニット404でもたらされた候補セットに基づく原解像度のN番目の層に対して局所探索を行い、これにより最適候補セット413を選択する。
After the search and selection described above,
上述の実施例より、本発明において、最適ブロックモードは、最低解像度の1番目の層に対する分割を可能にし、高解像度の層に対して局所探索が行われ、これによりこのブロックをさらに分解することができることがわかる。本発明によりさらに柔軟性がもたらされることから、計算量が少なくメモリ使用量も小さいという利点が維持され、最適な可変ブロックモードおよび動きベクトルが正確に予測できる。 From the above embodiments, in the present invention, the optimal block mode allows partitioning for the first layer with the lowest resolution, and a local search is performed for the higher resolution layer, thereby further decomposing this block. You can see that Further flexibility is provided by the present invention, so that the advantage of less computation and less memory usage is maintained, and the optimal variable block mode and motion vector can be predicted accurately.
本発明は、本発明の特定の実施例を参照しながら説明したが、通常の当業者であれば、本発明の考え方から逸脱することなく、説明された実施例に対して改造を行ってもよいことは明白である。したがって、本発明の適用範囲は、上述の詳細な説明ではなく、添付の請求項により決められる。 Although the present invention has been described with reference to particular embodiments of the invention, those of ordinary skill in the art may make modifications to the described embodiments without departing from the spirit of the invention. The good thing is obvious. The scope of the invention is, therefore, determined by the appended claims rather than by the foregoing detailed description.
111 原フレームデータ
112 基準フレームデータ
113 ベクトル
300 予測装置
301 層発生器
302 全文対象探索ユニット
303 最終探索ユニット
311 原フレームデータ
312 基準フレームデータ
313 最適候補セット
400 予測装置
401 層発生器
402 全文対象探索ユニット
403 局所探索ユニット
404 最終局所探索ユニット
405 最終探索ユニット
411 原フレームデータ
412 基準フレームデータ
413 最適候補セット
111
Claims (18)
(a)階層的データ構造を形成するために原フレームデータおよび基準フレームデータを用い、この階層的データ構造がN個の層を含むステップであって、N番目の層が原フレームデータおよび基準フレームデータを含み、残りのi番目の層が原フレームデータおよび基準フレームデータから生成されたデータを含み、i番目の層の画像解像度が(i+1)番目の層の画像解像度よりも低く、ここでNが2以上の正の整数であり、1≦i<Nであることを特徴とするステップと;
(b)1番目の層上にあるマクロブロックの複数候補セットのコストに応じてこの候補セットから少なくとも1つの候補セットを選択し、この選択された候補セットを2番目の層に与えるステップであって、候補セットのおのおのがマクロブロックの可変ブロックモードと、この可変ブロックモードのブロックのおのおのの動きベクトルとのセットを含むことを特徴とするステップと;
(c)Nが2より大きい場合に2番目から始まって2≦i<Nの順番で各i番目の層に対して以下の2つのサブステップを順序実施するステップであって、このサブステップが:
(c1)(i−1)番目の層でもたらされる候補セットに基づいて局所探索を行うサブステップと;
(c2)局所探索後に候補セットのコストに応じて局所探索から得られた候補セットから少なくとも1つの候補セットを選択し、選択された候補セットを(i+1)番目の層にもたらすサブステップであるステップと;
(d)N番目の層に対して以下の2つのサブステップを実施するステップであって、このサブステップが:
(d1)(N−1)番目の層でもたらされる候補セットに基づいて局所探索を行うサブステップと;
(d2)局所探索後に候補セットのコストに応じて局所探索から得られた候補セットから1つの候補セットを選択するサブステップであるステップと
を含む方法。 A method for motion prediction, which is:
(A) using original frame data and reference frame data to form a hierarchical data structure, the hierarchical data structure including N layers, wherein the Nth layer is the original frame data and the reference frame And the remaining i th layer contains data generated from the original frame data and the reference frame data, and the image resolution of the i th layer is lower than the image resolution of the (i + 1) th layer, where N Is a positive integer greater than or equal to 2 and 1 ≦ i <N;
(B) selecting at least one candidate set from the candidate sets according to the cost of a plurality of candidate sets of macroblocks on the first layer, and providing the selected candidate set to the second layer. Te, and variable block mode each of macroblock candidate set, the steps of comprising a set of each of the motion vectors of the blocks of the variable block mode;
(C) When N is greater than 2, the following two sub-steps are sequentially performed for each i-th layer in the order of 2 ≦ i <N starting from the second, :
(C1) a substep of performing a local search based on the candidate set provided in the (i-1) th layer;
(C2) A step that is a sub-step of selecting at least one candidate set from candidate sets obtained from the local search according to the cost of the candidate set after the local search and bringing the selected candidate set to the (i + 1) th layer When;
(D) performing the following two substeps for the Nth layer, which substeps:
(D1) a substep of performing a local search based on the candidate set provided in the (N-1) th layer;
(D2) A method including a step which is a sub-step of selecting one candidate set from candidate sets obtained from the local search according to the cost of the candidate set after the local search.
少なくとも1つの候補セットが選択されないようコストの1つを調整するステップを含むことを特徴とする方法。 The method for motion prediction according to claim 1, wherein step (b) further comprises:
Adjusting one of the costs so that at least one candidate set is not selected.
少なくとも1つの候補セットが選択されないようそのコストあるいはコストの1つを調整するステップを含むことを特徴とする方法。 The method for motion prediction according to claim 1, wherein step (c2) or (d2) further comprises:
Adjusting the cost or one of the costs so that at least one candidate set is not selected.
候補セットあるいは候補セットの1つから複数の導出された候補セットを導出し、この導出された候補セットを次のステップの選択に追加するステップであって、導出された候補セットのおのおのおよび上述の候補セットが同一の可変ブロックモードをもつが、動きベクトルは異なることを特徴とするステップを含む方法。 The method for motion prediction according to claim 1, wherein step (c1) or (d1) further comprises:
Deriving a plurality of derived candidate sets from the candidate set or one of the candidate sets and adding the derived candidate set to the selection of the next step, each of the derived candidate sets and the above-mentioned A method comprising the steps characterized in that the candidate sets have the same variable block mode but the motion vectors are different.
候補セットあるいは候補セットの1つから複数の導出された候補セットを導出し、この導出された候補セットを次のステップの選択に追加するステップであって、導出された候補セットのおのおのに対する可変ブロックモードが、上述の候補セットの可変ブロックモードを分割することから得られる結果であることを特徴とするステップを含む方法。 The method for motion prediction according to claim 1, wherein step (c1) or (d1) further comprises:
Deriving a plurality of derived candidate sets from the candidate set or one of the candidate sets and adding the derived candidate set to the selection of the next step, a variable block for each of the derived candidate sets A method comprising the steps characterized in that the mode is a result obtained by splitting the variable block mode of the candidate set described above.
原フレームデータおよび基準フレームデータを用いて階層的データ構造を形成するための層生成器であって、この階層的データ構造が2つの層を含むものであって、2番目の層が原フレームデータおよび基準フレームデータを含み、1番目の層が原フレームデータおよび基準フレームデータから生成されるデータを含み、1番目の層の画像解像度が2番目の層の画像解像度よりも低いことを特徴とする層生成器と;
上述の候補セットのコストに応じて1番目の層上にあるマクロブロックの複数候補セットから少なくとも1つの候補セットをもたらすための全範囲探索ユニットであって、候補セットのおのおのがマクロブロックの可変ブロックモードと、この可変ブロックモードのブロックのおのおのの動きベクトルとのセットであることを特徴とする全範囲探索ユニットと;
全範囲探索ユニットにより与えられた候補セットに基づいて2番目の層に対して局所探索を行い、局所探索後に候補セットのコストに応じた局所探索で得られた候補セットから候補セットを選択するための最終探索ユニットと
を備える装置。 A device for motion prediction, which device:
A layer generator for forming a hierarchical data structure using original frame data and reference frame data, wherein the hierarchical data structure includes two layers, the second layer being the original frame data And the first frame includes data generated from the original frame data and the reference frame data, and the image resolution of the first layer is lower than the image resolution of the second layer. With a layer generator;
A full range search unit for providing at least one candidate set from a plurality of candidate sets of macroblocks on the first layer according to the cost of the candidate set, wherein each candidate set is a variable block of a macroblock A full range search unit characterized in that it is a set of modes and respective motion vectors of blocks of this variable block mode;
To perform a local search for the second layer based on the candidate set given by the full range search unit, and to select a candidate set from the candidate set obtained by the local search according to the cost of the candidate set after the local search Comprising a final search unit.
原フレームデータおよび基準フレームデータを用いて階層的データ構造を形成するための層生成器であって、この階層的データ構造がN個の層を含むものであって、N番目の層が原フレームデータおよび基準フレームデータを含み、残りのi番目の層が原フレームデータおよび基準フレームデータから生成されたデータを含み、i番目の層の画像解像度が(i+1)番目の層の画像解像度よりも低く、ここでNが2よりも大きな正の整数であり、1≦i<Nであることを特徴とする層生成器と;
上述の候補セットのコストに応じて1番目の層上にあるマクロブロックの複数候補セットから少なくとも1つの候補セットをもたらすための全範囲対象探索ユニットであって、候補セットのおのおのがマクロブロックの可変ブロックモードと、この可変ブロックモードのブロックのおのおのの動きベクトルとのセットを含むことを特徴とする全範囲対象探索ユニットと;
N−2個の局所探索ユニットであって、1番目の局所探索ユニットが2番目の層に対応して全範囲対象探索ユニットにより与えられる候補セットを受け入れ、k番目の局所探索ユニットが(k+1)番目の層に対応して(k−1)番目の局所探索ユニットにより与えられる少なくとも1つの候補セットを受け入れ、ここでkは整数であり、1≦k≦N−2であり、局所探索ユニットのおのおのが、受け入れられた候補セットに基づいて対応する層に対して局所探索を行い、局所探索後に候補セットのコストに応じて局所探索から得られた候補セットから選択された少なくとも1つの候補セットをもたらすことを特徴とする局所探索ユニットと;
(N−2)番目の局所探索ユニットにより与えられた候補セットに基づいてN番目の層に対して局所探索を行い、局所探索後に候補セットのコストに応じた局所探索で得られた候補セットから1つの候補セットを選択するための最終探索ユニットと
を備える装置。 A device for motion prediction, which device:
A layer generator for forming a hierarchical data structure using original frame data and reference frame data, the hierarchical data structure including N layers, wherein the Nth layer is an original frame Data and reference frame data, the remaining i-th layer contains data generated from the original frame data and reference frame data, and the image resolution of the i-th layer is lower than the image resolution of the (i + 1) -th layer A layer generator, wherein N is a positive integer greater than 2 and 1 ≦ i <N;
A full-range object search unit for providing at least one candidate set from a plurality of candidate sets of macroblocks on the first layer according to the cost of the candidate set, wherein each candidate set is a variable macroblock A full range object search unit characterized in that it includes a set of block modes and respective motion vectors of blocks of this variable block mode;
N-2 local search units, where the first local search unit accepts the candidate set given by the full range object search unit corresponding to the second layer, and the kth local search unit is (k + 1) Accept at least one candidate set given by the (k−1) th local search unit corresponding to the th layer, where k is an integer, 1 ≦ k ≦ N−2, Each performs a local search on the corresponding layer based on the accepted candidate set, and after the local search, at least one candidate set selected from the candidate set obtained from the local search according to the cost of the candidate set A local search unit characterized by providing;
From the candidate set obtained by performing a local search for the Nth layer based on the candidate set given by the (N-2) th local search unit, and performing a local search according to the cost of the candidate set after the local search And a final search unit for selecting one candidate set.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW94124457A TWI280803B (en) | 2005-07-20 | 2005-07-20 | Method and apparatus for motion estimation |
TW94124457 | 2005-07-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007028574A JP2007028574A (en) | 2007-02-01 |
JP4921780B2 true JP4921780B2 (en) | 2012-04-25 |
Family
ID=37679023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005344110A Expired - Fee Related JP4921780B2 (en) | 2005-07-20 | 2005-11-29 | Method and apparatus for motion prediction |
Country Status (3)
Country | Link |
---|---|
US (1) | US7949194B2 (en) |
JP (1) | JP4921780B2 (en) |
TW (1) | TWI280803B (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8411970B2 (en) * | 2010-03-16 | 2013-04-02 | Pixia Corp. | Method and system for determining statistical data for image pixels having a higher bit depth per band |
TWI404422B (en) * | 2010-04-14 | 2013-08-01 | Himax Tech Ltd | Method and system of hierarchical motion estimation |
CN102420990B (en) * | 2011-12-15 | 2013-07-10 | 北京工业大学 | Multi-view video-oriented fast coding method |
JP5763578B2 (en) * | 2012-04-17 | 2015-08-12 | 三菱電機ビルテクノサービス株式会社 | Image coding apparatus, image coding method, and program |
CN103533349A (en) * | 2013-09-26 | 2014-01-22 | 广东电网公司电力科学研究院 | Support vector machine-based fast inter-frame prediction macro block mode selection method for B frame |
CN108737841B (en) | 2017-04-21 | 2020-11-24 | 腾讯科技(深圳)有限公司 | Coding unit depth determination method and device |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0846968A (en) * | 1994-08-03 | 1996-02-16 | Nippon Telegr & Teleph Corp <Ntt> | Method and device for detecting hierarchical motion vector |
JP3774954B2 (en) | 1996-10-30 | 2006-05-17 | 株式会社日立製作所 | Video encoding method |
US6128047A (en) * | 1998-05-20 | 2000-10-03 | Sony Corporation | Motion estimation process and system using sparse search block-matching and integral projection |
JP2003284091A (en) | 2002-03-25 | 2003-10-03 | Toshiba Corp | Motion picture coding method and motion picture coding apparatus |
ES2653437T3 (en) * | 2002-08-08 | 2018-02-07 | Godo Kaisha Ip Bridge 1 | Decoding procedure of moving images |
JP4841101B2 (en) | 2002-12-02 | 2011-12-21 | ソニー株式会社 | Motion prediction compensation method and motion prediction compensation device |
US7720151B2 (en) * | 2003-02-11 | 2010-05-18 | Texas Instruments Incorporated | Motion estimation using early decision for goodness of estimation with quick convergence feedback |
US7822150B2 (en) * | 2003-03-15 | 2010-10-26 | Alcatel-Lucent Usa Inc. | Spherical decoder for wireless communications |
US7471725B2 (en) * | 2003-03-26 | 2008-12-30 | Lsi Corporation | Segmented motion estimation with no search for small block sizes |
KR20060004060A (en) * | 2004-07-08 | 2006-01-12 | 삼성전자주식회사 | Motion estimation method based on multi resolution, and recording medium storing a program to implement thereof |
-
2005
- 2005-07-20 TW TW94124457A patent/TWI280803B/en not_active IP Right Cessation
- 2005-11-04 US US11/163,931 patent/US7949194B2/en active Active
- 2005-11-29 JP JP2005344110A patent/JP4921780B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7949194B2 (en) | 2011-05-24 |
JP2007028574A (en) | 2007-02-01 |
TW200706000A (en) | 2007-02-01 |
TWI280803B (en) | 2007-05-01 |
US20070019732A1 (en) | 2007-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4921780B2 (en) | Method and apparatus for motion prediction | |
US9154790B2 (en) | Methods for encoding/decoding of video using common merging candidate set of asymmetric partitions | |
US8391362B2 (en) | Motion vector estimation apparatus and motion vector estimation method | |
CN101389025B (en) | Motion refinement engine for use in video encoding in accordance with a plurality of sub-pixel resolutions and methods for use therewith | |
JP4735375B2 (en) | Image processing apparatus and moving image encoding method. | |
KR101621358B1 (en) | Hevc encoding device and method for deciding intra prediction mode for the same | |
CN1750656B (en) | Encoding and decoding images | |
US7471725B2 (en) | Segmented motion estimation with no search for small block sizes | |
US7236634B2 (en) | Image encoding of moving pictures | |
JP2007026459A (en) | Method and apparatus for global-to-local block motion estimation | |
US7027511B2 (en) | Fast motion estimation using N-queen pixel decimation | |
WO2006058331A1 (en) | Temporal prediction in video coding | |
CN101325710A (en) | Motion refinement engine with a plurality of cost calculation methods for use in video encoding and methods for use therewith | |
US6907074B2 (en) | Apparatus and method for performing mixed motion estimation based on hierarchical search | |
JPH08265777A (en) | Movement vector determination method using hierarchical movement presumption | |
JPH11511621A (en) | Method and apparatus for determining optimal motion vector based on hierarchical motion estimation technology | |
JP2004520744A5 (en) | ||
US20060109909A1 (en) | Decision mechanism for partition types of macro block | |
CN111031317A (en) | Encoding and decoding method, device and equipment | |
US8718391B2 (en) | Random access image encoding system and method | |
US20020080880A1 (en) | Effective motion estimation for hierarchical search | |
Lin et al. | Multistage spatial context models for learned image compression | |
CN101325709A (en) | Motion refinement engine with selectable partitionings for use in video encoding and methods for use therewith | |
US8170104B2 (en) | Apparatus and method for motion vector prediction | |
US20110110430A1 (en) | Method for motion estimation in multimedia images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080901 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090827 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20091112 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100318 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120203 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |