JP6490203B2 - 画像予測方法および関連装置 - Google Patents
画像予測方法および関連装置 Download PDFInfo
- Publication number
- JP6490203B2 JP6490203B2 JP2017517269A JP2017517269A JP6490203B2 JP 6490203 B2 JP6490203 B2 JP 6490203B2 JP 2017517269 A JP2017517269 A JP 2017517269A JP 2017517269 A JP2017517269 A JP 2017517269A JP 6490203 B2 JP6490203 B2 JP 6490203B2
- Authority
- JP
- Japan
- Prior art keywords
- motion information
- information unit
- image block
- pixel
- unit set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 143
- 230000033001 locomotion Effects 0.000 claims description 2590
- 239000013598 vector Substances 0.000 claims description 470
- 230000010354 integration Effects 0.000 claims description 78
- 230000008569 process Effects 0.000 claims description 52
- 238000004364 calculation method Methods 0.000 claims description 27
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 18
- 238000012545 processing Methods 0.000 description 34
- 230000002457 bidirectional effect Effects 0.000 description 24
- 230000006399 behavior Effects 0.000 description 18
- 238000012216 screening Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000005192 partition Methods 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002594 fluoroscopy Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/567—Motion estimation based on rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Analysis (AREA)
Description
画像ブロックx内のK1個の画素サンプルを決定して、K1個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットを決定するステップであって、各画素サンプルに対応する候補動き情報ユニットセットは、少なくとも1つの候補動き情報ユニットを含み、K1は、2以上の整数である、ステップと、
K1個の動き情報ユニットを含む統合動き情報ユニットセットiを決定するステップであって、
統合動き情報ユニットセットi内の各動き情報ユニットは、K1個の画素サンプル内の異なる画素サンプルに対応する候補動き情報ユニットセット内の動き情報ユニットの少なくとも一部から選択され、動き情報ユニットは、予測方向が順方向である動きベクトルおよび/または予測方向が逆方向である動きベクトルを含む、ステップと、
非並進動作モデルおよび統合動き情報ユニットセットiを用いて画像ブロックxの画素値を予測するステップと
を含む。
N個の候補統合動き情報ユニットセットから、K1個の動き情報ユニットを含む統合動き情報ユニットセットiを決定するステップであって、N個の候補統合動き情報ユニットセット内の各候補統合動き情報ユニットセットに含まれる各動き情報ユニットは、K1個の画素サンプルの異なる画素サンプルに対応する候補動き情報ユニットセット内の制約対応動き情報ユニットの少なくとも一部から選択され、Nは正の整数であり、N個の候補統合動き情報ユニットセットは互いに異なっており、N個の候補統合動き情報ユニットセット内の各候補統合動き情報ユニットセットは、K1個の動き情報ユニットを含む、ステップを含む。
第1の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の動き情報ユニットによって示される画像ブロックxの動きモードが非並進動作であることを含み、
第2の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の少なくとも2つの動き情報ユニットの予測方向が同一であることを含み、
第3の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の少なくとも2つの動き情報ユニットに対応する参照フレームインデックスが同一であり、
第4の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の2つの動き情報ユニットの水平成分の差の絶対値が水平成分閾値以下であることを含み、
第5の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の2つの動き情報ユニットの垂直成分の差の絶対値が垂直成分閾値以下であることを含む。
画像ブロックxの左上の画素サンプルは画像ブロックxの左上の頂点であるか、画像ブロックxの左上の頂点を含む画像ブロックx内の画素ブロックであり、画像ブロックxの左下の画素サンプルは、画像ブロックxの左下の頂点、または画像ブロックxの左下の頂点を含む画像ブロックx内の画素ブロックであり、画像ブロックxの右上の画素サンプルは、画像ブロックxの右上の頂点、または画像ブロックxの右上の頂点を含む画像ブロックx内の画素ブロックであり、画像ブロックxの中央の画素サンプルa1は、画像ブロックxの中央の画素、または画像ブロックxの中央の画素を含む画像ブロックx内の画素ブロックである。
画像ブロックxの左上の画素サンプルに対応する候補動き情報ユニットセットは、x1個の画素サンプルの動き情報ユニットを含み、x1個の画素サンプルは、画像ブロックxの左上の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または画像ブロックxの左上の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを含み、x1は正の整数であり、
x1個の画素サンプルは、画像ブロックxの左上の画素サンプルと同じ位置を有する画素サンプル、画像ブロックxの左端に空間的に隣接する画素サンプル、画像ブロックxの左上に空間的に隣接する画素サンプル、または画像ブロックxの上端に空間的に隣接する画素サンプルの内の少なくとも1つを、画像ブロックxが属する映像フレームに時間的に隣接している映像フレーム内に有する。
画像ブロックxの右上の画素サンプルに対応する候補動き情報ユニットセットは、x2個の画素サンプルの動き情報ユニットを含み、x2個の画素サンプルは、画像ブロックxの右上の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または画像ブロックxの右上の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを含み、x2は正の整数であり、
x2個の画素サンプルは、画像ブロックxの右上の画素サンプルと同じ位置を有する画素サンプル、画像ブロックxの右端に空間的に隣接する画素サンプル、画像ブロックxの右上に空間的に隣接する画素サンプル、または画像ブロックxの上端に空間的に隣接する画素サンプルの内の少なくとも1つを、画像ブロックxが属する映像フレームに時間的に隣接している映像フレーム内に有する。
x3個の画素サンプルは、画像ブロックxの左下の画素サンプルと同じ位置を有する画素サンプル、画像ブロックxの左端に空間的に隣接する画素サンプル、画像ブロックxの左下に空間的に隣接する画素サンプル、または画像ブロックxの下端に空間的に隣接する画素サンプルの内の少なくとも1つを、画像ブロックxが属する映像フレームに時間的に隣接している映像フレーム内に有する。
画像ブロックxの中央の画素サンプルa1に対応する候補動き情報ユニットセットはx5個の画素サンプルの動き情報ユニットを含み、x5個の画素サンプルの1つの画素サンプルが、画素サンプルa2であり、
画像ブロックxが属する映像フレーム内の中央の画素サンプルa1の位置は、画像ブロックxが属する映像フレームに隣接する映像フレーム内の画素サンプルa2の位置と同じであり、x5は正の整数である。
非並進動作モデルおよび統合動き情報ユニットセットiを用いて画像ブロックxの画素値を予測するステップは、統合動き情報ユニットセットiにおける予測方向が第1の予測方向である動きベクトルが異なる参照フレームインデックスに対応する場合、統合動き情報ユニットセットiにおける予測方向が第1の予測方向である動きベクトルを同一の参照フレームに縮小するように、統合動き情報ユニットセットiに対してスケーリング処理を行うステップと、非並進動作モデルおよび縮小された統合動き情報ユニットセットiを用いて画像ブロックxの画素値を予測するステップであって、第1の予測方向が順方向または逆方向である、ステップとを含み、または、
非並進動作および統合動き情報ユニットセットiを用いて画像ブロックxの画素値を予測するステップは、
統合動き情報ユニットセットiにおいて予測方向が順方向である動きベクトルが異なる参照フレームインデックスに対応し、統合動き情報ユニットセットiにおいて予測方向が逆方向である動きベクトルが異なる参照フレームインデックスに対応した場合、統合動き情報ユニットセットiにおいて予測方向が順方向である動きベクトルが同一の参照フレームに縮小され、統合動き情報ユニットセットiにおいて予測方向が逆方向である動きベクトルが同一の参照フレームに縮小するように、統合動き情報ユニットセットiに対してスケーリング処理を行うステップと、非並進動作モデルおよび縮小された統合動き情報ユニットセットiとを用いて画像ブロックxの画素値を予測するステップとを含む。
この方法は、
画像ブロックy内のK2個の画素サンプルを決定して、K2個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットを決定するステップであって、K2は1より大きい整数であり、画像ブロックyは画像ブロックxに空間的に隣接しており、K2個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットは、少なくとも1つの候補動き情報ユニットを含む、ステップと、
K2個の動き情報ユニットを含む統合動き情報ユニットセットjを決定するステップであって、
K2個の画素サンプルの画素サンプルz1に対応する候補動き情報ユニットセットは動き情報ユニットa2を含み、動き情報ユニットa2は、画素サンプルz2の動き情報ユニットに基づいて求められ、画素サンプルz2は、画像ブロックx内の画素サンプルであり、画素サンプルz2と画素サンプルz1との間の距離が閾値未満であるか、または画素サンプルz2は、画像ブロックx内の画素サンプルであり、画素サンプルz2と画素サンプルz1との間の距離は最短であり、統合動き情報ユニットセットj内のK2個の動き情報ユニットは、K2個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセット内の制約対応動き情報ユニットの少なくとも一部からそれぞれ選択される、ステップと、
非並進動作モデルおよび統合動き情報ユニットセットjを用いて画像ブロックyの画素値を予測するステップと
をさらに含む。
非並進動作モデルは、アフィン運動モデル、放物線運動モデル、回転運動モデル、遠近法運動モデル、せん断運動モデル、スケーリング運動モデル、または双線形運動モデルの内のいずれか1つである。
非並進動作モデルおよび統合動き情報ユニットセットiを用いて画像ブロックxの画素値を予測するステップは、
非並進動作モデルおよび統合動き情報ユニットセットiを用いて計算により画像ブロックxの各画素の動きベクトルを求めて、画像ブロックx内の各画素の求められた動きベクトルを用いて画像ブロックx内の各画素の予測画素値を決定するステップ、または、
非並進動作モデルおよび統合動き情報ユニットセットiを用いて計算により画像ブロックxの各画素ブロックの動きベクトルを求めて、画像ブロックx内の各画素ブロックの求められた動きベクトルを用いて画像ブロックx内の各画素ブロックの各画素の予測画素値を決定するステップを含む。
画像予測方法は映像符号化処理に適用されるか、または画像予測方法は映像復号処理に適用される。
画像ブロックx内のK1個の画素サンプルを決定して、K1個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットを決定するように構成された第1の決定部であって、各画素サンプルに対応する候補動き情報ユニットセットは、少なくとも1つの候補動き情報ユニットを含み、K1は、2以上の整数である、第1の決定部と、
K1個の動き情報ユニットを含む統合動き情報ユニットセットiを決定するように構成された第2の決定部であって、統合動き情報ユニットセットi内の各動き情報ユニットは、K1個の画素サンプル内の異なる画素サンプルに対応する候補動き情報ユニットセット内の動き情報ユニットの少なくとも一部から選択され、動き情報ユニットは、予測方向が順方向である動きベクトルおよび/または予測方向が逆方向である動きベクトルを含む、第2の決定部と、
非並進動作モデルおよび統合動き情報ユニットセットiを用いて画像ブロックxの画素値を予測するように構成された予測部と
を含む。
第2の決定部は、N個の候補統合動き情報ユニットセットから、K1個の動き情報ユニットを含む統合動き情報ユニットセットiを決定するように特に構成され、N個の候補統合動き情報ユニットセット内の各候補統合動き情報ユニットセットに含まれる各動き情報ユニットは、K1個の画素サンプルの異なる画素サンプルに対応する候補動き情報ユニットセット内の制約対応動き情報ユニットの少なくとも一部から選択され、Nは正の整数であり、N個の候補統合動き情報ユニットセットは互いに異なっており、N個の候補統合動き情報ユニットセット内の各候補統合動き情報ユニットセットは、K1個の動き情報ユニットを含む。
第1の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の動き情報ユニットによって示される画像ブロックxの動きモードが非並進動作であることを含み、
第2の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の少なくとも2つの動き情報ユニットの予測方向が同一であることを含み、
第3の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の少なくとも2つの動き情報ユニットに対応する参照フレームインデックスが同一であり、
第4の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の2つの動き情報ユニットの水平成分の差の絶対値が水平成分閾値以下であることを含み、
第5の条件は、N個の候補統合動き情報ユニットセット内の候補統合動き情報ユニットセット内の2つの動き情報ユニットの垂直成分の差の絶対値が垂直成分閾値以下であることを含む。
画像ブロックxの左上の画素サンプルは画像ブロックxの左上の頂点であるか、画像ブロックxの左上の頂点を含む画像ブロックx内の画素ブロックであり、画像ブロックxの左下の画素サンプルは、画像ブロックxの左下の頂点、または画像ブロックxの左下の頂点を含む画像ブロックx内の画素ブロックであり、画像ブロックxの右上の画素サンプルは、画像ブロックxの右上の頂点、または画像ブロックxの右上の頂点を含む画像ブロックx内の画素ブロックであり、画像ブロックxの中央の画素サンプルa1は、画像ブロックxの中央の画素、または画像ブロックxの中央の画素を含む画像ブロックx内の画素ブロックである。
画像ブロックxの左上の画素サンプルに対応する候補動き情報ユニットセットは、x1個の画素サンプルの動き情報ユニットを含み、x1個の画素サンプルは、画像ブロックxの左上の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または画像ブロックxの左上の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを含み、x1は正の整数であり、
x1個の画素サンプルは、画像ブロックxの左上の画素サンプルと同じ位置を有する画素サンプル、画像ブロックxの左端に空間的に隣接する画素サンプル、画像ブロックxの左上に空間的に隣接する画素サンプル、または画像ブロックxの上端に空間的に隣接する画素サンプルの内の少なくとも1つを、画像ブロックxが属する映像フレームに時間的に隣接している映像フレーム内に有する。
画像ブロックxの右上の画素サンプルに対応する候補動き情報ユニットセットは、x2個の画素サンプルの動き情報ユニットを含み、x2個の画素サンプルは、画像ブロックxの右上の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または画像ブロックxの右上の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを含み、x2は正の整数であり、
x2個の画素サンプルは、画像ブロックxの右上の画素サンプルと同じ位置を有する画素サンプル、画像ブロックxの右端に空間的に隣接する画素サンプル、画像ブロックxの右上に空間的に隣接する画素サンプル、または画像ブロックxの上端に空間的に隣接する画素サンプルの内の少なくとも1つを、画像ブロックxが属する映像フレームに時間的に隣接している映像フレーム内に有する。
x3個の画素サンプルは、画像ブロックxの左下の画素サンプルと同じ位置を有する画素サンプル、画像ブロックxの左端に空間的に隣接する画素サンプル、画像ブロックxの左下に空間的に隣接する画素サンプル、または画像ブロックxの下端に空間的に隣接する画素サンプルの内の少なくとも1つを、画像ブロックxが属する映像フレームに時間的に隣接している映像フレーム内に有する。
画像ブロックxの中央の画素サンプルa1に対応する候補動き情報ユニットセットはx5個の画素サンプルの動き情報ユニットを含み、x5個の画素サンプルの1つの画素サンプルが、画素サンプルa2であり、
画像ブロックxが属する映像フレーム内の中央の画素サンプルa1の位置は、画像ブロックxが属する映像フレームに隣接する映像フレーム内の画素サンプルa2の位置と同じであり、x5は正の整数である。
予測部は、統合動き情報ユニットセットiにおいて予測方向が順方向である動きベクトルが異なる参照フレームインデックスに対応し、統合動き情報ユニットセットiにおいて予測方向が逆方向である動きベクトルが異なる参照フレームインデックスに対応した場合、統合動き情報ユニットセットiにおいて予測方向が順方向である動きベクトルが同一の参照フレームに縮小され、統合動き情報ユニットセットiにおいて予測方向が逆方向である動きベクトルが同一の参照フレームに縮小されるように、統合動き情報ユニットセットiに対してスケーリング処理を行うように構成され、非並進動作モデルおよびスケーリングされた統合動き情報ユニットセットiを用いて画像ブロックxの画素値を予測するように特に構成される。
予測部は、非並進動作モデルおよび統合動き情報ユニットセットiを用いて、画像ブロックx内の各画素ブロックの動きベクトルを計算により求め、画像ブロックx内の各画素ブロックの求められた動きベクトルを用いて、画像ブロックx内の各画素の予測画素値を決定し、計算により求めるように特に構成されている。
第1の決定部は、画像ブロックy内のK2個の画素サンプルを決定して、K2個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットを決定するするように構成され、K2は1より大きい整数であり、画像ブロックyは画像ブロックxに空間的に隣接しており、K2個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットは、少なくとも1つの候補動き情報ユニットを含み、
第2の決定部は、さらに、K2個の動き情報ユニットを含む統合動き情報ユニットセットjを決定するように構成され、K2個の画素サンプルの画素サンプルz1に対応する候補動き情報ユニットセットは動き情報ユニットa2を含み、動き情報ユニットa2は、画素サンプルz2の動き情報ユニットに基づいて求められ、画素サンプルz2は、画像ブロックx内の画素サンプルであり、画素サンプルz2と画素サンプルz1との間の距離が閾値未満であるか、または画素サンプルz2は、画像ブロックx内の画素サンプルであり、画素サンプルz2と画素サンプルz1との間の距離は最短であり、統合動き情報ユニットセットj内のK2個の動き情報ユニットは、K2個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセット内の制約対応動き情報ユニットの少なくとも一部からそれぞれ選択され、予測部は、非並進動作モデルおよび統合動き情報ユニットセットjを用いて画像ブロックyの画素値を予測するように構成されている。
非並進動作モデルは、アフィン運動モデル、放物線運動モデル、回転運動モデル、遠近法運動モデル、せん断運動モデル、スケーリング運動モデル、または双線形運動モデルの内のいずれか1つである。
非並進動作モデルおよび統合動き情報ユニットセットiを用いて計算により画像ブロックx内の各画素ブロックの動きベクトルを求めて、画像ブロックx内の各画素ブロックの求められた動きベクトルを用いて、画像ブロックx内の各画素ブロック内の各画素の予測画素値を決定するステップを含む。
候補統合動き情報ユニットセットzの予測方向が逆方向である動きベクトルが同一の参照フレームに縮小されるように、候補統合動き情報ユニットセットに対してスケーリング処理が行われる。
510, 520 決定部
530 予測部
600 画像予測装置
601 バス
602 プロセッサ
603 メモリ
700 画像予測装置
701 プロセッサ
702 通信バス
703 ユーザインタフェース
704 ネットワークインタフェース
705 メモリ
7051 オペレーティングシステム
7052 アプリケーションプログラム
Claims (28)
- 画像ブロックx内のK1個の画素サンプルを決定して、前記K1個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットを決定するステップであって、各画素サンプルに対応する前記候補動き情報ユニットセットは、少なくとも1つの候補動き情報ユニットを備え、K1は、2以上の整数であり、前記K1個の画素サンプルは、前記画像ブロックxの左上の画素サンプル、右上の画素サンプル、左下の画素サンプル、および中央の画素サンプルa1に少なくとも2つの画素サンプルを備える、ステップと、
N個の候補統合動き情報ユニットセットから、前記K1個の動き情報ユニットを備える前記統合動き情報ユニットセットiを決定するステップであって、前記N個の候補統合動き情報ユニットセット内の各候補統合動き情報ユニットセットに備えられる各動き情報ユニットは、前記K1個の画素サンプルの異なる画素サンプルに対応する前記候補動き情報ユニットセット内の制約対応動き情報ユニットの少なくとも一部から選択され、Nは正の整数であり、前記N個の候補統合動き情報ユニットセットは互いに異なっており、前記N個の候補統合動き情報ユニットセット内の各候補統合動き情報ユニットセットは、K1個の動き情報ユニットを備え、前記動き情報ユニットは、予測方向が順方向である動きベクトルおよび/または予測方向が逆方向である動きベクトルを備える、ステップと、
非並進動作モデルおよび前記統合動き情報ユニットセットiを用いて前記画像ブロックxの画素値を予測するステップと
を備える、画像予測方法であって、
前記画像ブロックxの前記中央の画素サンプルa1に対応する候補動き情報ユニットセットはx5個の画素サンプルの動き情報ユニットを備え、前記x5個の画素サンプル内の1つの画素サンプルが画素サンプルa2であり、
前記画像ブロックxが属する映像フレーム内の前記中央の画素サンプルa1の位置は、前記画像ブロックxが属する前記映像フレームに隣接する映像フレーム内の前記画素サンプルa2の位置と同じであり、x5は正の整数である、
画像予測方法。 - 前記N個の候補統合動き情報ユニットセットは、第1の条件、第2の条件、第3の条件、第4の条件、または第5の条件のうちの少なくとも1つを満たし、
前記第1の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の動き情報ユニットによって示される前記画像ブロックxの動きモードが非並進動作であることを備え、
前記第2の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の少なくとも2つの動き情報ユニットの予測方向が同一であることを備え、
前記第3の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の少なくとも2つの動き情報ユニットに対応する参照フレームインデックスが同一であることを備え、
前記第4の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の2つの動き情報ユニットの水平成分間の差の絶対値が水平成分閾値以下であることを備え、
前記第5の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の2つの動き情報ユニットの垂直成分間の差の絶対値が垂直成分閾値以下であることを備える、
請求項1に記載の方法。 - 前記画像ブロックxの前記左上の画素サンプルは、前記画像ブロックxの左上の頂点であるか、前記画像ブロックxの左上の頂点を備える前記画像ブロックx内の画素ブロックであり、前記画像ブロックxの左下の画素サンプルは、前記画像ブロックxの左下の頂点、または前記画像ブロックxの左下の頂点を備える前記画像ブロックx内の画素ブロックであり、前記画像ブロックxの右上の画素サンプルは、前記画像ブロックxの右上の頂点、または前記画像ブロックxの右上の頂点を備える前記画像ブロックx内の画素ブロックであり、前記画像ブロックxの前記中央の画素サンプルa1は、前記画像ブロックxの中央の画素、または前記画像ブロックxの中央の画素を備える画像ブロックx内の画素ブロックである、請求項1または2に記載の方法。
- 前記画像ブロックxの前記左上の画素サンプルに対応する候補動き情報ユニットセットは、x1個の画素サンプルの動き情報ユニットを備え、前記x1個の画素サンプルは、前記画像ブロックxの前記左上の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または前記画像ブロックxの前記左上の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを備え、x1は正の整数であり、
前記x1個の画素サンプルは、前記画像ブロックxの前記左上の画素サンプルと同じ位置を有する画素サンプル、前記画像ブロックxの左端に空間的に隣接する画素サンプル、前記画像ブロックxの左上に空間的に隣接する画素サンプル、または前記画像ブロックxの上端に空間的に隣接する画素サンプルの内の少なくとも1つを、前記画像ブロックxが属する前記映像フレームに時間的に隣接している映像フレーム内に備える、請求項3に記載の方法。 - 前記画像ブロックxの前記右上の画素サンプルに対応する候補動き情報ユニットセットは、x2個の画素サンプルの動き情報ユニットを備え、前記x2個の画素サンプルは、前記画像ブロックxの前記右上の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または前記画像ブロックxの前記右上の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを備え、x2は正の整数であり、
前記x2個の画素サンプルは、前記画像ブロックxの前記右上の画素サンプルと同じ位置を有する画素サンプル、前記画像ブロックxの右端に空間的に隣接する画素サンプル、前記画像ブロックxの右上に空間的に隣接する画素サンプル、または前記画像ブロックxの前記上端に空間的に隣接する画素サンプルの内の少なくとも1つを、前記画像ブロックxが属する前記映像フレームに時間的に隣接している映像フレーム内に備える、請求項4に記載の方法。 - 前記画像ブロックxの前記左下の画素サンプルに対応する候補動き情報ユニットセットは、x3個の画素サンプルの動き情報ユニットを備え、前記x3個の画素サンプルは、前記画像ブロックxの前記左下の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または前記画像ブロックxの前記左下の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを備え、x3は正の整数であり、
前記x3個の画素サンプルは、前記画像ブロックxの前記左下の画素サンプルと同じ位置を有する画素サンプル、前記画像ブロックxの前記左端に空間的に隣接する画素サンプル、前記画像ブロックxの左下に空間的に隣接する画素サンプル、または前記画像ブロックxの下端に空間的に隣接する画素サンプルの内の少なくとも1つを、前記画像ブロックxが属する前記映像フレームに時間的に隣接している映像フレーム内に備える、請求項4または5に記載の方法。 - 前記非並進動作モデルおよび前記統合動き情報ユニットセットiを用いて前記画像ブロックxの前記画素値を予測する前記ステップは、前記統合動き情報ユニットセットiにおける予測方向が第1の予測方向である動きベクトルが異なる参照フレームインデックスに対応する場合、前記統合動き情報ユニットセットiにおける予測方向が前記第1の予測方向である前記動きベクトルを同一の参照フレームに縮小するように、前記統合動き情報ユニットセットiに対してスケーリング処理を行うステップと、前記非並進動作モデルおよび縮小された統合動き情報ユニットセットiを用いて前記画像ブロックxの前記画素値を予測するステップであって、前記第1の予測方向が順方向または逆方向である、ステップとを備え、または、
前記非並進動作モデルおよび前記統合動き情報ユニットセットiを用いて前記画像ブロックxの前記画素値を予測する前記ステップは、
前記統合動き情報ユニットセットiにおいて予測方向が順方向である動きベクトルが異なる参照フレームインデックスに対応し、前記統合動き情報ユニットセットiにおいて予測方向が逆方向である動きベクトルが異なる参照フレームインデックスに対応した場合、前記統合動き情報ユニットセットiにおいて予測方向が順方向である前記動きベクトルが同一の参照フレームに縮小され、前記統合動き情報ユニットセットiにおいて予測方向が逆方向である前記動きベクトルが同一の参照フレームに縮小するように、前記統合動き情報ユニットセットiに対してスケーリング処理を行うステップと、前記非並進動作モデルおよび縮小された統合動き情報ユニットセットiとを用いて前記画像ブロックxの前記画素値を予測するステップとを備える、請求項1から6のいずれか一項に記載の方法。 - 画像ブロックy内のK2個の画素サンプルを決定して、前記K2個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットを決定するステップであって、K2は1より大きい整数であり、前記画像ブロックyは前記画像ブロックxに空間的に隣接し、前記K2個の画素サンプル内の各画素サンプルに対応する前記候補動き情報ユニットセットは、少なくとも1つの候補動き情報ユニットを備える、ステップと、
K2個の動き情報ユニットを備える統合動き情報ユニットセットjを決定するステップであって、
前記K2個の画素サンプルの画素サンプルz1に対応する候補動き情報ユニットセットは動き情報ユニットa2を備え、前記動き情報ユニットa2は、画素サンプルz2の動き情報ユニットに基づいて求められ、前記画素サンプルz2は、前記画像ブロックx内の画素サンプルであり、前記画素サンプルz2と前記画素サンプルz1との間の距離が閾値未満であるか、または前記画素サンプルz2は、前記画像ブロックx内の画素サンプルであり、前記画素サンプルz2と前記画素サンプルz1との間の距離は最短であり、前記統合動き情報ユニットセットj内の前記K2個の動き情報ユニットは、前記K2個の画素サンプル内の各画素サンプルに対応する前記候補動き情報ユニットセット内の制約対応動き情報ユニットの少なくとも一部からそれぞれ選択される、ステップと、
前記非並進動作モデルおよび前記統合動き情報ユニットセットjを用いて前記画像ブロックyの画素値を予測するステップと
をさらに備える、請求項1から7のいずれか一項に記載の方法。 - 前記非並進動作モデルは、アフィン動きモデル、放物線動作モデル、回転動作モデル、遠近法動作モデル、せん断運動モデル、スケーリング動作モデル、または双線形動作モデルの内のいずれか1つである、請求項1から8のいずれか一項に記載の方法。
- 前記非並進動作モデルおよび前記統合動き情報ユニットセットiを用いて前記画像ブロックxの前記画素値を予測する前記ステップは、
前記非並進動作モデルおよび前記統合動き情報ユニットセットi用いて計算により前記画像ブロックxの各画素の動きベクトルを求めて、前記画像ブロックx内の各画素の求められた前記動きベクトルを用いて前記画像ブロックx内の各画素の予測画素値を決定するステップ、または、
前記非並進動作モデルおよび前記統合動き情報ユニットセットiを用いて計算により前記画像ブロックxの各画素ブロックの動きベクトルを求めて、前記画像ブロックx内の各画素ブロックの求められた前記動きベクトルを用いて前記画像ブロックx内の各画素ブロックの各画素の予測画素値を決定するステップと備える、請求項1から9のいずれか一項に記載の方法。 - 前記画像予測方法は、映像符号化処理に適用されるか、または前記画像予測方法は、映像復号処理に適用される、請求項1から10のいずれか一項に記載の方法。
- 前記画像予測方法が前記映像復号処理に適用される場合、N個の候補統合動き情報ユニットセットから、前記K1個の動き情報ユニットを備える前記統合動き情報ユニットセットiを決定する前記ステップは、前記N個の候補統合動き情報ユニットセットから、前記統合動き情報ユニットセットiであり、映像ビットストリームから得られる識別子に基づいて、前記K1個の動き情報ユニットを備える前記統合動き情報ユニットセットiを決定するステップを備える、請求項11に記載の方法。
- 前記画像予測方法が前記映像符号化処理に適用される場合、N個の候補統合動き情報ユニットセットから、前記K1個の動き情報ユニットを備える前記統合動き情報ユニットセットiを決定する前記ステップは、前記N個の候補統合動き情報ユニットセットから、歪みまたはレート歪みコストに従って、前記K1個の動き情報ユニットを備える前記統合動き情報ユニットセットiを決定するステップを備える、請求項11に記載の方法。
- 前記画像予測方法が前記映像符号化処理に適用される場合、前記統合動き情報ユニットセットiの識別子を映像ビットストリームに書き込むステップをさらに備える、請求項11または13に記載の方法。
- 画像ブロックx内のK1個の画素サンプルを決定して、前記K1個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットを決定するように構成された第1の決定部であって、各画素サンプルに対応する前記候補動き情報ユニットセットは、少なくとも1つの候補動き情報ユニットを備え、K1は、2以上の整数であり、前記K1個の画素サンプルは、前記画像ブロックxの左上の画素サンプル、右上の画素サンプル、左下の画素サンプル、および中央の画素サンプルa1に少なくとも2つの画素サンプルを備える、第1の決定部と、
N個の候補統合動き情報ユニットセットから、前記K1個の動き情報ユニットを備える統合動き情報ユニットセットiを決定するように構成された第2の決定部であって、前記N個の候補統合動き情報ユニットセット内の各候補統合動き情報ユニットセットに備えられる各動き情報ユニットは、前記K1個の画素サンプルの異なる画素サンプルに対応する前記候補動き情報ユニットセット内の制約対応動き情報ユニットの少なくとも一部から選択され、Nは正の整数であり、前記N個の候補統合動き情報ユニットセットは互いに異なっており、前記N個の候補統合動き情報ユニットセット内の各候補統合動き情報ユニットセットは、K1個の動き情報ユニットを備え、前記動き情報ユニットは、予測方向が順方向である動きベクトルおよび/または予測方向が逆方向である動きベクトルを備える、第2の決定部と、
非並進動作モデルおよび前記統合動き情報ユニットセットiを用いて前記画像ブロックxの画素値を予測するように構成された予測部と
を備える、画像予測装置であって、
前記画像ブロックxの前記中央の画素サンプルa1に対応する候補動き情報ユニットセットはx5個の画素サンプルの動き情報ユニットを備え、前記x5個の画素サンプル内の1つの画素サンプルが画素サンプルa2であり、
前記画像ブロックxが属する映像フレーム内の前記中央の画素サンプルa1の位置は、前記画像ブロックxが属する前記映像フレームに隣接する映像フレーム内の前記画素サンプルa2の位置と同じであり、x5は正の整数である、
画像予測装置。 - 前記N個の候補統合動き情報ユニットセットは、第1の条件、第2の条件、第3の条件、第4の条件、または第5の条件のうちの少なくとも1つを満たし、
前記第1の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の動き情報ユニットによって示される前記画像ブロックxの動きモードが非並進動作であることを備え、
前記第2の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の少なくとも2つの動き情報ユニットの予測方向が同一であることを備え、
前記第3の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の少なくとも2つの動き情報ユニットに対応する参照フレームインデックスが同一であることを備え、
前記第4の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の2つの動き情報ユニットの水平成分間の差の絶対値が水平成分閾値以下であることを備え、
前記第5の条件は、前記N個の候補統合動き情報ユニットセット内の任意の候補統合動き情報ユニットセット内の2つの動き情報ユニットの垂直成分間の差の絶対値が垂直成分閾値以下であることを備える、請求項15に記載の装置。 - 前記画像ブロックxの前記左上の画素サンプルは、前記画像ブロックxの左上の頂点であるか、前記画像ブロックxの左上の頂点を備える前記画像ブロックx内の画素ブロックであり、前記画像ブロックxの左下の画素サンプルは、前記画像ブロックxの左下の頂点、または前記画像ブロックxの左下の頂点を備える前記画像ブロックx内の画素ブロックであり、前記画像ブロックxの右上の画素サンプルは、前記画像ブロックxの右上の頂点、または前記画像ブロックxの右上の頂点を備える前記画像ブロックx内の画素ブロックであり、前記画像ブロックxの前記中央の画素サンプルa1は、前記画像ブロックxの中央の画素、または前記画像ブロックxの中央の画素を備える画像ブロックx内の画素ブロックである、請求項15または16のいずれか一項に記載の装置。
- 前記画像ブロックxの前記左上の画素サンプルに対応する候補動き情報ユニットセットは、x1個の画素サンプルの動き情報ユニットを備え、前記x1個の画素サンプルは、前記画像ブロックxの前記左上の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または前記画像ブロックxの前記左上の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを備え、x1は正の整数であり、
前記x1個の画素サンプルは、前記画像ブロックxの前記左上の画素サンプルと同じ位置を有する画素サンプル、前記画像ブロックxの左端に空間的に隣接する画素サンプル、前記画像ブロックxの左上に空間的に隣接する画素サンプル、または前記画像ブロックxの上端に空間的に隣接する画素サンプルの内の少なくとも1つを、前記画像ブロックxが属する前記映像フレームに時間的に隣接している映像フレーム内に備える、請求項17に記載の装置。 - 前記画像ブロックxの前記右上の画素サンプルに対応する候補動き情報ユニットセットは、x2個の画素サンプルの動き情報ユニットを備え、前記x2個の画素サンプルは、前記画像ブロックxの前記右上の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または前記画像ブロックxの前記右上の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを備え、x2は正の整数であり、
前記x2個の画素サンプルは、前記画像ブロックxの前記右上の画素サンプルと同じ位置を有する画素サンプル、前記画像ブロックxの右端に空間的に隣接する画素サンプル、前記画像ブロックxの右上に空間的に隣接する画素サンプル、または前記画像ブロックxの前記上端に空間的に隣接する画素サンプルの内の少なくとも1つを、前記画像ブロックxが属する前記映像フレームに時間的に隣接している映像フレーム内に備える、請求項18に記載の装置。 - 前記画像ブロックxの前記左下の画素サンプルに対応する候補動き情報ユニットセットは、x3個の画素サンプルの動き情報ユニットを備え、前記x3個の画素サンプルは、前記画像ブロックxの前記左下の画素サンプルに空間的に隣接する少なくとも1つの画素サンプルおよび/または前記画像ブロックxの前記左下の画素サンプルに時間的に隣接する少なくとも1つの画素サンプルを備え、x3は正の整数であり、
前記x3個の画素サンプルは、前記画像ブロックxの前記左下の画素サンプルと同じ位置を有する画素サンプル、前記画像ブロックxの前記左端に空間的に隣接する画素サンプル、前記画像ブロックxの左下に空間的に隣接する画素サンプル、または前記画像ブロックxの下端に空間的に隣接する画素サンプルの内の少なくとも1つを、前記画像ブロックxが属する前記映像フレームに時間的に隣接している映像フレーム内に備える、請求項18または19に記載の装置。 - 前記統合動き情報ユニットセットiにおける予測方向が第1の予測方向である動きベクトルが異なる参照フレームインデックスに対応する場合、前記予測部は、前記統合動き情報ユニットセットiにおける予測方向が前記第1の予測方向である前記動きベクトルを同一の参照フレームに縮小するように、前記統合動き情報ユニットセットiに対してスケーリング処理を行い、前記非並進動作モデルおよび縮小された統合動き情報ユニットセットiを用いて前記画像ブロックxの前記画素値を予測するように構成され、前記第1の予測方向が順方向または逆方向であり、または、
前記予測部は、前記統合動き情報ユニットセットiにおいて予測方向が順方向である動きベクトルが異なる参照フレームインデックスに対応し、前記統合動き情報ユニットセットiにおいて予測方向が逆方向である動きベクトルが異なる参照フレームインデックスに対応した場合、前記統合動き情報ユニットセットiにおいて予測方向が順方向である前記動きベクトルが同一の参照フレームに縮小され、前記統合動き情報ユニットセットiにおいて予測方向が逆方向である前記動きベクトルが同一の参照フレームに縮小するように、前記統合動き情報ユニットセットiに対してスケーリング処理を行い、前記非並進動作モデルおよび縮小された統合動き情報ユニットセットiを用いて前記画像ブロックxの前記画素値を予測するように構成されている、請求項15から20のいずれか一項に記載の装置。 - 前記予測部は、前記非並進動作モデルおよび前記統合動き情報ユニットセットi用いて計算により前記画像ブロックxの各画素の動きベクトルを求めて、前記画像ブロックx内の各画素の求められた前記動きベクトルを用いて前記画像ブロックx内の各画素の予測画素値を決定するように構成され、または、
前記予測部は、前記非並進動作モデルおよび前記統合動き情報ユニットセットiを用いて計算により前記画像ブロックxの各画素ブロックの動きベクトルを求めて、前記画像ブロックx内の各画素ブロックの求められた前記動きベクトルを用いて前記画像ブロックx内の各画素ブロックの各画素の予測画素値を決定するように構成された、請求項15から21のいずれか一項に記載の装置。 - 前記第1の決定部は、画像ブロックy内のK2個の画素サンプルを決定して、前記K2個の画素サンプル内の各画素サンプルに対応する候補動き情報ユニットセットを決定するようにさらに構成され、K2は1より大きい整数であり、前記画像ブロックyは前記画像ブロックxに空間的に隣接しており、前記K2個の画素サンプル内の各画素サンプルに対応する前記候補動き情報ユニットセットは、少なくとも1つの候補動き情報ユニットを備え、
前記第2の決定部は、K2個の動き情報ユニットを備える統合動き情報ユニットセットjを決定するようにさらに構成され、K2個の画素サンプルの画素サンプルz1に対応する候補動き情報ユニットセットは動き情報ユニットa2を含み、前記動き情報ユニットa2は、画素サンプルz2の動き情報ユニットに基づいて求められ、前記画素サンプルz2が前記画像ブロックx内の画素サンプルであり、前記画素サンプルz2と前記画素サンプルz1との間の距離が閾値未満であるか、または前記画素サンプルz2は、前記画像ブロックx内の画素サンプルであり、前記画素サンプルz2と前記画素サンプルz1との間の距離は最短であり、前記統合動き情報ユニットセットj内の前記K2個の動き情報ユニットは、前記K2個の画素サンプル内の各画素サンプルに対応する前記候補動き情報ユニットセット内の制約対応動き情報ユニットの少なくとも一部からそれぞれ選択され、
前記予測部は、前記非並進動作モデルおよび前記統合動き情報ユニットセットjを用いて前記画像ブロックyの画素値を予測するようにさらに構成されている、請求項15から22のいずれか一項に記載の装置。 - 前記非並進動作モデルは、アフィン動きモデル、放物線動作モデル、回転動作モデル、遠近法動作モデル、せん断運動モデル、スケーリング動作モデル、または双線形動作モデルの内のいずれか1つである、請求項15から23のいずれか一項に記載の装置。
- 前記画像予測装置は、映像符号化装置に適用されるか、または前記画像予測装置は、映像復号装置に適用される、請求項15から24のいずれか一項に記載の装置。
- 前記画像予測装置が前記映像符号化装置に適用される場合、前記第2の決定部は、前記N個の候補統合動き情報ユニットセットから、歪みまたはレート歪みコストに従って、前記K1個の動き情報ユニットを備える前記統合動き情報ユニットセットiを決定するように構成されている、請求項25に記載の装置。
- 前記画像予測装置が前記映像符号化装置に適用される場合、前記予測部は、前記統合動き情報ユニットセットiの識別子を映像ビットストリームに書き込むようにさらに構成されている、請求項25または26に記載の装置。
- 前記画像予測装置が前記映像復号装置に適用される場合、前記第2の決定部は、前記N個の候補統合動き情報ユニットセットから、前記統合動き情報ユニットセットiであり、かつ映像ビットストリームから得られる識別子に基づいて、前記K1個の動き情報ユニットを備える前記統合動き情報ユニットセットiを決定するように構成されている、請求項25に記載の装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018230221A JP7313816B2 (ja) | 2014-10-27 | 2018-12-07 | 画像予測方法および関連装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410584175.1A CN104363451B (zh) | 2014-10-27 | 2014-10-27 | 图像预测方法及相关装置 |
CN201410584175.1 | 2014-10-27 | ||
PCT/CN2015/077295 WO2016065873A1 (zh) | 2014-10-27 | 2015-04-23 | 图像预测方法及相关装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018230221A Division JP7313816B2 (ja) | 2014-10-27 | 2018-12-07 | 画像予測方法および関連装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017536002A JP2017536002A (ja) | 2017-11-30 |
JP6490203B2 true JP6490203B2 (ja) | 2019-03-27 |
Family
ID=52530673
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017517269A Active JP6490203B2 (ja) | 2014-10-27 | 2015-04-23 | 画像予測方法および関連装置 |
JP2018230221A Active JP7313816B2 (ja) | 2014-10-27 | 2018-12-07 | 画像予測方法および関連装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018230221A Active JP7313816B2 (ja) | 2014-10-27 | 2018-12-07 | 画像予測方法および関連装置 |
Country Status (6)
Country | Link |
---|---|
US (5) | US10440380B2 (ja) |
EP (2) | EP3177015B1 (ja) |
JP (2) | JP6490203B2 (ja) |
KR (4) | KR102013771B1 (ja) |
CN (1) | CN104363451B (ja) |
WO (1) | WO2016065873A1 (ja) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104363451B (zh) * | 2014-10-27 | 2019-01-25 | 华为技术有限公司 | 图像预测方法及相关装置 |
BR112017019264B1 (pt) * | 2015-03-10 | 2023-12-12 | Huawei Technologies Co., Ltd | Método de predição de imagem e dispositivo relacionado |
CN109005407B (zh) | 2015-05-15 | 2023-09-01 | 华为技术有限公司 | 视频图像编码和解码的方法、编码设备和解码设备 |
CN106331722B (zh) * | 2015-07-03 | 2019-04-26 | 华为技术有限公司 | 图像预测方法和相关设备 |
CN105163116B (zh) | 2015-08-29 | 2018-07-31 | 华为技术有限公司 | 图像预测的方法及设备 |
CN106559669B (zh) | 2015-09-29 | 2018-10-09 | 华为技术有限公司 | 预测图像编解码方法及装置 |
WO2017069419A1 (ko) * | 2015-10-22 | 2017-04-27 | 엘지전자 주식회사 | 비디오 코딩 시스템에서 인트라 예측 방법 및 장치 |
CN105681807B (zh) * | 2016-01-06 | 2018-11-02 | 福州瑞芯微电子股份有限公司 | 一种基于h264协议的分像素运动矢量计算方法和装置 |
US20190158870A1 (en) * | 2016-01-07 | 2019-05-23 | Mediatek Inc. | Method and apparatus for affine merge mode prediction for video coding system |
CN117354536A (zh) * | 2016-02-25 | 2024-01-05 | 株式会社Kt | 用于处理视频信号的方法和设备 |
SG11201806865YA (en) | 2016-03-15 | 2018-09-27 | Mediatek Inc | Method and apparatus of video coding with affine motion compensation |
WO2017156705A1 (en) * | 2016-03-15 | 2017-09-21 | Mediatek Inc. | Affine prediction for video coding |
US10560712B2 (en) | 2016-05-16 | 2020-02-11 | Qualcomm Incorporated | Affine motion prediction for video coding |
CN109076234A (zh) * | 2016-05-24 | 2018-12-21 | 华为技术有限公司 | 图像预测方法和相关设备 |
US10448010B2 (en) * | 2016-10-05 | 2019-10-15 | Qualcomm Incorporated | Motion vector prediction for affine motion models in video coding |
CN108271023B (zh) | 2017-01-04 | 2021-11-19 | 华为技术有限公司 | 图像预测方法和相关设备 |
CN107318024A (zh) * | 2017-06-27 | 2017-11-03 | 北京奇艺世纪科技有限公司 | 基于运动场的视频编码方法及装置 |
US11877001B2 (en) | 2017-10-10 | 2024-01-16 | Qualcomm Incorporated | Affine prediction in video coding |
KR102357142B1 (ko) * | 2017-11-07 | 2022-02-08 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 비디오 코딩을 위한 인터 예측 장치 및 방법을 위한 보간 필터 |
WO2019117659A1 (ko) * | 2017-12-14 | 2019-06-20 | 엘지전자 주식회사 | 움직임 벡터 도출을 기반으로 하는 영상 코딩 방법 및 그 장치 |
US20190208211A1 (en) * | 2018-01-04 | 2019-07-04 | Qualcomm Incorporated | Generated affine motion vectors |
KR20200131231A (ko) * | 2018-03-16 | 2020-11-23 | 소니 주식회사 | 화상 처리 장치와 화상 처리 방법 |
WO2019203504A1 (ko) * | 2018-04-15 | 2019-10-24 | 엘지전자 주식회사 | 비디오 처리 시스템에서 움직임 정보에 대한 저장 공간을 감소시키는 방법 및 장치 |
EP3794819A4 (en) * | 2018-05-23 | 2022-12-07 | HFI Innovation Inc. | METHOD AND APPARATUS FOR VIDEO CODING WITH BI-DIRECTIONAL CU WEIGHTS |
WO2019244719A1 (en) * | 2018-06-18 | 2019-12-26 | Sharp Kabushiki Kaisha | Systems and methods for performing affine motion compensation prediction for coding of video data |
TWI746994B (zh) | 2018-06-19 | 2021-11-21 | 大陸商北京字節跳動網絡技術有限公司 | 用於不同參考列表的不同精確度 |
CN118301334A (zh) | 2018-07-11 | 2024-07-05 | 华为技术有限公司 | 视频编码器、视频解码器及相应方法 |
CN117528072A (zh) | 2018-07-13 | 2024-02-06 | Lg电子株式会社 | 解码设备、编码设备和发送用于视频的数据的设备 |
CN116708816A (zh) * | 2018-08-09 | 2023-09-05 | Lg电子株式会社 | 编码设备、解码设备和数据发送设备 |
WO2020038232A1 (zh) * | 2018-08-21 | 2020-02-27 | 华为技术有限公司 | 一种图像块的运动信息的预测方法及装置 |
EP4325859A3 (en) * | 2018-09-19 | 2024-05-15 | Beijing Bytedance Network Technology Co., Ltd. | Syntax reuse for affine mode with adaptive motion vector resolution |
CN110933426B (zh) * | 2018-09-20 | 2022-03-01 | 杭州海康威视数字技术股份有限公司 | 一种解码、编码方法及其设备 |
CN112740663B (zh) * | 2018-09-24 | 2022-06-14 | 华为技术有限公司 | 图像预测方法、装置以及相应的编码器和解码器 |
CN115514958A (zh) | 2018-11-02 | 2022-12-23 | 抖音视界有限公司 | 用于基于历史的运动矢量预测的表维护 |
CN112997493B (zh) * | 2018-11-13 | 2024-01-05 | 北京字节跳动网络技术有限公司 | 用于单一类型运动候选列表的构建方法 |
US11024041B2 (en) * | 2018-12-10 | 2021-06-01 | Intel Corporation | Depth and motion estimations in machine learning environments |
WO2020156517A1 (en) | 2019-01-31 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Fast algorithms for symmetric motion vector difference coding mode |
KR20210121021A (ko) | 2019-01-31 | 2021-10-07 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 어파인 모드 적응적 움직임 벡터 해상도 코딩 문맥 |
CN111526362B (zh) * | 2019-02-01 | 2023-12-29 | 华为技术有限公司 | 帧间预测方法和装置 |
CN111698506B (zh) | 2019-03-11 | 2022-04-26 | 杭州海康威视数字技术股份有限公司 | 运动信息候选者列表构建方法、三角预测解码方法及装置 |
CN112204983A (zh) * | 2019-09-24 | 2021-01-08 | 北京大学 | 一种视频处理方法、设备及存储介质 |
EP4143843A1 (en) * | 2020-05-01 | 2023-03-08 | Given Imaging Ltd. | Systems and methods for selecting images of event indicators |
US11936877B2 (en) * | 2021-04-12 | 2024-03-19 | Qualcomm Incorporated | Template matching based affine prediction for video coding |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW257924B (en) | 1995-03-18 | 1995-09-21 | Daewoo Electronics Co Ltd | Method and apparatus for encoding a video signal using feature point based motion estimation |
JP2798120B2 (ja) * | 1995-08-04 | 1998-09-17 | 日本電気株式会社 | 動き補償フレーム間予測方法及び動き補償フレーム間予測装置 |
US6026182A (en) | 1995-10-05 | 2000-02-15 | Microsoft Corporation | Feature segmentation |
JPH104555A (ja) * | 1996-06-17 | 1998-01-06 | Oki Electric Ind Co Ltd | 動きベクトル検出装置 |
JP2000350216A (ja) * | 1999-06-09 | 2000-12-15 | Matsushita Electric Ind Co Ltd | 動き係数探索装置、及び動き係数探索方法 |
US6735249B1 (en) * | 1999-08-11 | 2004-05-11 | Nokia Corporation | Apparatus, and associated method, for forming a compressed motion vector field utilizing predictive motion coding |
KR101042623B1 (ko) * | 2004-11-17 | 2011-06-20 | 삼성전자주식회사 | 필드 가변분할방식을 이용한 디인터레이싱방법 및 장치 |
CN101350928A (zh) * | 2008-07-29 | 2009-01-21 | 北京中星微电子有限公司 | 一种运动估计方法及装置 |
JP5401071B2 (ja) | 2008-10-09 | 2014-01-29 | 株式会社Nttドコモ | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法 |
KR101279573B1 (ko) * | 2008-10-31 | 2013-06-27 | 에스케이텔레콤 주식회사 | 움직임 벡터 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
US8406569B2 (en) * | 2009-01-19 | 2013-03-26 | Sharp Laboratories Of America, Inc. | Methods and systems for enhanced dynamic range images and video from multiple exposures |
CN102883160B (zh) * | 2009-06-26 | 2016-06-29 | 华为技术有限公司 | 视频图像运动信息获取方法、装置及设备、模板构造方法 |
US9282338B2 (en) * | 2011-06-20 | 2016-03-08 | Qualcomm Incorporated | Unified merge mode and adaptive motion vector prediction mode candidates selection |
JP5937594B2 (ja) * | 2011-06-30 | 2016-06-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像復号方法及び画像復号装置 |
JP2014524706A (ja) | 2011-08-19 | 2014-09-22 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 動きベクトル処理 |
CN103024378B (zh) * | 2012-12-06 | 2016-04-13 | 浙江大学 | 一种视频编解码中运动信息导出方法及装置 |
US10057594B2 (en) * | 2013-04-02 | 2018-08-21 | Vid Scale, Inc. | Enhanced temporal motion vector prediction for scalable video coding |
CN104363451B (zh) * | 2014-10-27 | 2019-01-25 | 华为技术有限公司 | 图像预测方法及相关装置 |
-
2014
- 2014-10-27 CN CN201410584175.1A patent/CN104363451B/zh active Active
-
2015
- 2015-04-23 KR KR1020177007312A patent/KR102013771B1/ko active IP Right Grant
- 2015-04-23 KR KR1020197024188A patent/KR102070982B1/ko active IP Right Grant
- 2015-04-23 EP EP15855692.8A patent/EP3177015B1/en active Active
- 2015-04-23 WO PCT/CN2015/077295 patent/WO2016065873A1/zh active Application Filing
- 2015-04-23 KR KR1020207002096A patent/KR102248254B1/ko active IP Right Grant
- 2015-04-23 JP JP2017517269A patent/JP6490203B2/ja active Active
- 2015-04-23 KR KR1020217012948A patent/KR102334151B1/ko active IP Right Grant
- 2015-04-23 EP EP24154875.9A patent/EP4387229A3/en active Pending
-
2017
- 2017-03-20 US US15/463,850 patent/US10440380B2/en active Active
-
2018
- 2018-12-07 JP JP2018230221A patent/JP7313816B2/ja active Active
-
2019
- 2019-06-04 US US16/431,298 patent/US10623763B2/en active Active
-
2020
- 2020-04-10 US US16/845,161 patent/US11172217B2/en active Active
-
2021
- 2021-10-26 US US17/511,269 patent/US11968386B2/en active Active
-
2024
- 2024-04-05 US US18/628,367 patent/US20240276006A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4387229A3 (en) | 2024-09-04 |
KR102013771B1 (ko) | 2019-08-23 |
KR102070982B1 (ko) | 2020-01-29 |
BR112017007399A2 (pt) | 2018-06-19 |
EP3177015A1 (en) | 2017-06-07 |
EP3177015B1 (en) | 2024-04-03 |
US20190289313A1 (en) | 2019-09-19 |
KR20200011568A (ko) | 2020-02-03 |
US10623763B2 (en) | 2020-04-14 |
JP2017536002A (ja) | 2017-11-30 |
EP4387229A2 (en) | 2024-06-19 |
US20170195685A1 (en) | 2017-07-06 |
US20200244983A1 (en) | 2020-07-30 |
US11968386B2 (en) | 2024-04-23 |
CN104363451B (zh) | 2019-01-25 |
CN104363451A (zh) | 2015-02-18 |
EP3177015A4 (en) | 2017-08-09 |
KR102334151B1 (ko) | 2021-12-02 |
WO2016065873A1 (zh) | 2016-05-06 |
KR20170045264A (ko) | 2017-04-26 |
US20220053208A1 (en) | 2022-02-17 |
KR102248254B1 (ko) | 2021-05-06 |
US11172217B2 (en) | 2021-11-09 |
KR20210049989A (ko) | 2021-05-06 |
JP2019041418A (ja) | 2019-03-14 |
KR20190100435A (ko) | 2019-08-28 |
US20240276006A1 (en) | 2024-08-15 |
US10440380B2 (en) | 2019-10-08 |
JP7313816B2 (ja) | 2023-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6490203B2 (ja) | 画像予測方法および関連装置 | |
JP7252282B2 (ja) | 画像予測方法および関連装置 | |
JP6689499B2 (ja) | 画像予測方法および関連装置 | |
JP7335314B2 (ja) | 画像予測方法および関連装置 | |
CN109076234A (zh) | 图像预测方法和相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170511 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170511 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180703 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181207 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20181218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6490203 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |