JP2022503707A - ビデオ符号化及び復号 - Google Patents
ビデオ符号化及び復号 Download PDFInfo
- Publication number
- JP2022503707A JP2022503707A JP2021514321A JP2021514321A JP2022503707A JP 2022503707 A JP2022503707 A JP 2022503707A JP 2021514321 A JP2021514321 A JP 2021514321A JP 2021514321 A JP2021514321 A JP 2021514321A JP 2022503707 A JP2022503707 A JP 2022503707A
- Authority
- JP
- Japan
- Prior art keywords
- index
- motion information
- merge
- candidates
- merge mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000033001 locomotion Effects 0.000 claims abstract description 750
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 434
- 238000000034 method Methods 0.000 claims abstract description 184
- 239000013598 vector Substances 0.000 claims description 419
- 230000011664 signaling Effects 0.000 description 49
- 230000008569 process Effects 0.000 description 44
- 238000004891 communication Methods 0.000 description 33
- 230000002123 temporal effect Effects 0.000 description 33
- 238000009795 derivation Methods 0.000 description 30
- 239000002609 medium Substances 0.000 description 23
- 238000013461 design Methods 0.000 description 22
- 238000012545 processing Methods 0.000 description 21
- 230000008901 benefit Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 15
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 7
- 238000004091 panning Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 101150053106 CAND1 gene Proteins 0.000 description 3
- 101150117151 Cand2 gene Proteins 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003749 cleanliness Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000003116 impacting effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001454 recorded image Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000006163 transport media Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Systems (AREA)
Abstract
Description
ATMVP候補を含む動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックス(マージインデックス)を生成し、動きベクトル予測子インデックスの1つまたは複数のビットは、バイパスCABAC符号化される
ことを特徴とする方法が提供される。
ATMVP候補を含む動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して動きベクトル予測子インデックスを復号し、動きベクトル予測子インデックスの1つまたは複数のビットは、バイパスCABAC復号され、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
ATMVP候補を含む動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックス(マージインデックス)を生成する手段であって、動きベクトル予測子インデックスの1つまたは複数のビットがバイパスCABAC符号化される手段と
を備えることを特徴とする装置が提供される。
ATMVP候補を含む動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して動きベクトル予測子インデックスを復号する手段であって、動きベクトル予測子インデックスの1つまたは複数のビットがバイパスCABAC復号される手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、動きベクトル予測子インデックスの2つ以上のビットが同じコンテキストを共有する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、動きベクトル予測子インデックスの2つ以上のビットが同じコンテキストを共有し、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、動きベクトル予測子インデックスの2つ以上のビットが同じコンテキストを共有する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、動きベクトル予測子インデックスの2つ以上のビットが同じコンテキストを共有する手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数が、現在のブロックに隣接する少なくとも1つのブロックの動きベクトル予測子インデックスに依存する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、現在のブロックに隣接する少なくとも1つのブロックの動きベクトル予測子インデックスに依存し、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数が、現在のブロックに隣接する少なくとも1つのブロックの動きベクトル予測子インデックスに依存する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、現在のブロックに隣接する少なくとも1つのブロックの動きベクトル予測子インデックスに依存する手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数が、前記現在のブロックのスキップフラグに依存する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、動きベクトル予測子インデックスの復号前に利用可能な前記現在のブロックの別のパラメータまたはシンタックス要素に依存する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数が、現在のブロック内の動きの複雑さのインジケータである前記現在のブロックの別のパラメータまたはシンタックス要素に依存する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、前記現在のブロックのスキップフラグに依存し、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、動きベクトル予測子インデックスの復号前に利用可能である前記現在のブロックの別のパラメータまたはシンタックス要素に依存し、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、現在のブロックにおける動きの複雑さのインジケータである前記現在のブロックの別のパラメータまたはシンタックス要素に依存し、
復号された動きベクトル予測子インデックスを使用して、前記リスト中の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数が、前記現在のブロックのスキップフラグに依存する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、動きベクトル予測子インデックスの復号前に利用可能である前記現在のブロックの別のパラメータまたはシンタックス要素に依存する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、現在のブロック内の動きの複雑さのインジケータである前記現在のブロックの別のパラメータまたはシンタックス要素に依存する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、前記現在のブロックのスキップフラグに依存する手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、動きベクトル予測子インデックスの復号前に利用可能である前記現在のブロックの別のパラメータまたはシンタックス要素に依存する手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、現在のブロックにおける動きの複雑さのインジケータである前記現在のブロックの別のパラメータまたはシンタックス要素に依存する手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、前記リスト内にアフィン動きベクトル予測子候補がある場合にはそれに依存する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、前記リスト内にアフィン動きベクトル予測子候補がある場合にはそれに依存し、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、前記リスト内にアフィン動きベクトル予測子候補がある場合にはそれに依存する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、前記リスト内にアフィン動きベクトル予測子候補がある場合にはそれに依存する手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
アフィン動きベクトル予測子候補を含む動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数が、現在のブロックおよび/または現在のブロックに隣接する少なくとも1つのブロックのアフィンフラグに依存する
ことを特徴とする方法が提供される。
アフィン動きベクトル予測子候補を含む動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、現在のブロックおよび/または現在のブロックに隣接する少なくとも1つのブロックのアフィンフラグに依存し、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
アフィン動きベクトル予測子候補を含む動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、現在のブロックおよび/または現在のブロックに隣接する少なくとも1つのブロックのアフィンフラグに依存する手段と
を備えることを特徴とする装置が提供される。
アフィン動きベクトル予測子候補を含む動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は、現在のブロックおよび/または現在のブロックに隣接する少なくとも1つのブロックのアフィンフラグに依存する手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数が、現在のブロックのスキップフラグおよびアフィンフラグのうちの少なくとも1つのコンテキスト変数から導出される
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、現在のブロックのスキップフラグおよびアフィンフラグのうちの少なくとも1つのコンテキスト変数から導出され、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数が、現在のブロックのスキップフラグおよびアフィンフラグのうちの少なくとも1つのコンテキスト変数から導出される手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数が、現在のブロックのスキップフラグおよびアフィンフラグのうちの少なくとも1つのコンテキスト変数から導出される手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成し、
前記リスト内の動きベクトル予測子候補のうちの1つを選択し、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、2つの異なる可能な値のみを有する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成し、
CABAC復号を使用して、動きベクトル予測子インデックスを復号し、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数は2つの異なる可能な値のみを有し、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する
ことを特徴とする方法が提供される。
動きベクトル予測子候補のリストを生成する手段と、
前記リスト内の動きベクトル予測子候補のうちの1つを選択する手段と、
CABAC符号化を使用して、選択された動きベクトル予測子候補の動きベクトル予測子インデックスを生成する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットのコンテキスト変数は、2つの異なる可能な値のみを有する手段と
を備えることを特徴とする装置が提供される。
動きベクトル予測子候補のリストを生成する手段と、
CABAC復号を使用して、動きベクトル予測子インデックスを復号する手段であって、ここで、現在のブロックの動きベクトル予測子インデックスの少なくとも1つのビットに対するコンテキスト変数が、2つの異なる可能な値のみを有する手段と、
復号された動きベクトル予測子インデックスを使用して、前記リスト内の動きベクトル予測子候補のうちの1つを識別する手段と
を備えることを特徴とする装置が提供される。
-CPUで示されるマイクロプロセッサなどの中央処理部311
-本発明を実施するためのコンピュータプログラムを記憶するためのROMと表記される読み出し専用メモリ307
-本発明の実施形態の方法の実行可能コード、ならびに本発明の実施形態に係るデジタル画像のシーケンスを符号化する方法および/またはビットストリームを復号する方法を実現するために必要な変数およびパラメータを記録するように構成されたレジスタを記憶するRAMで示されたランダムアクセスメモリ312
-処理されるデジタルデータが送受信される通信ネットワーク303に接続された通信インターフェース302
と接続された通信バス313を備える。
-本発明の1つまたは複数の実施形態の方法を実施するためのコンピュータプログラム、および本発明の1つまたは複数の実施形態の実施中に使用または生成されるデータを記憶するための、ハードディスクなどのデータ記憶手段304
-ディスク306用のディスクドライブ305であって、ディスクドライブはディスク306からデータを読み取るか、またはディスクにデータを書き込むように構成されている
-キーボード310または他の任意のポインティング手段を用いて、データを表示し、および/またはユーザとのグラフィカルインターフェースとして機能する画面309
HEVCは、CABAC(Context based Adaptive Binary Arithmetic Coding)、ゴロムライス符号化(Golomb-rice Code)、または固定長符号化(Fixed Length Coding)と呼ばれる単純なバイナリ表現など、いくつかのタイプのエントロピー符号化を使用する。ほとんどの場合、異なるシンタックス要素を表現するためにバイナリ符号化処理が実行される。このバイナリ符号化処理も非常に具体的であり、異なるシンタックス要素に依存する。算術符号化は、それらの現在の確率に従ってシンタックス要素を表す。CABACは、コンテキスト変数によって定義される「コンテキスト」に応じてシンタックス要素の確率を分離する算術符号化の拡張である。これは条件付き確率に相当する。コンテキスト変数は、すでに復号されている、左上のブロック(以下で詳細に説明する図6bのA2)および左上のブロック(図6bのB3)の現在のシンタックスの値から導き出すことができる。
HEVCは、インターモード(高度動きベクトル予測(AMVP))、「古典的」マージモード(すなわち、「非アフィンマージモード」または「正規」マージモードとしても知られる)、および「古典的」マージスキップモード(すなわち、「非アフィンマージスキップ」モードまたは「正規」マージスキップモードとしても知られる)の3つの異なるINTERモードを使用する。これらのモード間の主な違いは、ビットストリームにおけるデータシグナリングである。動きベクトル符号化の場合、現在のHEVC規格は、規格の以前のバージョンには存在しなかった動きベクトル予測のための競合ベースのスキームを含む。インターモードまたはマージモード(すなわち、「古典的/正規」マージモードまたは「古典的/正規」マージスキップモード)のそれぞれについて、最良の動きベクトル予測子または最良の動き情報を見つけるために、いくつかの候補が符号器側でレート歪み基準と競合することを意味する。次に、最良の予測子または動き情報の最良の候補に対応するインデックスがビットストリームに挿入される。デコーダは、予測子または候補の同じセットを導出することができ、復号されたインデックスに従って最良のものを使用する。HEVCのスクリーンコンテンツ拡張では、イントラブロックコピー(IBC)と呼ばれる新しいコーディングツールが、これら3つのインターモードのいずれかとしてシグナリングされ、IBCと同等のインターモードとの間の差は、参照フレームが現在のものであるかどうかをチェックすることによって行われる。これは、例えば、リストL0の参照インデックスをチェックし、これがリスト内の最後のフレームである場合、これがイントラブロックコピーであると推定することによって実施することができる。別の方法は、現在のフレームと参照フレームとのピクチャオーダーカウントを比較することで、等しい場合、これはイントラブロックコピーである。
-同じ参照画像と同じ参照リストからの動きベクトル
-同じ参照画像と他の参照リストからの動きベクトル
-異なる参照画像と同じ参照リストからのスケーリングされた動きベクトル
-異なる参照画像と他の参照リストからのスケーリングされた動きベクトル
「左」A1動きベクトル(800)が利用可能である場合(810)、すなわち、それが存在し、このブロックがイントラ符号化されていない場合、「左」ブロックの動きベクトルが選択され、候補リスト内の第1候補として使用される(814)。
「上」B1動きベクトル(802)が利用可能である場合(810)、候補「上」ブロック動きベクトルは、存在する場合、「左」A1動きベクトルと比較される(812)。B1動きベクトルがA1動きベクトルに等しい場合、B1は空間的候補のリストに追加されない(814)。逆に、B1動きベクトルがA1動きベクトルに等しくない場合、B1が空間的候補のリストに追加される(814)。
「右上」B0動きベクトル(804)が利用可能である場合(810)、「右上」の動きベクトルがB1動きベクトルと比較される(812)。B0動きベクトルがB1動きベクトルに等しい場合、B0動きベクトルは空間的候補のリストに追加されない(814)。逆に、B0動きベクトルがB1動きベクトルに等しくない場合、B0動きベクトルが空間的候補のリストに追加される(814)。
「左下」A0動きベクトル(806)が利用可能である場合(810)、「左下」の動きベクトルがA1動きベクトルと比較される(812)。A0動きベクトルがA1動きベクトルに等しい場合、A0動きベクトルは空間的候補のリストに追加されない(814)。逆に、A0動きベクトルがA1動きベクトルと等しくない場合、A0動きベクトルが空間的候補のリストに追加される(814)。
空間的候補のリストが4つの候補を含まない場合、「左上」B2動きベクトル(808)の利用可能性がチェックされる(810)。利用可能であれば、A1動きベクトルおよびB1動きベクトルと比較される。B2動きベクトルがA1動きベクトルまたはB1動きベクトルに等しい場合、B2動きベクトルは空間的候補のリストに追加されない(814)。逆に、B2動きベクトルがA1動きベクトルまたはB1動きベクトルに等しくない場合、B2動きベクトルが空間的候補のリストに追加される(814)。
代替時間的動きベクトル予測(ATMVP)は、特別なタイプの動き補償である。時間的参照フレームからの現在のブロックについて1つの動き情報のみを考慮する代わりに、各コロケートされたブロックの各動き情報が考慮される。したがって、この時間的動きベクトル予測は、図9に示すように、各サブブロックの関連する動き情報を用いて、現在のブロックのセグメンテーションを与える。
HEVCでは、動き補償予測(MCP)のために並進運動モデルのみを適用した。一方、現実世界では、ズームイン/ズームアウト、回転、パースペクティブモーション、および他の不規則なモーションなど、多くの種類のモーションがある。
Ctx=IsAffine(A2)+IsAffine(B3)
ここで、IsAffine(block)は、ブロックがアフィンブロックでない場合に0を返し、ブロックがアフィンである場合に1を返す関数である。
JEMでは、アフィンマージモード(またはアフィンマージスキップモード)が位置A1、B1、B0、A0、B2のブロックの中でアフィンである第1隣接ブロック(first neighbouring block)(すなわち、アフィンモードを使用して符号化される第1隣接ブロック)から現在のブロックの動き情報を導出する。これらの位置を図6aおよび6bに示す。しかしながら、アフィンパラメータがどのように導出されるかは完全には定義されておらず、本発明は例えば、アフィンマージモードのアフィンパラメータを定義することによって、少なくともこの態様を改善することを目的とし、その結果、アフィンマージ候補のためのより広い選択の選択を可能にする(すなわち、アフィンである第1隣接ブロックだけでなく、インデックスなどの識別子を用いた選択のために少なくとも1つの他の候補が利用可能である)。
図12は、アフィンマージモードの使用をシグナリングするための符号化モードに関連するいくつかのシンタックス要素の部分復号処理のフローチャートである。この図では、スキップフラグ(1201)、予測モード(1211)、マージフラグ(1203)、マージインデックス(1208)、およびアフィンフラグ(1206)を復号することができる。
図13は、マージ候補(すなわち、古典的マージモードまたは古典的マージスキップモードの候補)導出を示すフローチャートである。この導出は、図8に示すマージモードの動きベクトル導出処理(すなわち、HEVCのマージ候補リスト導出)の上に構築されたものである。HEVCと比較した主な変更は、ATMVP候補(1319、1321、1323)の追加、候補の全重複チェック(1325)、および候補の新しい順序である。ATMVP予測は、現在のCUのいくつかの動き情報を表すので、専用の候補として設定される。第1サブブロック(first sub-block)(左上)の値は、時間的候補と比較され、時間的候補はそれらが等しい場合、マージのリストに追加されない(1320)。ATMVP候補は、他の空間的候補と比較されない。リスト内に既にある各空間的候補と比較され(1325)、重複候補であればマージ候補リストに追加されない時間的候補とは対照的である。
・ A1
・ B1
・ B0
・ A0
・ ATMVP
・ B2
・ 時間的
・ 組み合わせ
・ Zero_MV
空間的候補B2は、ATMVP候補の後に設定されることに留意することが重要である。
上述のように、現在のVTMリファレンスソフトウェアでは、ATMVPがマージ候補のリストに挿入されたマージ候補としてシグナリングされる。ATMVPは、(SPSレベルで)シーケンス全体に対してイネーブルまたはディスエーブルされることができる。ATMVPがディスエーブルされると、マージ候補の最大数は5である。ATMVPがイネーブルされると、マージ候補の最大数は、5から6に1だけ増加される。
第2の実施形態では、マージインデックスのすべてのビットはCABAC符号化されるが、それらはすべて同じコンテキストを共有する。この場合、ビット間で共有される、第1の実施形態のような単一のコンテキストが存在し得る。その結果、マージ候補のリストにマージ候補としてATMVPが含まれている場合(例えば、SPSレベルでATMVPがイネーブルされている場合)、VTM2.0リファレンスソフトウェアでは5であるのに対して、1つのコンテキストのみが使用される。VTM2.0リファレンスソフトウェアと比較したこの実施形態の利点は、符号化効率に影響を与えることなく、マージインデックス復号およびデコーダ設計(およびエンコーダ設計)の複雑さが低減されることである。
第1の実施形態では、マージインデックスの第1番目のビットが単一のコンテキストを使用してCABAC符号化された。
第4の実施形態では、マージインデックスのビットのコンテキスト変数が、2つ以上の隣接ブロックのマージインデックスのそれぞれの値に依存する。例えば、第1隣接ブロックは左ブロックA0、A1またはA2であり、第2隣接ブロック(second neighbouring block)は上ブロックB0、B1、B2またはB3である。2つ以上のマージインデックス値を組み合わせる方法は、特に限定されない。例を以下に示す。
第5の実施形態では、マージインデックスのビットのコンテキスト変数が、隣接ブロックA2およびB3のマージインデックスのそれぞれの値に依存する。
第6の実施形態では、マージインデックスのビットのコンテキスト変数が、隣接ブロックA1およびB1のマージインデックスのそれぞれの値に依存する。この変形例の利点は、マージ候補導出とのアラインメントである。その結果、いくつかのデコーダおよびエンコーダの実装では、メモリアクセスの削減を達成することができる。
第7の実施形態では、現在のブロックのマージインデックスにおけるビット位置idx_numを有するビットのコンテキスト変数が、以下の式に従って得られる。
ctxIdx=(Merge_index_left==idx_num)+(Merge_index_up==idx_num)
ここで、Merge_index_leftは左ブロックのマージインデックス、Merge_index_upは上ブロックのマージインデックス、シンボル==は等価シンボルである。
左上のブロックがマージインデックスを有さない場合、または左ブロックマージインデックスが第1インデックス(first index)ではない(すなわち0ではない)場合、および上ブロックマージインデックスが第1インデックスではない(すなわち0ではない)場合は0
左ブロックおよび上ブロックのうちの一方であって他方ではないブロックが第1インデックスに等しいマージインデックスを有する場合は1
左ブロックおよび上ブロックのそれぞれについてマージインデックスが第1インデックスに等しい場合は2
に等しく設定される。
左上のブロックがマージインデックスを有さない場合、または左ブロックマージインデックスがi番目のインデックスでない場合(i=idx_numの場合)、および上ブロックマージインデックスがi番目のインデックスでない場合は0
左ブロックと上ブロックの一方であって他方ではないブロックがi番目のインデックスと等しいマージインデックスを有する場合は1
左ブロックと上ブロックのそれぞれについてマージインデックスがi番目のインデックスと等しい場合は2
に等しく設定される。ここで、i番目のインデックスは、i=0の場合は第1インデックス(first index)を意味し、i=1の場合は第2インデックス(second index)を、というように意味する。
第8の実施形態では、現在のブロックのマージインデックスにおけるビット位置idx_numを有するビットのコンテキスト変数が、以下の式に従って得られる。
Ctx=(Merge_index_left>idx_num)+(Merge_index_up>idx_num) ここで、Merge_index_leftは左ブロックのマージインデックス、Merge_index_upは上ブロックのマージインデックス、シンボル>は「より大きい」を意味する。
左上のブロックがマージインデックスを有さない場合、または左ブロックマージインデックスが第1インデックス以下(すなわち0でない)である場合、および上ブロックマージインデックスが第1インデックス以下(すなわち0でない)である場合は0
左ブロックと上ブロックの一方であって他方ではないブロックが第1インデックスより大きいマージインデックスを有する場合は1
左ブロックと上ブロックの各々についてマージインデックスが第1インデックスより大きい場合は2
に等しく設定される。
より一般的には、CABAC符号化された位置idx_numのターゲットビットの場合、コンテキスト変数ctxIdxは、
左上のブロックがマージインデックスを有さない場合、または左ブロックマージインデックスがi番目のインデックスより小さい場合(i=idx_numの場合)、および上ブロックマージインデックスがi番目のインデックスより小さいか等しい場合は0
左ブロックと上ブロックの一方であって他方ではないブロックがi番目のインデックスより大きいマージインデックスを有する場合は1
左ブロックと上ブロックの各々についてマージインデックスがi番目のインデックスより大きい場合は2
に等しく設定される。
第4~第8の実施形態では、現ブロックのマージインデックスのビットのコンテキスト変数が2つ以上の隣接ブロックのマージインデックスのそれぞれの値に依存した。
左隣接ブロックも上隣接ブロックも、1にセットされたそのマージフラグを有さない場合には0
左および上の隣接ブロックの一方であって他方ではない隣接ブロックが1に設定されたそのマージフラグを有する場合は1
左および上の隣接ブロックの各々が1に設定されたそのマージフラグを有する場合は2
に設定される。
第3から第9の実施形態では、現在のブロックのマージインデックスのビットのコンテキスト変数が、1つまたは複数の隣接ブロックのマージインデックス値またはマージフラグに依存した。
第11の実施形態は、図11(a)、図11(b)および図12を参照して前述したアフィンマージシグナリングに関する。
A1がアフィンの場合は1
B1がアフィンの場合は2
B0がアフィンの場合は3
A0がアフィンの場合は4
B2がアフィンの場合は5
隣接ブロックがアフィンでない場合は0
に等しく設定される。
隣接ブロックがアフィンでない場合、またはA1またはB1がアフィンである場合は0
B0、A0、またはB2がアフィンの場合は1
に等しく設定される。
隣接ブロックがアフィンでない場合は0
A1またはB1がアフィンの場合は1
B0、A0、またはB2がアフィンの場合は2
に等しく設定される。
A1がアフィンの場合は1
B1がアフィンの場合は2
B0がアフィンの場合は3
A0またはB2がアフィンの場合は4
隣接ブロックがアフィンでない場合は0
に等しく設定される。
第12の実施形態では、アフィンモードをシグナリングすることは、候補動き予測子としてアフィンモードを挿入することを含む。
A1
B1
B0
A0
アフィンマージ
ATMVP
B2
時間的
組み合わせ
Zero_MV
アフィンマージ候補は、ATMVP候補の前であるが、4つの主要な隣接ブロックの後に配置されることに留意することが重要である。ATMVP候補の前にアフィンマージ候補を設定することの利点は、ATMVPおよび時間的予測子候補の後にそれを設定することと比較して、符号化効率が増加することである。この符号化効率の向上は、GOP(group of pictures)構造と、GOP内の各ピクチャのQP(Quantization Parameter)設定と、に依存する。しかし、最も使用されるGOPおよびQP設定では、この順序は符号化効率の増加をもたらす。
ctxIdx=IsAffine(A1)+IsAffine(B1)+IsAffine(B0)+IsAffine(A0)+IsAffine(B2)
結果として得られるコンテキスト値は、値0、1、2、3、4、または5を有することができる。
第10の実施形態では、現在のブロックのマージインデックスのビットのためのコンテキスト変数が、現在のブロック(現在の符号化ユニット、つまりCU)のためのスキップフラグの値に依存する。
第13の実施形態では、ターゲットビットのコンテキスト値が、現在のCUのスキップフラグのコンテキスト変数から導出された。
前述の実施形態のいくつかでは、コンテキスト変数が2を超える値、例えば、3つの値0、1、および2を有していた。しかしながら、複雑さを低減し、処理される状態の数を低減するために、許可されるコンテキスト変数値の数を2、例えば、0および1に制限することが可能である。これは、例えば、値2を有する任意の初期コンテキスト変数を1に変更することによって達成することができる。実際には、この単純化が符号化効率に影響を及ぼさないか、または限定された影響しか及ぼさない。
前述の実施形態のうちの任意の2つ以上が組み合わされてもよい。
第16の実施形態では、アフィンマージ候補のリストからアフィンマージモード予測子(候補)を識別するための動き情報予測子インデックスが、CABAC符号化を使用してシグナリングされ、動き情報予測子インデックスの1つまたは複数のビットは、バイパスCABAC符号化される。
前述の実施形態のうちの1つまたは複数は、図3の処理デバイス300のプロセッサ311、または図5のデコーダ60の、図17のCABACコーダの、図4のエンコーダ400の対応する機能モジュール/ユニット、またはその対応するCABACデコーダによって実装され、1つまたは複数の前述の実施形態の方法ステップを実行する。
本発明の目的は、アフィンモードが最も効率的な方法で利用されることを保証することであり、上述の特定の例は、アフィンモードが有用であると知覚される可能性に応じて、アフィンモードの使用をシグナリングすることに関することが理解されるのであろう。これのさらなる例は、複雑な動き(アフィン変換が特に効率的である場合がある)が符号化されていることが知られている場合に、エンコーダに適用され得る。このような場合の例は、
a) カメラズームイン/アウト
b) 撮影(すなわち、回転運動)中に向きを変えるポータブルカメラ(例えば、携帯電話)
c) 「魚眼」レンズカメラのパンニング(例えば、画像の一部の伸張/歪曲
を含む。
したがって、アフィンモードがスライス、フレームシーケンス、または実際にビデオストリーム全体のために使用される可能性が高くなるように、記録処理中に複雑な動きの指示を上げることができる。
Claims (22)
- 動き情報予測子インデックスを符号化する方法であって、
動き情報予測子候補のリストを生成し、
アフィンマージモードが使用される場合、リスト内の動き情報予測子候補の1つをアフィンマージモード予測子として選択し、
非アフィンマージモードが使用される場合、リスト内の動き情報予測子候補のうちの1つを非アフィンマージモード予測子として選択し、
CABAC符号化を使用して、選択された動き情報予測子候補の動き情報予測子インデックスを生成し、動き情報予測子インデックスの1つまたは複数のビットはバイパスCABAC符号化される
ことを特徴とする方法。 - 前記CABAC符号化は、前記アフィンマージモードが使用される場合および前記非アフィンマージモードが使用される場合、現在のブロックの前記動き情報予測子インデックスの少なくとも1つのビットについて、同じコンテキスト変数を使用することを含むことを特徴とする請求項1に記載の方法。
- CABAC符号化は、現在のブロックの動き情報予測子インデックスの少なくとも1つのビットについて、前記アフィンマージモードが使用される場合には第1コンテキスト変数を使用し、または前記非アフィンマージモードが使用される場合には第2コンテキスト変数を使用することを含み、
前記方法は、前記アフィンマージモードが使用される場合、ビットストリームにおける前記アフィンマージモードの使用を示すためのデータを含むことをさらに含むことを特徴とする請求項1に記載の方法。 - ビットストリーム内の動き情報予測子候補の前記生成されたリストに含めることができる動き情報予測子候補の最大数を決定するためのデータを含むことさらに含むことを特徴とする請求項1ないし3のいずれか1項に記載の方法。
- 前記動き情報予測子インデックスの第1番目のビットを除く全てのビットは、バイパスCABAC符号化されることを特徴とする請求項1ないし4のいずれか1項に記載の方法。
- 前記選択された動き情報予測子候補についての前記動き情報予測子インデックスは、前記アフィンマージモードが使用される場合および前記非アフィンマージモードが使用される場合、同じシンタックス要素を使用して符号化されることを特徴とする請求項1ないし5のいずれか1項に記載の方法。
- 動き情報予測子インデックスを復号する方法であって、
動き情報予測子候補のリストを生成し、
CABAC復号を使用して、動き情報予測子インデックスを復号し、動き情報予測子インデックスの1つまたは複数のビットがバイパスCABAC復号され、
アフィンマージモードが使用される場合、復号された動き情報予測子インデックスを使用して、リスト内の動き情報予測子候補のうちの1つをアフィンマージモード予測子として識別し、
非アフィンマージモードが使用される場合、復号された動き情報予測子インデックスを使用して、リスト内の動き情報予測子候補のうちの1つを非アフィンマージモード予測子として識別する
ことを特徴とする方法。 - 前記CABAC復号は、前記アフィンマージモードが使用される場合および前記非アフィンマージモードが使用される場合、現在のブロックの前記動き情報予測子インデックスの少なくとも1つのビットに対して同じコンテキスト変数を使用することを含むことを特徴とする請求項7に記載の方法。
- 前記アフィンマージモードの使用を示すデータをビットストリームから取得することをさらに含み、前記CABAC復号は、現在のブロックの前記動き情報予測子インデックスの少なくとも1つのビットについて、
前記取得されたデータが前記アフィンマージモードの使用を示す場合、第1コンテキスト変数を使用し、
前記取得されたデータが前記非アフィンマージモードの使用を示す場合、第2コンテキスト変数を使用する
ことを含むことを特徴とする請求項7に記載の方法。 - 前記アフィンマージモードの使用を示すデータをビットストリームから取得することをさらに含み、前記生成された動き情報予測子候補のリストは、
前記取得されたデータが前記アフィンマージモードの使用を示す場合、アフィンマージモード予測子候補を含み、
前記取得されたデータが前記非アフィンマージモードの使用を示す場合、非アフィンマージモード予測子候補を含む、
ことを特徴とする請求項7ないし9のいずれか1項に記載の方法。 - 動き情報予測子候補の生成されたリストに含まれうる動き情報予測子候補の最大数を決定するためのデータをビットストリームから取得することをさらに含むことを特徴とする請求項7ないし10のいずれか1項に記載の方法。
- 前記動き情報予測子インデックスの第1番目のビットを除く全てのビットが、バイパスCABAC復号されることを特徴とする請求項7ないし11のいずれか1項に記載の方法。
- 前記動き情報予測子インデックスを復号することは、前記アフィンマージモードが使用される場合および前記非アフィンマージモードが使用される場合、ビットストリームから同じシンタックス要素を構文解析することを含むことを特徴とする請求項7ないし12のいずれか1項に記載の方法。
- 動き情報予測子候補は、動きベクトルを得るための情報を含むことを特徴とする請求項1ないし13のいずれか1項に記載の方法。
- 動き情報予測子候補の前記生成されたリストは、ATMVP候補を含むことを特徴とする請求項1ないし14のいずれか1項に記載の方法。
- 動き情報予測子候補の前記生成されたリストは、前記アフィンマージモードが使用される場合および前記非アフィンマージモードが使用される場合、その中に含めることができる同じ最大数の動き情報予測子候補を有することを特徴とする請求項1ないし15のいずれか1項に記載の方法。
- 動き情報予測子インデックスを符号化する装置であって、
動き情報予測子候補のリストを生成する手段と、
アフィンマージモードが使用される場合、前記リスト内の動き情報予測子候補の1つをアフィンマージモード予測子として選択する手段と、
非アフィンマージモードが使用される場合、前記リスト内の動き情報予測子候補のうちの1つを非アフィンマージモード予測子として選択する手段と、
CABAC符号化を使用して、選択された動き情報予測子候補の動き情報予測子インデックスを生成する手段であって、動き情報予測子インデックスの1つまたは複数のビットがバイパスCABAC符号化される手段と
を備えることを特徴とする装置。 - 請求項1ないし6のいずれか1項に従属する場合、請求項1ないし6、または14ないし16のいずれか1項に記載の動き情報予測子インデックスを符号化する方法を実行する手段を備えることを特徴とする請求項17に記載の装置。
- 動き情報予測子インデックスを復号する装置であって、
動き情報予測子候補のリストを生成する手段と、
CABAC復号を使用して、動き情報予測子インデックスを復号する手段であって、動き情報予測子インデックスの1つ以上のビットはバイパスCABAC復号される手段と、
アフィンマージモードが使用される場合、復号された動き情報予測子インデックスを使用して、前記リスト内の動き情報予測子候補のうちの1つをアフィンマージモード予測子として識別する手段と、
非アフィンマージモードが使用される場合、復号された動き情報予測子インデックスを使用して、前記リスト内の動き情報予測子候補のうちの1つを非アフィンマージモード予測子として識別する手段と
を備えることを特徴とする装置。 - 請求項7ないし13のいずれか1項に従属する場合、請求項7ないし13、または14ないし16のいずれか1項に記載の動き情報予測子インデックスを復号する方法を実行する手段を含むことを特徴とする請求項19に記載の装置。
- コンピュータまたはプロセッサ上で実行される場合に、前記コンピュータまたはプロセッサに請求項1ないし16のいずれか1項に記載の方法を実行させるプログラム。
- 請求項21に記載のプログラムを担持するキャリア媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023007418A JP7413576B2 (ja) | 2018-10-18 | 2023-01-20 | ビデオ符号化及び復号 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1817019.1A GB2578150C (en) | 2018-10-18 | 2018-10-18 | Video coding and decoding |
GB1817019.1 | 2018-10-18 | ||
PCT/EP2019/078432 WO2020079254A1 (en) | 2018-10-18 | 2019-10-18 | Video coding and decoding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023007418A Division JP7413576B2 (ja) | 2018-10-18 | 2023-01-20 | ビデオ符号化及び復号 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022503707A true JP2022503707A (ja) | 2022-01-12 |
JP7216811B2 JP7216811B2 (ja) | 2023-02-01 |
Family
ID=64453671
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021514321A Active JP7216811B2 (ja) | 2018-10-18 | 2019-10-18 | ビデオ符号化及び復号 |
JP2023007418A Active JP7413576B2 (ja) | 2018-10-18 | 2023-01-20 | ビデオ符号化及び復号 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023007418A Active JP7413576B2 (ja) | 2018-10-18 | 2023-01-20 | ビデオ符号化及び復号 |
Country Status (8)
Country | Link |
---|---|
US (6) | US11516466B2 (ja) |
EP (1) | EP3868104A1 (ja) |
JP (2) | JP7216811B2 (ja) |
KR (1) | KR20210072072A (ja) |
CN (6) | CN117221568A (ja) |
GB (2) | GB2595053B (ja) |
TW (1) | TWI777095B (ja) |
WO (1) | WO2020079254A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170332095A1 (en) * | 2016-05-16 | 2017-11-16 | Qualcomm Incorporated | Affine motion prediction for video coding |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2015272007B2 (en) | 2011-04-20 | 2018-02-01 | Qualcomm Incorporated | Motion vector prediction in video coding |
US10523967B2 (en) | 2011-09-09 | 2019-12-31 | Kt Corporation | Method for deriving a temporal predictive motion vector, and apparatus using the method |
US9083983B2 (en) | 2011-10-04 | 2015-07-14 | Qualcomm Incorporated | Motion vector predictor candidate clipping removal for video coding |
KR20130050405A (ko) | 2011-11-07 | 2013-05-16 | 오수미 | 인터 모드에서의 시간 후보자 결정방법 |
CN107465922B (zh) | 2011-11-08 | 2020-10-09 | 株式会社Kt | 利用解码装置对视频信号进行解码的方法 |
KR101789954B1 (ko) * | 2013-12-27 | 2017-10-25 | 인텔 코포레이션 | 차세대 비디오 코딩을 위한 콘텐츠 적응적 이득 보상된 예측 |
GB2524476B (en) * | 2014-03-14 | 2016-04-27 | Canon Kk | Method, device and computer program for optimizing transmission of motion vector related information when transmitting a video stream |
WO2016008157A1 (en) * | 2014-07-18 | 2016-01-21 | Mediatek Singapore Pte. Ltd. | Methods for motion compensation using high order motion model |
CN107113446A (zh) | 2014-12-09 | 2017-08-29 | 联发科技股份有限公司 | 视频编码中的运动矢量预测子或合并候选的推导方法 |
US11477477B2 (en) | 2015-01-26 | 2022-10-18 | Qualcomm Incorporated | Sub-prediction unit based advanced temporal motion vector prediction |
JP6404487B2 (ja) * | 2015-03-10 | 2018-10-10 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 画像予測方法および関連装置 |
CN109274974B (zh) | 2015-09-29 | 2022-02-11 | 华为技术有限公司 | 图像预测的方法及装置 |
WO2017087751A1 (en) * | 2015-11-20 | 2017-05-26 | Mediatek Inc. | Method and apparatus for global motion compensation in video coding system |
WO2017118409A1 (en) * | 2016-01-07 | 2017-07-13 | Mediatek Inc. | Method and apparatus for affine merge mode prediction for video coding system |
WO2017147765A1 (en) * | 2016-03-01 | 2017-09-08 | Mediatek Inc. | Methods for affine motion compensation |
JP6938612B2 (ja) | 2016-07-12 | 2021-09-22 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute | 画像復号方法、画像符号化方法、及び非一時的なコンピュータ可読の記録媒体 |
KR102201604B1 (ko) | 2016-08-04 | 2021-01-12 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 예측 파라미터들에서의 데이터 숨김을 위한 방법 및 장치 |
US10721489B2 (en) | 2016-09-06 | 2020-07-21 | Qualcomm Incorporated | Geometry-based priority for the construction of candidate lists |
WO2018049594A1 (en) | 2016-09-14 | 2018-03-22 | Mediatek Inc. | Methods of encoder decision for quad-tree plus binary tree structure |
US10812791B2 (en) | 2016-09-16 | 2020-10-20 | Qualcomm Incorporated | Offset vector identification of temporal motion vector predictor |
US10778999B2 (en) * | 2016-09-30 | 2020-09-15 | Qualcomm Incorporated | Frame rate up-conversion coding mode with affine motion model |
CN109804626B (zh) | 2016-10-04 | 2023-10-10 | 英迪股份有限公司 | 用于对图像进行编码和解码的方法和设备以及用于存储比特流的记录介质 |
US10448010B2 (en) | 2016-10-05 | 2019-10-15 | Qualcomm Incorporated | Motion vector prediction for affine motion models in video coding |
EP4090025A1 (en) | 2016-12-05 | 2022-11-16 | LG Electronics Inc. | Video decoding method, video encoding method, storage medium and transmission method |
US10701390B2 (en) | 2017-03-14 | 2020-06-30 | Qualcomm Incorporated | Affine motion information derivation |
US10701391B2 (en) * | 2017-03-23 | 2020-06-30 | Qualcomm Incorporated | Motion vector difference (MVD) prediction |
EP3468195A1 (en) | 2017-10-05 | 2019-04-10 | Thomson Licensing | Improved predictor candidates for motion compensation |
US11877001B2 (en) | 2017-10-10 | 2024-01-16 | Qualcomm Incorporated | Affine prediction in video coding |
JP2021016016A (ja) | 2017-10-20 | 2021-02-12 | シャープ株式会社 | 動画像符号化装置及び動画像復号装置 |
US20190208211A1 (en) | 2018-01-04 | 2019-07-04 | Qualcomm Incorporated | Generated affine motion vectors |
US20190222834A1 (en) | 2018-01-18 | 2019-07-18 | Mediatek Inc. | Variable affine merge candidates for video coding |
CN110677675B (zh) | 2018-07-01 | 2022-02-08 | 北京字节跳动网络技术有限公司 | 高效的仿射Merge运动矢量推导的方法、装置及存储介质 |
TW202017377A (zh) | 2018-09-08 | 2020-05-01 | 大陸商北京字節跳動網絡技術有限公司 | 視頻編碼和解碼中的仿射模式 |
GB2577318B (en) | 2018-09-21 | 2021-03-10 | Canon Kk | Video coding and decoding |
-
2018
- 2018-10-18 GB GB2105853.2A patent/GB2595053B/en active Active
- 2018-10-18 GB GB1817019.1A patent/GB2578150C/en active Active
-
2019
- 2019-09-26 TW TW108134864A patent/TWI777095B/zh active
- 2019-10-18 CN CN202311181940.0A patent/CN117221568A/zh active Pending
- 2019-10-18 CN CN202311182569.XA patent/CN117221569A/zh active Pending
- 2019-10-18 EP EP19789979.2A patent/EP3868104A1/en active Pending
- 2019-10-18 CN CN201980067975.7A patent/CN112868231B/zh active Active
- 2019-10-18 JP JP2021514321A patent/JP7216811B2/ja active Active
- 2019-10-18 US US17/283,163 patent/US11516466B2/en active Active
- 2019-10-18 WO PCT/EP2019/078432 patent/WO2020079254A1/en unknown
- 2019-10-18 KR KR1020217013968A patent/KR20210072072A/ko not_active Application Discontinuation
- 2019-10-18 CN CN202311183662.2A patent/CN117221570A/zh active Pending
- 2019-10-18 CN CN202311181938.3A patent/CN117221567A/zh active Pending
- 2019-10-18 CN CN202311181935.XA patent/CN117221566A/zh active Pending
-
2022
- 2022-10-06 US US17/938,552 patent/US11849108B2/en active Active
-
2023
- 2023-01-20 JP JP2023007418A patent/JP7413576B2/ja active Active
- 2023-11-07 US US18/503,994 patent/US20240073410A1/en active Pending
- 2023-11-07 US US18/503,963 patent/US20240073408A1/en active Pending
- 2023-11-07 US US18/503,970 patent/US20240073409A1/en active Pending
- 2023-11-07 US US18/503,960 patent/US20240073407A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170332095A1 (en) * | 2016-05-16 | 2017-11-16 | Qualcomm Incorporated | Affine motion prediction for video coding |
Non-Patent Citations (4)
Title |
---|
GUILLAUME LAROCHE, ET AL.: "CE2: On Subblock Merge index coding (Test CE2.2.2)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-M0381, JPN6022054423, 3 January 2019 (2019-01-03), ISSN: 0004951031 * |
GUILLAUME LAROCHE, ET AL.: "CE4-related: On Merge Index coding", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-L0194, JPN6022054424, 25 September 2018 (2018-09-25), ISSN: 0004951030 * |
HAITAO YANG ET AL.: "CE4 summary report: Inter prediction and motion vector coding", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-K0024_r3, JPN6022027535, 12 July 2018 (2018-07-12), pages 23 - 24, ISSN: 0004816352 * |
JIANLE CHEN, ET AL.: "Algorithm Description of Joint Exploration Test Model 7 (JEM 7)", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-G1001-v1, JPN6022027534, 19 August 2017 (2017-08-19), pages 15, ISSN: 0004816351 * |
Also Published As
Publication number | Publication date |
---|---|
KR20210072072A (ko) | 2021-06-16 |
GB2595053B (en) | 2022-07-06 |
US20240073408A1 (en) | 2024-02-29 |
TWI777095B (zh) | 2022-09-11 |
US11849108B2 (en) | 2023-12-19 |
US20230109005A1 (en) | 2023-04-06 |
CN117221566A (zh) | 2023-12-12 |
JP7413576B2 (ja) | 2024-01-15 |
CN112868231A (zh) | 2021-05-28 |
US20240073409A1 (en) | 2024-02-29 |
GB2595053A (en) | 2021-11-17 |
EP3868104A1 (en) | 2021-08-25 |
CN117221568A (zh) | 2023-12-12 |
CN117221569A (zh) | 2023-12-12 |
GB2578150A (en) | 2020-04-22 |
GB2578150B (en) | 2021-06-09 |
US20210352275A1 (en) | 2021-11-11 |
US11516466B2 (en) | 2022-11-29 |
TW202308392A (zh) | 2023-02-16 |
JP7216811B2 (ja) | 2023-02-01 |
CN112868231B (zh) | 2023-09-12 |
CN117221570A (zh) | 2023-12-12 |
JP2023052553A (ja) | 2023-04-11 |
WO2020079254A1 (en) | 2020-04-23 |
GB2578150C (en) | 2022-05-18 |
CN117221567A (zh) | 2023-12-12 |
US20240073410A1 (en) | 2024-02-29 |
US20240073407A1 (en) | 2024-02-29 |
GB202105853D0 (en) | 2021-06-09 |
TW202017386A (zh) | 2020-05-01 |
GB201817019D0 (en) | 2018-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022511744A (ja) | ビデオ符号化及び復号 | |
JP2022501868A (ja) | ビデオ符号化の動きベクトル予測子インデックス符号化 | |
JP2022501870A (ja) | ビデオ符号化及び復号化 | |
US20240098297A1 (en) | Video coding and decoding | |
JP7413576B2 (ja) | ビデオ符号化及び復号 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210531 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210531 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221223 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230120 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7216811 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |