JP7554986B2 - 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム - Google Patents
画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム Download PDFInfo
- Publication number
- JP7554986B2 JP7554986B2 JP2023208456A JP2023208456A JP7554986B2 JP 7554986 B2 JP7554986 B2 JP 7554986B2 JP 2023208456 A JP2023208456 A JP 2023208456A JP 2023208456 A JP2023208456 A JP 2023208456A JP 7554986 B2 JP7554986 B2 JP 7554986B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- merge
- motion vector
- triangle
- merge candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 170
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 description 428
- 238000009795 derivation Methods 0.000 description 144
- 230000008569 process Effects 0.000 description 94
- 238000012545 processing Methods 0.000 description 68
- 238000005192 partition Methods 0.000 description 56
- 238000010586 diagram Methods 0.000 description 47
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 31
- 230000009466 transformation Effects 0.000 description 25
- 238000013139 quantization Methods 0.000 description 20
- 230000002123 temporal effect Effects 0.000 description 20
- 230000009469 supplementation Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
実施の形態では、所定の大きさで符号化・復号処理対象画像を均等分割する。この単位をツリーブロックと定義する。図4では、ツリーブロックのサイズを128x128画素としているが、ツリーブロックのサイズはこれに限定されるものではなく、任意のサイズを設定してよい。処理対象(符号化処理においては符号化対象、復号処理においては復号対象に対応する。)のツリーブロックは、ラスタスキャン順、すなわち左から右、上から下の順序で切り替わる。各ツリーブロックの内部は、さらに再帰的な分割が可能である。ツリーブロックを再帰的に分割した後の、符号化・復号の対象となるブロックを符号化ブロックと定義する。また、ツリーブロック、符号化ブロックを総称してブロックと定義する。適切なブロック分割を行うことにより効率的な符号化が可能となる。ツリーブロックのサイズは、符号化装置と復号装置で予め取り決めた固定値とすることもできるし、符号化装置が決定したツリーブロックのサイズを復号装置に伝送するような構成をとることもできる。ここでは、ツリーブロックの最大サイズを128x128画素、ツリーブロックの最小サイズを16x16画素とする。また、符号化ブロックの最大サイズを64x64画素、符号化ブロックの最小サイズを4x4画素とする。
処理対象符号化ブロック単位で、処理対象画像の処理済み画像信号から予測を行うイントラ予測(MODE_INTRA)、及び処理済み画像の画像信号から予測を行うインター予測(MODE_INTER)を切り替える。
処理済み画像は、符号化処理においては符号化が完了した信号を復号した画像、画像信号、ツリーブロック、ブロック、符号化ブロック等に用いられ、復号処理においては復号が完了した画像、画像信号、ツリーブロック、ブロック、符号化ブロック等に用いられる。
このイントラ予測(MODE_INTRA)とインター予測(MODE_INTER)を識別するモードを予測モード(PredMode)と定義する。予測モード(PredMode)はイントラ予測(MODE_INTRA)、またはインター予測(MODE_INTER)を値として持つ。
処理済み画像の画像信号から予測を行うインター予測では、複数の処理済み画像を参照ピクチャとして用いることができる。複数の参照ピクチャを管理するため、L0(参照リスト0)とL1(参照リスト1)の2種類の参照リストを定義し、それぞれ参照インデックスを用いて参照ピクチャを特定する。PスライスではL0予測(Pred_L0)が利用可能である。BスライスではL0予測(Pred_L0)、L1予測(Pred_L1)、双予測(Pred_BI)が利用可能である。L0予測(Pred_L0)はL0で管理されている参照ピクチャを参照するインター予測であり、L1予測(Pred_L1)はL1で管理されている参照ピクチャを参照するインター予測である。双予測(Pred_BI)はL0予測とL1予測が共に行われ、L0とL1のそれぞれで管理されている1つずつの参照ピクチャを参照するインター予測である。L0予測、L1予測、双予測を特定する情報を、インター予測モードと定義する。以降の処理において出力に添え字LXが付いている定数、変数に関しては、L0、L1ごとに処理が行われることを前提とする。
予測動きベクトルモードは、予測動きベクトルを特定するためのインデックス、差分動きベクトル、インター予測モード、参照インデックスを伝送し、処理対象ブロックのインター予測情報を決定するモードである。予測動きベクトルは、処理対象ブロックに隣接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックから導出した予測動きベクトル候補と、予測動きベクトルを特定するためのインデックスから導出する。
マージモードは、差分動きベクトル、参照インデックスを伝送せずに、処理対象ブロックに隣接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックのインター予測情報から、処理対象ブロックのインター予測情報を導出するモードである。
図11は、予測動きベクトルモード、マージモードで、インター予測情報を導出するために参照する参照ブロックを説明する図である。A0,A1,A2,B0,B1,B2,B3は、処理対象ブロックに隣接する処理済みブロックである。T0は、処理済み画像に属するブロックで、処理対象画像における処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックである。
アフィン変換動き補償は、符号化ブロックを所定単位のサブブロックに分割し、分割された各サブブロックに対して個別に動きベクトルを決定して動き補償を行うものである。各サブブロックの動きベクトルは、処理対象ブロックに隣接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックのインター予測情報から導出する1つ以上の制御点に基づき導出する。本実施の形態では、サブブロックのサイズを4x4画素とするが、サブブロックのサイズはこれに限定されるものではないし、画素単位で動きベクトルを導出してもよい。
図15に、制御点が3つの場合のアフィン変換動き補償の例を示す。この場合、3つの制御点が水平方向成分、垂直方向成分の2つのパラメータを有する。このため、制御点が3つの場合のアフィン変換を、6パラメータアフィン変換と呼称する。図15のCP1、CP2、CP3が制御点である。
図12A、図12B、および図13を用いて、符号化ブロックの予測モードを表現するためのシンタックスを説明する。図12Aのpred_mode_flagは、インター予測か否かを示すフラグである。pred_mode_flagが0であればインター予測となり、pred_mode_flagが1であればイントラ予測となる。イントラ予測の場合にはイントラ予測の情報intra_pred_modeを送り、インター予測の場合にはmerge_flagを送る。merge_flagは、マージモードとするか、予測動きベクトルモードとするかを示すフラグである。予測動きベクトルモードの場合(merge_flag=0)、サブブロック予測動きベクトルモードを適用するか否かを示すフラグinter_affine_flagを送る。サブブロック予測動きベクトルモードを適用する場合(inter_affine_flag=1)、cu_affine_type_flagを送る。cu_affine_type_flagは、サブブロック予測動きベクトルモードにおいて、制御点の数を決定するためのフラグである。
一方、マージモードの場合(merge_flag=1)、図12Bのmerge_subblock_flagを送る。merge_subblock_flagは、サブブロックマージモードを適用するか否かを示すフラグである。サブブロックマージモードの場合(merge_subblock_flag=1)、マージインデックスmerge_subblock_idxを送る。一方、サブブロックマージモードでない場合(merge_subblock_flag=0)、三角マージモードを適用するか否かを示すフラグmerge_triangle_flagを送る。三角マージモードを適用する場合(merge_triangle_flag=1)、ブロックを分割する方向merge_triangle_split_dir、および分割された2つのパーティションごとにマージ三角インデックスmerge_triangle_idx0,merge_triangle_idx1を送る。一方、三角マージモードを適用しない場合(merge_triangle_flag=0)、マージインデックスmerge_idxを送る。
図13に各シンタックスエレメントの値と、それに対応する予測モードを示す。merge_flag=0,inter_affine_flag=0は、通常予測動きベクトルモード(Inter Pred Mode)に対応する。merge_flag=0,inter_affine_flag=1は、サブブロック予測動きベクトルモード(Inter Affine Mode)に対応する。merge_flag=1,merge_subblock_flag=0,merge_trianlge_flag=0は、通常マージモード(Merge Mode)に対応する。merge_flag=1,merge_subblock_flag=0,merge_trianlge_flag=1は、三角マージモード(Triangle Merge Mode)に対応する。merge_flag=1,merge_subblock_flag=1は、サブブロックマージモード(Affine Merge Mode)に対応する。
POC(Picture Order Count)は符号化されるピクチャに関連付けられる変数であり、ピクチャの出力順序に応じた1ずつ増加する値が設定される。POCの値によって、同じピクチャであるかを判別したり、出力順序でのピクチャ間の前後関係を判別したり、ピクチャ間の距離を導出したりすることができる。例えば、2つのピクチャのPOCが同じ値を持つ場合、同一のピクチャであると判断できる。2つのピクチャのPOCが違う値を持つ場合、POCの値が小さいピクチャのほうが、先に出力されるピクチャであると判断でき、2つのピクチャのPOCの差が時間軸方向でのピクチャ間距離を示す。
本発明の第1の実施の形態に係る画像符号化装置100及び画像復号装置200について説明する。
図10A及び図10Bにイントラ予測の例を示す。図10Aは、イントラ予測の予測方向とイントラ予測モード番号の対応を示したものである。例えば、イントラ予測モード50は、垂直方向に参照画素をコピーすることによりイントラ予測画像を生成する。イントラ予測モード1は、DCモードであり、処理対象ブロックのすべての画素値を参照画素の平均値とするモードである。イントラ予測モード0は、Planarモードであり、垂直方向・水平方向の参照画素から2次元的なイントラ予測画像を作成するモードである。図10Bは、イントラ予測モード40の場合のイントラ予測画像を生成する例である。イントラ予測部103は、処理対象ブロックの各画素に対し、イントラ予測モードの示す方向の参照画素の値をコピーする。イントラ予測部103は、イントラ予測モードの参照画素が整数位置でない場合には、周辺の整数位置の参照画素値から補間により参照画素値を決定する。
実施の形態に係るインター予測方法は、図1の画像符号化装置のインター予測部102および図2の画像復号装置のインター予測部203において実施される。
図16は図1の画像符号化装置のインター予測部102の詳細な構成を示す図である。通常予測動きベクトルモード導出部301は、複数の通常予測動きベクトル候補を導出して予測動きベクトルを選択し、選択した予測動きベクトルと、検出された動きベクトルとの差分動きベクトルを算出する。検出されたインター予測モード、参照インデックス、動きベクトル、算出された差分動きベクトルが通常予測動きベクトルモードのインター予測情報となる。このインター予測情報がインター予測モード判定部305に供給される。通常予測動きベクトルモード導出部301の詳細な構成と処理については後述する。
図22は図2の画像復号装置のインター予測部203の詳細な構成を示す図である。
図17の通常予測動きベクトルモード導出部301は、空間予測動きベクトル候補導出部321、時間予測動きベクトル候補導出部322、履歴予測動きベクトル候補導出部323、予測動きベクトル候補補充部325、通常動きベクトル検出部326、予測動きベクトル候補選択部327、動きベクトル減算部328を含む。
図19を参照して符号化側の通常予測動きベクトルモード導出処理手順を説明する。図19の処理手順の説明において、図19に示した通常という言葉を省略することがある。
mvdLX = mvLX - mvpLX
としてLXの差分動きベクトルmvdLXを算出する(図19のステップS105)。
次に、図25を参照して復号側の通常予測動きベクトルモード処理手順を説明する。復号側では、空間予測動きベクトル候補導出部421、時間予測動きベクトル候補導出部422、履歴予測動きベクトル候補導出部423、予測動きベクトル候補補充部425で、通常予測動きベクトルモードのインター予測で用いる動きベクトルをL0,L1毎にそれぞれ算出する(図25のステップS201~S206)。具体的には処理対象ブロックの予測モードPredModeがインター予測(MODE_INTER)で、処理対象ブロックのインター予測モードがL0予測(Pred_L0)の場合、L0の予測動きベクトル候補リストmvpListL0を算出して、予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0を算出する。処理対象ブロックのインター予測モードがL1予測(Pred_L1)の場合、L1の予測動きベクトル候補リストmvpListL1を算出して、予測動きベクトルmvpL1を選択し、L1の動きベクトルmvL1を算出する。処理対象ブロックのインター予測モードが双予測(Pred_BI)の場合、L0予測とL1予測が共に行われ、L0の予測動きベクトル候補リストmvpListL0を算出して、L0の予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0を算出するとともに、L1の予測動きベクトル候補リストmvpListL1を算出して、L1の予測動きベクトルmvpL1を算出し、L1の動きベクトルmvL1をそれぞれ算出する。
mvLX = mvpLX + mvdLX
としてLXの動きベクトルmvLXを算出する(図25のステップS205)。
図20は本発明の実施の形態に係る画像符号化装置の通常予測動きベクトルモード導出部301及び画像復号装置の通常予測動きベクトルモード導出部401とで共通する機能を有する通常予測動きベクトルモード導出処理の処理手順を表すフローチャートである。
図18の通常マージモード導出部302は、空間マージ候補導出部341、時間マージ候補導出部342、平均マージ候補導出部344、履歴マージ候補導出部345、マージ候補補充部346、マージ候補選択部347を含む。
なお、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが、最大マージ候補数MaxNumMergeCandより小さい場合、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが最大マージ候補数MaxNumMergeCandを上限として履歴マージ候補は導出されて、マージ候補リストmergeCandListに登録される。
なお、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが、最大マージ候補数MaxNumMergeCandより小さい場合、マージ候補リストmergeCandList内に登録されているマージ候補数numCurrMergeCandが最大マージ候補数MaxNumMergeCandを上限として平均マージ候補は導出されて、マージ候補リストmergeCandListに登録される。
ここで、平均マージ候補は、マージ候補リストmergeCandListに登録されている第1のマージ候補と第2のマージ候補の有する動きベクトルをL0予測及びL1予測毎に平均して得られる動きベクトルを有する新たなマージ候補である。
次に、符号化側の符号化情報格納メモリ111及び復号側の符号化情報格納メモリ205に備える履歴予測動きベクトル候補リストHmvpCandListの初期化方法および更新方法について詳細に説明する。図26は履歴予測動きベクトル候補リスト初期化・更新処理手順を説明するフローチャートである。
次に、符号化側の通常予測動きベクトルモード導出部301の履歴予測動きベクトル候補導出部323、復号側の通常予測動きベクトルモード導出部401の履歴予測動きベクトル候補導出部423で共通の処理である図20のステップS304の処理手順である履歴予測動きベクトル候補リストHmvpCandListからの履歴予測動きベクトル候補の導出方法について詳細に説明する。図29は履歴予測動きベクトル候補導出処理手順を説明するフローチャートである。
次に、符号化側の通常マージモード導出部302の履歴マージ候補導出部345、復号側の通常マージモード導出部402の履歴マージ候補導出部445で共通の処理である図21のステップS404の処理手順である履歴マージ候補リストHmvpCandListからの履歴マージ候補の導出方法について詳細に説明する。図30は履歴マージ候補導出処理手順を説明するフローチャートである。
履歴予測動きベクトル候補リストのすべての要素の確認が完了するか、マージ候補リストのすべての要素にマージ候補が追加されたら、本履歴マージ候補の導出処理を完了する。
次に、符号化側の通常マージモード導出部302の平均マージ候補導出部344、復号側の通常マージモード導出部402の平均マージ候補導出部444で共通の処理である図21のステップS403の処理手順である平均マージ候補の導出方法について詳細に説明する。図39は平均マージ候補導出処理手順を説明するフローチャートである。
動き補償予測部306は、符号化において現在予測処理の対象となっているブロックの位置およびサイズを取得する。また、動き補償予測部306は、インター予測情報をインター予測モード判定部305から取得する。取得したインター予測情報から参照インデックスおよび動きベクトルを導出し、復号画像メモリ104内の参照インデックスで特定される参照ピクチャを、動きベクトルの分だけ予測処理の対象となっているブロックの画像信号と同一位置より移動させた位置の画像信号を取得した後に予測信号を生成する。
単一の参照ピクチャからの予測を行う処理を単予測と定義し、単予測の場合はL0予測またはL1予測という、参照リストL0、L1に登録された2つの参照ピクチャのいずれか一方を利用した予測を行う。
本発明の実施の形態では、動き補償予測の精度向上のために、動き補償予測において複数の参照ピクチャの中から最適な参照ピクチャを選択することを可能とする。そのため、動き補償予測で利用した参照ピクチャを参照インデックスとして利用するとともに、参照インデックスを差分動きベクトルとともにビットストリーム中に符号化する。
動き補償予測部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、通常予測動きベクトルモード導出部301によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
動き補償予測部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、通常マージモード導出部302によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
動き補償予測部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、サブブロック予測動きベクトルモード導出部303によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
動き補償予測部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、サブブロックマージモード導出部304によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックのインター予測モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
通常予測動きベクトルモード、および通常マージモードでは、以下のフラグに基づいてアフィンモデルによる動き補償が利用できる。以下のフラグは、符号化処理においてインター予測モード判定部305により決定されるインター予測の条件に基づいて以下のフラグに反映され、ビットストリーム中に符号化される。復号処理においては、ビットストリーム中の以下のフラグに基づいてアフィンモデルによる動き補償を行うか否かを特定する。
三角マージモードは、マージモードの一種であり、符号化・復号ブロック内を斜め方向のパーティションに分けて動き補償予測するモードである。三角マージモードは、符号化・復号ブロックを矩形ではない形状のブロックに分割する幾何学分割マージモードの一種であり、幾何学分割マージモードにおいて、符号化・復号ブロックを対角線で二つの直角三角形に分割するモードに相当する。
幾何学分割マージモードは、例えば、分割角度を示すインデックス(angleIdx)、および符号化ブロックの中心からの距離を示すインデックス(distanceIdx)の2つのパラメータの組み合わせにより表現される。一例では、幾何学分割マージモードとして64パターンを定義し、固定長符号化する。64パターンのうち、分割角度を示すインデックスが符号化ブロックの対角線をなす角度(例えば45度(360度を32分割で表現する構成においては、angleIdx=4)又は135度(360度を32分割で表現する構成においては、angleIdx=12))を示し、かつ符号化ブロックの中心からの距離を示すインデックスが最小(distanceIdx=0, 分割境界が符号化ブロックの中心を通ることを示す)となる2つのモードは、符号化ブロックを対角線で分割することを示し、三角マージモードに相当する。
マージ三角パーティション0の単予測動き情報候補は、MV0_L0、MV1_L0、MV3_L0、MV4_L0、MV3_L1の順序で、動き情報が構成され、マージ三角パーティション1の単予測動き情報候補は、MV0_L1、MV2_L1、MV3_L1、MV4_L0、MV3_L0の順序で、動き情報が構成される。
変形例1では、第1の実施の形態とはマージ三角インデックスが異なり、マージ三角インデックス0とマージ三角インデックス1の最大三角マージ候補数が互いに異なる。ここでは、マージ三角インデックス1の最大三角マージ候補数はマージ三角インデックス0の最大三角マージ候補数より1小さいものとする。この時、マージ三角インデックス1の単予測動き情報候補としてマージ三角インデックス0で選択されたマージ候補を除外する。つまり、マージ三角インデックス0の最大三角マージ候補数はマージインデックスの最大マージ候補数と同一となり、マージ三角インデックス1の最大三角マージ候補数はマージインデックスの最大マージ候補数より1小さくなる。
第2の実施の形態では、マージ三角パーティション0とマージ三角パーティション1において、参照リストL1内の候補探索の順序が第1の実施の形態と異なる。他の構成は第1の実施の形態と同様である。
変形例1では、第2の実施の形態とはマージ三角インデックスが異なり、マージ三角インデックス0とマージ三角インデックス1の最大三角マージ候補数が互いに異なる。ここでは、マージ三角インデックス1の最大三角マージ候補数はマージ三角インデックス0の最大三角マージ候補数より1小さいものとする。この時、マージ三角インデックス1の単予測動き情報候補としてマージ三角インデックス0で選択されたマージ候補を除外する。つまり、マージ三角インデックス0の最大三角マージ候補数はマージインデックスの最大マージ候補数と同一となり、マージ三角インデックス1の最大三角マージ候補数はマージインデックスの最大マージ候補数より1小さくなる。
Claims (6)
- 動画像をブロック単位でインター予測情報によるインター予測を用いて符号化し、ビットストリームを生成する画像符号化装置であって、
通常マージ候補を含む通常マージ候補リストを構築する通常マージ候補リスト構築部と、
マージインデックスに基づいて前記通常マージ候補リストから単予測又は双予測となる通常マージ候補を選択する通常マージ候補選択部と、
第1の三角マージインデックスに基づいて前記通常マージ候補リストから単予測となる第1の三角マージ候補を選択し、第2の三角マージインデックスに基づいて前記通常マージ候補リストから単予測となる第2の三角マージ候補を選択する三角マージ候補選択部と、
前記マージインデックス、または前記第1の三角マージインデックスおよび前記第2の三角マージインデックスを符号化する符号化部と、
を備え、
前記第1の三角マージインデックスと前記第2の三角マージインデックスは異なる優先順序で前記通常マージ候補リストからそれぞれ前記第1の三角マージ候補と前記第2の三角マージ候補を選択することを特徴とする画像符号化装置。 - 動画像をブロック単位でインター予測情報によるインター予測を用いて符号化し、ビットストリームを生成する画像符号化方法であって、
通常マージ候補を含む通常マージ候補リストを構築する通常マージ候補リスト構築ステップと、
マージインデックスに基づいて前記通常マージ候補リストから単予測又は双予測となる通常マージ候補を選択する通常マージ候補選択ステップと、
第1の三角マージインデックスに基づいて前記通常マージ候補リストから単予測となる第1の三角マージ候補を選択し、第2の三角マージインデックスに基づいて前記通常マージ候補リストから単予測となる第2の三角マージ候補を選択する三角マージ候補選択ステップと、
前記マージインデックス、または前記第1の三角マージインデックスおよび前記第2の三角マージインデックスを符号化する符号化ステップと、
を備え、
前記第1の三角マージインデックスと前記第2の三角マージインデックスは異なる優先順序で前記通常マージ候補リストからそれぞれ前記第1の三角マージ候補と前記第2の三角マージ候補を選択することを特徴とする画像符号化方法。 - 動画像をブロック単位でインター予測を用いて符号化されたビットストリームを復号する画像復号装置であって、
マージインデックス、または第1の三角マージインデックスおよび第2の三角マージインデックスを復号する復号部と、
通常マージ候補を含む通常マージ候補リストを構築する通常マージ候補リスト構築部と、
前記マージインデックスに基づいて前記通常マージ候補リストから単予測又は双予測となる通常マージ候補を選択する通常マージ候補選択部と、
前記第1の三角マージインデックスに基づいて前記通常マージ候補リストから単予測となる第1の三角マージ候補を選択し、前記第2の三角マージインデックスに基づいて前記通常マージ候補リストから単予測となる第2の三角マージ候補を選択する三角マージ候補選択部と、
を備え、
前記第1の三角マージインデックスと前記第2の三角マージインデックスは異なる優先順序で前記通常マージ候補リストからそれぞれ前記第1の三角マージ候補と前記第2の三角マージ候補を選択することを特徴とする画像復号装置。 - 動画像をブロック単位でインター予測を用いて符号化されたビットストリームを復号する画像復号方法であって、
マージインデックス、または第1の三角マージインデックスおよび第2の三角マージインデックスを復号する復号ステップと、
通常マージ候補を含む通常マージ候補リストを構築する通常マージ候補リスト構築ステップと、
前記マージインデックスに基づいて前記通常マージ候補リストから単予測又は双予測となる通常マージ候補を選択する通常マージ候補選択ステップと、
前記第1の三角マージインデックスに基づいて前記通常マージ候補リストから単予測となる第1の三角マージ候補を選択し、前記第2の三角マージインデックスに基づいて前記通常マージ候補リストから単予測となる第2の三角マージ候補を選択する三角マージ候補選択ステップと、
を備え、
前記第1の三角マージインデックスと前記第2の三角マージインデックスは異なる優先順序で前記通常マージ候補リストからそれぞれ前記第1の三角マージ候補と前記第2の三角マージ候補を選択することを特徴とする画像復号方法。 - 請求項2に記載された画像符号化方法に従って生成されたビットストリームを記録媒体に格納する格納方法。
- 請求項2に記載された画像符号化方法に従って生成されたビットストリームを伝送する伝送方法。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019042580 | 2019-03-08 | ||
JP2019042580 | 2019-03-08 | ||
PCT/JP2020/009772 WO2020184459A1 (ja) | 2019-03-08 | 2020-03-06 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
JP2021505038A JP6977909B2 (ja) | 2019-03-08 | 2020-03-06 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
JP2021183960A JP7209801B2 (ja) | 2019-03-08 | 2021-11-11 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
JP2023001024A JP7457883B2 (ja) | 2019-03-08 | 2023-01-06 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023001024A Division JP7457883B2 (ja) | 2019-03-08 | 2023-01-06 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2024037837A JP2024037837A (ja) | 2024-03-19 |
JP7554986B2 true JP7554986B2 (ja) | 2024-09-24 |
Family
ID=72427533
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021505038A Active JP6977909B2 (ja) | 2019-03-08 | 2020-03-06 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
JP2021183960A Active JP7209801B2 (ja) | 2019-03-08 | 2021-11-11 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
JP2023001024A Active JP7457883B2 (ja) | 2019-03-08 | 2023-01-06 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
JP2023208456A Active JP7554986B2 (ja) | 2019-03-08 | 2023-12-11 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021505038A Active JP6977909B2 (ja) | 2019-03-08 | 2020-03-06 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
JP2021183960A Active JP7209801B2 (ja) | 2019-03-08 | 2021-11-11 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
JP2023001024A Active JP7457883B2 (ja) | 2019-03-08 | 2023-01-06 | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
Country Status (8)
Country | Link |
---|---|
US (1) | US20220070444A1 (ja) |
EP (2) | EP3923582A4 (ja) |
JP (4) | JP6977909B2 (ja) |
KR (1) | KR20210107116A (ja) |
CN (6) | CN113557739B (ja) |
BR (1) | BR112021016738A8 (ja) |
MX (1) | MX2021010547A (ja) |
WO (1) | WO2020184459A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113508599A (zh) * | 2018-12-21 | 2021-10-15 | 交互数字Vc控股公司 | 用于视频编码中运动信息信令通知的语法 |
AR118250A1 (es) * | 2019-03-08 | 2021-09-22 | Jvckenwood Corp | Dispositivos, métodos y programas de codificación y decodificación de imágenes en movimiento |
CN110809161B (zh) * | 2019-03-11 | 2020-12-29 | 杭州海康威视数字技术股份有限公司 | 运动信息候选者列表构建方法及装置 |
WO2020260280A1 (en) * | 2019-06-25 | 2020-12-30 | Interdigital Vc Holdings France, Sas | Motion vector prediction in video encoding and decoding |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020073896A1 (en) | 2018-10-08 | 2020-04-16 | Huawei Technologies Co., Ltd. | Apparatuses and methods for inter prediction of a triangle partition of a coding block |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3277111B2 (ja) | 1995-10-18 | 2002-04-22 | シャープ株式会社 | 動画像符号化装置および動画像復号化装置 |
PL3751854T3 (pl) * | 2011-05-24 | 2023-08-28 | Sun Patent Trust | Sposób kodowania obrazu, urządzenie do kodowania obrazu, sposób dekodowania obrazu, urządzenie do dekodowania obrazu oraz urządzenie do kodowania/dekodowania obrazu |
JP5942782B2 (ja) * | 2011-10-31 | 2016-06-29 | 株式会社Jvcケンウッド | 動画像復号装置、動画像復号方法、動画像復号プログラム、受信装置、受信方法及び受信プログラム |
CN105791820B (zh) * | 2012-01-18 | 2018-03-13 | Jvc 建伍株式会社 | 动图像解码装置以及动图像解码方法 |
KR20140005099A (ko) * | 2012-07-02 | 2014-01-14 | 한국전자통신연구원 | 영상 부호화/복호화 방법 및 장치 |
WO2017118411A1 (en) * | 2016-01-07 | 2017-07-13 | Mediatek Inc. | Method and apparatus for affine inter prediction for video coding system |
WO2020079896A1 (ja) | 2018-10-17 | 2020-04-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理装置、情報処理方法及びプログラム |
MX2021007510A (es) * | 2018-12-21 | 2021-08-05 | Hfi Innovation Inc | Metodo y aparato de derivacion de lista de candidatos del modo de fusion de triangulo simplificado. |
US20200288175A1 (en) * | 2019-03-06 | 2020-09-10 | Qualcomm Incorporated | Signaling of triangle merge mode indexes in video coding |
-
2020
- 2020-03-06 EP EP20769207.0A patent/EP3923582A4/en active Pending
- 2020-03-06 EP EP24186017.0A patent/EP4418658A2/en active Pending
- 2020-03-06 CN CN202080019439.2A patent/CN113557739B/zh active Active
- 2020-03-06 CN CN202310676815.0A patent/CN116527930A/zh active Pending
- 2020-03-06 KR KR1020217024177A patent/KR20210107116A/ko not_active Application Discontinuation
- 2020-03-06 CN CN202310676835.8A patent/CN116527932A/zh active Pending
- 2020-03-06 CN CN202310676271.8A patent/CN116506637A/zh active Pending
- 2020-03-06 JP JP2021505038A patent/JP6977909B2/ja active Active
- 2020-03-06 CN CN202310676816.5A patent/CN116527931A/zh active Pending
- 2020-03-06 MX MX2021010547A patent/MX2021010547A/es unknown
- 2020-03-06 WO PCT/JP2020/009772 patent/WO2020184459A1/ja active Search and Examination
- 2020-03-06 CN CN202310675947.1A patent/CN116489388A/zh active Pending
- 2020-03-06 BR BR112021016738A patent/BR112021016738A8/pt unknown
-
2021
- 2021-09-08 US US17/468,763 patent/US20220070444A1/en active Pending
- 2021-11-11 JP JP2021183960A patent/JP7209801B2/ja active Active
-
2023
- 2023-01-06 JP JP2023001024A patent/JP7457883B2/ja active Active
- 2023-12-11 JP JP2023208456A patent/JP7554986B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020073896A1 (en) | 2018-10-08 | 2020-04-16 | Huawei Technologies Co., Ltd. | Apparatuses and methods for inter prediction of a triangle partition of a coding block |
Non-Patent Citations (4)
Title |
---|
Li Zhang et al.,CE10-related: Merge list construction process for triangular prediction mode,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-M0271,13th Meeting: Marrakech, MA,2019年01月,pp.1-4 |
Ru-Ling Liao, Jingya Li, and Chong Soon Lim,CE10-related: Simplification of triangular prediction unit mode,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-M0317-r3,13th Meeting: Marrakech, MA,2019年01月,pp.1-6 |
Timofey Solovyev et al.,Non-CE4: Simplifications for triangular prediction mode,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-M0286-v2,13th Meeting: Marrakech, MA,2019年01月,pp.1-7 |
Xianglin Wang and Yi-Wen Chen,Non-CE10: Triangle prediction merge list construction,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-M0233-v2,13th Meeting: Marrakech, MA,2019年01月,pp.1-3 |
Also Published As
Publication number | Publication date |
---|---|
BR112021016738A2 (pt) | 2021-10-19 |
JP6977909B2 (ja) | 2021-12-08 |
CN116489388A (zh) | 2023-07-25 |
JPWO2020184459A1 (ja) | 2021-12-09 |
BR112021016738A8 (pt) | 2022-08-02 |
CN113557739B (zh) | 2023-07-11 |
CN116506637A (zh) | 2023-07-28 |
CN116527930A (zh) | 2023-08-01 |
US20220070444A1 (en) | 2022-03-03 |
KR20210107116A (ko) | 2021-08-31 |
JP2024037837A (ja) | 2024-03-19 |
JP7457883B2 (ja) | 2024-03-29 |
MX2021010547A (es) | 2021-10-01 |
JP2022033109A (ja) | 2022-02-28 |
WO2020184459A1 (ja) | 2020-09-17 |
EP3923582A1 (en) | 2021-12-15 |
CN113557739A (zh) | 2021-10-26 |
CN116527932A (zh) | 2023-08-01 |
EP3923582A4 (en) | 2022-06-08 |
JP7209801B2 (ja) | 2023-01-20 |
CN116527931A (zh) | 2023-08-01 |
EP4418658A2 (en) | 2024-08-21 |
JP2023026659A (ja) | 2023-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7445936B2 (ja) | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム | |
JP7554986B2 (ja) | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム | |
JP7521645B2 (ja) | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム | |
JP2024053073A (ja) | 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム | |
JP7147926B2 (ja) | 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム | |
KR102587946B1 (ko) | 동화상 부호화 장치, 동화상 부호화 방법 및, 동화상 부호화 프로그램이 기록된 컴퓨터 판독가능 기록 매체, 동화상 복호 장치, 동화상 복호 방법 및 동화상 복호 프로그램이 기록된 컴퓨터 판독가능 기록 매체 | |
JP2021052390A (ja) | 画像復号装置、画像復号方法及び画像復号プログラム | |
WO2020137857A1 (ja) | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240806 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7554986 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |