JP2021027429A - 動画像符号化装置、動画像復号装置 - Google Patents
動画像符号化装置、動画像復号装置 Download PDFInfo
- Publication number
- JP2021027429A JP2021027429A JP2019142246A JP2019142246A JP2021027429A JP 2021027429 A JP2021027429 A JP 2021027429A JP 2019142246 A JP2019142246 A JP 2019142246A JP 2019142246 A JP2019142246 A JP 2019142246A JP 2021027429 A JP2021027429 A JP 2021027429A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- parameter
- triangle
- unit
- merge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000009795 derivation Methods 0.000 description 78
- 239000013598 vector Substances 0.000 description 52
- 230000033001 locomotion Effects 0.000 description 50
- 238000000034 method Methods 0.000 description 49
- 238000006243 chemical reaction Methods 0.000 description 45
- 230000015654 memory Effects 0.000 description 43
- 238000013139 quantization Methods 0.000 description 42
- 230000005540 biological transmission Effects 0.000 description 24
- 230000008569 process Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 15
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 14
- 101001036283 Xenopus laevis DNA-binding protein inhibitor ID-3-A Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000002457 bidirectional effect Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000010364 biochemical engineering Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 101100243951 Caenorhabditis elegans pie-1 gene Proteins 0.000 description 2
- 208000034188 Stiff person spectrum disease Diseases 0.000 description 2
- 229920010524 Syndiotactic polystyrene Polymers 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 208000012112 ischiocoxopodopatellar syndrome Diseases 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229920000069 polyphenylene sulfide Polymers 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000002490 spark plasma sintering Methods 0.000 description 2
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
以下、図面を参照しながら本発明の実施形態について説明する。
WAN:Wide Area Network)、小規模ネットワーク(LAN:Local Area Network)またはこれらの組み合わせである。ネットワーク21は、必ずしも双方向の通信網に限らず、地上デジタル放送、衛星放送等の放送波を伝送する一方向の通信網であっても良い。また、ネットワーク21は、DVD(Digital Versatile Disc:登録商標)、BD(Blue-ray Disc:登録商標)等の符号化ストリームTeを記録した記憶媒体で代替されても良い。
本明細書で用いる演算子を以下に記載する。
本実施形態に係る動画像符号化装置11および動画像復号装置31の詳細な説明に先立って、動画像符号化装置11によって生成され、動画像復号装置31によって復号される符号化ストリームTeのデータ構造について説明する。
符号化ビデオシーケンスでは、処理対象のシーケンスSEQを復号するために動画像復号装置31が参照するデータの集合が規定されている。シーケンスSEQは、図4に示すように、ビデオパラメータセット(Video Parameter Set)、シーケンスパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、Adaptation Parameter Set(APS)、ピクチャPICT、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。
符号化ピクチャでは、処理対象のピクチャPICTを復号するために動画像復号装置31が参照するデータの集合が規定されている。ピクチャPICTは、図4に示すように、スライス0〜スライスNS-1を含む(NSはピクチャPICTに含まれるスライスの総数)。
符号化スライスでは、処理対象のスライスSを復号するために動画像復号装置31が参照するデータの集合が規定されている。スライスは、図4に示すように、スライスヘッダ、および、スライスデータを含んでいる。
符号化スライスデータでは、処理対象のスライスデータを復号するために動画像復号装置31が参照するデータの集合が規定されている。スライスデータは、図4(d)に示すように、CTUを含んでいる。CTUは、スライスを構成する固定サイズ(例えば64x64)のブロックであり、最大符号化単位(LCU:Largest Coding Unit)と呼ぶこともある。
図4には、処理対象のCTUを復号するために動画像復号装置31が参照するデータの集合が規定されている。CTUは、再帰的な4分木分割(QT(Quad Tree)分割)、2分木分割(BT(Binary Tree)分割)あるいは3分木分割(TT(Ternary Tree)分割)により、符号化処理の基本的な単位である符号化ユニットCUに分割される。BT分割とTT分割を合わせてマルチツリー分割(MT(Multi Tree)分割)と呼ぶ。再帰的な4分木分割により得られる木構造のノードのことを符号化ノード(Coding Node)と称する。4分木、2分木、及び3分木の中間ノードは、符号化ノードであり、CTU自身も最上位の符号化ノードとして規定される。
図4は、処理対象の符号化ユニットを復号するために動画像復号装置31が参照するデータの集合が規定されている。具体的には、CUは、CUヘッダCUH、予測パラメータ、変換パラメータ、量子化変換係数等から構成される。CUヘッダでは予測モード等が規定される。
予測画像は、ブロックに付随する予測パラメータによって導出される。予測パラメータには、イントラ予測とインター予測の予測パラメータがある。
参照ピクチャリストは、参照ピクチャメモリ306に記憶された参照ピクチャからなるリストである。図6は、参照ピクチャおよび参照ピクチャリストの一例を示す概念図である。図6(a)において、矩形はピクチャ、矢印はピクチャの参照関係、横軸は時間、矩形中のI、P、Bは各々イントラピクチャ、単予測ピクチャ、双予測ピクチャ、矩形中の数字は復号順を示す。図に示すように、ピクチャの復号順は、I0、P1、B2、B3、B4であり、表示順は、I0、B3、B2、B4、P1である。図6(b)に、ピクチャB3(対象ピクチャ)の参照ピクチャリストの例を示す。参照ピクチャリストは、参照ピクチャの候補を表すリストであり、1つのピクチャ(スライス)が1つ以上の参照ピクチャリストを有してもよい。図の例では、対象ピクチャB3は、L0リストRefPicList0およびL1リストRefPicList1の2つの参照ピクチャリストを持つ。個々のCUでは、参照ピクチャリストRefPicListX(X=0または1)中のどのピクチャを実際に参照するかをrefIdxLXで指定する。図は、refIdxL0=2、refIdxL1=0の例である。なお、LXは、L0予測とL1予測を区別しない場合に用いられる記述方法であり、以降では、LXをL0、L1に置き換えることでL0リストに対するパラメータとL1リストに対するパラメータを区別する。
予測パラメータの復号(符号化)方法には、マージ予測(merge)モードとAMVP(Advan
ced Motion Vector Prediction、適応動きベクトル予測)モードがあり、merge_flagは、これらを識別するためのフラグである。マージ予測モードは、予測リスト利用フラグpredFlagLX、参照ピクチャインデックスrefIdxLX、動きベクトルmvLXを符号化データに含めずに、既に処理した近傍ブロックの予測パラメータ等から導出するモードである。AMVPモードは、inter_pred_idc、refIdxLX、mvLXを符号化データに含めるモードである。なお、mvLXは、予測ベクトルmvpLXを識別するmvp_LX_idxと差分ベクトルmvdLXとして符号化される。また、マージ予測モードの他に、アフィン予測モード、MMVD予測モードがあってもよい。
mvLXは、異なる2つのピクチャ上のブロック間のシフト量を示す。mvLXに関する予測ベクトル、差分ベクトルを、それぞれmvpLX、mvdLXと呼ぶ。
inter_pred_idcと、predFlagL0、predFlagL1の関係は以下のとおりであり、相互に変換可能である。
predFlagL0 = inter_pred_idc & 1
predFlagL1 = inter_pred_idc >> 1
なお、インター予測パラメータは、予測リスト利用フラグを用いても良いし、インター予測識別子を用いてもよい。また、予測リスト利用フラグを用いた判定は、インター予測識別子を用いた判定に置き替えてもよい。逆に、インター予測識別子を用いた判定は、予測リスト利用フラグを用いた判定に置き替えてもよい。
双予測であるかのフラグbiPredは、2つの予測リスト利用フラグがともに1であるかによって導出できる。例えば以下の式で導出できる。
あるいは、biPredは、インター予測識別子が2つの予測リスト(参照ピクチャ)を使うことを示す値であるか否かによっても導出できる。例えば以下の式で導出できる。
(動画像復号装置の構成)
本実施形態に係る動画像復号装置31(図7)の構成について説明する。
図8は、動画像復号装置31の概略的動作を説明するフローチャートである。
インター予測パラメータ導出部303は、パラメータ復号部302から入力されたシンタックス要素に基づいて、予測パラメータメモリ307に記憶された予測パラメータを参照してインター予測パラメータを導出する。また、インター予測パラメータをインター予測画像生成部309、予測パラメータメモリ307に出力する。インター予測パラメータ導出部303及びその内部の要素であるAMVP予測パラメータ導出部3032、マージ予測パラメータ導出部3036、アフィン予測部30372、MMVD予測部30373、Triangle予測部30377、DMVR部30537、MV加算部3038は、動画像符号化装置、動画像復号装置で共通する手段であるので、これらを総称して動きベクトル導出部(動きベクトル導出装置)と称してもよい。インター予測パラメータ導出部303の一例を図9に示す。
MV加算部3038では導出されたmvpLXとmvdLXを加算し、mvLXを導出する。
アフィン予測部30372は、1)対象ブロックの2つの制御点CP0、CP1、もしくは3つの制御点CP0, CP1, CP2の動きベクトルを導出し、2)対象ブロックのアフィン予測パラメータを導出し、3)アフィン予測パラメータから各サブブロックの動きベクトルを導出する。
(マージ予測)
図10(a)は、本実施形態に係るマージ予測パラメータ導出部3036の構成を示す概略図である。マージ予測パラメータ導出部3036は、マージ候補導出部30361、マージ候補選択部30362を備える。なお、マージ候補は、予測パラメータ(predFlagLX、mvLX、refIdxLX、bcwIdx)を含んで構成され、マージ候補リストに格納される。マージ候補リストに格納されたマージ候補には、所定の規則に従ってインデックスが割り当てられる。
ここで、A1,B1,B0,A0,B2は各々、下記の座標を含むブロックから導出される動き情報である。図10(b)にA1,B1,B0,A0,B2の位置を示す。
B1: (xCb + cbWidth - 1, yCb - 1)
B0: (xCb + cbWidth, yCb - 1)
A0: (xCb - 1, yCb + cbHeight)
B2: (xCb - 1, yCb - 1)
対象ブロックの左上座標を(xCb, yCb)、幅cbWidth、高さcbHeightとする。
mvLXavgK[1] = (mvLXp0Cand[1]+mvLXp1Cand[1])/2
マージ候補導出部30361は、refIdxLXが0…Mであり、mvLXのX成分、Y成分が共に0であるゼロマージ候補Z0,…, ZMを導出しマージ候補リストに格納する。
i = 0
if( availableFlagA1 )
mergeCandList[ i++ ] = A1
if( availableFlagB1 )
mergeCandList[ i++ ] = B1
if( availableFlagB0 )
mergeCandList[ i++ ] = B0
if( availableFlagA0 )
mergeCandList[ i++ ] = A0
if( availableFlagB2 )
mergeCandList[ i++ ] = B2
if( availableFlagCol )
mergeCandList[ i++ ] = Col
if( availableFlagAvgK )
mergeCandList[ i++ ] = avgK
if( i < MaxNumMergeCand )
mergeCandList[ i++ ] = ZK
マージ候補選択部30362は、マージ候補リストに含まれるマージ候補のうち、merge_idxが示すマージ候補Nを以下の式で選択する。
ここでNは、マージ候補を示すラベルであり、A1,B1,B0,A0,B2,Col,avgK,ZKなどをとる。ラベルNで示されるマージ候補の動き情報は(mvLXN[0], mvLXN[0])、predFlagLXN, refIdxLXN、bcwIdxNで示される。
MMVD予測部30373は、マージ候補導出部30361で導出した中心ベクトルmvpLX(マージ候補Nの動きベクトルmvLXN)に、所定の距離及び所定の方向のmvdLXを加算することでmvLXを求める。MMVD予測部30373は、符号化データのシンタックス要素base_candidate_idxを用いて中心ベクトルmvLX[]を導出し、方向テーブルのインデックスを示すdirection_idxと距離テーブルのインデックスを示すdistance_idxから差分ベクトルmMvdLX[]を導出する。
Triangle予測では、図14に示すように、対象ブロックを2種類の対角線を用いて2つの三角予測ユニット(PU0、PU1)に分割する。図中、(a)は分割方向triangleDir=0、(b)はtriangleDir=1を示す。また、PU0、PU1の予測画像を生成した後、対角線のエッジに対し、重みつけ処理が実行される。
Triangle予測のオンオフ、オンの場合のパラメータは符号化データで下記のように通知される。
MaxNumMergeCandはマージ予測の候補数の最大値である。max_num_merge_cand_minus_max_num_triangle_candがスライスヘッダで通知されず、かつ、sps_triangle_enabled_flag==1、かつ、MaxNumMergeCand>=2の場合、Triangle予測部30377は下式で設定する。
max_num_merge_cand_minus_max_num_triangle_candが通知される場合、MaxNumTriangleMergeCandは2以上、MaxNumMergeCand以下でなければならない。
・sps_triangle_enabled_flag=1(対象SPSにおいてTriangle予測が利用可能)
・slice_typeはBスライス
・general_merge_flag=1(マージ予測がオン、対象ブロックのインター予測パラメータは近傍のインター予測ブロックから推定する)
・MaxNumTriangleMergeCand>=2(Triangle予測の候補数の最大値が2以上)
・cbWidth*cbHeight>=64(対象ブロックの画素数が64以上)
・regular_merge_flag=0(基本的なマージ予測あるいはMMVD予測がオン)
・merge_subblock_flag=0(サブブロック単位のインター予測がオフ)
・ciip_flag=0(イントラ予測画像とインター予測画像の合成処理がオフ)
Triangle予測部30377はMergeTriangleFlag=1の場合に、以下の手順で予測画像生成に必要なパラメータを導出し、Triangle合成部30952に出力する。
Triangle予測部30377は、PU0とPU1のマージインデックスmとn、Triangle予測の分割方向triangleDirを導出する。
n = merge_triangle_idx1 + (merge_triangle_idx1 >= m) ? 1 : 0
triangleDir = merge_triangle_split_dir
以下では、マージインデックスmが指すマージ候補をM、マージインデックスnが指すマージ候補をNと示す。
mvA[1] = mvLXM[1]
refIdxA = refIdxLXM
predListFlagA = X
ここで、Xにmの下位1bitをセットする(m & 0x01)。なお、predFlagLXMが0の場合、Xを(1-X)にセットする。
mvB[1] = mvLXN[1]
refIdxB = refIdxLXN
predListFlagB = X
ここで、Xにnの下位1bitをセットする(n & 0x01)。なお、predFlagLXNが0の場合、Xを(1-X)にセットする。
Triangle予測部30377は、PU0、PU1境界の対角線のエッジに対し適用する重み予測の係数を以下の手順で導出する。ここでnCbW=cbWidth、nCbH=cbHeightである。
triangleDirが0の場合、予測画素の重み係数wValueを以下のように導出する。
triangleDirが1の場合、wValueを以下のように導出する。
: (Clip3(0, 8, (nCbW - 1 - x - y/nCbR) + 4))
wValueの一例を図14(c)に示す。
Triangle予測部30377は、後続の処理で参照できるように、以下の手順で、PU0、PU1の動き情報を4*4サブブロック単位でメモリに格納する。
xSbIdx = 0..numSbX - 1、ySbIdx = 0..numSbY - 1である4*4サブブロックの位置(xSbIdx,ySbIdx)毎に、以下の処理を実行する。
yIdx = (cbWidth > cbHeight) ? ySbIdx : (ySbIdx/cbRatio)
triangleDir==0の場合、図14(e)に示すsTypeを以下で導出する。
triangleDir==1の場合、図14(f)に示すsTypeを以下で導出する。
sTypeは、各4*4サブブロックがPU0、PU1、PU0とPU1の境界部分のいずれに位置するかを示
すパラメータである。sType=0は4*4サブブロックがPU0に位置することを示す。sType=1は4*4サブブロックがPU1に位置することを示す。sType=2は4*4サブブロックがPU0とPU1の境界部分に位置することを示す。
predFlagL1 = (predListFlagA == 0) ? 0 : 1
refIdxL0 = (predListFlagA == 0) ? refIdxA : -1
refIdxL1 = (predListFlagA == 0) ? -1 : refIdxA
mvL0[0] = (predListFlagA == 0) ? mvA[0] : 0
mvL0[1] = (predListFlagA == 0) ? mvA[1] : 0
mvL1[0] = (predListFlagA == 0) ? 0 : mvA[0]
mvL1[1] = (predListFlagA == 0) ? 0 : mvA[1]
そうではなく、sType==1、または、sType==2かつpredListFlagA+predListFlagB!=1の場合、下記を実施する。ここでpredListFlagA+predListFlagB!=1はPU0とPU1の参照ピクチャリストが同じであることを表す。
predFlagL1 = (predListFlagB == 0) ? 0 : 1
refIdxL0 = (predListFlagB == 0) ? refIdxB : -1
refIdxL1 = (predListFlagB == 0) ? -1 : refIdxB
mvL0[0] = (predListFlagB == 0) ? mvB[0] : 0
mvL0[1] = (predListFlagB == 0) ? mvB[1] : 0
mvL1[0] = (predListFlagB == 0) ? 0 : mvB[0]
mvL1[1] = (predListFlagB == 0) ? 0 : mvB[1]
そうでない場合(sType==2かつpredListFlagA+predListFlagB==1)、下記を実施する。ここでpredListFlagA+predListFlagB==1はPU0とPU1の参照ピクチャリストが異なることを表す。
predFlagL1 = 1
refIdxL0 = (predListFlagA == 0) ? refIdxA : refIdxB
refIdxL1 = (predListFlagA == 0) ? refIdxB : refIdxA
mvL0[0] = (predListFlagA == 0) ? mvA[0] : mvB[0]
mvL0[1] = (predListFlagA == 0) ? mvA[1] : mvB[1]
mvL1[0] = (predListFlagA == 0) ? mvB[0] : mvA[0]
mvL1[1] = (predListFlagA == 0) ? mvB[1] : mvA[1]
(変形例1)
第1の実施形態の変形例では、PPSにおいてpps_max_num_merge_cand_minus_max_num_triangle_cand_minus1に代わりにpps_max_num_merge_cand_minus_max_num_triangle_cand_plus1を通知する。
pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は、スライスヘッダでmax_num_merge_cand_minus_max_num_triangle_cand(第2のパラメータ)が通知されるか否かを示すフラグ、兼、スライスヘッダで通知しない場合のマージ候補数を導出するためのパラメータである。pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1=0は、スライスヘッダでmax_num_merge_cand_minus_max_num_triangle_candが通知されることを示す。pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1が0より大きい場合、スライスヘッダではmax_num_merge_cand_minus_max_num_triangle_candは通知されない。pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は0からMaxNumMergeCand-1の範囲の値をとる。
MaxNumMergeCandはマージ予測の候補数の最大値である。max_num_merge_cand_minus_max_num_triangle_candがスライスヘッダで通知されず(pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1!=0)、かつ、sps_triangle_enabled_flag==1、かつ、MaxNumMergeCand>=2の場合、Triangle予測部30377は下式で設定する。
max_num_merge_cand_minus_max_num_triangle_candが通知される場合、MaxNumTriangleMergeCandは2以上、MaxNumMergeCand以下でなければならない。
_plus1を復号する(S1802)。
あるいは、図17(b)のように、pps_max_num_merge_cand_minus_max_num_triangle_cand_minus1に代わりにpps_max_num_triangle_cand_minus1(第4のパラメータ)を通知する。
max_num_merge_cand_minus_max_num_triangle_candがスライスヘッダで通知されず(pps_max_num_triangle_cand_minus1!=0)、かつ、sps_triangle_enabled_flag==1、かつ、MaxNumMergeCand>=2の場合、Triangle予測部30377はMaxNumTriangleMergeCandを下式で設定する。
max_num_merge_cand_minus_max_num_triangle_candが通知される場合、MaxNumTriangleMergeCandは2以上、MaxNumMergeCand以下でなければならない。
本願の第2の実施形態では、Triangle予測を直接オフにすることができるシンタックス要素を説明する。
第1の実施形態と第2の実施形態を組み合わせてもよい。
続いて、DMVR部30375が行うDMVR(Decoder side Motion Vector Refinement)処理について説明する。DMVR部30375は、対象CUに対して、merge_flagが1の場合、又は、スキップフラグskip_flagが1の場合、マージ予測部30374が導出する当該対象CUのmvLXを、参照画像を用いて修正する。具体的には、マージ予測部30374が導出する予測パラメータが双予測である場合において、2つの参照ピクチャに対応すると動きベクトルから導出される予測画像を用いて、動きベクトルを修正する。修正後のmvLXはインター予測画像生成部309に供給される。
図10(c)は、本実施形態に係るAMVP予測パラメータ導出部3032の構成を示す概略図である。AMVP予測パラメータ導出部3032は、ベクトル候補導出部3033とベクトル候補選択部3034を備える。ベクトル候補導出部3033は、refIdxLXに基づいて予測パラメータメモリ307が記憶する復号済みの隣接ブロックの動きベクトルから予測ベクトル候補を導出し、予測ベクトル候補リストmvpListLX[]に格納する。
MV加算部3038は、AMVP予測パラメータ導出部3032から入力されたmvpLXと復号したmvdLXを加算してmvLXを算出する。加算部3038は、算出したmvLXをインター予測画像生成部309および予測パラメータメモリ307に出力する。
mvLX[1] = mvpLX[1]+mvdLX[1]
(動きベクトルスケーリング)
動きベクトルのスケーリングの導出方法を説明する。動きベクトルMv(参照動きベクトル)、Mvをもつブロックを含むピクチャPicMv、Mvの参照ピクチャPicMvRef、スケーリング後の動きベクトルsMv、sMvをもつブロックを含むピクチャCurPic、sMvが参照する参照ピクチャCurPicRefとすると、sMvの導出関数MvScale(Mv,PicMv,PicMvRef,CurPic,CurPicRef)は下式で表される。
= Clip3(-R1,R1-1,sign(distScaleFactor*Mv)*((abs(distScaleFactor*Mv)+round1-1)>>shift1))
distScaleFactor = Clip3(-R2,R2-1,(tb*tx+round2)>>shift2)
tx = (16384+abs(td)>>1)/td
td = DiffPicOrderCnt(PicMv,PicMvRef)
tb = DiffPicOrderCnt(CurPic,CurPicRef)
ここで、round1、round2、shift1、shift2は、逆数を用いて除算を行うためのラウンド値及びシフト値で、例えば、round1=1<<(shift1-1)、round2=1<<(shift2-1)、shift1=8、shift2=6などである。DiffPicOrderCnt(Pic1,Pic2)はPic1とPic2の時間情報(例えばPOC)の差を返す関数である。R1、R2は処理を限られた精度で行うために値域を制限するもので例えば、R1=32768、R2=4096などである。
Mv*DiffPicOrderCnt(CurPic,CurPicRef)/DiffPicOrderCnt(PicMv,PicMvRef)
すなわち、CurPicとCurPicRefの時間情報の差と、PicMvとPicMvRefの時間情報の差との比に応じてMvをスケーリングしてもよい。
イントラ予測パラメータ導出部304は、パラメータ復号部302からの入力に基づいて、予測パラメータメモリ307に記憶された予測パラメータを参照してイントラ予測パラメータ、例えば、イントラ予測モードIntraPredModeを導出する。イントラ予測パラメータ導出部304は、イントラ予測パラメータを予測画像生成部308に出力し、また予測パラメータメモリ307に記憶する。イントラ予測パラメータ導出部304は、輝度と色差で異なるイントラ予測モードを導出しても良い。
また、予測画像生成部308は、参照ピクチャメモリ306から参照ピクチャを読み出す。予測画像生成部308は、predModeが示す予測モードで、パラメータと参照ピクチャ(参照ピクチャブロック)を用いてブロックもしくはサブブロックの予測画像を生成する。ここで、参照ピクチャブロックとは、参照ピクチャ上の画素の集合(通常矩形であるのでブロックと呼ぶ)であり、予測画像を生成するために参照する領域である。
predModeがインター予測モードを示す場合、インター予測画像生成部309は、インター予測パラメータ導出部303から入力されたインター予測パラメータと参照ピクチャを用いてインター予測によりブロックもしくはサブブロックの予測画像を生成する。
動き補償部3091(補間画像生成部3091)は、インター予測パラメータ導出部303から入力された、インター予測パラメータ(predFlagLX、refIdxLX、mvLX)に基づいて、参照ピクチャメモリ306から参照ブロックを読み出すことによって補間画像(動き補償画像)を生成する。参照ブロックは、refIdxLXで指定された参照ピクチャRefPicLX上で、対象ブロックの位置からmvLXシフトした位置のブロックである。ここで、mvLXが整数精度でない場合には、動き補償フィルタと呼ばれる小数位置の画素を生成するためのフィルタを施して、補間画像を生成する。
xFrac = mvLX[0]&(MVPREC-1)
yInt = yPb+(mvLX[1]>>(log2(MVPREC)))+y
yFrac = mvLX[1]&(MVPREC-1)
ここで、(xPb,yPb)は、bW*bHサイズのブロックの左上座標、x=0…bW-1、y=0…bH-1であり、MVPRECは、mvLXの精度(1/MVPREC画素精度)を示す。例えばMVPREC=16である。
続いて、動き補償部3091は、一時的画像temp[][]を垂直補間処理により、補間画像Pred[][]を導出する。以下のΣはk=0..NTAP-1のkに関する和、shift2は値のレンジを調整する正規化パラメータ、offset2=1<<(shift2-1)である。
なお、双予測の場合、上記のPred[][]をL0リスト、L1リスト毎に導出し(補間画像PredL0[][]とPredL1[][]と呼ぶ)、PredL0[][]とPredL1[][]から補間画像Pred[][]を生成する。
IntraInter合成部30951は、インター予測画像とイントラ予測画像の重み付け和により予測画像を生成する。
MergeTriangleFlagが1の時、Triangle合成部30952は予測画像predSamplesを生成する。
predSamples[x][y] = Clip3(0, (1 << bitDepth) - 1, (predSamplesLA[x][y] * wValue + predSamplesLB[x][y] * (8 - wValue) + offset1) >> shift1)
ここで、shift1 = Max(5, 17 - bitDepth)、offset1 = 1 << (shift1 - 1)である。
BIO部30954は、双予測モードにおいて、2つの予測画像(第1の予測画像及び第2の予測画像)及び勾配補正項を参照して予測画像を生成する。
重み予測部3094は、補間画像PredLXに重み係数を乗算することによりブロックの予測画像を生成する。予測リスト利用フラグの一方(predFlagL0もしくはpredFlagL1)が1(単予測)、かつ、重み予測を用いない場合、PredLX(LXはL0もしくはL1)を画素ビット数bitDepthに合わせる以下の式の処理を行う。
ここで、shift1=14-bitDepth、offset1=1<<(shift1-1)である。
また、予測リスト利用フラグの両者(predFlagL0とpredFlagL1)が1(双予測PRED_BI)、かつ、重み予測を用いない場合、PredL0、PredL1を平均し画素ビット数に合わせる以下の式の処理を行う。
ここで、shift2=15-bitDepth、offset2=1<<(shift2-1)である。
ここで、log2WDは所定のシフト量を示す変数である。
インター予測画像生成部309は生成したブロックの予測画像を加算部312に出力する。
predModeがイントラ予測モードを示す場合、イントラ予測画像生成部310は、イントラ予測パラメータ導出部304から入力されたイントラ予測パラメータと参照ピクチャメモリ306から読み出した参照画素を用いてイントラ予測を行う。
次に、本実施形態に係る動画像符号化装置11の構成について説明する。図12は、本実施形態に係る動画像符号化装置11の構成を示すブロック図である。動画像符号化装置11は、予測画像生成部101、減算部102、変換・量子化部103、逆量子化・逆変換部105、加算部106、ループフィルタ107、予測パラメータメモリ(予測パラメータ記憶部、フレームメモリ)108、参照ピクチャメモリ(参照画像記憶部、フレームメモリ)109、符号化パラメータ決定部110、パラメータ符号化部111、予測パラメータ導出部120、エントロピー符号化部104を含んで構成される。
インター予測パラメータ符号化部112は図13に示すように、パラメータ符号化制御部1121、インター予測パラメータ導出部303を含んで構成される。インター予測パラメータ導出部303は動画像復号装置と共通の構成である。パラメータ符号化制御部1121は、マージインデックス導出部11211とベクトル候補インデックス導出部11212を含む。
イントラ予測パラメータ符号化部113は、パラメータ符号化制御部1131とイントラ予測パラメータ導出部304を備える。イントラ予測パラメータ導出部304は動画像復号装置と共通の構成である。
SAO、ALFを施す。なお、ループフィルタ107は、必ずしも上記3種類のフィルタを含まなくてもよく、例えばデブロッキングフィルタのみの構成であってもよい。
ても良い。
上述した動画像符号化装置11及び動画像復号装置31は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
るとよい。
、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
また、上述した動画像復号装置31および動画像符号化装置11の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の実施形態の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
301 エントロピー復号部
302 パラメータ復号部
303 インター予測パラメータ導出部
304 イントラ予測パラメータ導出部
305、107 ループフィルタ
306、109 参照ピクチャメモリ
307、108 予測パラメータメモリ
308、101 予測画像生成部
309 インター予測画像生成部
310 イントラ予測画像生成部
311、105 逆量子化・逆変換部
312、106 加算部
320 予測パラメータ導出部
11 画像符号化装置
102 減算部
103 変換・量子化部
104 エントロピー符号化部
110 符号化パラメータ決定部
111 パラメータ符号化部
112 インター予測パラメータ符号化部
113 イントラ予測パラメータ符号化部
120 予測パラメータ導出部
Claims (5)
- スライスヘッダで第2のパラメータを復号するパラメータ復号部と、
対象ブロックを対角線で分割した2つの三角予測ユニット毎に予測処理を行うTriangle予測部を備える動画像復号装置において、
第2のパラメータは、スライスにおいてマージ予測候補の最大数とTriangle予測候補の最大数を用いて導出した値であり、
Triangle予測部は、
マージ予測候補の最大数から第2のパラメータを減算してTriangle予測候補の最大数を導出し、
Triangle予測候補の最大数が1以下の場合にTriangle予測をオフ、2以上の場合にTriangle予測をオンに設定することを特徴とする動画像復号装置。 - PPSで第1のパラメータを復号し、第1のパラメータが0の場合、スライスヘッダで第2のパラメータを復号するパラメータ復号部と、
対象ブロックを対角線で分割した2つの三角予測ユニット毎に予測処理を行うTriangle予測部を備える動画像復号装置において、
第1のパラメータは、ピクチャにおいてマージ予測候補の最大数とTriangle予測候補の最大数を用いて導出した値であり、
第2のパラメータは、スライスにおいてマージ予測候補の最大数とTriangle予測候補の最大数を用いて導出した値であり、
Triangle予測部は、
第1のパラメータが0より大きい場合、第2のパラメータを第1のパラメータから1を引いた値に設定し、
マージ予測候補の最大数から第2のパラメータを減算してTriangle予測候補の最大数を導出することを特徴とする動画像復号装置。 - PPSで第1のパラメータを復号し、第1のパラメータが0の場合、スライスヘッダで第2のパラメータを復号するパラメータ復号部と、
対象ブロックを対角線で分割した2つの三角予測ユニット毎に予測処理を行うTriangle予測部を備える動画像復号装置において、
第1のパラメータは、ピクチャにおけるTriangle予測候補の最大数であり、
第2のパラメータは、スライスにおいてマージ予測候補の最大数とTriangle予測候補の最大数を用いて導出した値であり、
Triangle予測部は、
第1のパラメータが0より大きい場合、第1のパラメータを用いてTriangle予測候補の最大数を設定し、
第1のパラメータが0の場合、マージ予測候補の最大数から第2のパラメータを減算した値をTriangle予測候補の最大数に設定することを特徴とする動画像復号装置。 - 前記パラメータ復号部はさらにPPSで第1のパラメータを復号し、
第1のパラメータは、ピクチャにおいてマージ予測候補の最大数とTriangle予測候補の最大数を用いて導出した値であり、
前記Triangle予測部は、
第1のパラメータが0の場合、第2のパラメータに第1のパラメータから1を引いた値を設定し、
マージ予測候補の最大数から第2のパラメータを減算してTriangle予測候補の最大数を導出することを特徴とする請求項1に記載の動画像復号装置。 - PPSで第1のパラメータを符号化し、第1のパラメータが0の場合、スライスヘッダで
第2のパラメータを符号化するパラメータ符号化部と、
対象ブロックを対角線で分割した2つの三角予測ユニット毎に予測処理を行うTriangle予測部を備える動画像符号化装置において、
第1のパラメータは、ピクチャにおいてマージ予測候補の最大数とTriangle予測候補の最大数を用いて導出した値であり、
第2のパラメータは、スライスにおいてマージ予測候補の最大数とTriangle予測候補の最大数を用いて導出した値であり、
Triangle予測部は、
第1のパラメータが0より大きい場合、第2のパラメータは第1のパラメータから1を引いた値に設定し、
マージ予測候補の最大数から第2のパラメータを減算してTriangle予測候補の最大数を導出し、
Triangle予測候補の最大数が1以下の場合にTriangle予測をオフ、2以上の場合にTriangle予測をオンに設定することを特徴とする動画像符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019142246A JP2021027429A (ja) | 2019-08-01 | 2019-08-01 | 動画像符号化装置、動画像復号装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019142246A JP2021027429A (ja) | 2019-08-01 | 2019-08-01 | 動画像符号化装置、動画像復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021027429A true JP2021027429A (ja) | 2021-02-22 |
JP2021027429A5 JP2021027429A5 (ja) | 2022-06-24 |
Family
ID=74662533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019142246A Pending JP2021027429A (ja) | 2019-08-01 | 2019-08-01 | 動画像符号化装置、動画像復号装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021027429A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023051637A1 (en) * | 2021-09-29 | 2023-04-06 | Beijing Bytedance Network Technology Co., Ltd. | Method, device, and medium for video processing |
CN115955565A (zh) * | 2023-03-15 | 2023-04-11 | 深圳传音控股股份有限公司 | 处理方法、处理设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020106190A1 (en) * | 2018-11-22 | 2020-05-28 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods for inter prediction |
WO2020185595A1 (en) * | 2019-03-08 | 2020-09-17 | Tencent America LLC | Merge list construction in triangular prediction |
-
2019
- 2019-08-01 JP JP2019142246A patent/JP2021027429A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020106190A1 (en) * | 2018-11-22 | 2020-05-28 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods for inter prediction |
WO2020185595A1 (en) * | 2019-03-08 | 2020-09-17 | Tencent America LLC | Merge list construction in triangular prediction |
Non-Patent Citations (2)
Title |
---|
BENJAMIN BROSS, JIANLE CHEN, AND SHAN LIU: "Versatile Video Coding (Draft 6)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-O2001 (version 14), JPN6023026355, 31 July 2019 (2019-07-31), pages 50 - 54, ISSN: 0005221038 * |
XIANG LI, GUICHUN LI, XIAOZHONG XU, AND SHAN LIU: "CE4-related: Signaling of maximum number of triangle candidates", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-N0400_v4, JPN6023026356, March 2019 (2019-03-01), pages 1 - 8, ISSN: 0005091365 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023051637A1 (en) * | 2021-09-29 | 2023-04-06 | Beijing Bytedance Network Technology Co., Ltd. | Method, device, and medium for video processing |
CN115955565A (zh) * | 2023-03-15 | 2023-04-11 | 深圳传音控股股份有限公司 | 处理方法、处理设备及存储介质 |
CN115955565B (zh) * | 2023-03-15 | 2023-07-04 | 深圳传音控股股份有限公司 | 处理方法、处理设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021111962A1 (ja) | 動画像復号装置 | |
JP7448349B2 (ja) | 動画像復号装置 | |
JP2021002780A (ja) | 動画像復号装置および動画像符号化装置 | |
JPWO2020137920A1 (ja) | 予測画像生成装置、動画像復号装置、動画像符号化装置および予測画像生成方法 | |
US11589056B2 (en) | Video decoding apparatus and video coding apparatus | |
JP7568625B2 (ja) | 画像復号装置および画像復号方法 | |
JP7475908B2 (ja) | 予測画像生成装置、動画像復号装置及び動画像符号化装置 | |
JP2021027429A (ja) | 動画像符号化装置、動画像復号装置 | |
JP2022007319A (ja) | 動画像符号化装置、復号装置 | |
WO2021200658A1 (ja) | 動画像復号装置及び動画像復号方法 | |
WO2021200610A1 (ja) | 動画像復号装置、動画像符号化装置、動画像復号方法及び動画像符号化方法 | |
JP7409802B2 (ja) | 動画像復号装置および動画像符号化装置 | |
JP2022096879A (ja) | 動画像符号化装置、復号装置 | |
JP2022156140A (ja) | 動画像符号化装置、復号装置 | |
JP2021106309A (ja) | 動画像復号装置および動画像符号化装置 | |
JP2021082913A (ja) | 動画像復号装置および動画像符号化装置 | |
JP2020195014A (ja) | 動画像復号装置および動画像符号化装置 | |
JP2020170901A (ja) | 予測画像生成装置、動画像復号装置および動画像符号化装置 | |
JP2020202454A (ja) | 予測画像生成装置、動画像復号装置および動画像符号化装置 | |
JP2021180342A (ja) | 予測画像生成装置、動画像復号装置、および動画像符号化装置 | |
JP7465128B2 (ja) | 動画像符号化装置及び動画像復号装置 | |
JP7514611B2 (ja) | 動画像復号装置、動画像符号化装置、及び、予測画像生成装置 | |
WO2021235448A1 (ja) | 動画像符号化装置及び動画像復号装置 | |
JP2021027458A (ja) | 動画像符号化装置、動画像復号装置、予測画像生成方法 | |
JP2021048514A (ja) | 動画像符号化装置、動画像復号装置、予測画像生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220616 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220616 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20221207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230627 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231219 |