JP7397586B2 - 画像復号装置及び画像符号化装置 - Google Patents
画像復号装置及び画像符号化装置 Download PDFInfo
- Publication number
- JP7397586B2 JP7397586B2 JP2019116421A JP2019116421A JP7397586B2 JP 7397586 B2 JP7397586 B2 JP 7397586B2 JP 2019116421 A JP2019116421 A JP 2019116421A JP 2019116421 A JP2019116421 A JP 2019116421A JP 7397586 B2 JP7397586 B2 JP 7397586B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- transform
- transformation
- inverse
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009466 transformation Effects 0.000 claims description 287
- 238000006243 chemical reaction Methods 0.000 claims description 202
- 238000013139 quantization Methods 0.000 description 99
- 238000000034 method Methods 0.000 description 84
- 239000011159 matrix material Substances 0.000 description 53
- 238000010586 diagram Methods 0.000 description 45
- 238000012545 processing Methods 0.000 description 40
- 230000005540 biological transmission Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 14
- 230000006854 communication Effects 0.000 description 14
- 238000003702 image correction Methods 0.000 description 10
- 238000012937 correction Methods 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000009795 derivation Methods 0.000 description 3
- 229920000069 polyphenylene sulfide Polymers 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 2
- 208000034188 Stiff person spectrum disease Diseases 0.000 description 2
- 229920010524 Syndiotactic polystyrene Polymers 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 208000012112 ischiocoxopodopatellar syndrome Diseases 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000002490 spark plasma sintering Methods 0.000 description 2
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 1
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 1
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Description
Coding)方式等が挙げられる。
関連技術を提供することを目的とする。
前記変換係数に対して逆セカンダリ変換を適用する第2の変換部と、
前記第2の変換部による変換後の変換係数に対して逆コア変換を適用する第1の変換部を備える画像復号装置において、
第2の変換部は、CU単位で選択可能なstIdx、イントラ予測モードにより異なるstTrSetIdの何れかあるいは両方によって、セカンダリ変換を行う範囲を切り替え、セカンダリ変換領域v[][]を変換係数d[][]に設定することを特徴とする。
予測方向によって切り替えることを特徴とする。
前記予測残差に対してコア変換を適用する第1の変換部と、
前記第1の変換部による変換後の変換係数に対してセカンダリ変換を適用する第2の変換部を備える画像符号化装置において、
第2の変換部は、CU単位で選択可能なstIdx、イントラ予測モードにより異なるstTrSetIdの何れかあるいは両方によって、セカンダリ変換を行う変換係数の範囲を切り替え、変換係数d[][]をセカンダリ変換領域v[]に設定することを特徴とする。
トラ予測方向によって切り替えることを特徴とする。
以下、図面を参照しながら本発明の実施形態について説明する。
本明細書で用いる演算子を以下に記載する。
、|=はOR代入演算子であり、||は論理和を示す。
本実施形態に係る動画像符号化装置11及び動画像復号装置31の詳細な説明に先立って、動画像符号化装置11によって生成され、動画像復号装置31によって復号される符号化ストリームTeのデータ構造について説明する。
ームTeは、例示的に、シーケンス、及びシーケンスを構成する複数のピクチャを含む。図4には、それぞれ、シーケンスSEQを既定する符号化ビデオシーケンス、ピクチャPICTを規定する符号化ピクチャ、スライスSを規定する符号化スライス、スライスデータを規定す
る符号化スライスデータ、符号化スライスデータに含まれる符号化ツリーユニット、符号化ツリーユニットに含まれる符号化ユニットを示す図が示されている。
符号化ビデオシーケンスでは、処理対象のシーケンスSEQを復号するために動画像復号
装置31が参照するデータの集合が規定されている。シーケンスSEQは、図4の符号化ビデオシーケンスに示すように、ビデオパラメータセット(Video Parameter Set)、シーケン
スパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、ピクチャPICT、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。
の画像に共通する符号化パラメータの集合及び画像に含まれる複数のレイヤ及び個々のレイヤに関連する符号化パラメータの集合が規定されている。
置31が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの幅や高さが規定される。なお、SPSは複数存在してもよい。その場合、PPSから複数のSPSの何れか
を選択する。
動画像復号装置31が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの復号に用いられる量子化幅の基準値(pic_init_qp_minus26)や重み付き予測の適用を示すフラグ(weighted_pred_flag)及びスケーリングリスト(量子化マトリックス)が含まれる。なお、PPSは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。
符号化ピクチャでは、処理対象のピクチャPICTを復号するために動画像復号装置31が参照するデータの集合が規定されている。ピクチャPICTは、図4の符号化ピクチャに示すよ
うに、スライス0~スライスNS-1を含む(NSはピクチャPICTに含まれるスライスの総数)
。
添え字を省略して記述することがある。また、以下に説明する符号化ストリームTeに含まれるデータであって、添え字を付している他のデータについても同様である。
符号化スライスでは、処理対象のスライスSを復号するために動画像復号装置31が参照
するデータの集合が規定されている。スライスは、図4の符号化スライスに示すように、
スライスヘッダ、及び、スライスデータを含んでいる。
符号化スライスデータでは、処理対象のスライスデータを復号するために動画像復号装置31が参照するデータの集合が規定されている。スライスデータは、図4の符号化スライ
スヘッダに示すように、CTUを含んでいる。CTUは、スライスを構成する固定サイズ(例えば64x64)のブロックであり、最大符号化単位(LCU:Largest Coding Unit)と呼ぶこともある。
図4の符号化ツリーユニットには、処理対象のCTUを復号するために動画像復号装置31が参照するデータの集合が規定されている。CTUは、再帰的な4分木分割(QT(Quad Tree)
分割)、2分木分割(BT(Binary Tree)分割)あるいは3分木分割(TT(Ternary Tree)
分割)により符号化処理の基本的な単位である符号化ユニットCUに分割される。BT分割とTT分割を合わせてマルチツリー分割(MT(Multi Tree)分割)と呼ぶ。再帰的な4分木分
割により得られる木構造のノードのことを符号化ノード(Coding Node)と称する。4分木、2分木、及び3分木の中間ノードは、符号化ノードであり、CTU自身も最上位の符号化ノードとして規定される。
分割の有無を示すMT分割フラグ(split_mt_flag)、MT分割の分割方向を示すMT分割方向
(split_mt_dir)、MT分割の分割タイプを示すMT分割タイプ(split_mt_type)を含む。cu_split_flag、split_mt_flag、split_mt_dir、split_mt_type は符号化ノード毎に伝送される。cu_split_flagが1の場合、符号化ノードは4つの符号化ノードに分割される(図5のQT)。cu_split_flagが0の時、split_mt_flagが0の場合に符号化ノードは分割されず1つのCUをノードとして持つ(図5の分割なし)。CUは符号化ノードの末端ノードであり、これ以上分割されない。CUは、符号化処理の基本的な単位となる。
(図5のBT(水平分割))、split_mt_dirが0の場合に符号化ノードは2つの符号化ノードに垂直分割される(図5のBT(垂直分割))。また、split_mt_typeが1の時、split_mt_dirが1の場合に符号化ノードは3つの符号化ノードに水平分割され(図5のTT(水平分割))、split_mt_dirが0の場合に符号化ノードは3つの符号化ノードに垂直分割される(図5のTT(垂直分割))。これらを図5のCT情報に示す。
図4の符号化ユニットに示すように、処理対象の符号化ユニットを復号するために動画
像復号装置31が参照するデータの集合が規定されている。具体的には、CUは、CUヘッダCUH、予測パラメータ、変換パラメータ、量子化変換係数等から構成される。CUヘッダでは予測モード等が規定される。
のサイズよりも大きい場合、CUは、サブCUに分割される。例えばCUが8x8、サブCUが4x4の場合、CUは水平2分割、垂直2分割からなる、4つのサブCUに分割される。
予測は、同一ピクチャ内の予測であり、インター予測は、互いに異なるピクチャ間(例えば、表示時刻間、レイヤ画像間)で行われる予測処理を指す。
でエントロピー符号化してもよい。
予測画像は、ブロックに付随する予測パラメータによって導出される。予測パラメータには、イントラ予測とインター予測の予測パラメータがある。
、イントラ予測モードの種類(モード番号)を示す概略図である。図6に示すように、イ
ントラ予測モードは、例えば67種類(0~66)存在する。例えば、プレーナ予測(0)、DC予測(1)、Angular予測(2~66)である。さらに、色差ではLMモード(67~72)を追加
してもよい。
intra_luma_mpm_flagは、対象ブロックのIntraPredModeYとMPM(Most Probable Mode)とが一致するか否かを示すフラグである。MPMは、MPM候補リストmpmCandList[]に含まれ
る予測モードである。MPM候補リストは、隣接ブロックのイントラ予測モード及び所定の
イントラ予測モードから、対象ブロックに適用される確率が高いと推定される候補を格納したリストである。intra_luma_mpm_flagが1の場合、MPM候補リストとインデックスintra_luma_mpm_idxを用いて、対象ブロックのIntraPredModeYを導出する。
(REM)
intra_luma_mpm_flagが0の場合、イントラ予測モード全体からMPM候補リストに含まれるイントラ予測モードを除いた残りのモードRemIntraPredModeからイントラ予測モードを
選択する。RemIntraPredModeとして選択可能なイントラ予測モードは、「非MPM」又は「REM」と呼ばれる。RemIntraPredModeはintra_luma_mpm_remainderを用いて導出される。
本実施形態に係る動画像復号装置31(図7)の構成について説明する。
)302、ループフィルタ305、参照ピクチャメモリ306、予測パラメータメモリ307、予測画像生成部(予測画像生成装置)308、逆量子化・逆変換部311、及び加算部312を含んで構
成される。なお、後述の動画像符号化装置11に合わせ、動画像復号装置31にループフィルタ305が含まれない構成もある。
部3022(予測モード復号部)を備えており、CU復号部3022はTU復号部3024を備えている。これらを総称して復号モジュールと呼んでもよい。ヘッダ復号部3020は、符号化データからVPS、SPS、PPS等のパラメータセット情報、スライスヘッダ(スライス情報)を復号す
る。CT情報復号部3021は、符号化データからCTを復号する。CU復号部3022は符号化データからCUを復号する。TU復号部3024は、TUに予測誤差が含まれている場合に、符号化データからQP更新情報(量子化補正値)と量子化予測誤差(residual_coding)を復号する。
を復号する。具体的には、TU復号部3024は、CUの幅と高さが4以上であり、且つ、予測モードがイントラモードであり、且つ、CU内の変換係数の数numSigCoeffが所定の数THSt(例えば、SINGLE_TREEでは2、それ以外は1)より大きい場合にstIdxを復号する。なお、stIdxは0の場合、セカンダリ変換の非適用を示し、1の場合、セカンダリ変換基底のセット(ペア)のうち一方の変換を示し、2の場合、上記ペアのうち他方の変換を示す。
、サブCU単位で処理をしてもよい。あるいはCTU、CUをブロック、サブCUをサブブロック
と読み替え、ブロックあるいはサブブロック単位の処理としてもよい。
ピー復号を行って、個々の符号(シンタックス要素)を分離し復号する。エントロピー符号化には、シンタックス要素の種類や周囲の状況に応じて適応的に選択したコンテキスト(確率モデル)を用いてシンタックス要素を可変長符号化する方式と、予め定められた表、あるいは計算式を用いてシンタックス要素を可変長符号化する方式がある。前者のCABAC(Context Adaptive Binary Arithmetic Coding)は、符号化あるいは復号したピクチャ(スライス)毎に更新した確率モデルをメモリに格納する。そして、Pピクチャ、あるいはBピクチャのコンテキストの初期状態として、メモリに格納された確率モデルの中から、同じスライスタイプ、同じスライスレベルの量子化パラメータを使用したピクチャの確率モデルを設定する。この初期状態を符号化、復号処理に使用する。分離された符号には、予測画像を生成するための予測情報及び、差分画像を生成するための予測誤差等がある。
ータ復号部302の指示に基づいて行われる。
図8、動画像復号装置31の概略的動作を説明するフローチャートである。
(スライス情報)を復号する。
の処理を繰り返すことにより各CTUの復号画像を導出する。
号する。
フラグsplit_transform_flag、CU残差フラグcbf_cb、cbf_cr、cbf_luma等を復号する。
データからQP更新情報(量子化補正値)と量子化予測誤差(residual_coding)を復号す
る。なお、QP更新情報は、量子化パラメータQPの予測値である量子化パラメータ予測値qPpredからの差分値である。
、逆量子化・逆変換部311より供給される予測誤差とを加算することによって、対象CUの
復号画像を生成する。
量子化マトリックスは、変換係数の位置ごとに異なる量子化・逆量子化を行う方法、及び、量子化に用いるマトリックスを意味する。量子化・逆量子化はスケーリングとも呼ばれ、量子化マトリックスは、スケーリングリスト、スケーリングファクタとも呼ばれる。量子化マトリックスを用いることで、高周波数成分をより小さく(0になりやすく)して、主観画質の低下を抑えながら符号化レートを削減することができる。また、高周波数成分と低周波数成分の比率や、水平成分、垂直成分、斜め成分の比率を調整して画質を調整することができる。
イントラ予測パラメータ復号部304は、エントロピー復号部301から入力された符号に基づいて、予測パラメータメモリ307に記憶された予測パラメータを参照してイントラ予測
パラメータ、例えば、イントラ予測モードIntraPredModeを復号する。イントラ予測パラ
メータ復号部304は、復号したイントラ予測パラメータを予測画像生成部308に出力し、また予測パラメータメモリ307に記憶する。イントラ予測パラメータ復号部304は、輝度と色差で異なるイントラ予測モードを導出してもよい。
である。図9に示すように、イントラ予測パラメータ復号部304は、パラメータ復号制御部3041と、輝度イントラ予測パラメータ復号部3042と、色差イントラ予測パラメータ復号部3043とを含んで構成される。
示し、エントロピー復号部301からシンタックス要素を受け取る。その中のintra_luma_mpm_flagが1の場合、パラメータ復号制御部3041は、輝度イントラ予測パラメータ復号部3042内のMPMパラメータ復号部30422にintra_luma_mpm_idxを出力する。また、intra_luma_mpm_flagが0の場合、パラメータ復号制御部3041は、輝度イントラ予測パラメータ復号部3042の非MPMパラメータ復号部30423にintra_luma_mpm_remainderを出力する。また、パラメータ復号制御部3041は、色差イントラ予測パラメータ復号部3043に色差のイントラ予測パラメータのシンタックス要素を出力する。
ータ復号部30422と、非MPMパラメータ復号部30423(復号部、導出部)とを含んで構成さ
れる。
歪を除去し、画質を改善するフィルタである。ループフィルタ305は、加算部312が生成したCUの復号画像に対し、デブロッキングフィルタ、サンプル適応オフセット(SAO)、適
応ループフィルタ(ALF)等のフィルタを施す。
メータを記憶する。具体的には、予測パラメータメモリ307は、パラメータ復号部302が復号したパラメータ及びエントロピー復号部301が分離したpredMode等を記憶する。
生成部308は、参照ピクチャメモリ306から参照ピクチャを読み出す。予測画像生成部308
は、predModeが示す予測モードで、予測パラメータと読み出した参照ピクチャ(参照ピクチャブロック)を用いてブロック若しくはサブブロックの予測画像を生成する。ここで、参照ピクチャブロックとは、参照ピクチャ上の画素の集合(通常矩形であるのでブロックと呼ぶ)であり、予測画像を生成するために参照する領域である。
predModeがイントラ予測モードを示す場合、イントラ予測画像生成部310は、イントラ
予測パラメータ復号部304から入力されたイントラ予測パラメータと参照ピクチャメモリ306から読み出した参照画素を用いてイントラ予測を行う。
め定めた範囲にある隣接ブロックを参照ピクチャメモリ306から読み出す。予め定めた範
囲とは、対象ブロックの左、左上、上、右上の隣接ブロックであり、イントラ予測モードによって参照する領域は異なる。
したブロックの予測画像を加算部312に出力する。
照領域Rとして設定する。そして、参照領域R上の画素を特定の方向に外挿することで予測画像を生成する。例えば、参照領域Rは、予測対象ブロックの左と上(あるいは、さらに、左上、右上、左下)を含むL字型の領域(例えば図10の参照領域の例1の斜線の丸印の画素で示される領域)として設定してもよい。
次に、図11を用いてイントラ予測画像生成部310の構成の詳細を説明する。イントラ予
測画像生成部310は、予測対象ブロック設定部3101、未フィルタ参照画像設定部3102(第
1の参照画像設定部)、フィルタ済参照画像設定部3103(第2の参照画像設定部)、イントラ予測部3104、及び、予測画像補正部3105(予測画像補正部、フィルタ切替部、重み係数変更部)を備える。
予測対象ブロック設定部3101は、対象CUを予測対象ブロックに設定し、予測対象ブロックに関する情報(予測対象ブロック情報)を出力する。予測対象ブロック情報には、予測対象ブロックのサイズ、位置、輝度か色差かを示すインデックスが少なくとも含まれる。
未フィルタ参照画像設定部3102は、予測対象ブロックのサイズと位置に基づいて、予測対象ブロックの隣接周辺領域を参照領域Rとして設定する。続いて、参照領域R内の各画素値(未フィルタ参照画像、境界画素)に、参照ピクチャメモリ306上で対応する位置の
各復号画素値をセットする。図10の参照領域の例1に示す予測対象ブロック上辺に隣接する復号画素のラインr[x][-1]、及び、予測対象ブロック左辺に隣接する復号画素の列r[-1][y]が未フィルタ参照画像である。
フィルタ済参照画像設定部3103は、イントラ予測モードに応じて、未フィルタ参照画像に参照画素フィルタ(第1のフィルタ)を適用して、参照領域R上の各位置(x,y)のフィ
ルタ済参照画像s[x][y]を導出する。具体的には、位置(x,y)とその周辺の未フィルタ参照画像にローパスフィルタを適用し、フィルタ済参照画像(図10の参照領域の例2)を導出する。なお、必ずしも全イントラ予測モードにローパスフィルタを適用する必要はなく、一部のイントラ予測モードに対してローパスフィルタを適用してもよい。なお、フィルタ済参照画像設定部3103において参照領域R上の未フィルタ参照画像に適用するフィルタを「参照画素フィルタ(第1のフィルタ)」と呼称するのに対し、後述の予測画像補正部3105において仮予測画像を補正するフィルタを「バウンダリフィルタ(第2のフィルタ)」と呼称する。
イントラ予測部3104は、イントラ予測モードと、未フィルタ参照画像、フィルタ済参照画素値に基づいて予測対象ブロックの仮予測画像(仮予測画素値、補正前予測画像)を生成し、予測画像補正部3105に出力する。イントラ予測部3104は、内部にPlanar予測部31041、DC予測部31042、Angular予測部31043、及びLM予測部31044を備えている。イントラ予測部3104は、イントラ予測モードに応じて特定の予測部を選択して、未フィルタ参照画像、フィルタ済参照画像を入力する。イントラ予測モードと対応する予測部との関係は次の通りである。
・Planar予測 ・・・Planar予測部31041
・DC予測 ・・・DC予測部31042
・Angular予測 ・・・Angular予測部31043
・LM予測 ・・・LM予測部31044
(Planar予測)
Planar予測部31041は、予測対象画素位置と参照画素位置との距離に応じて、複数のフ
ィルタ済参照画像を線形加算して仮予測画像を生成し、予測画像補正部3105に出力する。
DC予測部31042は、フィルタ済参照画像s[x][y]の平均値に相当するDC予測値を導出し、DC予測値を画素値とする仮予測画像q[x][y]を出力する。
Angular予測部31043は、イントラ予測モードの示す予測方向(参照方向)のフィルタ済参照画像s[x][y]を用いて仮予測画像q[x][y]を生成し、予測画像補正部3105に出力する。
LM予測部31044は、輝度の画素値に基づいて色差の画素値を予測する。具体的には、復
号した輝度画像をもとに、線形モデルを用いて、色差画像(Cb、Cr)の予測画像を生成する方式である。LM予測の1つであるCCLM(Cross-Component Linear Model prediction)
予測は、1つのブロックに対し、輝度から色差を予測するための線形モデルを使用する予
測方式である。
予測画像補正部3105は、イントラ予測モードに応じて、イントラ予測部3104から出力された仮予測画像を修正する。具体的には、予測画像補正部3105は、仮予測画像の各画素に対し、参照領域Rと対象予測画素との距離に応じて、未フィルタ参照画像と仮予測画像を重み付け加算(加重平均)することで、仮予測画像を修正した予測画像(補正済予測画像)Predを導出する。なお、一部のイントラ予測モードでは、予測画像補正部3105で仮予測画像を補正せず、イントラ予測部3104の出力をそのまま予測画像としてもよい。
逆量子化・逆変換部311は、エントロピー復号部301から入力された量子化変換係数qd[ ][ ]を逆量子化して変換係数d[ ][ ]を求める。この量子化変換係数qd[ ][ ]は、符号化処理において、予測誤差に対してDCT(Discrete Cosine Transform、離散コサイン変換)、DST(Discrete Sine Transform、離散サイン変換)等の周波数変換を行い量子化して得られる係数である。逆量子化・逆変換部311は、求めた変換係数について逆DCT、逆DST等の逆周波数変換を行い、予測誤差を算出する。逆量子化・逆変換部311は予測誤差を加算部312に出力する。
逆量子化・逆変換部311の構成例について示す機能ブロック図である。図12に示すように
、量子化・逆変換部311は、逆量子化部3111と、逆変換部3112とを備えている。逆量子化
部3111は、TU復号部3024において復号した量子化変換係数qd[ ][ ]を逆量子化し、変換係数d[ ][ ]を導出する。逆量子化部3111は、導出した変換係数d[ ][ ]を逆変換部3112に出力する。
誤差r[ ][ ]を復元する。逆変換部3112は、復元された予測誤差r[ ][ ]を加算部312に出
力する。
と、逆コア変換部(第1の変換部)31123と、を備えている。
逆セカンダリ変換部(第2の変換部)31121は、逆量子化の後、逆コア変換の前に、変換係数d[ ][ ]に対して逆セカンダリ変換を適用する。
れ、変換基底はイントラ予測モードを参照して決定される。変換基底の選択については後
述する。
以下、図13を用いて逆セカンダリ変換部31121による逆セカンダリ変換の適用例1について説明する。図13は、本実施形態における逆セカンダリ変換の対象となる領域の一例を説明するための図である。
ち、最低周波数成分を含むNUMSTC個以内の変換係数に対してのみ逆セカンダリ変換を適用する。
を説明する前提として、まず、セカンダリ変換及び逆セカンダリ変換について説明する。
セカンダリ変換は、動画像符号化装置11において、TUのコア変換(DCT2及びDST7等)後の一部又は全領域の変換係数に対して適用される。セカンダリ変換では、変換係数に残る相関を除去しエネルギーを一部の変換係数に集中させる。逆セカンダリ変換は、動画像復号装置31において、TUの一部又は全領域の変換係数に対して適用される。逆セカンダリ変換が適用された後、逆セカンダリ変換後の変換係数に対して、逆コア変換(DCT2及びDST7等)が適用される。また、TUを4x4のサブブロックに分割した場合において、左上の所定
のサブブロックのみにセカンダリ変換及び逆セカンダリ変換が適用される。TUの幅W、高
さHのうち、一方が4であるTUのサイズは、例えば、4×4、8×4、4×8、L×4及び4×L(L
は16以上の自然数)が挙げられる。
列u[]から1次元配列v[]に変換し、最後にS4の処理でd[][]に再度格納する処理を示す。
逆セカンダリ変換では、TUのサイズ(幅W, 高さH)に応じて、逆セカンダリ変換のサイズ(4x4又は8x8)、出力の変換係数の数(nStOutSize)、適用する変換係数(入力の変換係数)の数nonZeroSize及び逆セカンダリ変換を適用するサブブロックの数(numStX, numStY)を導出する。4x4、8x8の逆セカンダリ変換のサイズをnStSize=4、8で示す。また、4x4、8x8の逆セカンダリ変換のサイズは、各々RST4x4、RST8x8と呼んでもよい。
上記以外の場合、log2StSize = 2、nStOutSize=16
nStSize = 1<<log2StSize
W及びHが両方とも4の場合、又は8x8の場合、nonZeroSize = 8
上記以外の場合、nonZeroSize = 16
numStX = (nTbH == 4 && nTbW > 8) ? 2 : 1
numStY = (nTbW == 4 && nTbH > 8) ? 2 : 1
(S2:1次元信号に並び替え)
逆セカンダリ変換では、TUの一部の変換係数d[][]を一度、1次元配列u[]に並び替えて処理する。具体的には、逆セカンダリ変換では、図13の点線の矩形ブロックである領域RUによって示される対象TUの2次元の変換係数d[][]から、x = 0.. nonZeroSize-1の変換係数を参照して、u[]を導出する。xC, yCはTU上の位置であり、スキャン順を示す配列DiagScanOrderとサブブロック中の変換係数の位置xから導出する。
yC = (ySbIdx<<log2StSize) + DiagScanOrder[log2StSize][log2StSize][x][1]
u[x] = d[ xC ][ yC ]
なお、1次元配列にコピーされる範囲を領域RUと呼ぶ。
逆セカンダリ変換では、長さがnonZeroSizeのu[](ベクトルF')に対して、第1種の変
換基底(行列)T1を用いた変換を行い、出力として長さがnStOutSizeの一次元配列の係数v'[](ベクトルV')を導出する。
ここで、変換サイズが4x4の場合(RST4x4)の変換基底を第1種の変換基底T1と呼ぶ。変換サイズが8x8の場合(RST8x8)の変換基底を第2種の変換基底T2と呼ぶ。T1は16×16(16行16列)行列であって、変換は16x16行列F'と、16x1(16行1列)ベクトルF'との積として16×1(16行1列)ベクトルV'、すなわち、長さ16の係数v'[]を導出する。T2は、48×16(48行16列)行列であって、変換は48x16行列F'と、16x1ベクトルF'との積として48×1(48行1
列、長さ48)ベクトルV'、すなわち、長さ48の係数v'[]を導出する。
るセカンダリ変換のセット番号(stTrSetId)と、符号化データから復号されるセカンダ
リ変換の変換基底を示すstIdxと、セカンダリ変換サイズnStSizeから、対応する変換マトリックスsecTranMatrix[][](変換基底T1 or T2)とを導出する。さらに、逆セカンダリ
変換では、以下の式に示すように、変換マトリックスと一次元変数u[]との積和演算を行
う。
v[i] = Clip3( CoeffMin, CoeffMax,ΣsecTransMatrix[j][i]*u[j])
ここで、Σはj=0..nonZeroSize-1までの和である。また、iは0..nStSize-1に対して処
理を行う。CoeffMin、CoeffMaxは変換係数の値の範囲を示す。
逆セカンダリ変換では、変換された一次元配列の係数v'[]を再度TU内の所定の位置(例えば図13の領域R1)に配置する。
角方向までの間の方向(イントラ予測モードが34以下)である場合、左から右に4係数ず
つ、上から下に4回繰り返し、長さ16の係数v'[]を配置する。また、イントラ予測方向が
図6に示す左上対角方向から右上対角方向までの間の方向(イントラ予測モードが35以上
)である場合、上から下に4係数ずつ、左から右に4回繰り返し、長さ16の係数v'[]を配置する。これにより、コア変換前の4×4サブブロックが得られる。
上対角方向までの間の方向(イントラ予測モードが34以下)である場合、逆セカンダリ変換部は、左から右に8係数ずつ配置し、これを上から下に4回繰り返す。次に、左から右
に4係数ずつ配置し、これを上から下に4回繰り返す。また、図6に示す左上対角方向から右上対角方向までの間の方向(イントラ予測モードが35以上)である場合、逆セカンダリ変換では、上から下に8係数ずつ配置し、これを左から右に4回繰り返す。次に、上から
下に4係数ずつ配置し、これを左から右に4回繰り返す。
(y < 4) ? v[x+(y<<log2StSize)] : ((x < 4) ? v[32 + x + ((y - 4) << 2)] :
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y])
それ以外の場合、逆セカンダリ変換では、以下の式を適用する。
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] =
(y < 4) ? v[x+(y<<log2StSize)] : ((x < 4) ? v[32 + (y - 4) + (x << 2)] : d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y])
上述の処理では、RST4×4(16×16行列)によって表される第1種の変換基底T1を保持するためのテーブルを複数個(例えばセカンダリ変換のセットの数とセカンダリインデックスstIdxの数の積、例えば8個)利用してもよい。同様に、上述の処理では、RST8×8(48
×16行列)によって表される第2種の変換基底T2を保持するためのテーブルを複数個(例
えば8個)利用してもよい。この場合、セカンダリ変換及び逆セカンダリ変換に必要なメ
モリ量は、約8Kbyte(16×16×8+48×16×8=8192byte)と巨大となっており、好適にセカ
ンダリ変換及び逆セカンダリ変換を適用することができない。
以下では、逆セカンダリ変換の対象となる変換係数の個数(上記説明のnStOutSize)がNUMSTC(NUMSTCは48未満)である例について説明する。逆セカンダリ変換部31121は、TU
が8×8以上である場合に、TUに含まれる変換係数のうち、最低周波数成分を含むNUMSTC個の変換係数に対して逆セカンダリ変換を適用する。具体的には、逆セカンダリ変換部31121は、図13の逆量子化後の変換残差の例に示す、逆量子化後の変換残差の左上側の領域RUに含まれる最低周波数成分を含むNUMSTC個の変換係数に対して逆セカンダリ変換を適用する。NUMSTCは、43個以内であればよいが、例えば、36であってもよいし、32であってもよい。
数の位置及び個数以外は、上述の例と同様にセカンダリ変換及び逆セカンダリ変換を適用する。
図13の変換係数の選択例1を参照して、逆セカンダリ変換部31121による逆セカンダリ変換の適用例1について詳細に説明する。
。逆セカンダリ変換部31121は、u[]に量子化、逆量子化を施したu'[]に逆セカンダリ変換を適用し、係数v'[]を導出する。そして、逆セカンダリ変換部31121は、係数v'[]を並び
替えて領域R2に配置する。この場合、セカンダリ変換部及び逆セカンダリ変換部31121は
、RST8×8として、NUMSTC×16行列、例えば36×16行列によって表される第2種の変換基底T2を適用する。領域RUのうち領域R2に含まれない変換係数は保持しておいてもよいし、ゼロアウトしてもよい。
cnt = 0
for (y = 0; y < nStSize; y++) {
for (x = 0; x < nStSize; x++) {
if (x < NN - y) // セカンダリ変換領域内であればv[]を配置
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = v[cnt++]
else // 非セカンダリ変換領域でなければd[][]を配置
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y]
上記以外の場合、
cnt = 0
for (x = 0; x < nStSize; x++) {
for (y = 0; y < nStSize; y++) {
if (y < NN - x) // セカンダリ変換領域内であればv[]を配置
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = v[cnt++]
else // 非セカンダリ変換領域でなければd[][]を配置
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y]
ここでNUMSTC=36の場合、NN = 8とする。また、後述するstAreaTblを使う場合には、以下のテーブルを利用して、x < NN - yの代わりにx < stAreaTbl[y]、y < NN - xの代わりにy < stAreaTbl[x]で判定してもよい。
ここでNUMSTC=28の場合、NN = 7とする。また、後述するstAreaTblを使う場合には、以下のテーブルを利用して判定してもよい。
これにより、セカンダリ変換及び逆セカンダリ変換に必要なテーブルのメモリは、約6.7Kbyte(16×16×8+36×16×8=6656byte)となり、当該メモリを大幅に(ここでは約20%)削減することができる。その結果、好適にセカンダリ変換及び逆セカンダリ変換を適用することができる。
図13の変換係数の選択例2及び3を参照して、逆セカンダリ変換部31121による逆セカン
ダリ変換の適用例2について適用例1との相違点のみ説明する。
、処理S4において、長さがnStOutSize=NUMSTCの一次元配列の係数v'[]を領域R3に配置し
てもよい。
PredModeIntra <= 34 or INTRA_LT_CCLM, INTRA_T_CCLM, or INTRA_L_CCLMの場合、以下
を適用する。
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = v[x+(y<<log2StSize)]
それ以外の場合、以下を適用する。
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] =
(y < 4) ? v[x+(y<<log2StSize)] : ((x < 4) ? v[32 + (y - 4) + (x << 2)] : d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y])
また、図13の変換係数の選択例3に示すように、逆セカンダリ変換部31121は、NUMSTC=32とし、処理S4において、長さがnStOutSize=NUMSTCの一次元配列の係数v'[]を領域R4に配置してもよい。
域R4)になる。そして変換係数の個数NUMSTCが32に設定される。この場合、セカンダリ変換部及び逆セカンダリ変換部31121は、RST8×8として32×16行列によって表される第2種
の変換基底T2を適用する。
リ変換を適用するのかを決定してもよい。
に対して逆セカンダリ変換を適用するのかを決定してもよい。より具体的には、逆セカンダリ変換部31121は、TUの形状がW≧Hである場合に、領域R3に対して逆セカンダリ変換を
適用するように決定してもよい。また、逆セカンダリ変換部31121は、TUの形状がW<Hである場合に、領域R4に対して逆セカンダリ変換を適用するように決定してもよい。
ち、何れに対して逆セカンダリ変換を適用するのかを決定してもよい。より具体的には、逆セカンダリ変換部31121は、図6に示す左上対角方向から右上対角方向までの間の方向(イントラ予測モードが35以上)である場合に、領域R3に対して逆セカンダリ変換を適用するように決定してもよい。また、逆セカンダリ変換部31121は、図6に示す左下対角方向から左上対角方向までの間の方向(イントラ予測モードが34以下)である場合に、領域R4に対して逆セカンダリ変換を適用するように決定してもよい。
以下、図14を用いて逆セカンダリ変換部31121による逆セカンダリ変換の適用例2について説明する。図14は、本実施形態における逆セカンダリ変換部31121による逆セカンダリ
変換の一例を説明するための図である。
基底T1を導出する。
があればよく、RST4×4として適用する16×16行列を保持するためのテーブルを必要とし
ない。そのため、逆セカンダリ変換に必要なテーブルのメモリは、約6.1Kbyte(48×16×8=6144byte)となり、当該メモリを大幅に(ここでは約25%)削減することができる。その
結果、好適に逆セカンダリ変換を適用することができる。
出することができる。
逆セカンダリ変換部31121は、逆セカンダリ変換後の各係数の1次元配列のベクトル(1
次元ベクトル)V'を2次元配列のベクトル(2次元配列)d[]に並べ替える(変換する)処
理において、イントラ予測をする際に所定の方向の画素を参照するか否かに応じて、並べ替える(変換する)方法を切り替える。また、また、上述の所定の方向にはCCLM予測が参照する画素の方向が含まれる。
次元配列d[]に並び替えて配置する。
説明する。この場合、逆セカンダリ変換部31121は、1次元ベクトルV'を以下の式に従って2次元配列d[]に配置する。
d[x][y] = v'[x+(y<<log2(RW))]
else // if (IntraPredMode>34 || IntraPredMode==INTRA_T_CCLM)
d[x][y] = v'[y+(x<<log2(RH))]
ここで、RW及びRHは領域R2、R3及びR4における幅及び高さ(例えばnStSize)である。INTRA_LT_CCLM、INTRA_L_CCLM及びINTRA_T_CCLMはCCLM予測モードを表す。CCLM予測モードは、各々、対象ブロックの左及び上の画素を参照して予測パラメータ(スケーリング係数及びオフセット)を導出するモード、対象ブロックの左の画素を参照して予測パラメータを導出するモード、並びに、対象ブロックの上の画素を参照して予測パラメータを導出するモードである。
右に、上から下に配置する。そうでない場合には、CCLM予測モードは、対象ブロックの左側ブロックの画素を参照しない予測モードであり、2次元配列d[][]に1次元ベクトルV'を
上から下に、左から右に配置する。
に並び替えて上述の領域RU内等に配置する際に、当該1次元ベクトルV'をより好適に配置
することができる。その結果、より好適に逆セカンダリ変換を適用することができる。
セカンダリ変換は、コア変換により得られた変換係数の一部のみを再変換する。変換係数の分布は画像の領域および予測方法によって異なることから、異なる2次元配置を用いて配置しても良い。図20は本発明の実施形態の逆セカンダリ変換部の処理を示すフローチ
ャートである。本例では、stTrSetIdに応じてセカンダリ変換領域を変更する。
S3:逆セカンダリ変換部31121は、1次元配列u[]を、変換行列lowFreqTransMatrix[][]の積を用いてv[]に変換する。逆セカンダリ変換部31121は、nStSizeとstTrSetId、stIdx
を用いて変換行列secTransMatrix[][]を導出(選択)する。変換セットインデックスstTrSetIdは、イントラ予測モードpredModeIntraから以下のように導出される。
0 <= predModeIntra <= 1ならばstTrSetId = 0
2 <= predModeIntra <= 12ならばstTrSetId = 1
13 <= predModeIntra <= 23ならばstTrSetId = 2
24 <= predModeIntra <= 44ならばstTrSetId = 3
45 <= predModeIntra <= 55ならばstTrSetId = 2
56 <= predModeIntra <= 80ならばstTrSetId = 1
81 <= predModeIntra <= 83ならばstTrSetId = 0
S4:逆セカンダリ変換部31121は、stTrSetIdが所定のグループであるか否かによってv[]をd[][]に配置する処理を分岐する(S401)。stTrSetIdが第1のグループの場合には第1の配置によってv[]をd[][]に配置する(S411)。それ以外(第2のグループ)の場合には第2の配置によってv[]をd[][]に配置する(S412)。
であり、stAreaTbl[1][]は第2の配置を示すテーブル(areaMode=1)である。stAreaTbl[][]の各要素は、例えばTU内の座標を(x, y)と表現する場合、x < stAreaTbl[][y]の範囲で
あればセカンダリ変換領域、それ以外であれば非セカンダリ変換領域と判定してもよい。また、y < stAreaTbl[][x]の範囲であればセカンダリ変換領域、それ以外であれば非セカンダリ変換領域と判定してもよい。逆セカンダリ変換部31121は、S4(S411 or S412)にお
いて、セカンダリ変換領域であれば、S3でsecTransformMatrix[][]により変換されたv[]
をd[][]に格納し、それ以外であれば、d[][]を格納してもよい。
す図である。図では出力されるセカンダリ変換の個数nOutSizeは32である。
stAreaTbl[1][] = {5, 5, 5, 5, 4, 4, 4, 0}
stAreaTbl[][i]に格納された数値はi行(あるいは列)目のセカンダリ変換係数の個数を
表す。
また、stAreaTblは1次元配列であってもよい。
stAreaTbl1[] = {5, 5, 5, 5, 4, 4, 4, 0}
逆セカンダリ変換部31121は、stAreaTbl[][]を用いて、以下のように配置してもよい。
cnt = 0
for (y = 0; y < nStSize; y++) {
for (x = 0; x < nStSize; x++) {
if (x < stAreaTbl[areaMode][y]) // セカンダリ変換領域内であればv[]を配置
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = v[cnt++]
else // 非セカンダリ変換領域でなければd[][]を配置
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y]
なお、逆セカンダリ変換部31121は、stAreaTbl[][]を用いて、以下のように配置してもよい。
cnt = 0
for (x = 0; x < nStSize; x++) {
for (y = 0; y < nStSize; y++) {
if (y < stAreaTbl[areaMode][x]) // セカンダリ変換領域内であればv[]を配置
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = v[cnt++]
else // 非セカンダリ変換領域でなければd[][]を配置
d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y] = d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y]
なお、上記2つの配置方法をpredModeIntraに応じて切り替えてもよい。例えば、下記
条件を満たす場合、上記手順<処理-S4A>を適用し、それ以外の場合<処理-S4B>を適用してもよい。
図25は、本発明の実施形態の逆セカンダリ変換部の2次元配置stAreaTbl[][]の別の例
を示す図である。図ではnOutSize=36である。
stAreaTbl[1][] = {6, 6, 6, 6, 4, 4, 4, 0}
上記、areaMode==0の配置は、90度回転に対して対称であり、areaMode==1の配置は、対称ではない。本発明の実施形態の逆セカンダリ変換部は、セカンダリ変換後の変換係数v[]として、90度回転に対して対称である場合と、対称ではない場合を選択してd[][]に配置してもよい。
ここでareaMode = 0もしくは1である。またM個のテーブルを用いる場合には、areaMode
= 0..M-1である。
を示す図である。図ではnOutSize=36である。
stAreaTbl[1][] = {8, 6, 6, 6, 4, 4, 1, 1}
あるいは、
stAreaTbl[0][] = {7, 7, 6, 6, 4, 4, 2, 0}
stAreaTbl[1][] = {8, 6, 6, 6, 4, 4, 1, 1}
上記はどちらも90度回転に対して対称である。本発明の実施形態の逆セカンダリ変換部は
、セカンダリ変換後の変換係数v[]として、共に90度回転に対して対称である場合を選択
して2次元配列d[][]に配置してもよい。
を示す図である。図ではnOutSize=40である。
stAreaTbl[1][] = {6, 6, 6, 6, 4, 4, 4, 4}
図28は、本発明の実施形態の逆セカンダリ変換部の2次元配置stAreaTbl[][]の別の例
を示す図である。nOutSize=48の場合の例である。
stAreaTbl[1][] = {6, 6, 6, 6, 6, 6, 6, 6}
例えば、逆セカンダリ変換部31121は、stTrSetId==0, 2の場合には、図24、図25、図26、図27、図28の左図に示す配置を行う。具体的にはareaMode=0に設定してもよい(S412)。stTrSetId==1, 3の場合には、図24、図25、図26、図27、図28の右図に示す配置、具体的にはareaMode=1に設定してもよい(S412)。
インデックスを以下の式によって導出しても良い。
あるいは下式で導出してもよい。
図21は、本発明の実施形態の逆セカンダリ変換部の処理を示すフローチャートである。本例では、セカンダリ変換の利用及び変換基底を示す値stIdxに応じて、セカンダリ変換
領域を変更する。
、図28の左図に示す配置、具体的にはareaMode=0に設定してもよい(S412)。stIdx==2の場合には、図24、図25、図26、図27、図28の右図に示す配置、具体的にはareaMode=1に設定してもよい(S412)。
インデックスを以下の式によって導出しても良い。
図22は、本発明の実施形態の逆セカンダリ変換部の処理を示すフローチャートである。本例では、stTrSetIdとstIdxに応じて、セカンダリ変換領域を変更する。
インデックスを以下の式によって導出しても良い。
図23は、本発明の実施形態の逆セカンダリ変換部の処理を示すフローチャートである。本例では、stTrSetIdとstIdxに応じてセカンダリ変換領域を変更する。図22よりも細かい分類を行ってもよい。
インデックスを以下の式によって導出しても良い。
areaMode = 1 (if ((stTrSetId==0 || stTrSetId==2) and stIdx == 1)
areaMode = 2 (if ((stTrSetId==1 || stTrSetId==3) and stIdx == 0)
areaMode = 3 (if ((stTrSetId==1 || stTrSetId==3) and stIdx == 1)
上記構成によれば、セカンダリ変換領域を、CU単位で選択可能なstIdx、イントラ予測
モードにより異なるstTrSetIdの何れかあるいは両方によって、セカンダリ変換を行う変
換係数の範囲を切り替えることによって符号化効率を向上させる効果を奏する。また、x
座標またはy座標と、セカンダリ変換後の変換係数v[]を使うか否かを判定するテーブルstAreaTbl[][]を用いて、容易にセカンダリ変換を行う範囲を切り替えることができる効果を奏する。また、上記テーブルstAreaTbl[][]の引数となる座標がx座標であるかy座標であるかをイントラ予測方向によって切り替えることによって、さらに符号化効率を向上させる効果を奏する。
スケーリング部31122は、逆セカンダリ変換部31121による変換後の係数(変換係数)に対して係数単位の重みを用いてスケーリングする。
して、まず、通常適用されるスケーリングについて説明する。
通常のスケーリングは、逆量子化と共に(同時に)、量子化マトリックスを用いて変換係数をスケーリングする。しかし、量子化マトリックスは、コア変換係数に対応するため、セカンダリ変換の係数をスケーリングするのは適切ではない。
本実施形態におけるスケーリング部31122は、逆量子化後の係数を逆セカンダリ変換部31121によって変換後の係数(変換係数)をスケーリングする。これにより、量子化マトリックスの各値が、逆セカンダリ変換後の係数、すなわち、コア変換係数に対応することになるため、適切にスケーリングすることができる。結果として、逆セカンダリ変換を好適に適用することができる。
。これにより、スケーリングする際の計算の精度を保つことができる。
逆セカンダリ変換を行う動画像復号装置においては、逆セカンダリ変換部31121の前に
適用するスケーリング部と、逆セカンダリ変換部31121の後に適用するスケーリング部の
2つのスケーリング部を備えてもよい。逆セカンダリ変換部31121によって変換後の係数
に対してスケーリングを行う係数スケーリング部31122は、以下の構成では、第2スケー
リング部31112として説明される。
逆コア変換部31123は、逆セカンダリ変換部31121による変換後の係数(変換係数)に対して逆コア変換を適用する。逆コア変換部31123は、逆セカンダリ変換部31121によって変換された変換係数が、スケーリング部31122によるスケーリング後の係数(変換係数)に
対して、逆コア変換を適用してもよい。逆コア変換部31123は、垂直方向、水平方向の2
回の1次元変換を行う手段であり、通例は変換部と呼ばれる。なお、逆コア変換部31123
は、垂直方向、水平方向の一方又は両方をスキップし、変換係数の大きさ変換(スケーリング)のみをする場合を備えていてもよい。
ここで、transMatrix[ ][ ](=transMatrixV [ ][ ])は、trTypeVerを用いて導出したnTbS × nTbSの行列で表された変換基底である。nTbSはTUの高さnTbHである。trType==0
のDCT2の4 × 4変換(nTbS=4)の場合には、例えばtransMatrix ={{29, 55, 74, 84}{74, 74, 0, -74}{84, -29, -74, 55}{55, -84, 74, -29}}を用いる。Σの記号は、 j = 0.. nTbS - 1までの添え字jについて、行列transMatrix[ y ][ j ]と変換係数d[ x ][ j ]の積を加算する処理を意味する。つまり、e[ x ][ y ]は、d[ x ][ y ]の各列(column)であるd[ x ][ j ](j = 0.. nTbS - 1)からなるベクトルx[ j ] (j = 0.. nTbS - 1)と行列の要素transMatrix[ y ][ j ] の積から得られる列を並べて得られる。
間値g[ x ][ y ]を導出する。
上式の64、7は変換基底のビット深度から決まる数値で、上式では変換基底を7bitと仮
定している。またcoeffMin、coeffMaxはクリッピングの最小値と最大値である。
y ]に変換する。
上記記号Σは、 j = 0.. nTbS - 1までの添え字jについて、行列transMatrix[ x ][j]
とg[j][ y ]の積を加算する処理を意味する。つまり、r[ x ][ y ]は、g[ x ][ y ]の各
行(row)であるg[ j ][ y ](j = 0.. nTbS - 1)と行列transMatrixの積から得られる行
を並べて得られる。
加算部312はブロックの復号画像を参照ピクチャメモリ306に記憶し、また、ループフィルタ305に出力する。
上述の例では、セカンダリ変換部は、TUが8×8以上である場合に、TUに含まれる変換係数のうち最低周波数成分を含むNUMSTC個の変換係数に対してのみセカンダリ変換を適用し、ベクトルFを導出する。そして、逆セカンダリ変換部31121は、ベクトルFに量子化及び逆量子化を施したベクトルF'を逆セカンダリ変換した後、最低周波数成分を含む領域に配置する。また、セカンダリ変換部及び逆セカンダリ変換部31121は、TUが8×8未満である場合に適用される第1種の変換基底T1、及び、TUが8×8以上である場合に適用される第2種の変換基底T2の何れかを用いてセカンダリ変換及び逆セカンダリ変換を行っている。また、セカンダリ変換部及び逆セカンダリ変換部31121は、第1種の変換基底T1を、第2種の変換基底T2から導出している。
の機能の代わりに、以下の機能を備えていてもよい。すなわち、TUが8×8より大きい場合に、TUに含まれる変換係数のうち、最低周波数成分を含む8×8領域から、水平方向及び垂直方向が共に高周波数成分である一部の領域に含まれる変換係数を、セカンダリ変換及び逆セカンダリ変換の対象から外してもよい。また、低周波数成分を含む8×8領域を水平方向に拡張した領域、及び、最低周波数成分を含む8×8領域を垂直方向に拡張した領域の少なくとも何れかを、セカンダリ変換及び逆セカンダリ変換の対象に含めてもよい。TUのサイズとしては、16×16、8×16及び16×8等、8×8より大きいサイズが挙げられる。
以下、図15を用いて逆セカンダリ変換部31121による逆セカンダリ変換の適用例4について説明する。図15は、変形例における逆セカンダリ変換の対象となる領域の一例を説明するための図である。
逆セカンダリ変換では、TUが8×8より大きい場合に、逆量子化後の変換残差の左上の8
×8領域RUの変換係数に対し、RST8×8として、64×16行列によって表される第2種の変換
基底T2を適用してもよい。この場合、セカンダリ変換では、図13に示す逆量子化後の変換残差から領域RUを除く領域に含まれる変換係数をゼロアウトする。ここでは、逆量子化後の変換残差における左上の8×8領域RUに含まれる変換係数を保持している。しかしながら、変換係数の分布を考慮すると、左上の8×8領域RUに含まれる変換係数のみを保持して、それ以外の領域をゼロアウトするのは好ましくない。
これに対し、本実施形態では、逆セカンダリ変換部31121は、図15の変換係数の選択例4に示すように、最低周波数成分を含む8×8領域RUから、高周波数成分を含む一部の領域R5に含まれる変換係数を、逆セカンダリ変換の対象から外してもよい。また、逆セカンダリ変換部31121は、最低周波数成分を含む8×8領域RUを水平方向に拡張した領域R6を、逆セ
カンダリ変換の対象に含めてもよい。換言すれば、逆セカンダリ変換部31121は、逆量子
化後の1次元ベクトルF'に逆セカンダリ変換を施した1次元ベクトルX'を、最低周波数成分を含む8×8領域RUに配置する場合に、高周波数成分に属する一部の領域R5に配置しなくてもよい。また、逆セカンダリ変換部31121は、最低周波数成分を含む8×8領域RUを水平方
向に拡張した領域R6に1次元ベクトルX'を格納してもよい。
数成分を含む8×8領域RUを垂直方向に拡張した領域R8を、逆セカンダリ変換の対象に含めてもよい。換言すれば、逆セカンダリ変換部31121は、逆量子化後の1次元ベクトルF'に逆セカンダリ変換を施した1次元ベクトルV'を、図15の最低周波数成分を含む8×8領域RUに
配置する場合に、高周波数成分に属する一部の領域R7に配置しなくてもよい。また、逆セカンダリ変換部31121は、最低周波数成分を含む8×8領域RUを垂直方向に拡張した領域R8
に1次元ベクトルV'を格納してもよい。
数成分を含む8×8領域Rを水平方向に拡張した領域R6、及び、最低周波数成分を含む8×8
領域Rを垂直方向に拡張した領域R8を、セカンダリ変換の対象に含めてもよい。換言すれ
ば、逆セカンダリ変換部31121は、逆量子化後の1次元ベクトルF'に逆セカンダリ変換を施した1次元ベクトルV'を、図15の最低周波数成分を含む8×8領域RUに配置する場合に、高
周波数成分に属する一部の領域R9に配置しなくてもよい。また、逆セカンダリ変換部31121は、最低周波数成分を含む8×8領域RUを水平方向に拡張した領域R6、及び、最低周波数成分を含む8×8領域RUを垂直方向に拡張した領域R8に1次元ベクトルV'を格納してもよい。
に拡張した領域及び垂直方向に拡張した領域の少なくとも何れかを、逆セカンダリ変換の対象に含める。これにより、コア変換係数の情報の損失を抑え、効率的且つ好適に逆セカンダリ変換を適用することができる。
と同様に逆セカンダリ変換を適用する。
次に、本実施形態に係る動画像符号化装置11の構成について説明する。図16は、本実施形態に係る動画像符号化装置11の構成を示すブロック図である。動画像符号化装置11は、予測画像生成部101、減算部102、変換・量子化部103、逆量子化・逆変換部105、加算部106、ループフィルタ107、予測パラメータメモリ(予測パラメータ記憶部、フレームメモリ)108、参照ピクチャメモリ(参照画像記憶部、フレームメモリ)109、符号化パラメータ決定部110、パラメータ符号化部111、エントロピー符号化部104を含んで構成される。
に出力する。
量子化変換係数をエントロピー符号化部104及び逆量子化・逆変換部105に出力する。
図30は、図20で説明した本実施形態の逆量子化・逆変換部311に対応する変換・量子化
部103の概略処理を示すフローチャートである。
う。
図31は、図23で説明した本実施形態の逆量子化・逆変換部311に対応する変換・量子化
部103の概略処理を示すフローチャートである。
2の順スケーリングは、量子化マトリックスを用いたスケーリング処理を含む。
図32は、図27で説明した本実施形態の逆量子化・逆変換部311に対応する変換・量子化
部103の概略処理を示すフローチャートである。
は、量子化マトリックスを用いたスケーリング処理を含む。
う。
第1の順スケーリングは、TUサイズを用いるスケーリング処理を含む。
ほぼ等しい処理を行う。
ここで、trans(T)はTの転置行列である。セカンダリ変換部は、以下の式によって、一次
元係数u[](ベクトルF)を導出してもよい。
ここで、Tinvは、第1種の変換基底T1及び第2種の変換基底T2から構成される変換基底Tの
逆行列である。なお、セカンダリ変換部は、変換基底Tに対し、直交行列を用いることに
より、変換基底Tのtrans(T)をTinvとしてもよい。
べ変えて、変換係数d[][]を導出する。
yC = (ySbIdx<<log2StSize) + DiagScanOrder[log2StSize][log2StSize][x][1]
d[ xC ][yC ] = u[x]
また、セカンダリ変換部は、TUが8×8以上である場合に、コア変換係数のうち、最低周波数成分を含むNUMSTC個以内の係数に対してのみセカンダリ変換を適用する。NUMSTCは、36個以内であればよい。例えば、36であってもよいし、32であってもよい。また、セカンダリ変換部はTUが8×8未満である場合に適用される第1種の変換基底T1、及び、TUが8×8
以上である場合に適用される第2種の変換基底T2の何れかを用いてセカンダリ変換を行う
。また、セカンダリ変換部は、第1種の変換基底T1を、第2種の変換基底T2から導出する。これらの何れによっても、セカンダリ変換に必要なテーブルのメモリを大幅に削減することができる。その結果、好適にセカンダリ変換を適用することができる。
変換ユニット毎に予測残差を変換する画像符号化装置であって、前記予測残差に対してコア変換を適用する第1の変換部と、前記第1の変換部による変換後の変換係数に対してセカンダリ変換を適用する第2の変換部を備える画像符号化装置において、第2の変換部は、CU単位で選択可能なstIdx、イントラ予測モードにより異なるstTrSetIdの何れかあるいは両方によって、セカンダリ変換を行う範囲を切り替え、変換係数d[][]をセカンダリ
変換領域v[]に設定する。
を判定するテーブルstAreaTbl[][]を用いて、セカンダリ変換を行う変換係数の範囲を切
り替えてもよい。
と同じであり、説明を省略する。算出した予測誤差は加算部106に出力される。
、predModeである。
ロピー符号化して符号化ストリームTeを生成し、出力する。
符号化部1112(予測モード符号化部)、及びインター予測パラメータ符号化部112とイン
トラ予測パラメータ符号化部113を備えている。CU符号化部1112はさらにTU符号化部1114
を備えている。
割情報、予測情報、量子化変換係数等のパラメータの符号化処理を行う。
子化変換係数等のシンタックス要素をエントロピー符号化部104に供給する。
イントラ予測パラメータ符号化部113は、符号化パラメータ決定部110から入力されたIntraPredModeから、符号化するための形式(例えばintra_luma_mpm_idx、intra_luma_mpm_remainder等)を導出する。イントラ予測パラメータ符号化部113は、イントラ予測パラメータ復号部304がイントラ予測パラメータを導出する構成と、一部同一の構成を含む。
度イントラ予測パラメータ導出部1132、色差イントラ予測パラメータ導出部1133とを含んで構成される。
びIntraPredModeCが入力される。パラメータ符号化制御部1131はMPM候補リスト導出部30421のmpmCandList[]を参照して、intra_luma_mpm_flagを決定する。そして、intra_luma_mpm_flagとIntraPredModeYを、輝度イントラ予測パラメータ導出部1132に出力する。また、IntraPredModeCを色差イントラ予測パラメータ導出部1133に出力する。
イントラ予測モードを参照して、mpmCandList[]を導出する。MPMパラメータ導出部11322
は、intra_luma_mpm_flagが1の場合に、IntraPredModeYとmpmCandList[]からintra_luma_mpm_idxを導出し、エントロピー符号化部104に出力する。非MPMパラメータ導出部11323は、intra_luma_mpm_flagが0の場合に、IntraPredModeYとmpmCandList[]からRemIntraPredModeを導出し、intra_luma_mpm_remainderをエントロピー符号化部104に出力する。
部106は生成した復号画像を参照ピクチャメモリ109に記憶する。
くてもよく、例えばデブロッキングフィルタのみの構成であってもよい。
誤差を示すRDコスト値を算出する。符号化パラメータ決定部110は、算出したコスト値が
最小となる符号化パラメータのセットを選択する。これにより、エントロピー符号化部104は、選択した符号化パラメータのセットを符号化ストリームTeとして出力する。符号化パラメータ決定部110は決定した符号化パラメータを予測パラメータメモリ108に記憶する。
上述の例では、セカンダリ変換部は、TUが8×8以上である場合に、コア変換係数のうち、最低周波数成分を含むNUMSTC個以内の係数に対してのみセカンダリ変換を適用している。また、セカンダリ変換部は、TUが8×8未満である場合に適用される第1種の変換基底T1、及び、TUが8×8以上である場合に適用される第2種の変換基底T2の何れかを用いてセカンダリ変換を行っている。また、セカンダリ変換部は、第1種の変換基底T1を、第2種の変換基底T2から導出するように構成されている。
コア変換係数が符号化されないことによる情報の損失を抑え、効率的且つ好適にセカンダリ変換を適用することができる。
部308、逆量子化・逆変換部311、加算部312、予測画像生成部101、減算部102、変換・量
子化部103、エントロピー符号化部104、逆量子化・逆変換部105、ループフィルタ107、符号化パラメータ決定部110、パラメータ符号化部111をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、動画像符号化装置11、動画像復号装置31の何れかに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。
上述した動画像符号化装置11及び動画像復号装置31は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CG及びGUIを含む)であってもよい。
示されている。図に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した動画像符号化装置11は、この符号化部PROD_A1として利用される。
するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成又は加工する画像処理部A7を更に備えていてもよ
い。図においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。
し、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(
不図示)を介在させるとよい。
図が示されている。図に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した動画像復号装置31は、この復号部PROD_B3として利用される。
るディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図においては、これら全て
を受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。
もよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から
取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
ック図が示されている。図に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した動画像符号化装置11
は、この符号化部PROD_C1として利用される。
接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc:登録商標)やBD(Blu-ray Disc:登録商標)等のように、記録装置PROD_Cに内蔵されたドライブ
装置(不図示)に装填されるものであってもよい。
を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成又は加工する画像処理部PROD_C6を更に備えていてもよい。図においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。
、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の
主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5又は画像処理
部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3又は受
信部PROD_C5が動画像の主な供給源となる)等も、このような記録装置PROD_Cの一例であ
る。
ブロック図が示されている。図に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した動画像復号装置31は、この復号部PROD_D2として利用される。
、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBD等のよう
に、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図においては、これら全てを
再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。
、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3
が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3又は
送信部PROD_D5が動画像の主な供給先となる)等も、このような再生装置PROD_Dの一例で
ある。
また、上述した動画像復号装置31及び動画像符号化装置11の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random
Access Memory)、上記プログラム及び各種データを格納するメモリ等の記憶装置(記録媒体)等を備えている。そして、本発明の実施形態の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(又はCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、ISDN(Integrated Services Digital Network)、VAN(Value-Added Network)、CATV(Community Antenna television/Cable Television)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成又は種類のものに限定されない。例えば、IEEE(Institute of Electrical and Electronic Engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDA(Infrared Data Association)やリモコンのような赤外線、BlueTooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance:登録商標)、携帯電話網、衛星回線、地上デジタル放送網等の無線でも利用可能である。なお、本発明の実施形態は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
301 エントロピー復号部
302 パラメータ復号部
3020 ヘッダ復号部
308 予測画像生成部
311 逆量子化・逆変換部
312 加算部
11 動画像符号化装置
101 予測画像生成部
102 減算部
103 変換・量子化部
104 エントロピー符号化部
105 逆量子化・逆変換部
107 ループフィルタ
110 符号化パラメータ決定部
111 パラメータ符号化部
3111 逆量子化部
3112 逆変換部
31121 逆セカンダリ変換部
31122 スケーリング部
31123 逆コア変換部
Claims (6)
- 変換ユニット毎に変換係数を逆変換する画像復号装置であって、
上記変換係数に対して逆セカンダリ変換を適用する第2の変換部と、
上記第2の変換部による変換後の変換係数に対して逆コア変換を適用する第1の変換部を備え、
上記第2の変換部は、符号化データから復号されるセカンダリ変換を示す第1のシンタックス、およびイントラ予測モードから導出される第1の変数の何れかあるいは両方を用いて、セカンダリ変換後の1次元の変換係数を2次元の変換係数に設定するためのセカンダリ変換を行う範囲を切り替えることを特徴とする画像復号装置。 - 変換ユニット毎に変換係数を逆変換する画像復号装置であって、
上記変換係数に対して逆セカンダリ変換を適用する第2の変換部と、
上記第2の変換部による変換後の変換係数に対して逆コア変換を適用する第1の変換部を備え、
上記第2の変換部は、符号化データから復号されるセカンダリ変換を示すシンタックスである第1のシンタックス、およびイントラ予測モードから導出される変数である第1の変数の何れかあるいは両方を用いて、セカンダリ変換後の1次元の変換係数を2次元の変換係数に設定し、
上記第2の変換部は、上記2次元の変換係数の座標xもしくは座標yと、所定のテーブルの座標xもしくは座標yにおける値とを用いて、上記1次元の変換係数を上記2次元の変換係数に設定するか否かを切り替えることを特徴とする画像復号装置。 - 上記第2の変換部は、セカンダリ変換後の変数の配置を示す第2の変数に応じて、所定のテーブルを切り替えることを特徴とする請求項2に記載の画像復号装置。
- 上記第2の変換部は、所定のテーブルの引数となる座標がx座標であるかy座標であるかを上記イントラ予測モードによって切り替えることを特徴とする請求項1から3の何れか1項に記載の画像復号装置。
- 変換ユニット毎に変換係数を逆変換する画像復号装置であって、
上記変換係数に対して逆セカンダリ変換を適用する第2の変換部と、
上記第2の変換部による変換後の変換係数に対して逆コア変換を適用する第1の変換部を備え、
上記第2の変換部は、符号化データから復号されるセカンダリ変換を示すシンタックスである第1のシンタックス、およびイントラ予測モードから導出される変数である第1の変数の何れかあるいは両方を用いて、セカンダリ変換後の1次元の変換係数を2次元の変換係数に設定し、
上記第2の変換部は、上記1次元の変換係数を上記2次元の変換係数に設定するためのセカンダリ変換を行う範囲として、90度回転に対して対称な範囲と、対称ではない範囲を用いることを特徴とする画像復号装置。 - 変換ユニット毎に変換係数を逆変換する画像符号化装置であって、
上記変換係数に対して逆セカンダリ変換を適用する第2の変換部と、
上記第2の変換部による変換後の変換係数に対して逆コア変換を適用する第1の変換部を備え、
上記第2の変換部は、セカンダリ変換を示す第1のシンタックス、およびイントラ予測モードから導出される第1の変数の何れかあるいは両方を用いて、セカンダリ変換後の1次元の変換係数を2次元の変換係数に設定するためのセカンダリ変換を行う範囲を切り替えることを特徴とする画像符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019116421A JP7397586B2 (ja) | 2019-06-24 | 2019-06-24 | 画像復号装置及び画像符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019116421A JP7397586B2 (ja) | 2019-06-24 | 2019-06-24 | 画像復号装置及び画像符号化装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021002797A JP2021002797A (ja) | 2021-01-07 |
JP2021002797A5 JP2021002797A5 (ja) | 2022-06-22 |
JP7397586B2 true JP7397586B2 (ja) | 2023-12-13 |
Family
ID=73994322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019116421A Active JP7397586B2 (ja) | 2019-06-24 | 2019-06-24 | 画像復号装置及び画像符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7397586B2 (ja) |
-
2019
- 2019-06-24 JP JP2019116421A patent/JP7397586B2/ja active Active
Non-Patent Citations (3)
Title |
---|
Jianle Chen et al.,Algorithm description for Versatile Video Coding and Test Model 5 (VTM 5),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 14th Meeting: Geneva, CH, 19-27 Mar. 2019,JVET-N1002-v2,2019年06月11日,pp.50-53 |
Moonmo Koo et al.,CE6: Reduced Secondary Transform (RST) (CE6-3.1),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 14th Meeting: Geneva, CH, 19-27 March 2019,JVET-N0193,2019年03月27日,pp.3-6 |
Moonmo Koo et al.,CE6: Reduced Secondary Transform (RST) (test 6.5.1),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting: Marrakech, MA, 9-18 Jan. 2019,JVET-M0292,2019年01月12日,pp.3-6 |
Also Published As
Publication number | Publication date |
---|---|
JP2021002797A (ja) | 2021-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7402016B2 (ja) | 画像復号装置及び画像符号化装置 | |
JP7368145B2 (ja) | 画像符号化装置、および、画像復号装置 | |
JP7461347B2 (ja) | 画像復号装置、画像符号化装置、画像復号方法及び画像符号化方法 | |
CN112532976A (zh) | 运动图像解码装置以及运动图像编码装置 | |
JP2020061701A (ja) | 動画像符号化装置および動画像復号装置 | |
JPWO2020241858A5 (ja) | ||
WO2020184366A1 (ja) | 画像復号装置 | |
WO2020004349A1 (ja) | 動画像符号化装置および動画像復号装置 | |
WO2020067440A1 (ja) | 動画像符号化装置および動画像復号装置 | |
WO2021246284A1 (ja) | 動画像復号装置及び動画像符号化装置 | |
JP7397586B2 (ja) | 画像復号装置及び画像符号化装置 | |
JP2020202417A (ja) | 画像復号装置及び画像符号化装置 | |
JP2021034887A (ja) | 画像復号装置及び画像符号化装置 | |
JP2021153213A (ja) | 動画像符号化装置および動画像復号装置 | |
JP2021034966A (ja) | 動画像符号化装置、動画像復号装置 | |
JP7425568B2 (ja) | 動画像復号装置、動画像符号化装置、動画像復号方法および動画像符号化方法 | |
JP7444570B2 (ja) | 動画像復号装置、動画像符号化装置、動画像復号方法および動画像符号化方法 | |
WO2024009962A1 (ja) | Cclm予測部、動画像復号装置、および動画像符号化装置 | |
JP2020195012A (ja) | 画像復号装置及び画像符号化装置 | |
WO2020045275A1 (ja) | 画像復号装置および画像符号化装置 | |
JP2021016058A (ja) | 画像復号装置及び画像符号化装置 | |
JP2021048556A (ja) | 画像復号装置及び画像符号化装置 | |
JP2021197557A (ja) | 画像復号装置及び画像符号化装置 | |
JP2021061470A (ja) | 画像復号装置及び画像符号化装置 | |
JP2020195042A (ja) | 動画像復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20220525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220614 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220614 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7397586 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |