JP2023501529A

JP2023501529A - 変換に基づく映像コーディング方法及びその装置

Info

Publication number: JP2023501529A
Application number: JP2022527133A
Authority: JP
Inventors: ムンモク; スンファンキム; サレヒファーメフディ; チェヒョンイム
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2019-11-11
Filing date: 2020-11-09
Publication date: 2023-01-18
Also published as: AU2020382581A1; AU2020382581B2; WO2021096174A1; AU2024203190A1; US20220400266A1; CN114930846A; KR20220058583A

Abstract

本文書による映像デコーディング方法は、現在ブロックの左上端第１の領域を除外した第２の領域に有効係数が存在するかどうかを判断するステップ、前記第２の領域に前記有効係数が存在しないことに基づいて前記ビットストリームからＭＴＳインデックスをパーシングするステップ、及び、前記ＭＴＳインデックスに基づいて導出された変換カーネルを前記第１の領域の変換係数に適用して前記現在ブロックに対するレジデュアルサンプルを導出するステップを含み、前記ＭＴＳインデックスは、前記有効係数がスキャンされるスキャンサブブロック内に存在する前記有効係数が前記第２の領域に存在しないことに基づいてパーシングされる。【選択図】図１３

Description

本文書は、画像コーディング技術に関し、より詳細には、画像コーディングシステムにおいて変換（ｔｒａｎｓｆｏｒｍ）に基づく画像コーディング方法及びその装置に関する。

近年、４Ｋまたは８Ｋ以上のＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）画像／ビデオのような高解像度、高品質の画像／ビデオに対する需要が様々な分野で増加している。画像／ビデオデータが高解像度、高品質になるほど、既存の画像／ビデオデータに比べて相対的に送信される情報量またはビット量が増加するので、既存の有無線広帯域回線のような媒体を利用して画像データを送信するか、既存の格納媒体を利用して画像／ビデオデータを格納する場合、送信費用と格納費用が増加する。

また、近年、ＶＲ（ＶｉｒｔｕａｌＲｅａｌｉｔｙ）、ＡＲ（ＡｒｔｉｆｉｃｉａｌＲｅａｌｔｉｙ）コンテンツやホログラムなどの実感メディア（ＩｍｍｅｒｓｉｖｅＭｅｄｉａ）に対する関心及び需要が増加しており、ゲーム画像のように、現実画像と異なる画像特性を有する画像／ビデオに対する放送が増加している。

これにより、前記のような様々な特性を有する高解像度高品質の画像／ビデオの情報を効果的に圧縮して送信するか格納し、再生するために高効率の画像／ビデオ圧縮技術が求められる。

本文書の技術的課題は、映像コーディング効率を上げる方法及び装置を提供することにある。

本文書の他の技術的課題は、変換インデックスコーディングの効率を上げる方法及び装置を提供することにある。

本文書の他の技術的課題は、ＭＴＳを活用した映像コーディング方法及び装置を提供することにある。

本文書の他の技術的課題は、ＭＴＳインデックスシグナリングに対する映像コーディング方法及び装置を提供することにある。

本文書の一実施例によると、デコーディング装置により実行される映像デコーディング方法を提供する。前記方法は、現在ブロックの左上端第１の領域を除外した第２の領域に有効係数が存在するかどうかを判断するステップ、前記第２の領域に前記有効係数が存在しないことに基づいて前記ビットストリームからＭＴＳインデックスをパーシングするステップ、及び、前記ＭＴＳインデックスに基づいて導出された変換カーネルを前記第１の領域の変換係数に適用して前記現在ブロックに対するレジデュアルサンプルを導出するステップを含み、前記ＭＴＳインデックスは、前記有効係数がスキャンされるスキャンサブブロック内に存在する前記有効係数が前記第２の領域に存在しないことに基づいてパーシングされる。

前記第２の領域に有効係数が存在するかどうかを判断するステップは、前記スキャンサブブロック内に前記有効係数が存在するかどうかを示すフラグ値が１であるかどうかを判断するステップ、及び、前記スキャンサブブロック内に存在する有効係数が前記第２の領域に位置するかどうかを判断するステップを含む。

前記第２の領域に有効係数が存在するかどうかを判断するステップは、前記スキャンサブブロック内に前記有効係数が存在するかどうかを示すフラグ値が１であるかどうかを判断するステップ、及び、前記スキャンサブブロックが前記第２の領域に位置するかどうかを判断するステップを含む。

前記第２の領域に有効係数が存在するかどうかを判断するステップは、前記第２の領域に前記有効係数が存在するかどうかを示すフラグ情報を導出するステップを含み、前記フラグ情報は、最初１に設定され、前記有効係数が前記第２の領域に位置する場合、前記フラグ情報は、０に変更される。

前記第１の領域は、前記現在ブロックの左上端１６×１６領域であり、前記スキャンサブブロックは、４×４ブロックである。

前記スキャンサブブロックは、前記現在ブロック内の前記最後の有効係数の位置から逆対角スキャン方向によってスキャンされる。

本文書の一実施例によると、エンコーディング装置により実行される映像エンコーディング方法を提供する。前記方法は、レジデュアルサンプルに対する１次変換に基づいて前記現在ブロックに対する変換係数を導出するステップ、前記現在ブロックの左上端第１の領域を除外した第２の領域をゼロアウトするステップ、有効係数がスキャンされるスキャンサブブロック内に存在する前記有効係数が前記第２の領域に存在しないことに基づいてＭＴＳインデックスがパーシングされるように映像情報を構成するステップ、及び、前記現在ブロックに対する前記変換係数に基づいて導出されたレジデュアル情報及び前記ＭＴＳインデックスをエンコーディングするステップを含む。

本文書の他の一実施例によると、エンコーディング装置により実行された映像エンコーディング方法によって生成されたエンコーディングされた映像情報及びビットストリームが含まれている映像データが格納されたデジタル格納媒体が提供される。

本文書の他の一実施例によると、デコーディング装置により前記映像デコーディング方法を実行するようにするエンコーディングされた映像情報及びビットストリームが含まれている映像データが格納されたデジタル格納媒体が提供される。

本文書によると、全般的な映像／ビデオ圧縮効率を上げることができる。

本文書によると、ＭＴＳインデックスコーディングの効率を上げることができる。

本文書によると、ＭＴＳを活用した映像コーディング方法の効率を上げることができる。

本明細書の具体的な一例を介して得られる効果は、以上で羅列された効果に制限されない。例えば、関連する技術分野における通常の知識を有する者（ａｐｅｒｓｏｎｈａｖｉｎｇｏｒｄｉｎａｒｙｓｋｉｌｌｉｎｔｈｅｒｅｌａｔｅｄａｒｔ）が、本明細書から理解または誘導できる様々な技術的効果が存在し得る。これによって、本明細書の具体的な効果は、本明細書に明示的に記載されているものに制限されず、本明細書の技術的特徴から理解または誘導できる様々な効果を含み得る。

本文書が適用され得るビデオ／画像エンコード装置の構成を概略的に説明する図である。

本文書が適用され得るビデオ／画像デコード装置の構成を概略的に説明する図である。

本文書の一実施形態に係る多重変換技法を概略的に示す。

６５個予測方向のイントラ方向性モードを例示的に示す。

本文書の一実施形態に係るＲＳＴを説明するための図である。

一例によって順方向１次変換の出力データを１次元ベクトルで配列する順序を示した図である。

一例によって順方向２次変換の出力データを２次元ブロックで配列する順序を示した図である。

ＬＦＮＳＴが適用されるブロック形状を示した図である。

一例によって順方向ＬＦＮＳＴの出力データの配置を示した図である。

一例によって４×４ＬＦＮＳＴが適用されるブロックでのゼロアウトを示す図である。

一例によって８×８ＬＦＮＳＴが適用されるブロックでのゼロアウトを示す図である。

本文書の一例に係る３２×３２変換ブロックのスキャンを説明するための図である。

一例に係る映像のデコーディング方法を説明するための図である。

一例に係る映像のエンコーディング方法を説明するための図である。

本文書が適用されることができるビデオ／映像コーディングシステムの例を概略的に示す。

本文書が適用されるコンテンツストリーミングシステム構造図を例示的に示す。

本文書は、様々な変更を加えることができ、様々な実施形態を有することができるが、特定の実施形態を図面に例示し、詳細に説明しようとする。しかし、これは、本文書を特定の実施形態に限定しようとするわけではない。本明細書で常用する用語は、単に特定の実施形態を説明するために使用されたものであって、本文書における技術的思想を限定しようとする意図に使用されるわけではない。単数の表現は、文脈上明らかに異なる意味ではない限り、複数の表現を含む。本明細書において、「含む」又は「有する」等の用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品又はこれらを組み合わせたものが存在することを指定しようとするものであり、１つ又はそれ以上の異なる特徴や、数字、ステップ、動作、構成要素、部品又はこれらを組み合わせたものの存在又は付加の可能性を予め排除しないものと理解されるべきである。

一方、本文書で説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の便宜のために独立して示すものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで実現されるということを意味するのではない。例えば、各構成のうち、２つ以上の構成が合わせられて１つの構成をなすこともあり、１つの構成が複数の構成に分けられることもある。各構成が統合及び／又は分離された実施形態も、本文書の本質から外れない限り、本文書の権利範囲に含まれる。

以下、添付図を参照として、本文書の好ましい実施例をより詳細に説明しようとする。以下、図面上の同じ構成要素に対しては同じ参照符号を使用し、同じ構成要素に対して重複した説明は省略する。

本文書は、ビデオ／画像コーディングに関する。例えば、本文書で開示された方法／実施例は、ＶＶＣ（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ）標準（ＩＴＵ－ＴＲｅｃ．Ｈ．２６６）、ＶＶＣ以降の次世代ビデオ／イメージのコーディング標準、又はそれ以外のビデオコーディング関連の標準（例えば、ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）標準（ＩＴＵ－ＴＲｅｃ．Ｈ．２６５）、ＥＶＣ（ｅｓｓｅｎｔｉａｌｖｉｄｅｏｃｏｄｉｎｇ）標準、ＡＶＳ２標準等）と関連し得る。

本文書では、ビデオ／画像コーディングに関する様々な実施形態を提示し、別の言及がない限り、前記実施形態は互いに組み合わせて実行することもある。

本文書で、ビデオ（ｖｉｄｅｏ）は、時間の流れによる一連の画像（ｉｍａｇｅ）の集合を意味することができる。ピクチャ（ｐｉｃｔｕｒｅ）は、一般的に特定の時間帯における１つの画像を示す単位を意味し、スライス（ｓｌｉｃｅ）／タイル（ｔｉｌｅ）は、コーディングにおいてピクチャの一部を構成する単位である。スライス／タイルは、１つ以上のＣＴＵ（ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ）を含むことができる。１つのピクチャは、１つ以上のスライス／タイルで構成されることができる。１つのピクチャは、１つ以上のタイルグループで構成されることができる。１つのタイルグループは、１つ以上のタイルを含むことができる。

ピクセル（ｐｉｘｅｌ）又はペル（ｐｅｌ）は、１つのピクチャ（又は画像）を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル（ｓａｍｐｌｅ）」が使用できる。サンプルは、一般的にピクセル又はピクセルの値を示すことがあり、ルマ（ｌｕｍａ）成分のピクセル／ピクセル値のみを示すこともあり、クロマ（ｃｈｒｏｍａ）成分のピクセル／ピクセル値のみを示すこともある。或いは、サンプルは空間ドメインでのピクセル値を意味することもあり、このようなピクセル値が周波数ドメインに変換されると、周波数ドメインでの変換係数を意味することもある。

ユニット（ｕｎｉｔ）は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定領域及び当該領域に関する情報の少なくとも１つを含むことができる。１つのユニットは、１つのルマブロック及び２つのクロマ（例えば、ｃｂ、ｃｒ）ブロックを含むことができる。ユニットは、場合に応じて、ブロック（ｂｌｏｃｋ）又は領域（ａｒｅａ）等の用語と混用して使用されてもよい。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列とＮ個の行とからなるサンプル（又はサンプルアレイ）又は変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）の集合（又はアレイ）を含むことができる。

本文書において、「／」及び「、」は、「及び／又は」と解釈される。例えば、「Ａ／Ｂ」は、「Ａ及び／又はＢ」と解釈され、「Ａ、Ｂ」は、「Ａ及び／又はＢ」と解釈される。さらに、「Ａ／Ｂ／Ｃ」は、「Ａ、Ｂ及び／又はＣの少なくとも１つ」を意味する。また、「Ａ、Ｂ、Ｃ」も、「Ａ、Ｂ及び／又はＣの少なくとも１つ」を意味する。（Ｉｎｔｈｉｓｄｏｃｕｍｅｎｔ，ｔｈｅｔｅｒｍ “／” ａｎｄ “，” ｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ “ａｎｄ／ｏｒ．” Ｆｏｒｉｎｓｔａｎｃｅ，ｔｈｅｅｘｐｒｅｓｓｉｏｎ “Ａ／Ｂ” ｍａｙｍｅａｎ “Ａａｎｄ／ｏｒＢ．” Ｆｕｒｔｈｅｒ，“Ａ，Ｂ” ｍａｙｍｅａｎ “Ａａｎｄ／ｏｒＢ．” Ｆｕｒｔｈｅｒ， “Ａ／Ｂ／Ｃ” ｍａｙｍｅａｎ “ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂ，ａｎｄ／ｏｒＣ．” Ａｌｓｏ，“Ａ／Ｂ／Ｃ” ｍａｙｍｅａｎ “ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂ，ａｎｄ／ｏｒＣ．”）

さらに、本文書において、「又は」は、「及び／又は」と解釈される。例えば、「Ａ又はＢ」は、１）「Ａ」のみを意味し、２）「Ｂ」のみを意味するか、３）「Ａ及びＢ」を意味し得る。言い換えると、本文書の「又は」は、「さらに又は代案として（ａｄｄｉｔｉｏｎａｌｌｙｏｒａｌｔｅｒｎａｔｉｖｅｌｙ）」を意味し得る。（Ｆｕｒｔｈｅｒ，ｉｎｔｈｅｄｏｃｕｍｅｎｔ，ｔｈｅｔｅｒｍ “ｏｒ” ｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ “ａｎｄ／ｏｒ．” Ｆｏｒｉｎｓｔａｎｃｅ，ｔｈｅｅｘｐｒｅｓｓｉｏｎ “ＡｏｒＢ” ｍａｙｃｏｍｐｒｉｓｅ１）ｏｎｌｙＡ，２）ｏｎｌｙＢ，ａｎｄ／ｏｒ３）ｂｏｔｈＡａｎｄＢ．Ｉｎｏｔｈｅｒｗｏｒｄｓ，ｔｈｅｔｅｒｍ “ｏｒ” ｉｎｔｈｉｓｄｏｃｕｍｅｎｔｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ “ａｄｄｉｔｉｏｎａｌｌｙｏｒａｌｔｅｒｎａｔｉｖｅｌｙ．”）

本明細書において、「少なくとも１つのＡ及びＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄＢ）」は、「ただＡ」、「ただＢ」又は「Ａ及びＢ両方」を意味し得る。また、本明細書において、「少なくとも１つのＡ又はＢ（ａｔｌｅａｓｔｏｎｅｏｆＡｏｒＢ）」や「少なくとも１つのＡ及び／又はＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄ／ｏｒＢ）」という表現は、「少なくとも１つのＡ及びＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄＢ）」と同様に解釈され得る。

また、本明細書において、「少なくとも１つのＡ、Ｂ及びＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢａｎｄＣ）」は、「ただＡ」、「ただＢ」、「ただＣ」、又は「Ａ、Ｂ及びＣの任意の全ての組み合わせ（ａｎｙｃｏｍｂｉｎａｔｉｏｎｏｆＡ，ＢａｎｄＣ）」を意味し得る。また、「少なくとも１つのＡ、Ｂ又はＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢｏｒＣ）」や「少なくとも１つのＡ、Ｂ及び／又はＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂａｎｄ／ｏｒＣ）」は、「少なくとも１つのＡ、Ｂ及びＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢａｎｄＣ）」を意味し得る。

また、本明細書で使用される括弧は、「例えば（ｆｏｒｅｘａｍｐｌｅ）」を意味し得る。具体的に、「予測（イントラ予測）」で表示された場合、「予測」の一例として「イントラ予測」が提案されたものであり得る。言い換えると、本明細書の「予測」は、「イントラ予測」に制限（ｌｉｍｉｔ）されず、「イントラ予測」が「予測」の一例として提案されたものであり得る。また、「予測（すなわち、イントラ予測）」で表示された場合にも、「予測」の一例として「イントラ予測」が提案されたものであり得る。

本明細書において１つの図面内で個別的に説明される技術的特徴は、個別的に実現されてもよく、同時に実現されてもよい。

図１は、本文書が適用できるビデオ／画像エンコード装置の構成を概略的に説明する図面である。以下、ビデオエンコード装置とは、画像エンコード装置を含むことができる。

図１を参照すると、エンコード装置１００は、画像分割部（ｉｍａｇｅｐａｒｔｉｔｉｏｎｅｒ）１１０、予測部（ｐｒｅｄｉｃｔｏｒ）１２０、レジデュアル処理部（ｒｅｓｉｄｕａｌｐｒｏｃｅｓｓｏｒ）１３０、エントロピーエンコード部（ｅｎｔｒｏｐｙｅｎｃｏｄｅｒ）１４０、加算部（ａｄｄｅｒ）１５０、フィルタリング部（ｆｉｌｔｅｒ）１６０、及びメモリ（ｍｅｍｏｒｙ）１７０を含めて構成されることができる。予測部１２０は、インター予測部１２１及びイントラ予測部１２２を含むことができる。レジデュアル処理部１３０は、変換部（ｔｒａｎｓｆｏｒｍｅｒ）１３２、量子化部（ｑｕａｎｔｉｚｅｒ）１３３、逆量子化部（ｄｅｑｕａｎｔｉｚｅｒ）１３４、逆変換部（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍｅｒ）１３５を含むことができる。レジデュアル処理部１３０は、減算部（ｓｕｂｔｒａｃｔｏｒ）１３１をさらに含むことができる。加算部１５０は、復元部（ｒｅｃｏｎｓｔｒｕｃｔｏｒ）または復元ブロック生成部（ｒｅｃｏｎｔｒｕｃｔｇｅｄｂｌｏｃｋｇｅｎｅｒａｔｏｒ）と呼ばれ得る。前述した画像分割部１１０、予測部１２０、レジデュアル処理部１３０、エントロピーエンコード部１４０、加算部１５０、及びフィルタリング部１６０は、実施形態によって１つ以上のハードウェアコンポーネント（例えば、エンコーダチップセットまたはプロセッサ）によって構成されることができる。また、メモリ１７０は、ＤＰＢ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を含むことができ、デジタル格納媒体によって構成されることもできる。前記ハードウェアコンポーネントは、メモリ１７０を内／外部コンポーネントとしてさらに含むこともできる。

画像分割部１１０は、エンコード装置１００に入力された入力画像（または、ピクチャ、フレーム）を１つ以上の処理ユニット（ｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）に分割することができる。一例として、前記処理ユニットは、コーディングユニット（ｃｏｄｉｎｇｕｎｉｔ、ＣＵ）と呼ばれ得る。この場合、コーディングユニットは、コーディングツリーユニット（ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ、ＣＴＵ）または最大コーディングユニット（ｌａｒｇｅｓｔｃｏｄｉｎｇｕｎｉｔ、ＬＣＵ）からＱＴＢＴＴＴ（Ｑｕａｄ－ｔｒｅｅｂｉｎａｒｙ－ｔｒｅｅｔｅｒｎａｒｙ－ｔｒｅｅ）構造によって再帰的に（ｒｅｃｕｒｓｉｖｅｌｙ）分割されることができる。例えば、１つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び／又はターナリ構造に基づいて下位（ｄｅｅｐｅｒ）デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び／又はターナリ構造がその後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて、本文書に係るコーディング手順が行われ得る。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットがすぐに最終コーディングユニットとして使用されることができ、または、必要に応じてコーディングユニットは、再帰的に（ｒｅｃｕｒｓｉｖｅｌｙ）もっと下位デプスのコーディングユニットに分割されて、最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット（ＰＵ：ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ）または変換ユニット（ＴＵ：ＴｒａｎｓｆｏｒｍＵｎｉｔ）をさらに含むことができる。この場合、前記予測ユニット及び前記変換ユニットは、各々上述した最終コーディングユニットから分割またはパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であってもよく、前記変換ユニットは、変換係数を導く単位及び／又は変換係数からレジデュアル信号（ｒｅｓｉｄｕａｌｓｉｇｎａｌ）を導く単位であってもよい。

ユニットは、場合に応じて、ブロック（ｂｌｏｃｋ）または領域（ａｒｅａ）などの用語と混用して使用されることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列とＮ個の行とからなるサンプルまたは変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）の集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、輝度（ｌｕｍａ）成分のピクセル／ピクセル値のみを示すこともでき、彩度（ｃｈｒｏｍａ）成分のピクセル／ピクセル値のみを示すこともできる。サンプルは、１つのピクチャ（または、画像）をピクセル（ｐｉｘｅｌ）またはペル（ｐｅｌ）に対応する用語として使用できる。

エンコード装置１００は、入力画像信号（原本ブロック、原本サンプルアレイ）でインター予測部１２１またはイントラ予測部１２２から出力された予測信号（予測されたブロック、予測サンプルアレイ）を減算してレジデュアル信号（ｒｅｓｉｄｕａｌｓｉｇｎａｌ、残余ブロック、残余サンプルアレイ）を生成することができ、生成されたレジデュアル信号は、変換部１３２に送信される。この場合、図示されたように、エンコード装置１００内で入力画像信号（原本ブロック、原本サンプルアレイ）から予測信号（予測ブロック、予測サンプルアレイ）を減算するユニットは、減算部１３１と呼ばれることができる。予測部は、処理対象ブロック（以下、現在ブロックという）に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック（ｐｒｅｄｉｃｔｅｄｂｌｏｃｋ）を生成することができる。予測部は、現在ブロックまたはＣＵ単位でイントラ予測が適用されるか、またはインター予測が適用されるか決定することができる。予測部は、各予測モードについての説明で後述するように、予測モード情報など、予測に関する様々な情報を生成してエントロピーエンコード部１４０に伝達することができる。予測に関する情報は、エントロピーエンコード部１４０でエンコードされてビットストリーム形態で出力されることができる。

イントラ予測部１２２は、現在ピクチャ内のサンプルを参照して現在ブロックを予測できる。前記参照されるサンプルは、予測モードによって前記現在ブロックの周辺（ｎｅｉｇｈｂｏｒ）に位置してもよく、または、離れて位置してもよい。イントラ予測における予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。非方向性モードは、例えば、ＤＣモード及びプラナーモード（Ｐｌａｎａｒモード）を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、３３個の方向性予測モードまたは６５個の方向性予測モードを含むことができる。ただし、これは、例示であり、設定に応じてそれ以上またはそれ以下の個数の方向性予測モードが使用され得る。イントラ予測部１２２は、周辺ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。

インター予測部１２１は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロックを導くことができる。そのとき、インター予測モードで送信される動き情報の量を減らすために、周辺ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、Ｂｉ予測等）情報をさらに含むことができる。インター予測の場合に、周辺ブロックは、現在ピクチャ内に存在する空間的周辺ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と参照ピクチャに存在する時間的周辺ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）とを含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的周辺ブロックを含む参照ピクチャとは同じであってもよく、異なってもよい。前記時間的周辺ブロックは、同一位置参照ブロック（ｃｏｌｌｏｃａｔｅｄｒｅｆｅｒｅｎｃｅｂｌｏｃｋ）、同一位置ＣＵ（ｃｏｌＣＵ）などの名前で呼ばれ得、前記時間的周辺ブロックを含む参照ピクチャは、同一位置ピクチャ（ｃｏｌｌｏｃａｔｅｄｐｉｃｔｕｒｅ、ｃｏｌＰｉｃ）とも呼ばれ得る。例えば、インター予測部１２１は、周辺ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び／又は参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が実行されることができ、例えば、スキップモードとマージモードの場合に、インター予測部１２１は、周辺ブロックの動き情報を現在ブロックの動き情報として用いることができる。スキップモードの場合、マージモードと異なり、レジデュアル信号が送信されないことがある。動き情報予測（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｉｏｎ、ＭＶＰ）モードの場合、周辺ブロックの動きベクトルを動きベクトル予測子（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）として用い、動きベクトル差分（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）をシグナリングすることにより、現在ブロックの動きベクトルを指示することができる。

予測部１２０は、後述する様々な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、１つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、ｃｏｍｂｉｎｅｄｉｎｔｅｒａｎｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（ｉｎｔｒａｂｌｏｃｋｃｏｐｙ、ＩＢＣ）予測モードに基づくことができ、またはパレットモード（ｐａｌｅｔｔｅｍｏｄｅ）に基づくこともできる。前記ＩＢＣ予測モードまたはパレットモードは、例えば、ＳＣＣ（ｓｃｒｅｅｎｃｏｎｔｅｎｔｃｏｄｉｎｇ）などのように、ゲームなどのコンテンツ画像／動画コーディングのために使用されることができる。ＩＢＣは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と類似して行われることができる。すなわち、ＩＢＣは、本文書で説明されるインター予測技法のうち、少なくとも１つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例とみなすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報に基づいてピクチャ内のサンプル値をシグナリングすることができる。

前記予測部（インター予測部１２１及び／又は前記イントラ予測部１２２を含む）を介して生成された予測信号は、復元信号を生成するために用いられるか、レジデュアル信号を生成するために用いられることができる。変換部１３２は、レジデュアル信号に変換技法を適用して変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔｓ）を生成することができる。例えば、変換技法は、ＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）、ＤＳＴ（ＤｉｓｃｒｅｔｅＳｉｎｅＴｒａｎｓｆｏｒｍ）、ＫＬＴ（Ｋａｒｈｕｎｅｎ－ＬｏｅｖｅＴｒａｎｓｆｏｒｍ）、ＧＢＴ（Ｇｒａｐｈ－ＢａｓｅｄＴｒａｎｓｆｏｒｍ）、またはＣＮＴ（ＣｏｎｄｉｔｉｏｎａｌｌｙＮｏｎ－ｌｉｎｅａｒＴｒａｎｓｆｏｒｍ）のうち、少なくとも１つを含むことができる。ここで、ＧＢＴは、ピクセル間の関係情報をグラフで表現するとするとき、このグラフから得られた変換を意味する。ＣＮＴは、以前に復元された全てのピクセル（ａｌｌｐｒｅｖｉｏｕｓｌｙｒｅｃｏｎｓｔｒｕｃｔｅｄｐｉｘｅｌ）を用いて予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は、正方形の同じ大きさを有するピクセルブロックに適用されることができ、正方形でない可変大きさのブロックにも適用されることができる。

量子化部１３３は、変換係数を量子化してエントロピーエンコード部１４０に送信され、エントロピーエンコード部１４０は、量子化された信号（量子化された変換係数に関する情報）をエンコードしてビットストリームに出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部１３３は、係数スキャン順序（ｓｃａｎｏｒｄｅｒ）に基づいてブロック形態の量子化された変換係数を１次元ベクトル形態で再整列することができ、前記１次元ベクトル形態の量子化された変換係数に基づいて前記量子化された変換係数に関する情報を生成することもできる。エントロピーエンコード部１４０は、例えば、指数ゴロム（ｅｘｐｏｎｅｎｔｉａｌＧｏｌｏｍｂ）、ＣＡＶＬＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｖａｒｉａｂｌｅｌｅｎｇｔｈｃｏｄｉｎｇ）、ＣＡＢＡＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）などのような様々なエンコード方法を行うことができる。エントロピーエンコード部１４０は、量子化された変換係数の他に、ビデオ／イメージ復元に必要な情報（例えば、シンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔｓ）の値等）を共にまたは別にエンコードすることもできる。エンコードされた情報（例えば、エンコードされたビデオ／画像情報）は、ビットストリーム形態でＮＡＬ（ｎｅｔｗｏｒｋａｂｓｔｒａｃｔｉｏｎｌａｙｅｒ）ユニット単位に送信または格納されることができる。前記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）など、様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ／画像情報は、一般制限情報（ｇｅｎｅｒａｌｃｏｎｓｔｒａｉｎｔｉｎｆｏｒｍａｔｉｏｎ）をさらに含むことができる。本文書においてエンコード装置からデコード装置に伝達／シグナリングされる情報及び／又はシンタックス要素は、ビデオ／画像情報に含まれることができる。前記ビデオ／画像情報は、上述したエンコード手順を介してエンコードされて前記ビットストリームに含まれることができる。前記ビットストリームは、ネットワークを介して送信されることができ、またはデジタル格納媒体に格納されることができる。ここで、ネットワークは、放送網及び／又は通信網などを含むことができ、デジタル格納媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、様々な格納媒体を含むことができる。エントロピーエンコード部１４０から出力された信号は、送信する送信部（図示せず）及び／又は格納する格納部（図示せず）がエンコード装置１００の内／外部エレメントとして構成され得るし、または送信部は、エントロピーエンコード部１４０に含まれることもできる。

量子化部１３３から出力された量子化された変換係数は、予測信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部１３４及び逆変換部１３５を介して逆量子化及び逆変換を適用することにより、レジデュアル信号（レジデュアルブロックまたはレジデュアルサンプル）を復元できる。加算部１５５は、復元されたレジデュアル信号をインター予測部１２１またはイントラ予測部１２２から出力された予測信号に加えることにより、復元（ｒｅｃｏｎｓｔｒｕｃｔｅｄ）信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）が生成され得る。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部１５０は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て次のピクチャのインター予測のために使用されることもできる。

一方、ピクチャエンコード及び／又は復元過程でＬＭＣＳ（ｌｕｍａｍａｐｐｉｎｇｗｉｔｈｃｈｒｏｍａｓｃａｌｉｎｇ）が適用されることもできる。

フィルタリング部１６０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部１６０は、復元ピクチャに様々なフィルタリング方法を適用して修正された（ｍｏｄｉｆｉｅｄ）復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ１７０、具体的に、メモリ１７０のＤＰＢに格納することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ）、適応的ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ）、両方向フィルタ（ｂｉｌａｔｅｒａｌｆｉｌｔｅｒ）などを含むことができる。フィルタリング部１６０は、各フィルタリング方法についての説明で後述するように、フィルタリングに関する様々な情報を生成してエントロピーエンコード部１４０に伝達することができる。フィルタリング関する情報は、エントロピーエンコード部１４０でエンコードされてビットストリームの形態で出力されることができる。

メモリ１７０に送信された修正された復元ピクチャは、インター予測部１２１で参照ピクチャとして使用されることができる。エンコード装置は、これを介してインター予測が適用される場合、エンコード装置１００とデコード装置における予測のミスマッチを避けることができ、符号化効率も向上させることができる。

メモリ１７０のＤＰＢは、修正された復元ピクチャをインター予測部１２１における参照ピクチャとして使用するために格納することができる。メモリ１７０は、現在ピクチャ内の動き情報が導出された（または、エンコードされた）ブロックの動き情報及び／又は既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的周辺ブロックの動き情報または時間的周辺ブロックの動き情報として活用するために、インター予測部１２１に伝達することができる。メモリ１７０は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部１２２に伝達することができる。

図２は、本文書が適用できるビデオ／画像デコード装置の構成を概略的に説明する図である。

図２を参照すると、デコード装置２００は、エントロピーデコード部（ｅｎｔｒｏｐｙｄｅｃｏｄｅｒ）２１０、レジデュアル処理部（ｒｅｓｉｄｕａｌｐｒｏｃｅｓｓｏｒ）２２０、予測部（ｐｒｅｄｉｃｔｏｒ）２３０、加算部（ａｄｄｅｒ）２４０、フィルタリング部（ｆｉｌｔｅｒ）２５０、及びメモリ（ｍｅｍｏｅｒｙ）２６０を含めて構成されることができる。予測部２３０は、インター予測部２３１及びイントラ予測部２３２を含むことができる。レジデュアル処理部２２０は、逆量子化部（ｄｅｑｕａｎｔｉｚｅｒ）２２１及び逆変換部（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍｅｒ）２２２を含むことができる。前述したエントロピーデコード部２１０、レジデュアル処理部２２０、予測部２３０、加算部２４０、及びフィルタリング部２５０は、実施形態によって１つのハードウェアコンポーネント（例えば、デコーダチップセットまたはプロセッサ）により構成されることができる。また、メモリ２６０は、ＤＰＢ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を含むことができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ２６０を内／外部コンポーネントとしてさらに含むこともできる。

ビデオ／画像情報を含むビットストリームが入力されると、デコード装置２００は、図２のエンコード装置でビデオ／画像情報が処理されたプロセスに対応して画像を復元できる。例えば、デコード装置２００は、前記ビットストリームから取得したブロック分割に関する情報に基づいてユニット／ブロックを導出できる。デコード装置２００は、エンコード装置で適用された処理ユニットを用いてデコードを実行することができる。したがって、デコードの処理ユニットは、例えば、コーディングユニットであってもよく、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットからクアッドツリー構造、バイナリツリー構造、及び／又はターナリツリー構造にしたがって分割されることができる。コーディングユニットから１つ以上の変換ユニットが導出できる。そして、デコード装置２００を介してデコード及び出力された復元画像信号は、再生装置を介して再生されることができる。

デコード装置２００は、図１のエンコード装置から出力された信号をビットストリーム形態で受信することができ、受信された信号は、エントロピーデコード部２１０を介してデコードされることができる。例えば、エントロピーデコード部２１０は、前記ビットストリームをパーシングして画像復元（または、ピクチャ復元）に必要な情報（例えば、ビデオ／画像情報）を導出することができる。前記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）など、様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ／画像情報は、一般制限情報（ｇｅｎｅｒａｌｃｏｎｓｔｒａｉｎｔｉｎｆｏｒｍａｔｉｏｎ）をさらに含むことができる。デコード装置は、さらに、前記パラメータセットに関する情報及び／又は前記一般制限情報に基づいてピクチャをデコードすることができる。本文書において後述されるシグナリング／受信される情報及び／又はシンタックス要素は、前記デコード手順を介してデコードされて、前記ビットストリームから取得されることができる。例えば、エントロピーデコード部２１０は、指数ゴロム符号化、ＣＡＶＬＣ、またはＣＡＢＡＣなどのコーディング方法を基にビットストリーム内の情報をデコードし、画像復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値などを出力することができる。より詳細に、ＣＡＢＡＣエントロピーデコード方法は、ビットストリームで各構文要素に該当するビンを受信し、デコード対象構文要素情報と周辺及びデコード対象ブロックのデコード情報、あるいは以前ステップでデコードされたシンボル／ビンの情報を利用して文脈（ｃｏｎｔｅｘｔ）モデルを決定し、決定された文脈モデルによってビン（ｂｉｎ）の発生確率を予測し、ビンの算術デコード（ａｒｉｔｈｍｅｔｉｃｄｅｃｏｄｉｎｇ）を行って、各構文要素の値に該当するシンボルを生成することができる。このとき、ＣＡＢＡＣエントロピーデコード方法は、文脈モデル決定後、次のシンボル／ビンの文脈モデルのためにデコードされたシンボル／ビンの情報を利用して文脈モデルをアップデートすることができる。エントロピーデコード部２１０でデコードされた情報のうち、予測に関する情報は、予測部（インター予測部２３２及びイントラ予測部２３１）に提供され、エントロピーデコード部２１０でエントロピーデコードが行われたレジデュアル値、すなわち、量子化された変換係数及び関連パラメータ情報は、レジデュアル処理部２２０に入力されることができる。レジデュアル処理部２２０は、レジデュアル信号（レジデュアルブロック、レジデュアルサンプル、レジデュアルサンプルアレイ）を導出することができる。また、エントロピーデコード部２１０でデコードされた情報のうち、フィルタリングに関する情報は、フィルタリング部２５０に提供されることができる。一方、エンコード装置から出力された信号を受信する受信部（図示せず）がデコード装置２００の内／外部エレメントとしてさらに構成されることができ、または受信部は、エントロピーデコード部２１０の構成要素であることもできる。一方、本文書に係るデコード装置は、ビデオ／画像／ピクチャデコード装置と呼ばれることができ、前記デコード装置は、情報デコーダ（ビデオ／画像／ピクチャ情報デコーダ）及びサンプルデコーダ（ビデオ／画像／ピクチャサンプルデコーダ）に区分することもできる。前記情報デコーダは、前記エントロピーデコード部２１０を含むことができ、前記サンプルデコーダは、前記逆量子化部２２１、逆変換部２２２、加算部２４０、フィルタリング部２５０、メモリ２６０、インター予測部２３２、及びイントラ予測部２３１のうち、少なくとも１つを含むことができる。

逆量子化部２２１では、量子化された変換係数を逆量子化して変換係数を出力できる。逆量子化部２２１は、量子化された変換係数を２次元のブロック形態で再整列することができる。この場合、前記再整列は、エンコード装置で行われた係数のスキャン順序に基づいて再整列を行うことができる。逆量子化部２２１は、量子化パラメータ（例えば、量子化ステップサイズ情報）を用いて量子化された変換係数に対する逆量子化を実行し、変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）を獲得できる。

逆変換部２２２では、変換係数を逆変換してレジデュアル信号（レジデュアルブロック、レジデュアルサンプルアレイ）を獲得することになる。

予測部は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック（ｐｒｅｄｉｃｔｅｄｂｌｏｃｋ）を生成することができる。予測部は、エントロピーデコード部２１０から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか、またはインター予測が適用されるか決定することができ、具体的なイントラ／インター予測モードを決定することができる。

予測部２２０は、後述する様々な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、１つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、ｃｏｍｂｉｎｅｄｉｎｔｅｒａｎｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（ｉｎｔｒａｂｌｏｃｋｃｏｐｙ、ＩＢＣ）予測モードに基づくことができ、またはパレットモード（ｐａｌｅｔｔｅｍｏｄｅ）に基づくこともできる。前記ＩＢＣ予測モードまたはパレットモードは、例えば、ＳＣＣ（ｓｃｒｅｅｎｃｏｎｔｅｎｔｃｏｄｉｎｇ）などのように、ゲームなどのコンテンツ画像／動画コーディングのために使用されることができる。ＩＢＣは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と類似して行われることができる。すなわち、ＩＢＣは、本文書において説明されるインター予測技法のうち、少なくとも１つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例とみなすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報が前記ビデオ／画像情報に含まれてシグナリングされることができる。

イントラ予測部２３１は、現在ピクチャ内のサンプルを参照して現在ブロックを予測できる。前記参照されるサンプルは、予測モードによって前記現在ブロックの周辺（ｎｅｉｇｈｂｏｒ）に位置してもよく、または離れて位置してもよい。イントラ予測における予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。イントラ予測部２３１は、周辺ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。

インター予測部２３２は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロックを導くことができる。そのとき、インター予測モードで送信される動き情報の量を減らすために、周辺ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、Ｂｉ予測等）情報をさらに含むことができる。インター予測の場合に、周辺ブロックは、現在ピクチャ内に存在する空間的周辺ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と参照ピクチャに存在する時間的周辺ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）とを含むことができる。例えば、インター予測部２３２は、周辺ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び／又は参照ピクチャインデックスを導出できる。様々な予測モードに基づいてインター予測が実行されることができ、前記予測に関する情報は、前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。

加算部２４０は、取得されたレジデュアル信号を予測部（インター予測部２３２及び／又はイントラ予測部２３１を含む）から出力された予測信号（予測されたブロック、予測サンプルアレイ）に加えることにより、復元信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）を生成することができる。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。

加算部２４０は、復元部または復元ブロック生成部と呼ばれ得る。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て出力されてもよく、または次のピクチャのインター予測のために使用されてもよい。

一方、ピクチャデコード過程でＬＭＣＳ（ｌｕｍａｍａｐｐｉｎｇｗｉｔｈｃｈｒｏｍａｓｃａｌｉｎｇ）が適用されることもできる。

フィルタリング部２５０は、復元信号にフィルタリングを適用して、主観的／客観的画質を向上させることができる。例えば、フィルタリング部２５０は、復元ピクチャに様々なフィルタリング方法を適用して修正された（ｍｏｄｉｆｉｅｄ）復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ２６０、具体的に、メモリ２６０のＤＰＢに送信することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ）、適応的ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ）、両方向フィルタ（ｂｉｌａｔｅｒａｌｆｉｌｔｅｒ）などを含むことができる。

メモリ２６０のＤＰＢに格納された（修正された）復元ピクチャは、インター予測部２３２で参照ピクチャとして使用されることができる。メモリ２６０は、現在ピクチャ内の動き情報が導出された（または、デコードされた）ブロックの動き情報及び／又は既に復元されたピクチャ内のブロックの動き情報を格納できる。前記格納された動き情報は、空間的周辺ブロックの動き情報または時間的周辺ブロックの動き情報として活用するために、インター予測部２３２に伝達することができる。メモリ２６０は、現在ピクチャ内の復元されたブロックの復元サンプルを格納でき、イントラ予測部２３１に伝達することができる。

本文書において、エンコード装置１００のフィルタリング部１６０、インター予測部１２１、及びイントラ予測部１２２で説明された実施形態等は、各々デコード装置２００のフィルタリング部２５０、インター予測部２３２、及びイントラ予測部２３１にも同一または対応するように適用されることができる。

上述したように、ビデオコーディングを行うにあたり、圧縮効率を高めるために予測を行う。これを通じて、コーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、予測されたブロックは、空間ドメイン（または、ピクセルドメイン）での予測サンプルを含む。予測されたブロックは、エンコード装置及びデコード装置で同一に導出され、エンコード装置は、原本ブロックの原本サンプル値自体でない、原本ブロックと予測されたブロックとの間のレジデュアルに関する情報（レジデュアル情報）をデコード装置にシグナリングすることにより画像コーディング効率を高めることができる。デコード装置は、レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、レジデュアルブロックと予測されたブロックとを合わせて復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。

前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコード装置は、原本ブロックと予測されたブロックとの間のレジデュアルブロックを導出し、レジデュアルブロックに含まれているレジデュアルサンプル（レジデュアルサンプルアレイ）に変換手順を行って変換係数を導出し、変換係数に量子化手順を行って量子化された変換係数を導出し、関連したレジデュアル情報を（ビットストリームを介して）デコード装置にシグナリングすることができる。ここで、レジデュアル情報は、量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコード装置は、レジデュアル情報に基づいて逆量子化／逆変換手順を行い、レジデュアルサンプル（または、レジデュアルブロック）を導出することができる。デコード装置は、予測されたブロックとレジデュアルブロックとに基づいて復元ピクチャを生成することができる。エンコード装置は、さらに、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化／逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。

図３は、本文書にかかる多重変換技法を概略的に示す。

図３を参照すると、変換部は、前述した図１のエンコード装置内の変換部に対応し得、逆変換部は、前述した図１のエンコード装置内の逆変換部又は図３のデコード装置内の逆変換部に対応し得る。

変換部は、レジデュアルブロック内のレジデュアルサンプル（レジデュアルサンプルアレイ）に基づいて１次変換を行って、（１次）変換係数を導出することができる（Ｓ３１０）。このような１次変換（ｐｒｉｍａｒｙｔｒａｎｓｆｏｒｍ）は、核心変換（ｃｏｒｅｔｒａｎｓｆｏｒｍ）と指称され得る。ここで、前記１次変換は、多重変換選択（ＭｕｌｔｉｐｌｅＴｒａｎｓｆｏｒｍＳｅｌｅｃｔｉｏｎ、ＭＴＳ）に基づき得、１次変換として多重変換が適用される場合、多重核心変換と指称され得る。

多重核心変換は、ＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）タイプ２、ＤＳＴ（ＤｉｓｃｒｅｔｅＳｉｎｅＴｒａｎｓｆｏｒｍ）タイプ７、ＤＣＴタイプ８、及び／又はＤＳＴタイプ１をさらに使用して変換する方式を示すことができる。すなわち、前記多重核心変換は、前記ＤＣＴタイプ２、前記ＤＳＴタイプ７、前記ＤＣＴタイプ８、及び前記ＤＳＴタイプ１のうち選択された複数の変換カーネルに基づいて、空間ドメインのレジデュアル信号（又はレジデュアルブロック）を周波数ドメインの変換係数（又は１次変換係数）に変換する変換方法を示すことができる。ここで、前記１次変換係数は、変換部の立場で仮の変換係数と呼ばれ得る。

言い換えると、既存の変換方法が適用される場合、ＤＣＴタイプ２に基づいて、レジデュアル信号（又はレジデュアルブロック）に対する空間ドメインから周波数ドメインへの変換が適用されて、変換係数が生成できた。これと異なり、前記多重核心変換が適用される場合、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、及び／又はＤＳＴタイプ１等に基づいて、レジデュアル信号（又はレジデュアルブロック）に対する空間ドメインから周波数ドメインへの変換が適用されて、変換係数（又は１次変換係数）が生成できる。ここで、ＤＣＴタイプ２、ＤＳＴタイプ７、ＤＣＴタイプ８、及びＤＳＴタイプ１等は、変換タイプ、変換カーネル（ｋｅｒｎｅｌ）又は変換コア（ｃｏｒｅ）と呼ばれ得る。このようなＤＣＴ／ＤＳＴ変換タイプは、基底関数に基づいて定義されることができる。

前記多重核心変換が実行される場合、前記変換カーネルのうち、対象ブロックに対する垂直変換カーネル及び水平変換カーネルが選択でき、前記垂直変換カーネルに基づいて前記対象ブロックに対する垂直変換が実行され、前記水平変換カーネルに基づいて前記対象ブロックに対する水平変換が実行されることができる。ここで、前記水平変換は、前記対象ブロックの水平成分に対する変換を示すことができ、前記垂直変換は、前記対象ブロックの垂直成分に対する変換を示すことができる。前記垂直変換カーネル／水平変換カーネルは、レジデュアルブロックを含む対象ブロック（ＣＵ又はサブブロック）の予測モード及び／又は変換インデックスに基づいて、適応的に決定されることができる。

また、一例によると、ＭＴＳを適用して１次変換を実行する場合、特定の基底関数を所定の値に設定し、垂直変換又は水平変換であるとき、どの基底関数が適用されるか否かを組み合わせて、変換カーネルに対するマッピング関係を設定することができる。例えば、水平方向の変換カーネルをｔｒＴｙｐｅＨｏｒで示し、垂直方向の変換カーネルをｔｒＴｙｐｅＶｅｒで示す場合、ｔｒＴｙｐｅＨｏｒ又はｔｒＴｙｐｅＶｅｒの値０はＤＣＴ２に設定され、ｔｒＴｙｐｅＨｏｒ又はｔｒＴｙｐｅＶｅｒの値１はＤＳＴ７に設定され、ｔｒＴｙｐｅＨｏｒ又はｔｒＴｙｐｅＶｅｒの値２はＤＣＴ８に設定されることができる。

この場合、多数の変換カーネルセットのいずれかを指示するために、ＭＴＳインデックス情報がエンコードされ、デコード装置にシグナリングされることができる。例えば、ＭＴＳインデックスが０であると、ｔｒＴｙｐｅＨｏｒ及びｔｒＴｙｐｅＶｅｒの値がすべて０であることを指示し、ＭＴＳインデックスが１であると、ｔｒＴｙｐｅＨｏｒ及びｔｒＴｙｐｅＶｅｒの値がすべて１であることを指示し、ＭＴＳインデックスが２であると、ｔｒＴｙｐｅＨｏｒの値は２であり、ｔｒＴｙｐｅＶｅｒの値は１であることを指示し、ＭＴＳインデックスが３であると、ｔｒＴｙｐｅＨｏｒの値は１であり、ｔｒＴｙｐｅＶｅｒの値は２であることを指示し、ＭＴＳインデックスが４であると、ｔｒＴｙｐｅＨｏｒ及びｔｒＴｙｐｅＶｅｒの値がすべて２であることを指示することができる。

一例によって、ＭＴＳのインデックス情報による変換カーネルセットを表で示すと、次の通りである。

変換部は、前記（１次）変換係数に基づいて２次変換を行って修正された（２次）変換係数を導出する（Ｓ３２０）。前記１次変換は空間ドメインから周波数ドメインへの変換であり、前記２次変換は（１次）変換係数間に存在する相関関係（ｃｏｒｒｅｌａｔｉｏｎ）を利用してより圧縮的な表現に変換することを意味する。前記２次変換は非分離変換（ｎｏｎ－ｓｅｐａｒａｂｌｅｔｒａｎｓｆｏｒｍ）を含む。この場合、前記２次変換は非分離２次変換（ｎｏｎ－ｓｅｐａｒａｂｌｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ、ＮＳＳＴ）又はＭＤＮＳＳＴ（ｍｏｄｅ－ｄｅｐｅｎｄｅｎｔｎｏｎ－ｓｅｐａｒａｂｌｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）と呼ばれてもよい。前記非分離２次変換は、前記１次変換により導出された（１次）変換係数を非分離変換マトリックス（ｎｏｎ－ｓｅｐａｒａｂｌｅｔｒａｎｓｆｏｒｍｍａｔｒｉｘ）に基づいて２次変換してレジデュアル信号に対する修正された変換係数（又は、２次変換係数）を生成する変換を示す。ここで、前記非分離変換マトリックスに基づいて前記（１次）変換係数に対して垂直変換及び水平変換を分離して（又は、水平垂直変換を独立的に）適用せずに一度に変換を適用することができる。言い換えると、前記非分離２次変換は、前記（１次）変換係数に対して垂直方向と水平方向に別に適用されずに、例えば、２次元信号（変換係数）を特定の決まった方向（例えば、行優先（ｒｏｗ－ｆｉｒｓｔ）方向又は列優先（ｃｏｌｕｍｎ－ｆｉｒｓｔ）方向）により１次元信号に再整列した後、前記非分離変換マトリックスに基づいて修正された変換係数（又は、２次変換係数）を生成する変換方法を示す。例えば、行優先順序はＭ×Ｎブロックに対して１番目の行、２番目の行、...、Ｎ番目の行の順に一列に配置することであり、列優先順序はＭ×Ｎブロックに対して１番目の列、２番目の列、... 、Ｍ番目の列の順に一列に配置することである。前記非分離２次変換は、（１次）変換係数で構成されたブロック（以下、変換係数ブロックという）の左上側（ｔｏｐ－ｌｅｆｔ）領域に対して適用できる。例えば、前記変換係数ブロックの幅（Ｗ）及び高さ（Ｈ）が両方とも８以上である場合、８×８非分離２次変換が前記変換係数ブロックの左上側８×８の領域に対して適用できる。また、前記変換係数ブロックの幅（Ｗ）及び高さ（Ｈ）が両方とも４以上でありながら、前記変換係数ブロックの幅（Ｗ）又は高さ（Ｈ）が８より小さい場合、４×４非分離２次変換が前記変換係数ブロックの左上側ｍｉｎ（８，Ｗ）×ｍｉｎ（８，Ｈ）領域に対して適用できる。ただ、実施形態はこれに限定されず、例えば、前記変換係数ブロックの幅（Ｗ）又は高さ（Ｈ）が両方とも４以上である条件のみを満足しても、４×４非分離２次変換が前記変換係数ブロックの左上側ｍｉｎ（８，Ｗ）×ｍｉｎ（８，Ｈ）領域に対して適用されることもできる。

具体的に、例えば、４×４の入力ブロックが使用される場合、非分離２次変換は次のように実行されることができる。

前記４×４の入力ブロックＸは、次のように示されることができる。

前記Ｘをベクトルの形態で示す場合、ベクトル

は、次のように示されることができる。

数式２のように、ベクトル

は、行優先（ｒｏｗ－ｆｉｒｓｔ）の順序によって、数式１におけるＸの２次元ブロックを１次元ベクトルに再配列する。

この場合、前記２次非分離変換は、次のように計算されることができる。

ここで、

は、変換係数ベクトルを示し、Ｔは、１６×１６の（非分離）変換マトリックスを示す。

前記数式３を介して、１６×１の変換係数ベクトル

が導出でき、前記

は、スキャン順序（水平、垂直、対角（ｄｉａｇｏｎａｌ）等）を介して、４×４ブロックで再構成（ｒｅ－ｏｒｇａｎｉｚｅｄ）できる。但し、前述した計算は例示であって、非分離２次変換の計算複雑度を減らすために、ＨｙＧＴ（Ｈｙｐｅｒｃｕｂｅ－ＧｉｖｅｎｓＴｒａｎｓｆｏｒｍ）等が非分離２次変換の計算のために使用されることもできる。

一方、前記非分離２次変換は、モードベース（ｍｏｄｅｄｅｐｅｎｄｅｎｔ）として変換カーネル（又は変換コア、変換タイプ）が選択できる。ここで、モードは、イントラ予測モード及び／又はインター予測モードを含むことができる。

前述したように、前記非分離２次変換は、前記変換係数ブロックの幅（Ｗ）及び高さ（Ｈ）に基づいて決定された８×８変換又は４×４変換に基づいて実行されることができる。８ｘ８変換は、ＷとＨがすべて８よりも等しいか大きいとき、当該変換係数ブロックの内部に含まれている８ｘ８領域に適用されることができる変換を指し、当該８ｘ８領域は、当該変換係数ブロックの内部の左上側の８ｘ８領域であり得る。同様に、４ｘ４変換は、ＷとＨがすべて４よりも等しいか大きいとき、当該変換係数ブロックの内部に含まれている４ｘ４領域に適用されることができる変換を指し、当該４ｘ４領域は、当該変換係数ブロックの内部の左上側の４ｘ４領域であり得る。例えば、８ｘ８変換カーネルマトリックスは、６４ｘ６４／１６ｘ６４行列、４ｘ４変換カーネルマトリックスは、１６ｘ１６／８ｘ１６行列になり得る。

そのとき、モードベースの変換カーネルの選択のために、８×８変換及び４×４変換の両方に対して、非分離２次変換のための変換セット当たり２個ずつの非分離２次変換カーネルが構成され得、変換セットは４個であり得る。すなわち、８×８変換に対して４個の変換セットが構成され、４×４変換に対して４個の変換セットが構成され得る。この場合、８×８変換に対する４個の変換セットには、それぞれ２個ずつの８×８変換カーネルが含まれ得、この場合、４×４変換に対する４個の変換セットには、それぞれ２個ずつの４×４変換カーネルが含まれ得る。

但し、前記変換のサイズ、すなわち、変換が適用される領域のサイズは例示として８×８又は４×４以外のサイズが使用され得、前記セットの数はｎ個、各セット内の変換カーネルの数はｋ個であり得る。

前記変換セットは、ＮＳＳＴセット又はＬＦＮＳＴセットと呼ばれ得る。前記変換セットのうちの特定セットの選択は、例えば、現在ブロック（ＣＵ又はサブブロック）のイントラ予測モードに基づいて実行されることができる。ＬＦＮＳＴ（Ｌｏｗ－ＦｒｅｑｕｅｎｃｙＮｏｎ－ＳｅｐａｒａｂｌｅＴｒａｎｓｆｏｒｍ）は、後述される減少した非分離変換の一例であり得、低周波成分に対する非分離変換を示す。

参考までに、例えば、イントラ予測モードは、２個の非方向性（ｎｏｎ－ｄｉｒｅｃｔｉｎｏａｌ、又は非角度性（ｎｏｎ－ａｎｇｕｌａｒ））イントラ予測モードと６５個の方向性（ｄｉｒｅｃｔｉｏｎａｌ、又は角度性（ａｎｇｕｌａｒ））イントラ予測モードとを含むことができる。前記非方向性イントラ予測モードは、０番であるプラナー（ｐｌａｎａｒ）イントラ予測モード及び１番であるＤＣイントラ予測モードを含むことができ、前記方向性イントラ予測モードは、２番乃至６６番の６５個のイントラ予測モードを含むことができる。但し、これは例示であって、本文書は、イントラ予測モードの数が異なる場合にも適用できる。一方、場合に応じて、６７番のイントラ予測モードがさらに使用でき、前記６７番のイントラ予測モードは、ＬＭ（ｌｉｎｅａｒｍｏｄｅｌ）モードを示すことができる。

図４は、６５個の予測方向のイントラ方向性モードを例示的に示す。

図４を参照すると、右下側対角の予測方向を有する３４番のイントラ予測モードを中心に水平方向性（ｈｏｒｉｚｏｎｔａｌｄｉｒｅｃｔｉｏｎａｌｉｔｙ）を有するイントラ予測モードと、垂直方向性（ｖｅｒｔｉｃａｌｄｉｒｅｃｔｉｏｎａｌｉｔｙ）を有するイントラ予測モードとを区分することができる。図４のＨとＶは、それぞれ水平方向性と垂直方向性を意味し、－３２～３２の数字は、サンプルグリッドポジション（ｓａｍｐｌｅｇｒｉｄｐｏｓｉｔｉｏｎ）上で１／３２単位の変位を示す。これは、モードインデックス値に対するオフセットを示すことができる。２番乃至３３番のイントラ予測モードは水平方向性、３４番乃至６６番のイントラ予測モードは垂直方向性を有する。一方、３４番のイントラ予測モードは、厳密に言えば、水平方向性でも垂直方向性でもないと見ることができるが、２次変換の変換セットを決定する観点から、水平方向性に属すると分類できる。これは、３４番のイントラ予測モードを中心に対称である垂直方向モードに対しては、入力データをトランスポーズ（ｔｒａｎｓｐｏｓｅ）して使用し、３４番のイントラ予測モードに対しては、水平方向モードに対する入力データの整列方式を使用するためである。入力データをトランスポーズすることは、２次元ブロックのデータＭｘＮに対して、行が列となり、列が行となり、ＮｘＭのデータを構成することを意味する。１８番のイントラ予測モードと５０番のイントラ予測モードとは、それぞれ水平イントラ予測モード（ｈｏｒｉｚｏｎｔａｌｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｍｏｄｅ）、垂直イントラ予測モード（ｖｅｒｔｉｃａｌｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｍｏｄｅ）を示し、２番のイントラ予測モードは、左側の参照ピクセルをもって右上側方向と予測するので、右上側対角のイントラ予測モードと呼ばれ得、同じ脈絡で３４番のイントラ予測モードは、右下側対角のイントラ予測モード、６６番のイントラ予測モードは、左下側対角のイントラ予測モードと呼ばれ得る。

一例によって、イントラ予測モードによって、４個の変換セットのマッピング（ｍａｐｐｉｎｇ）は、例えば、次の表のように示され得る。

表２のように、イントラ予測モードによって４個の変換セットのいずれか、すなわち、ｌｆｎｓｔＴｒＳｅｔＩｄｘが０から３、すなわち、４個のいずれかにマッピングされることができる。

一方、非分離変換に特定セットが使用されるものと決定されると、非分離２次変換インデックスを介して、前記特定セット内のｋ個の変換カーネルのうち一つが選択できる。エンコード装置は、ＲＤ（ｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎ）チェックに基づいて特定の変換カーネルを指す非分離２次変換インデックスを導出することができ、前記非分離２次変換インデックスをデコード装置にシグナリングできる。デコード装置は、前記非分離２次変換インデックスに基づいて、特定セット内のｋ個の変換カーネルのうち一つを選択することができる。例えば、ｌｆｎｓｔのインデックス値０は、１番目の非分離２次変換カーネルを指すことができ、ｌｆｎｓｔのインデックス値１は、２番目の非分離２次変換カーネルを指すことができ、ｌｆｎｓｔのインデックス値２は、３番目の非分離２次変換カーネルを指すことができる。或いは、ｌｆｎｓｔのインデックス値０は、対象ブロックに対して、１番目の非分離２次変換が適用されないことを指すことができ、ｌｆｎｓｔのインデックス値１乃至３は、前記３個の変換カーネルを指すことができる。

変換部は、選択された変換カーネルに基づいて前記非分離２次変換を実行し、修正された（２次）変換係数を獲得することができる。前記修正された変換係数は、前述したように量子化部を介して量子化された変換係数で導出されることができ、エンコードされて、デコード装置にシグナリング及びエンコード装置内の逆量子化／逆変換部に伝達されることができる。

一方、前述したように２次変換が省略される場合、前記１次（分離）変換の出力である（１次）変換係数が、前述したように量子化部を介して量子化された変換係数で導出されることができ、エンコードされて、デコード装置にシグナリング及びエンコード装置内の逆量子化／逆変換部に伝達されることができる。

逆変換部は、前述した変換部で実行された手順の逆順で一連の手順を実行することができる。逆変換部は、（逆量子化された）変換係数を受信し、２次（逆）変換を実行して（１次）変換係数を導出し（Ｓ３５０）、前記（１次）変換係数に対して１次（逆）変換を実行し、レジデュアルブロック（レジデュアルサンプル）を獲得することができる（Ｓ３６０）。ここで、前記１次変換係数は、逆変換部の立場で、修正された（ｍｏｄｉｆｉｅｄ）変換係数と呼ばれ得る。エンコード装置及びデコード装置は、前記レジデュアルブロックと予測されたブロックとに基づいて復元ブロックを生成し、これに基づいて復元ピクチャを生成することができることは前述した通りである。

一方、デコード装置は、２次逆変換適用可否決定部（又は２次逆変換の適用可否を決定する要素）と、２次逆変換決定部（又は２次逆変換を決定する要素）をさらに含むことができる。２次逆変換適用可否決定部は、２次逆変換の適用可否を決定することができる。例えば、２次逆変換は、ＮＳＳＴ、ＲＳＴ又はＬＦＮＳＴであり得、２次逆変換適用可否決定部は、ビットストリームからパーシングした２次変換フラグに基づいて、２次逆変換の適用可否を決定することができる。別の一例として、２次逆変換適用可否決定部は、レジデュアルブロックの変換係数に基づいて、２次逆変換の適用可否を決定することもできる。

２次逆変換決定部は、２次逆変換を決定することができる。そのとき、２次逆変換決定部は、イントラ予測モードによって指定されたＬＦＮＳＴ（ＮＳＳＴ又はＲＳＴ）変換セットに基づいて、現在ブロックに適用される２次逆変換を決定することができる。また、一実施例として、１次変換決定方法に依存的に（ｄｅｐｅｎｄｏｎ）２次変換決定方法が決定できる。イントラ予測モードによって１次変換と２次変換の多様な組み合わせが決定できる。また、一例として、２次逆変換決定部は、現在ブロックの大きさに基づいて、２次逆変換が適用される領域を決定することもできる。

一方、前述したように、２次（逆）変換が省略される場合、（逆量子化された）変換係数を受信し、前記１次（分離）逆変換を実行してレジデュアルブロック（レジデュアルサンプル）を獲得することができる。エンコード装置及びデコード装置は、前記レジデュアルブロックと予測されたブロックに基づいて復元ブロックを生成し、これに基づいて復元ピクチャを生成することができることは前述した通りである。

一方、本文書においては、非分離２次変換に伴われる計算量とメモリ要求量の低減のために、ＮＳＳＴの概念で変換マトリックス（カーネル）の大きさが減少したＲＳＴ（ｒｅｄｕｃｅｄｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）を適用することができる。

一方、本文書で説明された変換カーネル、変換マトリックス、変換カーネルマトリックスを構成する係数、すなわち、カーネル係数又はマトリックス係数は、８ビットで表現され得る。これは、デコード装置及びエンコード装置で具現するための一つの条件であり得、既存の９ビット又は１０ビットと比較し、合理的に受け入れられる性能低下を伴いながら、変換カーネルを格納するためのメモリ要求量を減らすことができる。また、カーネルマトリックスを８ビットで表現することによって、小さい掛け算器を使用でき、最適のソフトウェアの具現のために使用されるＳＩＭＤ（ＳｉｎｇｌｅＩｎｓｔｒｕｃｔｉｏｎＭｕｌｔｉｐｌｅＤａｔａ）命令により好適であり得る。

本明細書において、ＲＳＴは簡素化ファクター（ｆａｃｔｏｒ）によって大きさが減少した変換マトリックス（ｔｒａｎｓｆｏｒｍｍａｔｒｉｘ）に基づいて、対象ブロックに対するレジデュアルサンプルに対して実行される変換を意味することができる。簡素化変換を実行する場合、変換マトリックスの大きさの減少により、変換時に要求される演算量が減少し得る。すなわち、ＲＳＴは、大きさが大きいブロックの変換又は非分離変換時に発生する演算の複雑度（ｃｏｍｐｌｅｘｉｔｙ）のイシューを解消するために利用できる。

ＲＳＴは、減少した変換、減少変換、ｒｅｄｕｃｅｄｔｒａｎｓｆｏｒｍ、ｒｅｄｕｃｅｄｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ、ｒｅｄｕｃｔｉｏｎｔｒａｎｓｆｏｒｍ、ｓｉｍｐｌｉｆｉｅｄｔｒａｎｓｆｏｒｍ、ｓｉｍｐｌｅｔｒａｎｓｆｏｒｍ等の多様な用語で指称され得、ＲＳＴが指称され得る名称は、挙げられた例示に限定されない。或いは、ＲＳＴは、主に変換ブロックで０ではない係数を含む低周波領域で行われるので、ＬＦＮＳＴ（Ｌｏｗ－ＦｒｅｑｕｅｎｃｙＮｏｎ－ＳｅｐａｒａｂｌｅＴｒａｎｓｆｏｒｍ）と指称されることもある。前記変換インデックスは、ＬＦＮＳＴインデックスと名付けられ得る。

一方、２次逆変換がＲＳＴに基づいてなされる場合、エンコード装置１００の逆変換部１３５とデコード装置２００の逆変換部２２２とは、変換係数に対する逆ＲＳＴに基づいて修正された変換係数を導出する逆ＲＳＴ部と、修正された変換係数に対する逆１次変換に基づいて前記対象ブロックに対するレジデュアルサンプルを導出する逆１次変換部とを備えることができる。逆１次変換は、レジデュアルに適用されていた１次変換の逆変換を意味する。本文書において変換に基づいて変換係数を導出することは、当該変換を適用して変換係数を導出することを意味することができる。

図５は、本文書の一実施例に係るＲＳＴを説明するための図である。

本明細書において、「対象ブロック」は、コーディングが実行される現在ブロック又はレジデュアルブロック又は変換ブロックを意味することができる。

一実施例に係るＲＳＴで、Ｎ次元ベクトル（Ｎｄｉｍｅｎｓｉｏｎａｌｖｅｃｔｏｒ）が異なる空間に位置したＲ次元ベクトル（Ｒｄｉｍｅｎｓｉｏｎａｌｖｅｃｔｏｒ）にマッピングされ、減少した変換マトリックスが決定でき、ここで、ＲはＮよりも小さい。Ｎは、変換が適用されるブロックの一辺の長さ（ｌｅｎｇｔｈ）の二乗、又は変換が適用されるブロックと対応する変換係数の総個数を意味することができ、簡素化ファクターは、Ｒ／Ｎ値を意味することができる。簡素化ファクターは、減少したファクター、減少ファクター、ｒｅｄｕｃｅｄｆａｃｔｏｒ、ｒｅｄｕｃｔｉｏｎｆａｃｔｏｒ、ｓｉｍｐｌｉｆｉｅｄｆａｃｔｏｒ、ｓｉｍｐｌｅｆａｃｔｏｒ等の多様な用語で指称され得る。一方、Ｒは、簡素化係数（ｒｅｄｕｃｅｄｃｏｅｆｆｉｃｉｅｎｔ）と指称され得るが、場合に応じては、簡素化ファクターがＲを意味することもある。また、場合に応じて、簡素化ファクターは、Ｎ／Ｒ値を意味することもある。

一実施例において、簡素化ファクター又は簡素化係数は、ビットストリームを介してシグナリングできるが、実施例がこれに限定されるわけではない。例えば、簡素化ファクター又は簡素化係数に対する既に定義された値が各エンコード装置１００及びデコード装置２００に格納されていることがあり、この場合、簡素化ファクター又は簡素化係数は、別にシグナリングされないことがある。

一実施例にかかる簡素化変換マトリックスのサイズは、通常の変換マトリックスのサイズＮｘＮよりも小さいＲｘＮであり、下記の数式４のように定義されることができる。

図５の（ａ）に示すＲｅｄｕｃｅｄＴｒａｎｓｆｏｒｍブロック内のマトリックスＴは、数式４のマトリックスＴＲｘＮを意味することができる。図５の（ａ）のように、対象ブロックに対するレジデュアルサンプルに対して簡素化変換マトリックスＴＲｘＮが掛けられる場合、対象ブロックに対する変換係数が導出できる。

一実施例において、変換が適用されるブロックのサイズが８ｘ８であり、Ｒ＝１６（すなわち、Ｒ／Ｎ＝１６／６４＝１／４である）である場合、図５の（ａ）によるＲＳＴは、下記の数式５のような行列演算で表現され得る。この場合、メモリと掛け算演算が簡素化ファクターにより略１／４と減少し得る。

本文書において行列演算とは、行列を列ベクトルの左側に置いて、行列と列ベクトルを掛けて列ベクトルを得る演算で理解できる。

数式５において、ｒ１乃至ｒ６４は、対象ブロックに対するレジデュアルサンプルを示すことができ、より具体的に、１次変換を適用して生成された変換係数であり得る。数式５の演算結果、対象ブロックに対する変換係数ｃｉが導出でき、ｃｉの導出過程は数式６の通りである。

数式６の演算結果、対象ブロックに対する変換係数ｃ１乃至ｃＲが導出できる。すなわち、Ｒ＝１６である場合、対象ブロックに対する変換係数ｃ１乃至ｃ１６が導出できる。もし、ＲＳＴではなく、通常の（ｒｅｇｕｌａｒ）変換が適用されて、サイズが６４ｘ６４（ＮｘＮ）である変換マトリックスが、サイズが６４ｘ１（Ｎｘ１）であるレジデュアルサンプルに掛けられたら、対象ブロックに対する変換係数が６４個（Ｎ個）が導出されるかもしれないが、ＲＳＴが適用されたため、対象ブロックに対する変換係数が１６個（Ｒ個）のみ導出される。対象ブロックに対する変換係数の総個数がＮ個からＲ個に減少し、エンコード装置１００がデコード装置２００に送信するデータの量が減少するので、エンコード装置１００－デコード装置２００の間の送信効率が増加し得る。

変換マトリックスのサイズの観点から検討すると、通常の変換マトリックスのサイズは６４ｘ６４（ＮｘＮ）であるが、簡素化変換マトリックスのサイズは１６ｘ６４（ＲｘＮ）と減少するので、通常の変換を実行する時と比較すると、ＲＳＴを実行する時にメモリの使用をＲ／Ｎの割合で減少させることができる。また、通常の変換マトリックスを用いる際の掛け算演算の数ＮｘＮと比較すると、簡素化変換マトリックスを用いると、掛け算演算の数をＲ／Ｎの割合で減少（ＲｘＮ）させることができる。

一実施例において、エンコード装置１００の変換部１３２は、対象ブロックに対するレジデュアルサンプルを１次変換及びＲＳＴベースの２次変換を実行することによって、対象ブロックに対する変換係数を導出することができる。このような変換係数は、デコード装置２００の逆変換部に伝達されることができ、デコード装置２００の逆変換部２２２は、変換係数に対する逆ＲＳＴ（ｒｅｄｕｃｅｄｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）に基づいて修正された変換係数を導出し、修正された変換係数に対する逆１次変換に基づいて、対象ブロックに対するレジデュアルサンプルを導出することができる。

一実施例にかかる逆ＲＳＴマトリックスＴＮｘＲのサイズは、通常の逆変換マトリックスのサイズＮｘＮよりも小さいＮｘＲであり、数式４に示した簡素化変換マトリックスＴＲｘＮとトランスポーズ（ｔｒａｎｓｐｏｓｅ）の関係にある。

図５の（ｂ）に示したＲｅｄｕｃｅｄＩｎｖ．Ｔｒａｎｓｆｏｒｍブロック内のマトリックスＴｔは、逆ＲＳＴマトリックスＴＲｘＮＴを意味することができる（上付き文字Ｔはトランスポーズを意味する）。図５の（ｂ）のように、対象ブロックに対する変換係数に対して逆ＲＳＴマトリックスＴＲｘＮＴが掛けられる場合、対象ブロックに対する修正された変換係数又は対象ブロックに対するレジデュアルサンプルが導出できる。逆ＲＳＴマトリックスＴＲｘＮＴは、（ＴＲｘＮ）ＴＮｘＲと表現することもある。

より具体的に、２次逆変換に逆ＲＳＴが適用される場合には、対象ブロックに対する変換係数に対して逆ＲＳＴマトリックスＴＲｘＮＴが掛けられると、対象ブロックに対する修正された変換係数が導出できる。一方、逆１次変換に逆ＲＳＴが適用でき、この場合、対象ブロックに対する変換係数に対して逆ＲＳＴマトリックスＴＲｘＮＴが掛けられると、対象ブロックに対するレジデュアルサンプルが導出できる。

一実施例において、逆変換が適用されるブロックのサイズが８ｘ８であり、Ｒ＝１６（すなわち、Ｒ／Ｎ＝１６／６４＝１／４である場合）である場合、図５の（ｂ）によるＲＳＴは、下記の数式７のような行列演算で表現されることができる。

数式７において、ｃ１乃至ｃ１６は、対象ブロックに対する変換係数を示すことができる。数式７の演算結果、対象ブロックに対する修正された変換係数又は対象ブロックに対するレジデュアルサンプルを示すｒｊが導出でき、ｒｊの導出過程は、数式８の通りである。

数式８の演算結果、対象ブロックに対する修正された変換係数又は対象ブロックに対するレジデュアルサンプルを示すｒ１乃至ｒＮが導出できる。逆変換マトリックスのサイズの観点から検討すると、通常の逆変換マトリックスのサイズは６４ｘ６４（ＮｘＮ）であるが、簡素化逆変換マトリックスのサイズは、６４ｘ１６（ＮｘＲ）と減少するので、通常の逆変換を実行する時と比較すると、逆ＲＳＴを実行する時にメモリの使用をＲ／Ｎの割合で減少させることができる。また、通常の逆変換マトリックスを用いる時の掛け算演算の数ＮｘＮと比較すると、簡素化逆変換マトリックスを用いると、掛け算演算の数をＲ／Ｎの割合で減少（ＮｘＲ）させることができる。

一方、８ｘ８のＲＳＴに対しても、表２のような変換セットの構成を適用することができる。すなわち、表２での変換セットによって当該８ｘ８のＲＳＴが適用できる。一つの変換セットは、画面内の予測モードによって２個又は３個の変換（カーネル）で構成されているので、２次変換を適用しない場合まで含めて、最大４個の変換のうち一つを選択するように構成されることができる。２次変換を適用しないときの変換は、恒等行列が適用されたものとみなされ得る。４個の変換に対してそれぞれ０、１、２、３のインデックスを付与するとしたとき（例えば、０番のインデックスを恒等行列、すなわち、２次変換を適用しない場合に割り当てることができる）、変換インデックス又はｌｆｎｓｔのインデックスというシンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）を変換係数のブロック毎にシグナリングし、適用される変換を指定することができる。すなわち、変換インデックスを介して８ｘ８左上側のブロックに対して、ＲＳＴの構成では８ｘ８のＲＳＴを指定することができ、又はＬＦＮＳＴが適用される場合、８ｘ８のｌｆｎｓｔを指定することができる。８ｘ８のｌｆｎｓｔ及び８ｘ８のＲＳＴは、変換の対象になる対象ブロックのＷとＨがすべて８よりも等しいか大きいとき、当該変換係数のブロック内部に含まれている８ｘ８領域に適用されることができる変換を指し、当該８ｘ８領域は、当該変換係数のブロック内部の左上側の８ｘ８領域であり得る。同様に、４ｘ４のｌｆｎｓｔ及び４ｘ４のＲＳＴは、対象ブロックのＷとＨがすべて４よりも等しいか大きいとき、当該変換係数のブロック内部に含まれている４ｘ４領域に適用されることができる変換を指し、当該４ｘ４領域は、当該変換係数のブロック内部の左上側の４ｘ４領域であり得る。

一方、本文書の一実施例にかかり、エンコード過程の変換で、８ｘ８領域を構成する６４個のデータに対して、１６ｘ６４の変換カーネルマトリックスではなく、４８個のデータのみを選択し、最大１６ｘ４８の変換カーネルマトリックスを適用することができる。ここで、「最大」とは、ｍ個の係数を生成することができるｍｘ４８の変換カーネルマトリックスに対して、ｍの最大値が１６ということを意味する。すなわち、８ｘ８の領域にｍｘ４８の変換カーネルマトリックス（ｍ≦１６）を適用してＲＳＴを実行する場合、４８個のデータの入力を受けて、ｍ個の係数を生成することができる。ｍが１６である場合、４８個のデータの入力を受けて、１６個の係数を生成する。すなわち、４８個のデータが４８ｘ１ベクトルをなすとしたとき、１６ｘ４８行列と４８ｘ１ベクトルを順序通りに掛けて、１６ｘ１ベクトルが生成できる。そのとき、８ｘ８領域をなす４８個のデータを適切に配列し、４８ｘ１ベクトルを構成することができる。そのとき、最大１６ｘ４８の変換カーネルマトリックスを適用して行列演算を行うと、１６個の修正された変換係数が生成されるが、１６個の修正された変換係数は、スキャニング順序に従って左上側の４ｘ４領域に配置されることができ、右上側の４ｘ４領域と左下側の４ｘ４領域は０で満たされ得る。

デコード過程の逆変換には、前記述べられた変換カーネルマトリックスのトランスポーズされたマトリックスが使用できる。すなわち、デコード装置で実行される逆変換過程で逆ＲＳＴ又はＬＦＮＳＴが実行される場合、逆ＲＳＴを適用する入力係数データは、所定の配列順序に従って１次元ベクトルで構成され、１次元ベクトルに当該逆ＲＳＴの行列を左側で掛けて得られた修正された係数ベクトルを所定の配列順序に従って２次元ブロックに配列されることができる。

整理すると、変換過程で、８ｘ８領域にＲＳＴ又はＬＦＮＳＴが適用される場合、８ｘ８領域の変換係数のうち、８ｘ８領域の右下側領域を除いた左上側、右上側、左下側領域の４８個の変換係数と、１６ｘ４８の変換カーネルマトリックスとの行列演算が実行される。行列演算のために、４８個の変換係数は１次元の配列に入力される。このような行列演算が行われると、１６個の修正された変換係数が導出され、修正された変換係数は、８ｘ８領域の左上側領域に配列されることができる。

逆に、逆変換過程で、８ｘ８領域に逆ＲＳＴ又はＬＦＮＳＴが適用される場合、８ｘ８領域の変換係数のうち、８ｘ８領域の左上側に対応する１６個の変換係数は、スキャニング順序に従って、１次元の配列形態で入力されて、４８ｘ１６の変換カーネルマトリックスと行列演算されることができる。すなわち、このような場合の行列演算は、（４８ｘ１６行列）＊（１６ｘ１変換係数ベクトル）＝（４８ｘ１修正された変換係数ベクトル）で示すことができる。ここで、ｎｘ１ベクトルは、ｎｘ１行列のような意味で解釈され得るので、ｎｘ１列ベクトルで表記されることもある。また、＊は、行列の掛け算演算を意味する。このような行列演算が行われると、４８個の修正された変換係数が導出でき、４８個の修正された変換係数は、８ｘ８領域の右下側領域を除いた左上側、右上側、左下側領域に配列されることができる。

前述された非分離変換、ＬＦＮＳＴについて具体的にみると、次の通りである。ＬＦＮＳＴは、エンコード装置による順方向（ｆｏｒｗａｒｄ）変換と、デコード装置による逆方向（ｉｎｖｅｒｓｅ）変換を含むことができる。

エンコード装置は、順方向１次変換（ｐｒｉｍａｒｙ（ｃｏｒｅ）ｔｒａｎｓｆｏｒｍ）を適用した後、導出された結果（又は結果の一部）を入力として、順方向２次変換（ｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）を適用する。

前記数式９で、ｘとｙは、それぞれ２次変換の入力と出力であり、Ｇは、２次変換を示す行列であって、変換基底ベクトル（ｔｒａｎｓｆｏｒｍｂａｓｉｓｖｅｃｔｏｒ）は列ベクトルで構成される。逆方向ＬＦＮＳＴの場合、変換行列Ｇの次元（ｄｉｍｅｎｓｉｏｎ）を［ｒｏｗ数×ｃｏｌｕｍｎ数］で表記したとき、順方向ＬＦＮＳＴの場合、行列ＧのトランスポーズをとったことがＧＴの次元になる。

逆方向ＬＦＮＳＴの場合、行列Ｇの次元は、［４８ｘ１６］、［４８ｘ８］、［１６ｘ１６］、［１６ｘ８］となり、［４８ｘ８］行列と［１６ｘ８］行列は、それぞれ［４８ｘ１６］行列と［１６ｘ１６］行列の左側から８個の変換基底ベクトルをサンプリングした部分行列である。

反面、順方向ＬＦＮＳＴの場合、行列ＧＴの次元は、［１６ｘ４８］、［８ｘ４８］、［１６ｘ１６］、［８ｘ１６］となり、［８ｘ４８］行列と［８ｘ１６］行列は、それぞれ［１６ｘ４８］行列と［１６ｘ１６］行列の上方から８個の変換基底ベクトルをサンプリングした部分行列である。

従って、順方向ＬＦＮＳＴの場合、入力ｘとしては［４８ｘ１］ベクトル又は［１６ｘ１］ベクトルが可能であり、出力ｙとしては、［１６ｘ１］ベクトル又は［８ｘ１］ベクトルが可能である。ビデオコーディング及びデコードにおける順方向１次変換の出力は、２次元（２Ｄ）データであるので、入力ｘとして［４８ｘ１］ベクトル又は［１６ｘ１］ベクトルを構成するために、順方向変換の出力である２Ｄデータを適切に配列して１次元ベクトルを構成しなければならない。

図６は、一例によって、順方向１次変換の出力データを１次元ベクトルに配列する順序を示した図である。図６の（ａ）及び（ｂ）の左側図は、［４８ｘ１］ベクトルを作るための順序を示し、図６の（ａ）及び（ｂ）の右側図は、［１６ｘ１］ベクトルを作るための順序を示す。ＬＦＮＳＴの場合、図６の（ａ）及び（ｂ）のような順序で２Ｄデータを順次に配列し、１次元ベクトルｘが得られる。

このような順方向１次変換の出力データの配列方向は、現在ブロックのイントラ予測モードによって決定されることができる。例えば、現在ブロックのイントラ予測モードが対角線方向を基準に水平方向であると、順方向１次変換の出力データは、図６の（ａ）の順に配列されることができ、現在ブロックのイントラ予測モードが対角線方向を基準に垂直方向であると、順方向１次変換の出力データは、図６の（ｂ）の順に配列されることができる。

一例によって、図６の（ａ）及び（ｂ）の配列順序（ｏｒｄｅｒｉｎｇ）と異なる配列順序を適用することができ、図６の（ａ）及び（ｂ）の配列順序を適用したときと同じ結果（ｙベクトル）を導出するためには、行列Ｇの列ベクトルを当該配列順序に合わせて再配列すればよい。すなわち、ｘベクトルを構成する各要素に対して、常時同じ変換基底ベクトルと掛けられるようにＧの列ベクトルを再配置することができる。

数式９を介して導出される出力ｙは、１次元ベクトルであるので、もし順方向２次変換の結果を入力として処理する構成、例えば、量子化又はレジデュアルコーディングを実行する構成が、入力データとして２次元データが必要であれば、数式９の出力ｙベクトルは再度２Ｄデータに適切に配置されなければならない。

図７は、一例によって順方向２次変換の出力データを２次元ブロックで配列する順序を示した図である。

ＬＦＮＳＴの場合、決められたスキャン順序に従って２Ｄブロックに配置されることができる。図７の（ａ）は、出力ｙが［１６ｘ１］ベクトルである場合、２次元ブロックの１６個の位置に対角スキャン（ｄｉａｇｏｎａｌｓｃａｎ）順序に従って出力値が配置されることを示す。図７の（ｂ）は、出力ｙが［８ｘ１］ベクトルである場合、２次元ブロックの８個の位置に対角スキャン順序に従って出力値が配置され、残りの８個の位置には０で満たされることを示す。図７の（ｂ）のＸは、０と満たされることを示す。

別の例によって、量子化又はレジデュアルコーディング実行する構成により、出力ベクトルｙが処理される順序は、既設定された順序に従って実行されることができるため、図７のように、出力ベクトルｙが２Ｄブロックに配置されないことがある。但し、レジデュアルコーディングの場合、ＣＧ（ＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ）のような２Ｄブロック（例えば、４ｘ４）単位でデータコーディングが実行でき、この場合、図７の対角スキャン順序のように特定の順序に従ってデータが配列できる。

一方、デコード装置は、逆方向の変換のために逆量子化過程等を通じて出力された２次元データを既設定されたスキャン順序に従って羅列し、１次元入力ベクトルであるｙを構成することができる。入力ベクトルｙは、下記数式により入力ベクトルｘに出力されることができる。

逆方向ＬＦＮＳＴの場合、［１６ｘ１］ベクトル又は［８ｘ１］ベクトルである入力ベクトルｙにＧ行列を掛けることによって、出力ベクトルｘを導出することができる。逆方向ＬＦＮＳＴの場合、出力ベクトルｘは［４８ｘ１］ベクトル又は［１６ｘ１］ベクトルであり得る。

出力ベクトルｘは、図６に示した順序に従って、２次元ブロックに配置されて２次元データに配列され、このような２次元データは、逆方向１次変換の入力データ（又は入力データの一部）になる。

従って、逆方向２次変換は、全体的に順方向２次変換の過程と反対であり、逆変換の場合、順方向と異なり、逆方向２次変換を先に適用した後、逆方向１次変換を適用することになる。

逆方向ＬＦＮＳＴでは、変換行列Ｇとして［４８ｘ１６］行列８個と［１６ｘ１６］行列８個のうち１つが選択できる。［４８ｘ１６］行列と［１６ｘ１６］行列のうち、どの行列を適用するか否かは、ブロックの大きさと形状によって決定される。

また、８個の行列は、前述した表２のように４個の変換セットから導出されることができ、各変換セットは、２個の行列で構成されることができる。４個の変換セットのうち、どの変換セットを使用するかはイントラ予測モードによって決定され、より具体的に広角イントラ予測モード（ＷｉｄｅＡｎｇｌｅＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ、ＷＡＩＰ）まで考慮して、拡張されたイントラ予測モード値に基づいて変換セットが決定される。選択された変換セットを構成する２個の行列のうち、どの行列を選択するかはインデックスシグナリング（ｉｎｄｅｘｓｉｇｎａｌｉｎｇ）を介して導出される。より具体的に、送信されるインデックス値としては、０、１、２が可能であり、０はＬＦＮＳＴを適用しないことを指示し、１と２はイントラ予測モード値に基づいて選択された変換セットを構成する２個の変換行列の何れかを指示することができる。

一方、前述したように、［４８ｘ１６］行列と［１６ｘ１６］行列のうち、どの変換行列をＬＦＮＳＴに適用するか否かは、変換対象ブロックの大きさと形状により決定される。

図８は、ＬＦＮＳＴが適用されるブロックの形状を示した図である。図８の（ａ）は４ｘ４ブロックを、（ｂ）は４ｘ８及び８ｘ４ブロックを、（ｃ）はＮが１６以上である４ｘＮ又はＮｘ４ブロックを、（ｄ）は８ｘ８ブロックを、（ｅ）はＭ≧８、Ｎ≧８であり、Ｎ＞８又はＭ＞８であるＭｘＮブロックを示している。

図８で、太い枠を有するブロックが、ＬＦＮＳＴが適用される領域を指す。図８の（ａ）及び（ｂ）のブロックについては、左上側（ｔｏｐ－ｌｅｆｔ）の４ｘ４領域に対してＬＦＮＳＴが適用され、図８の（ｃ）のブロックに対しては、連続して配置された２個の左上側の４ｘ４領域に対して、それぞれＬＦＮＳＴが適用される。図８の（ａ）、（ｂ）、（ｃ）では、４ｘ４領域の単位でＬＦＮＳＴが適用されるので、このようなＬＦＮＳＴを以下「４ｘ４のＬＦＮＳＴ」と名づけることとし、当該変換行列としては、数式９及び数式１０のＧに対する行列次元を基準［１６ｘ１６］又は［１６ｘ８］行列が適用できる。

より具体的に、図８の（ａ）の４ｘ４ブロック（４ｘ４ＴＵ又は４ｘ４ＣＵ）に対しては［１６ｘ８］行列が適用され、図８の（ｂ）及び（ｃ）におけるブロックに対しては［１６ｘ１６］行列が適用される。これは、最悪の場合（ｗｏｒｓｔｃａｓｅ）に対する計算複雑度をサンプル当たり８掛け算（８ｍｕｌｔｉｐｌｉｃａｔｉｏｎｓｐｅｒｓａｍｐｌｅ）に合わせるためである。

図８の（ｄ）及び（ｅ）については、左上側の８ｘ８領域に対してＬＦＮＳＴが適用され、このようなＬＦＮＳＴを以下「８ｘ８のＬＦＮＳＴ」と名付けることとする。当該変換行列としては、［４８ｘ１６］又は［４８ｘ８］行列が適用できる。順方向ＬＦＮＳＴの場合、入力データとして［４８ｘ１］ベクトル（数式９のｘベクトル）が入力されるので、左上側の８ｘ８領域の全てのサンプル値が順方向ＬＦＮＳＴの入力値として使用されない。すなわち、図６の（ａ）の左側順序又は図６の（ｂ）の左側順序で見るように、右下側（ｂｏｔｔｏｍ－ｒｉｇｈｔ）の４ｘ４ブロックはそのまま置いて、残りの３個の４ｘ４ブロックに属したサンプルに基づいて、［４８ｘ１］ベクトルを構成することができる。

図８の（ｄ）における８ｘ８ブロック（８ｘ８ＴＵ又は８ｘ８ＣＵ）に［４８ｘ８］行列が適用され、図８の（ｅ）における８ｘ８ブロックに［４８ｘ１６］行列が適用できる。これもやはり、最悪の場合（ｗｏｒｓｔｃａｓｅ）に対する計算複雑度をサンプル当たり８掛け算（８ｍｕｌｔｉｐｌｉｃａｔｉｏｎｓｐｅｒｓａｍｐｌｅ）に合わせるためである。

ブロックの形状に応じて、これに対応する順方向ＬＦＮＳＴ（４ｘ４ＬＦＮＳＴ又は８ｘ８ＬＦＮＳＴ）が適用されると、８個又は１６個の出力データ（数式９におけるｙベクトル、［８ｘ１］又は［１６ｘ１］ベクトル）が生成され、順方向ＬＦＮＳＴでは、行列ＧＴの特性上、出力データの数が入力データの数よりも等しいか少なくなる。

図９は、一例によって順方向ＬＦＮＳＴの出力データの配置を示した図面であり、ブロック形状に沿って順方向ＬＦＮＳＴの出力データが配置されるブロックを示す。

図９に示したブロックの左上側に陰影で処理された領域が順方向ＬＦＮＳＴの出力データが位置する領域に当該し、０で表記された位置は０値で満たされるサンプルを示し、残りの領域は、順方向ＬＦＮＳＴにより変更されない領域を示す。ＬＦＮＳＴにより変更されない領域には、順方向１次変換の出力データが変更されずにそのまま存在する。

前述したように、ブロックの形状に応じて適用される変換行列の次元が変わるので、出力データの数も変わる。図９のように、順方向ＬＦＮＳＴの出力データが左上側４ｘ４ブロックを全て満たさないこともある。図１１の（ａ）及び（ｄ）の場合、太い線で表示されたブロック又はブロック内部の一部領域には、それぞれ［１６ｘ８］行列と［４８ｘ８］行列が適用されて、順方向ＬＦＮＳＴの出力で［８ｘ１］ベクトルが生成される。すなわち、図７の（ｂ）に示したスキャン順序に従って、８個の出力データのみ図９の（ａ）及び（ｄ）のように満たされ、残りの８個の位置に対しては０が満たされることができる。図８の（ｄ）のＬＦＮＳＴの適用ブロックの場合、図９の（ｄ）のように左上側の４ｘ４ブロックに隣接した右上側及び左下側の２個の４ｘ４ブロックも０値で満たされる。

前記のように、基本的にＬＦＮＳＴインデックスをシグナリングし、ＬＦＮＳＴの適用可否、及び適用する変換行列を指定することになる。図９に示したように、ＬＦＮＳＴが適用される場合、順方向ＬＦＮＳＴの出力データの数が入力データの数よりも等しいか少ないことがあるため、０値で満たされる領域が次のように発生する。

１）図９の（ａ）のように、左上側の４ｘ４ブロック内にスキャン順序上８番目以降の位置、すなわち、９番目から１６番目までのサンプル

２）図９の（ｄ）及び（ｅ）のように、［１６×４８］行列又は［８×４８］行列が適用されて左上側の４×４ブロックに隣接した２つの４×４ブロック又はスキャン順序上の２番目と３番目の４×４ブロック

従って、前記１）と２）の領域をチェックし、０ではない（ｎｏｎ－ｚｅｒｏ）データが存在することになると、ＬＦＮＳＴが適用されていないことが確実であるため、当該ＬＦＮＳＴインデックスのシグナリングを省略することができるようになる。

一例によって、例えば、ＶＶＣ標準に採択されたＬＦＮＳＴの場合、ＬＦＮＳＴインデックスのシグナリングは、レジデュアルコーディングの後に実行されるので、エンコード装置は、レジデュアルコーディングを介してＴＵ又はＣＵブロック内部の全ての位置に対する０ではないデータ（有効係数）の存在可否が分かるようになる。従って、エンコード装置は、０ではないデータの存在可否を通じて、ＬＦＮＳＴインデックスに対するシグナリングを実行するか否かを判断することができ、デコード装置は、ＬＦＮＳＴインデックスのパーシング可否を判断することができる。もし、前記１）と２）で指定された領域に０ではないデータが存在しない場合、ＬＦＮＳＴインデックスのシグナリングを実行するようになる。

一方、採択されたＬＦＮＳＴに対して、次のような単純化方法が適用できる。

（ｉ）一例によって、順方向ＬＦＮＳＴに対する出力データの数を最大１６個に限定することができる。

図８の（ｃ）の場合、左上側に隣接した２個の４ｘ４領域にそれぞれ４ｘ４のＬＦＮＳＴが適用でき、そのとき、最大３２個のＬＦＮＳＴ出力データが生成できる。もし、順方向ＬＦＮＳＴに対する出力データの数を最大１６に限定すると、４ｘＮ／Ｎｘ４（Ｎ≧１６）ブロック（ＴＵ又はＣＵ）に対しても、左上側に存在する１個の４ｘ４領域に対してのみ４ｘ４ＬＦＮＳＴを適用し、図８の全てのブロックに対して、ＬＦＮＳＴを一度だけ適用できる。これを通じて、画像コーディングに対する具現が単純になる。

（ｉｉ）一例によって、ＬＦＮＳＴが適用されない領域に対して、追加的にゼロアウト（ｚｅｒｏ－ｏｕｔ）を適用することができる。本文書におけるゼロアウトは、特定の領域に属した全ての位置の値を０値で満たすことを意味することができる。即ち、ＬＦＮＳＴによって変更されずに順方向１次変換の結果を維持している領域に対しても、ゼロアウトを適用することができる。前述したように、ＬＦＮＳＴは４×４ＬＦＮＳＴと８×８ＬＦＮＳＴとに区分されるため、下記のように２種類（（ｉｉ）－（Ａ）及び（ｉｉ）－（Ｂ））にゼロアウトを区分することができる。

（ｉｉ）－（Ａ）４×４ＬＦＮＳＴが適用されるとき、４×４ＬＦＮＳＴが適用されない領域をゼロアウトすることができる。図１０は、一例によって、４×４ＬＦＮＳＴが適用されるブロックでのゼロアウトを示す図である。

図１０のように、４×４ＬＦＮＳＴが適用されるブロックに対して、即ち、図９の（ａ）、（ｂ）、及び（ｃ）のブロックに対してＬＦＮＳＴが適用されない領域まで全て０で満たされることができる。

一方、図１０の（ｄ）は、一例によって順方向ＬＦＮＳＴの出力データ個数の最大値を１６に限定した場合、４×４ＬＦＮＳＴが適用されない残りのブロックに対してゼロアウトを実行したことを示す。

（ｉｉ）－（Ｂ）８×８ＬＦＮＳＴが適用されるとき、８×８ＬＦＮＳＴが適用されない領域をゼロアウトすることができる。図１１は、一例によって、８×８ＬＦＮＳＴが適用されるブロックでのゼロアウトを示す図である。

図１１のように、８×８ＬＦＮＳＴが適用されるブロックに対して、即ち、図９の（ｄ）及び（ｅ）のブロックに対してＬＦＮＳＴが適用されない領域まで全て０で満たされることができる。

（ｉｉｉ）前記（ｉｉ）で提示したゼロアウトによって、ＬＦＮＳＴが適用されるとき、０で満たされる領域が変わることができる。したがって、前記（ｉｉ）で提案されたゼロアウトによって０でないデータが存在するかどうかを図９のＬＦＮＳＴの場合よりも広い領域に対してチェックできる。

例えば、（ｉｉ）－（Ｂ）を適用する場合、図９の（ｄ）及び（ｅ）で０値で満たされる領域に追加して、図１１で追加的に０で満たされた領域まで０でないデータが存在するかどうかをチェックした後、０でないデータが存在しない場合にのみ、ＬＦＮＳＴインデックスに対するシグナリングを実行することができる。

もちろん、前記（ｉｉ）で提案されたゼロアウトを適用しても、既存ＬＦＮＳＴインデックスシグナリングと同様に、０でないデータが存在するかどうかをチェックすることができる。即ち、図９に０で満たされたブロックに対して、０でないデータが存在するかどうかをチェックし、ＬＦＮＳＴインデックスシグナリングを適用することができる。このような場合、エンコーディング装置にのみゼロアウトを実行し、デコーディング装置では該当ゼロアウトを仮定せずに、即ち、図９で明示的に０で表記された領域に対してのみ０でないデータが存在するかどうかのみをチェックしてＬＦＮＳＴインデックスパーシングを実行することができる。

前記ＬＦＮＳＴに対する単純化方法（（ｉ）、（ｉｉ）－（Ａ）、（ｉｉ）－（Ｂ）、（ｉｉｉ））の組み合わせを適用した多様な実施例が導出されることができる。もちろん、前記単純化方法に対する組み合わせは、下記の実施例に限定されるものではなく、任意の組み合わせをＬＦＮＳＴに適用できる。

実施例

－順方向ＬＦＮＳＴに対する出力データ数を最大１６個に限定→（ｉ）

－４×４ＬＦＮＳＴが適用されるとき、４×４ＬＦＮＳＴが適用されない領域を全てゼロアウト→（ｉｉ）－（Ａ）

－８×８ＬＦＮＳＴが適用されるとき、８×８ＬＦＮＳＴが適用されない領域を全てゼロアウト→（ｉｉ）－（Ｂ）

－既存０値で満たされる領域と追加的なゼロアウト（（ｉｉ）－（Ａ）、（ｉｉ）－（Ｂ））によって０で満たされる領域に対しても、０でないデータが存在するかどうかをチェックした後、０でないデータが存在しない場合にのみＬＦＮＳＴインデクシングシグナリング→（ｉｉｉ）

前記実施例の場合、ＬＦＮＳＴが適用されるとき、０でない出力データが存在できる領域が左上端４×４領域の内部に制限される。より詳しく、図１０の（ａ）と図１１の（ａ）の場合、スキャン順序上に８番目の位置が、０でないデータが存在できる最後の位置になり、図１０の（ｂ）及び（ｄ）と図１１の（ｂ）の場合、スキャン順序上に１６番目の位置（即ち、左上端４×４ブロックの右下側の位置）が、０でないデータが存在できる最後の位置になる。

従って、ＬＦＮＳＴが適用されたとき、レジデュアルコーディング過程が許容されない位置（最も最後の位置を越えた位置で）で０ではないデータが存在するか否かをチェックした後、ＬＦＮＳＴインデックスのシグナリング可否が決定できる。

（ｉｉ）で提案されたゼロアウト方式の場合、１次変換とＬＦＮＳＴの両方ともを適用したときに最終的に発生するデータの数が減少するため、全体変換過程を行うときに要求される計算量を減らすことができる。すなわち、ＬＦＮＳＴが適用される場合、ＬＦＮＳＴが適用されない領域に存在する順方向１次変換出力データに対してもゼロアウトを適用するため、順方向１次変換を行うときからゼロアウトとなる領域に対するデータを生成する必要がない。従って、当該データ生成に要求される演算量を節約することができる。（ｉｉ）で提案されたゼロアウト方式の追加的な効果をまとめると、以下のようである。

第１に、前記のように全体変換過程の実行に必要な計算量が低減する。

特に、（ｉｉ）－（Ｂ）を適用する場合、最悪の場合に対する計算量が減少して変換の過程を軽量化することができる。敷衍すると、一般的に大きなサイズの１次変換実行に大量の演算が要求されるが、（ｉｉ）－（Ｂ）を適用すると、順方向ＬＦＮＳＴ実行結果として導出されるデータの数を１６個以下に減らすことができ、全体ブロック（ＴＵまたはＣＵ）サイズが大きくなるほど、変換演算量低減効果はさらに増加する。

第２に、変換過程全体に必要な演算量が減少して変換実行に必要な電力消費を削減することができる。

第３に、変換過程に伴う遅延時間（ｌａｔｅｎｃｙ）を減少させる。

ＬＦＮＳＴのような２次変換は既存の１次変換に計算量を追加することになるので、変換実行に伴う全体遅延時間を増加させる。特に、イントラ予測の場合、予測過程で隣接ブロックの復元データが使用されるので、エンコード時に２次変換による遅延時間の増加が復元（ｒｅｃｏｎｓｔｒｕｃｔｉｏｎ）までの遅延時間の増加につながり、イントラ予測エンコードの全体的な遅延時間の増加につながる可能性がある。

しかしながら、（ｉｉ）で提示したゼロアウトを適用すると、ＬＦＮＳＴ適用時に１次変換実行の遅延時間を大幅に減らすことができるため、変換実行全体に対する遅延時間はそのまま維持されるか低減することになり、エンコード装置をより簡単に実現することができる。

一方、従来のイントラ予測は、現在符号化しようとするブロックを１つの符号化単位とみなして分割なしに符号化を行っていた。しかしながら、ＩＳＰ（ＩｎｔｒａＳｕｂ－Ｐａｒｉｔｉｏｎｓ）コーディングは、現在符号化しようとするブロックを水平方向又は垂直方向に分割してイントラ予測符号化を行うことを意味する。このとき、分割されたブロック単位で符号化／復号化を行って復元されたブロックを生成し、復元されたブロックは次の分割されたブロックの参照ブロックとして使用される。一例によって、ＩＳＰコーディング時に１つのコーディングブロックが２つ又は４つのサブブロックに分割されてコーディングされてもよく、ＩＳＰにおいて１つのサブブロックは隣接する左側又は隣接する上側に位置するサブブロックの復元されたピクセル値を参照してイントラ予測が行われる。以下、使用される「コーディング」は、エンコード装置において行われるエンコードとデコード装置で行われるデコードを全て含む概念として使用される。

ＩＳＰは、ブロックのサイズに応じてルマイントラで予測されたブロックを垂直方向又は水平方向に２つ又は４つのサブパーティショニングに分割することである。例えば、ＩＳＰが適用できる最小ブロックサイズは４×８又は８×４である。ブロックサイズが４×８又は８×４より大きい場合、ブロックは４つのサブパーティショニングに分割される。

ＩＳＰ適用の時、サブブロックは分割の形態に応じて、例えば、水平（Ｈｏｒｉｚｏｎｔａｌ）又は垂直（Ｖｅｒｔｉｃｉａｌ）、左側から右側又は上側から下側に順次コーディングされ、１つのサブブロックに対する逆変換とイントラ予測を経て復元過程まで行われた後、次のサブブロックに対するコーディングが行われる。最左側又は最上側のサブブロックに対しては通常のイントラ予測方式のように既にコーディングされたコーディングブロックの復元ピクセルを参照する。また、後続の内部のサブブロックの各辺に対して以前のサブブロックと隣接していない場合は、当該辺に隣接した参照ピクセルを導出するために、通常のイントラ予測方式のように既にコーディングされた隣接したコーディングブロックの復元ピクセルを参照する。

ＩＳＰコーディングモードでは全てのサブブロックが同じイントラ予測モードでコーディングされることができ、ＩＳＰコーディングを使用するかどうかを示すフラグとどの方向に（水平または垂直）分割するかを示すフラグなどがシグナリングされることができる。このとき、ブロックもようによってサブブロックの個数を２個または４個に調節することができ、一つサブブロックの大きさ（幅×高さ）が１６未満である場合、該当サブブロックへの分割を許容しない、またはＩＳＰコーディング自体を適用しないように制限できる。

一方、ＩＳＰ予測モードである場合、１つのコーディングユニットが２つ又は４つのパーティションブロック、すなわち、サブブロックに分割されて予測され、当該分割された２つ又は４つのパーティションブロックには同一の画面内予測モードが適用される。

前述したように、分割方向は、水平方向（横長さと縦長さがそれぞれＭ、ＮであるＭ×Ｎコーディングユニットが水平方向に分割されると、２つに分割される場合はＭ×（Ｎ／２）ブロックに分割され、４つに分割される場合はＭ×（Ｎ／４）ブロックに分割される）と、垂直方向（Ｍ×Ｎコーディングユニットが垂直方向に分割されると、２つに分割される場合は（Ｍ／２）×Ｎブロックに分割され、４つに分割される場合は（Ｍ／４）×Ｎブロックに分割される）が全て可能である。水平方向に分割される場合、上側から下側の方向順にパーティションブロックがコーディングされ、垂直方向に分割される場合、左側から右側の方向順にパーティションブロックがコーディングされる。現在コーディングされるパーティションブロックは水平（垂直）方向分割である場合、上側（左側）パーティションブロックの復元されたピクセル値を参照して予測されることができる。

ＩＳＰ予測方法で生成されたレジデュアル信号にパーティションブロック単位で変換が適用されることができる。順方向（ｆｏｒｗａｒｄ）を基準に１次変換（ｃｏｒｅｔｒａｎｓｆｏｒｍ又はｐｒｉｍａｒｙｔｒａｎｓｆｏｒｍ）に既存のＤＣＴ－２だけでなくＤＳＴ－７／ＤＣＴ－８組み合わせベースのＭＴＳ（ＭｕｌｔｉｐｌｅＴｒａｎｓｆｏｒｍＳｅｌｅｃｔｉｏｎ）技術が適用され、１次変換により生成された変換係数に順方向ＬＦＮＳＴ（ＬｏｗＦｒｅｑｕｅｎｃｙＮｏｎ－ＳｅｐａｒａｂｌｅＴｒａｎｓｆｏｒｍ）が適用されて最終的な修正された変換係数が生成されることができる。

すなわち、ＩＳＰ予測モードが適用されて分割されたパーティションブロックにもＬＦＮＳＴが適用でき、前述のように、分割されたパーティションブロックには同一のイントラ予測モードが適用される。従って、イントラ予測モードに基づいて導出されるＬＦＮＳＴセットを選択するとき、全てのパーティションブロックに導出されたＬＦＮＳＴセットを適用することができる。すなわち、全てのパーティションブロックに同一のイントラ予測モードが適用されるので、これにより全てのパーティションブロックには同一のＬＦＮＳＴセットが適用されることができる。

一方、一例によって、ＬＦＮＳＴは横長と縦長が全て４以上である変換ブロックに対してのみ適用できる。従って、ＩＳＰ予測方式に従って分割されたパーティションブロックの縦長又は横長が４未満である場合、ＬＦＮＳＴが適用されずＬＦＮＳＴインデックスもシグナリングされない。また、各パーティションブロックにＬＦＮＳＴを適用する場合、当該パーティションブロックを１つの変換ブロックとみなすことができる。もちろん、ＩＳＰ予測方式が適用されない場合、コーディングブロックにＬＦＮＳＴが適用される。

各パーティションブロックにＬＦＮＳＴを適用することを具体的に説明すると、以下のようにある。

一例によって、個別的なパーティションブロックに対して順方向ＬＦＮＳＴを適用した後、左上側４×４領域に変換係数スキャン順序に従って最大１６個（８個又は１６個）の係数のみを残した後、残りの位置及び領域は全て０値で充填するゼロアウトが適用される。

または、一例によって、パーティションブロックの一辺の長さが４である場合、左上側４×４領域に対してのみＬＦＮＳＴを適用し、パーティションブロックの全ての辺、すなわち、幅及び高さの長さが８以上である場合、左上側８×８領域内部の右下側４×４領域を除いた残りの４８個の係数に対してＬＦＮＳＴを適用することができる。

または、一例によって、最悪の場合の計算複雑度を８掛け算／サンプル（ｍｕｌｔｉｐｌｉｃａｔｉｏｎｓｐｅｒｓａｍｐｌｅ）に合わせるために、各パーティションブロックが４×４又は８×８である場合は、順方向ＬＦＮＳＴ適用後に８つの変換係数のみを出力することができる。すなわち、パーティションブロックが４×４であると、変換マトリックスとして８×１６行列が適用され、パーティションブロックが８×８であると、変換マトリックスとして８×４８行列が適用される。

一方、現在ＶＶＣ標準において、ＬＦＮＳＴインデックスシグナリングはコーディングユニット単位で行われる。従って、ＩＳＰ予測モードであり、全てのパーティションブロックに対してＬＦＮＳＴを適用する場合、当該パーティションブロックに対して同一のＬＦＮＳＴインデックス値が適用できる。すなわち、コーディングユニットレベルにおいてＬＦＮＳＴインデックス値が一度送信されると、コーディングユニット内部の全てのパーティションブロックに対しては該当ＬＦＮＳＴインデックスが適用できる。前述のように、ＬＦＮＳＴインデックス値は０、１、２値を有し、０はＬＦＮＳＴが適用されない場合を示し、１と２はＬＦＮＳＴが適用されるときに１つのＬＦＮＳＴセット内に存在する２つの変換マトリックスを示す。

前記のように、ＬＦＮＳＴセットはイントラ予測モードにより決定され、ＩＳＰ予測モードである場合、コーディングユニット内の全てのパーティションブロックが同一のイントラ予測モードで予測されるので、パーティションブロックは同一のＬＦＮＳＴセットを参照することができる。

また他の一例として、ＬＦＮＳＴインデックスシグナリングは依然としてコーディングユニット単位で行われるが、ＩＳＰ予測モードの場合、全てのパーティションブロックに対して一律にＬＦＮＳＴ適用の可否を決定せず、別途の条件に従ってそれぞれのパーティションブロックに対してコーディングユニットレベルにおいてシグナリングされたＬＦＮＳＴインデックス値を適用するか、それともＬＦＮＳＴを適用しないかを決定する。ここで、別途の条件は、ビットストリームを介して各パーティションブロック別にフラグ形態でシグナリングされ、フラグ値が１であると、コーディングユニットレベルにおいてシグナリングされたＬＦＮＳＴインデックス値を適用し、フラグ値が０であると、ＬＦＮＳＴを適用しない。

以下では、ＩＳＰモードにＬＦＮＳＴ適用時、最悪の場合に関する計算複雑度を維持する方法について説明する。

ＩＳＰモードである場合、ＬＦＮＳＴ適用時にサンプル当たり（又は、係数当たり、位置当たり）掛け算数を一定値以下に維持するためにＬＦＮＳＴ適用を制限することができる。パーティションブロックのサイズに応じて、以下のようにＬＦＮＳＴを適用してサンプル当たり（又は、係数当たり、位置当たり）掛け算数を８個以下に維持することができる。

１．パーティションブロックの横長と縦長が両方とも４以上である場合は、現在ＶＶＣ標準におけるＬＦＮＳＴに対する最悪の場合に対する計算複雑度調節方式と同一の方式を適用することができる。

すなわち、パーティションブロックが４×４ブロックである場合には１６×１６行列の代わりに、順方向では１６×１６行列から上位８個の行をサンプリングした８×１６行列を適用し、逆方向では１６×１６行列から左側８個の列をサンプリングした１６×８行列を適用することができる。また、パーティションブロックが８×８ブロックであるときは、順方向の場合は１６×４８行列の代わりに、１６×４８行列から上位８個の行をサンプリングした８×４８行列を適用し、逆方向の場合は４８×１６行列の代わりに４８×１６から左側の８個の列をサンプリングした４８×８行列を適用することができる。

４×Ｎ又はＮ×４（Ｎ＞４）ブロックの場合、順方向変換を行う時、左上側４×４ブロックに対してのみ１６×１６行列を適用した後、生成された１６個の係数は左上側４×４領域に配置され、それ以外の領域は０値で充填される。また、逆方向変換を行う時には左上４×４ブロックに位置した１６個の係数をスキャン順序に従って配置して入力ベクトルを構成した後、１６×１６行列を掛け算して１６個の出力データを生成することができる。生成された出力データは左上側４×４領域に配置され、左上側４×４領域を除いた残りの領域は０で充填される。

８×Ｎ又はＮ×８（Ｎ＞８）ブロックの場合、順方向変換を行う時に左上側８×８ブロック内部のＲＯＩ領域（左上側８×８ブロックから右下側４×４ブロックを除いた残りの領域）に対してのみ１６×４８行列を適用した後、生成された１６個の係数は左上側４×４領域に配置され、それ以外の領域は全て０値で充填される。また、逆方向変換を行う時には左上側４×４ブロックに位置した１６個の係数をスキャン順序に従って配置して入力ベクトルを構成した後、４８×１６行列を掛け算して４８個の出力データを生成する。生成された出力データは、前記ＲＯＩ領域に充填され、残りの領域は全て０値で充填される。

また他の一例として、サンプル当たり（又は、係数当たり、位置当たり）掛け算数を一定値以下に維持するためにＩＳＰパーティションブロックのサイズではないＩＳＰコーディングユニットのサイズを基準にサンプル当たり（又は、係数当たり、位置当たり）掛け算数を８個以下に維持する。もし、ＩＳＰパーティションブロックのうちＬＦＮＳＴが適用される条件を満たすブロックが１つだけ存在する場合、パーティションブロックのサイズではない当該コーディングユニットのサイズに基づいてＬＦＮＳＴ最悪の場合に対する複雑度演算が適用される。例えば、あるコーディングユニットに対するルマコーディングブロックが４×４サイズの４つのパーティションブロックに分割されてＩＳＰでコーディングされ、そのうち２つのパーティションブロックに対しては０ではない変換係数が存在しない場合、他の２つのパーティションブロックには（エンコーダ基準で）それぞれ８つではない１６個の変換係数が生成されるように設定することができる。

以下では、ＩＳＰモードである場合、ＬＦＮＳＴインデックスをシグナリングする方法について説明する。

前述のように、ＬＦＮＳＴインデックスは０、１、２値を有し、０はＬＦＮＳＴを適用しないことを示し、１と２は選択されたＬＦＮＳＴのセットに含まれる２つのＬＦＮＳＴカーネルマトリックスのいずれか１つずつを示す。ＬＦＮＳＴインデックスにより選択されたＬＦＮＳＴカーネルマトリックスに基づいてＬＦＮＳＴが適用される。現在ＶＶＣ標準においてＬＦＮＳＴインデックスの送信方式を説明すると、以下のようである。

１．コーディングユニット（ＣＵ）毎に１回ずつＬＦＮＳＴインデックスを送信することができ、デュアルツリー（ｄｕａｌ－ｔｒｅｅ）の場合は、ルマブロックとクロマブロックに対してそれぞれ個別のＬＦＮＳＴインデックスがシグナリングされる。

２．ＬＦＮＳＴインデックスがシグナリングされない場合は、ＬＦＮＳＴインデックス値はデフォルト値である０と決定される（ｉｎｆｅｒ）。ＬＦＮＳＴインデックス値が０と類推される場合は次のようである。

Ａ．変換が適用されないモードである場合（例えば、変換スキップ（ｔｒａｎｓｆｏｒｍｓｋｉｐ）、ＢＤＰＣＭ、無損失（ｌｏｓｓｌｅｓｓ）コーディングなど）

Ｂ．１次変換がＤＣＴ－２でない場合（ＤＳＴ７やＤＣＴ８）、すなわち、水平方向の変換又は垂直方向の変換がＤＣＴ－２でない場合

Ｃ．コーディングユニットのルマブロックに対する横長又は縦長が変換可能な最大ルマ変換のサイズを超過する場合、例えば、変換可能な最大ルマ変換のサイズが６４である場合、コーディングブロックのルマブロックに対するサイズが１２８×１６と同様である場合はＬＦＮＳＴが適用できない。

デュアルツリーの場合、ルマ成分に対するコーディングユニットとクロマ成分に対するコーディングユニットのそれぞれに対して、最大ルマ変換のサイズを超過するか否かが判断される。すなわち、ルマブロックに対して変換が可能な最大ルマ変換のサイズを超過するか否かがチェックされ、クロマブロックに対してカラーフォーマットに対する対応ルマブロックの縦／横の長さと最大変換が可能な最大ルマ変換のサイズを超過するか否かがチェックされる。例えば、カラーフォーマットが４：２：０である場合には、対応ルマブロックの横／縦の長さはそれぞれ当該クロマブロックの２倍となり、対応ルマブロック変換のサイズは当該クロマブロックの２倍となる。また他の例として、カラーフォーマットが４：４：４である場合には、対応ルマブロックの横／縦の長さと変換のサイズは、対応するクロマブロックと同じである。

６４長さ変換又は３２長さ変換がそれぞれ６４又は３２長さを有する横又は縦に適用される変換を意味し、「変換サイズ」は当該長さである６４又は３２を意味する。

シングルツリーである場合、ルマブロックに対して横長又は縦長が変換可能な最大ルマ変換ブロックのサイズを超過しているか否かをチェックした後、超過する場合はＬＦＮＳＴインデックスシグナリングを省略してもよい。

Ｄ．コーディングユニットの横長と縦長の両方とも４以上である場合にのみＬＦＮＳＴインデックスを送信できる。

デュアルツリーである場合、該当成分（すなわち、ルマ又はクロマ成分）に対する横長と縦長が両方とも４以上である場合にのみＬＦＮＳＴインデックスをシグナリングすることができる。

シングルツリーである場合は、ルマ成分に対する横長さ縦長が両方とも４以上である場合に対してＬＦＮＳＴインデックスをシグナリングすることができる。

Ｅ．最後の０ではない係数の位置（ｌａｓｔｎｏｎ－ｚｅｒｏｃｏｅｆｆｉｃｉｅｎｔｐｏｓｉｔｉｏｎ）がＤＣ位置（ブロックの左上側位置）ではない場合、デュアルツリータイプのルマブロックであると、最終０ではない係数の位置がＤＣ位置でない場合はＬＦＮＳＴインデックスを送信する。デュアルツリータイプのクロマブロックであると、Ｃｂに対する最後の０ではない係数の位置とＣｒに対する最後の０ではない係数の位置のうち１つでもＤＣ位置でない場合は、該当ＬＮＦＳＴインデックスを送信する。

シングルツリータイプであると、ルマ成分、Ｃｂ成分、Ｃｒ成分のうち１つでも当該最後の０ではない係数の位置がＤＣ位置でない場合は、ＬＦＮＳＴインデックスを送信する。

ここで、１つの変換ブロックに対する変換係数の存在の可否を示すＣＢＦ（ｃｏｄｅｄｂｌｏｃｋｆｌａｇ）値が０であると、ＬＦＮＳＴインデックスシグナリングを行うか否かを判断するために、当該変換ブロックに対する最後の０ではない係数の位置をチェックしない。すなわち、当該ＣＢＦ値が０である場合、当該ブロックに変換が適用されないので、ＬＦＮＳＴインデックスシグナリングに対する条件をチェックするとき、最後の０ではない係数の位置を考慮しなくてもよい。

例えば、１）デュアルツリータイプで、ルマ成分である場合、当該ＣＢＦ値が０であると、ＬＦＮＳＴインデックスをシグナリングせず、２）デュアルツリータイプで、クロマ成分である場合、Ｃｂに対するＣＢＦ値が０であり、Ｃｒに対するＣＢＦ値が１であると、Ｃｒに対する最後の０ではない係数の位置のみをチェックして該当ＬＦＮＳＴインデックスを送信し、３）シングルツリータイプである場合は、ルマ、Ｃｂ、Ｃｒの全てに対して各ＣＢＦ値が１である成分に対してのみ最後の０ではない係数の位置をチェックする。

Ｆ．ＬＦＮＳＴ変換係数が存在できる場所ではない位置に変換係数が存在することが確認された場合、ＬＦＮＳＴインデックスシグナリングを省略することができる。４×４変換ブロックと８×８変換ブロックの場合は、ＶＶＣ標準においての変換係数スキャン順序に従ってＤＣ位置から８つの位置にＬＦＮＳＴ変換係数が存在し、残りの位置は全て０で充填される。また、４×４変換ブロックと８×８変換ブロックではない場合は、ＶＶＣ標準での変換係数スキャン順序に従ってＤＣ位置から１６個の位置にＬＦＮＳＴ変換係数が存在し、残りの位置は全て０で充填される。

従って、レジデュアルコーディング（ｒｅｓｉｄｕａｌｃｏｄｉｎｇ）を行った後、前記０値が充填されなければならない領域に０ではない変換係数が存在すると、ＬＦＮＳＴインデックスシグナリングを省略することができる。

一方、ＩＳＰモードは、ルマブロックである場合にのみ適用されるか、ルマブロックとクロマブロックの両方ともに適用されることもある。前述したように、ＩＳＰ予測が適用される場合、該当コーディングユニットは２つ又は４つのパーティションブロックに分割されて予測され、変換も該当パーティションブロックにそれぞれ適用される。従って、コーディングユニット単位でＬＦＮＳＴインデックスをシグナリングする条件を決定する時にも該当パーティションブロックにそれぞれＬＦＮＳＴが適用できるという事実を考慮しなければならない。また、ＩＳＰ予測モードが特定成分（例えば、ルマブロック）に対してのみ適用される場合は、当該成分に対してのみパーティションブロックに分割されるという事実を考慮してＬＦＮＳＴインデックスをシグナリングしなければならない。ＩＳＰモードである場合、可能なＬＦＮＳＴインデックスシグナリング方式を整理すると、以下のようである。

１．コーディングユニット（ＣＵ）毎に１回ずつＬＦＮＳＴインデックスを送信することができ、デュアルツリー（ｄｕａｌ－ｔｒｅｅ）である場合はルマブロックとクロマブロックに対してそれぞれ個別的なＬＦＮＳＴインデックスがシグナリングされることができる。

２．ＬＦＮＳＴインデックスがシグナリングされない場合は、ＬＦＮＳＴインデックス値はデフォルト値である０に決定される（ｉｎｆｅｒ）。ＬＦＮＳＴインデックス値が０と類推される場合は次のようである。

Ｂ．コーディングユニットのルマブロックに対する横長又は縦長が変換可能な最大ルマ変換のサイズを超過する場合、例えば、変換可能な最大ルマ変換のサイズが６４である場合、コーディングブロックのルマブロックに対するサイズが１２８×１６と同一である場合はＬＦＮＳＴが適用できない。

コーディングユニットの代わりにパーティションブロックのサイズを基準にＬＦＮＳＴインデックスのシグナリングを行うか否かを決定することもできる。すなわち、当該ルマブロックに対するパーティションブロックの横長又は縦長が変換可能な最大ルマ変換のサイズを超過する場合、ＬＦＮＳＴインデックスシグナリングを省略し、ＬＦＮＳＴインデックス値を０と類推できる。

デュアルツリーの場合、ルマ成分に対するコーディングユニット又はパーティションブロックとクロマ成分に対するコーディングユニット又はパーティションブロックのそれぞれに対して最大変換ブロックサイズを超過するか否かが判断される。すなわち、ルマに対するコーディングユニット又はパーティションブロックの縦長と横長をそれぞれ最大ルマ変換サイズと比較して１つでも最大ルマ変換サイズより大きい場合はＬＦＮＳＴを適用せず、クロマに対するコーディングユニット又はパーティションブロックの場合は、カラーフォーマットに対する対応ルマブロックの横／縦の長さと最大変換可能な最大ルマ変換のサイズが比較される。例えば、カラーフォーマットが４：２：０である場合には、対応ルマブロックの横／縦の長さはそれぞれ当該クロマブロックの２倍となり、対応ルマブロックの変換サイズは当該クロマブロックの２倍となる。また他の例として、カラーフォーマットが４：４：４である場合には、対応ルマブロックの横／縦の長さと変換サイズは対応するクロマブロックと同じである。

シングルツリーである場合、ルマブロック（コーディングユニット又はパーティションブロック）に対して横長又は縦長が変換可能な最大ルマ変換ブロックサイズを超過しているか否かをチェックした後、超過する場合はＬＦＮＳＴインデックスシグナリングを省略してもよい。

Ｃ．もし、現在のＶＶＣ標準に含まれているＬＦＮＳＴを適用すると、パーティションブロックの横長と縦長が両方とも４以上である場合にのみＬＦＮＳＴインデックスを送信することができる。

もし、現在ＶＶＣ標準に含まれているＬＦＮＳＴ以外に、２×Ｍ（１×Ｍ）又はＭ×２（Ｍ×１）ブロックに対するＬＦＮＳＴまで適用すると、パーティションブロックのサイズが２×Ｍ（１×Ｍ）又はＭ×２（Ｍ×１）ブロックより大きいか等しい場合にのみＬＦＮＳＴインデックスを送信することができる。ここで、Ｐ×ＱブロックがＲ×Ｓブロックより大きいか等しいという意味は、Ｐ≧Ｒであり、Ｑ≧Ｓであることを意味する。

整理すると、パーティションブロックがＬＦＮＳＴが適用可能な最小限のサイズより大きいか等しい場合にのみＬＦＮＳＴインデックスを送信することができる。デュアルツリーの場合、ルマ又はクロマ成分に対するパーティションブロックがＬＦＮＳＴが適用可能な最小限のサイズより大きい等しい場合にのみＬＦＮＳＴインデックスをシグナリングすることができる。シングルツリーの場合、ルマ成分に対するパーティションブロックがＬＦＮＳＴが適用可能な最小限のサイズより大きいか等しい場合にのみＬＦＮＳＴインデックスをシグナリングすることができる。

本文書において、Ｍ×ＮブロックがＫ×Ｌブロックより大きいか等しいことは、ＭがＫより大きいか等しく、ＮがＬより大きいか等しいことを意味する。Ｍ×ＮブロックがＫ×Ｌブロックより大きいということは、ＭがＫより大きいか等しく、ＮがＬより大きいか等しいながら、ＭがＫより大きいか、ＮがＬより大きいということを意味する。Ｍ×ＮブロックがＫ×Ｌブロックより小さいか等しいということは、ＭがＫより小さいか等しく、ＮがＬより小さいか等しいということを意味し、Ｍ×ＮブロックがＫ×Ｌブロックより小さいということはＭがＫより小さいか等しく、ＮがＬより小さかいか等しいながら、ＭがＫより小さいか、ＮがＬより小さいことを意味する。

Ｄ．最後の０ではない係数の位置（ｌａｓｔｎｏｎ－ｚｅｒｏｃｏｅｆｆｉｃｉｅｎｔｐｏｓｉｔｉｏｎ）がＤＣ位置（ブロックの左上端位置）でない場合、デュアルツリータイプのルマブロックであれば、全てのパーティションブロックのうち１つでも当該最後の０ではない係数の位置がＤＣ位置でなければ、ＬＦＮＳＴ送信することができる。デュアルツリータイプであり、クロマブロックであれば、Ｃｂに対する全てのパーティションブロックの（ＩＳＰモードがクロマ成分に適用されない場合には、パーティションブロックの数は１個であるとみなす）最後の０ではない係数の位置とＣｒに対する全てのパーティションブロックの（ＩＳＰモードがクロマ成分に適用されない場合には、パーティションブロックの数が１個であるとみなす）最後の０ではない係数の位置のうち１つでもＤＣ位置でなければ、当該ＬＮＦＳＴインデックスを送信することができる。

シングルツリータイプの場合、ルマ成分、Ｃｂの成分、Ｃｒ成分に対する全てのパーティションブロックのうち１つでも最後の０ではない係数の位置がＤＣ位置でないと、該当ＬＦＮＳＴインデックスを送信することができる。

ここで、各パーティションブロックに対して変換係数が存在するか否かを示すＣＢＦ（ｃｏｄｅｄｂｌｏｃｋｆｌａｇ）値が０であると、ＬＦＮＳＴインデックスシグナリングを行うか否かを判断するために、当該パーティションブロックに対する最後の０ではない係数の位置をチェックしない。すなわち、当該ＣＢＦ値が０であると、当該ブロックに変換が適用されないので、ＬＦＮＳＴインデックスシグナリングに関する条件をチェックするとき、当該パーティションブロックに対する最後の０ではない係数の位置を考慮しない。

例えば、１）デュアルツリータイプで、ルマ成分である場合、各パーティションブロックに対して該当ＣＢＦ値が０であると、ＬＦＮＳＴインデックスシグナリングを行うか否かを決定する時に該当パーティションブロックを除外し、２）デュアルツリータイプで、クロマ成分である場合、各パーティションブロックに対してＣｂに対するＣＢＦ値が０で、Ｃｒに対するＣＢＦ値が１であると、Ｃｒに対する最後の０ではない係数の位置のみをチェックして該当ＬＦＮＳＴインデックスシグナリングを行うか否かを決定し、３）シングルツリータイプである場合、ルマ成分、Ｃｂ成分、Ｃｒ成分の全てのパーティションブロックに対してＣＢＦ値が１であるブロックに対してのみ最後の０ではない係数の位置をチェックしてＬＦＮＳＴインデックスシグナリングを行うか否かを決定することができる。

ＩＳＰモードである場合は、最後の０ではない係数の位置をチェックしないように映像情報を構成してもよく、これに関する実施形態は次のようである。

ｉ．ＩＳＰモードである場合は、ルマブロックとクロマブロックの両方ともに対して最後の０ではない係数の位置に関するチェックを省略し、ＬＦＮＳＴインデックスシグナリングを許容する。すなわち、全てのパーティションブロックに対して最後の０ではない係数の位置がＤＣ位置であるか、該当ＣＢＦ値が０であっても、当該ＬＦＮＳＴインデックスシグナリングを許容する。

ｉｉ．ＩＳＰモードである場合は、ルマブロックに対してのみ最後の０ではない係数の位置に関するチェックを省略し、クロマブロックである場合は、前述の方式の最後の０ではない係数の位置に関するチェックを行う。例えば、デュアルツリータイプであり、ルマブロックである場合は、最後の０ではない係数の位置に関するチェックを行わずにＬＦＮＳＴインデックスシグナリングを許容し、デュアルツリータイプであり、クロマブロックである場合は、前述の方式で最後の０ではない係数の位置に対するＤＣ位置の存在可否をチェックして該当ＬＦＮＳＴインデックスのシグナリングを行うか否かを決定する。

ｉｉｉ．ＩＳＰモードであり、シングルツリータイプである場合は、前記ｉ番又はｉｉ番の方式を適用する。すなわち、ＩＳＰモードでありシングルツリータイプにｉ番を適用する場合、ルマブロックとクロマブロックの両方ともに対して最後の０ではない係数の位置に関するチェックを省略し、ＬＦＮＳＴインデックスシグナリングを許容する。または、ｉｉ番を適用してルマ成分に対するパーティションブロックに対しては最後の０ではない係数の位置に関するチェックを省略し、クロマ成分に対するパーティションブロック（クロマ成分に対してＩＳＰを適用しない場合はパーティションブロックの数が１であると見なす）に対しては前述の方式で最後の０ではない係数の位置に関するチェックを行って該当ＬＦＮＳＴインデックスシグナリングを行うか否かを決定することができる。

Ｅ．全てのパーティションブロックのうち１つのパーティションブロックに対してでもＬＦＮＳＴ変換係数が存在できる位置ではない位置に変換係数が存在することが確認されると、ＬＦＮＳＴインデックスシグナリングを省略することができる。

例えば、４×４パーティションブロックと８×８パーティションブロックの場合は、ＶＶＣ標準での変換係数スキャン順序に従ってＤＣ位置から８つの位置にＬＦＮＳＴ変換係数が存在し、残りの位置は全て０で充填される。また、４×４より大きいか等しいながら４×４パーティションブロック及び８×８パーティションブロックではない場合は、ＶＶＣ標準での変換係数スキャン順序に従ってＤＣ位置から１６個の位置にＬＦＮＳＴ変換係数が存在し、残りの位置は全て０で充填される。

一方、ＩＳＰモードである場合、現在ＶＶＣ標準においては水平方向と垂直方向に対してそれぞれ独立的に長さ条件を見てＭＴＳインデックスに対するシグナリングなしにＤＣＴ－２の代わりにＤＳＴ－７を適用する。縦長又は横長が４より大きいか等しく１６より小さいか等しい否かが判断され、判断結果に応じて１次変換カーネルが決定される。従って、ＩＳＰモードでありながらＬＦＮＳＴが適用できる場合に対しては次のような変換組み合わせ構成が可能である。

１．ＬＦＮＳＴインデックスが０である場合（ＬＦＮＳＴインデックスが０と類推される場合も含む）については、現在ＶＶＣ標準に含まれているＩＳＰであるときの１次変換の決定条件に従う。すなわち、水平方向と垂直方向に対してそれぞれ独立的に長さ条件（４より大きいか等しく１６より小さいか等しい条件）を満足するか否かをチェックして、満足する場合は１次変換のためにＤＣＴ－２の代わりにＤＳＴ－７を適用し、満足しない場合はＤＣＴ－２を適用する。

２．ＬＦＮＳＴインデックスが０より大きい場合については、１次変換で次のような２つの構成が可能である。

Ａ．水平方向と垂直方向の両方ともに対してＤＣＴ－２が適用できる。

Ｂ．現在ＶＶＣ標準に含まれているＩＳＰであるときの１次変換の決定条件に従うことができる。すなわち、水平方向と垂直方向に対してそれぞれ独立的に長さの条件（４より大きいか等しく１６より小さいか等しい条件）を満足するか否かをチェックして、満足する場合はＤＣＴ－２の代わりにＤＳＴ－７を適用し、満足しない場合はＤＣＴ－２を適用する。

ＩＳＰモードである場合、ＬＦＮＳＴインデックスはコーディングユニット毎に送信されるのではなく、パーティションブロック毎に送信するように映像情報を構成することができる。このような場合、前述のＬＦＮＳＴインデックスシグナリング方式においてＬＦＮＳＴインデックスが送信される単位内にパーティションブロックが１つだけ存在すると見なし、ＬＦＮＳＴインデックスシグナリングを行うか否かを決定することができる。

一方、以下ではＬＦＮＳＴインデックスとＭＴＳインデックスのシグナリングに対して説明する。

一例に係るＬＦＮＳＴインデックスとＭＴＳインデックスのシグナリングに関連したコーディングユニットシンタックステーブル、変換ユニットシンタックステーブル、及びレジデュアルコーディングシンタックステーブルは、以下の表の通りである。表３によると、ＭＴＳインデックスは、変換ユニットレベルからコーディングユニットレベルのシンタックスに移動し、ＬＦＮＳＴインデックスシグナリング以後にシグナリングされる。また、コーディングユニットにＩＳＰが適用される場合、ＬＦＮＳＴを許容しない制限条件が除去された。コーディングユニットにＩＳＰが適用される場合、ＬＦＮＳＴを許容しない制限条件が除去されるため、ＬＦＮＳＴを全てのイントラ予測ブロックに適用できる。また、ＭＴＳインデックス及びＬＦＮＳＴインデックスの両方ともコーディングユニットレベルの最後の部分に条件付きでシグナリングされる。

前記表の主要変数の意味は、下記の通りである。

１．ｃｂＷｉｄｔｈ、ｃｂＨｅｉｇｈｔ：現在コーディングブロック（ＣｏｄｉｎｇＢｌｏｃｋ）の幅と高さ

２．ｌｏｇ２ＴｂＷｉｄｔｈ、ｌｏｇ２ＴｂＨｅｉｇｈｔ：現在変換ブロック（ＴｒａｎｓｆｏｒｍＢｌｏｃｋ）の幅と高さに対するベース－２のログ値、ゼロアウトが反映されて０ではない係数（ｎｏｎ－ｚｅｒｏｃｏｅｆｆｉｃｉｅｎｔ）が存在できる左上端領域に縮小されることができる。

３．ｓｐｓ＿ｌｆｎｓｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ：ＬＦＮＳＴの適用可能（ｅｎａｂｌｅ）可否を示すフラグであって、フラグ値が０である場合は、ＬＦＮＳＴが適用不可であることを示し、フラグ値が１である場合は、ＬＦＮＳＴが適用可能であることを示す。シーケンスパラメータセット（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ；ＳＰＳ）に定義されている。

４．ＣｕＰｒｅｄＭｏｄｅ［ｃｈＴｙｐｅ］［ｘ０］［ｙ０］：変数ｃｈＴｙｐｅと（ｘ０、ｙ０）位置に対応される予測モード、ｃｈＴｙｐｅは０と１値を有することができ、０はルマ成分を示し、１はクロマ成分を示す。（ｘ０、ｙ０）位置は、ピクチャ上での位置を示し、ＣｕＰｒｅｄＭｏｄｅ［ｃｈＴｙｐｅ］［ｘ０］［ｙ０］値ではＭＯＤＥ＿ＩＮＴＲＡ（イントラ予測）とＭＯＤＥ＿ＩＮＴＥＲ（インター予測）が可能である。

５．ＩｎｔｒａＳｕｂＰａｒｔｉｔｉｏｎｓＳｐｌｉｔ［ｘ０］［ｙ０］：（ｘ０、ｙ０）位置に対する内容は、前記４と同じである。（ｘ０、ｙ０）位置でのどのようなＩＳＰ分割が適用されたかを示し、ＩＳＰ＿ＮＯ＿ＳＰＬＩＴは、（ｘ０、ｙ０）位置に該当するコーディングユニットがパーティションブロックに分割されないことを示す。

６．ｉｎｔｒａ＿ｍｉｐ＿ｆｌａｇ［ｘ０］［ｙ０］：（ｘ０、ｙ０）位置に対する内容は、前記４と同じである。ｉｎｔｒａ＿ｍｉｐ＿ｆｌａｇは、ＭＩＰ（Ｍａｔｒｉｘ－ｂａｓｅｄＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ）予測モードが適用されたかどうかを示すフラグである。フラグ値が０である場合は、ＭＩＰが適用不可であることを示し、フラグ値が１である場合は、ＭＩＰが適用されることを示す。

７．ｃＩｄｘ：０値は、ルマを示し、１値と２値は、各々、クロマ成分であるＣｂ、Ｃｒを示す。

８．ｔｒｅｅＴｙｐｅ：シングルツリー（ｓｉｎｇｌｅ－ｔｒｅｅ）とデュアルツリー（ｄｕａｌ－ｔｒｅｅ）などを指す（ＳＩＮＧＬＥ＿ＴＲＥＥ：シングルツリー、ＤＵＡＬ＿ＴＲＥＥ＿ＬＵＭＡ：ルマ成分に対するデュアルツリー、ＤＵＡＬ＿ＴＲＥＥ＿ＣＨＲＯＭＡ：クロマ成分に対するデュアルツリー）

９．ｌａｓｔＳｕｂＢｌｏｃｋ：最後の有効係数（ｌａｓｔｎｏｎ－ｚｅｒｏｃｏｅｆｆｉｃｉｅｎｔ）が位置するサブブロック（ｓｕｂ－ｂｌｏｃｋ、ＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ（ＣＧ））のスキャン順序上の位置を示す。０は、ＤＣ成分が含まれているサブブロックを指し、０より大きい場合は、ＤＣ成分が含まれているサブブロックでない。

１０．ｌａｓｔＳｃａｎＰｏｓ：最後の有効係数が一サブブロック内部でスキャン順序上どの位置にあるかを示す。一つのサブブロックが１６個の位置で構成されている場合、０から１５までの値が可能である。

１１．ｌｆｎｓｔ＿ｉｄｘ［ｘ０］［ｙ０］：パーシングしようとするＬＦＮＳＴインデックスシンタックスエレメントである。パーシングされない場合、０値と類推される。即ち、デフォルト値が０に設定され、ＬＦＮＳＴを適用しないことを示す。

１２．ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸ、ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹ：最後の有効係数が変換ブロック内に位置するｘ座標とｙ座標を示す。ｘ座標は、０から始めて左側から右側へ増加し、ｙ座標は０から始めて上側から下側に増加する。二つの変数の値が全て０である場合は、最後の有効係数がＤＣに位置することを意味する。

１３．ｃｕ＿ｓｂｔ＿ｆｌａｇ：現在ＶＶＣ標準に含まれているサブブロック変換（ＳｕｂＢｌｏｃｋＴｒａｎｓｆｏｒｍ、ＳＢＴ）が適用可能かどうかを示すフラグであって、フラグ値が０である場合は、ＳＢＴが適用不可であることを示し、フラグ値が１である場合は、ＳＢＴが適用されることを示す。

１４．ｓｐｓ＿ｅｘｐｌｉｃｉｔ＿ｍｔｓ＿ｉｎｔｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｓｐｓ＿ｅｘｐｌｉｃｉｔ＿ｍｔｓ＿ｉｎｔｒａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ：各々インターＣＵとイントラＣＵに対して明示的なＭＴＳが適用されたかどうかを示すフラグであって、該当フラグ値が０である場合は、インターＣＵまたはイントラＣＵに対してＭＴＳが適用不可であることを示し、１である場合は、適用可能であることを示す。

１５．ｔｕ＿ｍｔｓ＿ｉｄｘ［ｘ０］［ｙ０］：パーシングしようとするＭＴＳインデックスシンタックスエレメントである。パーシングされない場合、０値と類推される。即ち、デフォルト値が０に設定され、水平方向と垂直方向に対して全てＤＣＴ－２が適用されることを示す。

表３に示すように、ｍｔｓ＿ｉｄｘ［ｘ０］［ｙ０］をコーディングするとき、様々な条件がチェックされ、ｌｆｎｓｔ＿ｉｄｘ［ｘ０］［ｙ０］値が０である場合にのみｔｕ＿ｍｔｓ＿ｉｄｘ［ｘ０］［ｙ０］がシグナリングされる。

また、ｔｕ＿ｃｂｆ＿ｌｕｍａ［ｘ０］［ｙ０］は、ルマ成分に対して有効係数が存在するかどうかを示すフラグである。

表３によると、ルマ成分に対するコーディングユニットの幅と高さが両方とも３２以下であるとき、ｍｔｓ＿ｉｄｘ［ｘ０］［ｙ０］がシグナリングされ（Ｍａｘ（ｃｂＷｉｄｔｈ、ｃｂＨｅｉｇｈｔ）<＝３２）、即ち、ＭＴＳ適用可否がルマ成分に対するコーディングユニットの幅と高さにより決定される。

また、表３によると、ＩＳＰモードの場合にも（ＩｎｔｒａＳｕｂＰａｒｔｉｔｉｏｎｓＳｐｌｉｔＴｙｐｅ！＝ＩＳＰ＿ＮＯ＿ＳＰＬＩＴ）ｌｆｎｓｔ＿ｉｄｘ［ｘ０］［ｙ０］をシグナリングするように構成でき、全てのＩＳＰパーティションブロックに対して同じＬＦＮＳＴインデックス値が適用されることができる。

一方、ｍｔｓ＿ｉｄｘ［ｘ０］［ｙ０］は、ＩＳＰモードでない場合にのみシグナリングされることができる（ＩｎｔｒａＳｕｂＰａｒｔｉｔｉｏｎｓＳｐｌｉｔ［ｘ０］［ｙ０］＝＝ＩＳＰ＿ＮＯ＿ＳＰＬＩＴ）。

表５のようにｌｏｇ２ＺｏＴｂＷｉｄｔｈとｌｏｇ２ＺｏＴｂＨｅｉｇｈｔを決定する過程で（ここで、ｌｏｇ２ＺｏＴｂＷｉｄｔｈとｌｏｇ２ＺｏＴｂＨｅｉｇｈｔは、各々、ゼロアウトが実行された後に残った左上端領域に対する幅と高さのベース－２（ｂａｓｅ－２）ログ値を示す）ｍｔｓ＿ｉｄｘ［ｘ０］［ｙ０］値をチェックする部分が省略されることができる。

また、一例によってレジデュアルコーディングでｌｏｇ２ＺｏＴｂＷｉｄｔｈとｌｏｇ２ＺｏＴｂＨｅｉｇｈｔを決定するとき、ｓｐｓ＿ｍｔｓ＿ｅｎａｂｌｅ＿ｆｌａｇをチェックする条件が追加されることができる。

表３の変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、ＬＦＮＳＴが適用されるとき、ゼロアウトになる位置に有効係数が存在する場合は０であり、そうでない場合は１になる。変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、表５に示す様々な条件によって設定されることができる。

一例によって、表３の変数ＬｆｎｓｔＤｃＯｎｌｙは、該当ＣＢＦ（ＣｏｄｅｄＢｌｏｃｋＦｌａｇ、該当ブロック内に有効係数が一つでも存在する場合は１、そうでない場合は０）値が１である変換ブロックに対して最後の有効係数が全てＤＣ位置（左上端位置）に位置する場合は１になり、そうでない場合は０になる。より具体的に、デュアルツリールマである場合には最後の有効係数の位置をルマ変換ブロック一つに対してチェックし、デュアルツリークロマである場合にはＣｂに対する変換ブロックとＣｒに対する変換ブロックの両方ともに対して最後の有効係数位置をチェックする。シングルツリーである場合にはルマ、Ｃｂ、Ｃｒに対する変換ブロックに対して最後の有効係数位置をチェックすることができる。

表３において、ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、最初に１に設定され、この値は、表５のレジデュアルコーディングで変更されることができる。変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、ゼロアウトによって０で満たされるべき領域（ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸ>１５||ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹ>１５）に有効係数が存在すると、その値が１から０へ変更され、この場合、表３のように、ＭＴＳインデックスはシグナリングされない。

一方、表３のように、ｔｕ＿ｃｂｆ＿ｌｕｍａ［ｘ０］［ｙ０］が０である場合にはｍｔｓ＿ｉｄｘ［ｘ０］［ｙ０］コーディングを省略することができる。即ち、ルマ成分のＣＢＦ値が０である場合は、変換を適用しないため、ＭＴＳインデックスをシグナリングする必要がなくて、ＭＴＳインデックスコーディングを省略することができる。

一例によって、前記技術的特徴は、他の条件付き構文で具現されることができる。例えば、ＭＴＳが実行された後、現在ブロックのＤＣ領域を除外した領域に有効係数が存在するかどうかを示す変数を導出することができ、前記変数がＤＣ領域を除外した領域に有効係数が存在することを示す場合、ＭＴＳインデックスをシグナリングすることができる。即ち、現在ブロックのＤＣ領域を除外した領域に有効係数が存在するということは、ｔｕ＿ｃｂｆ＿ｌｕｍａ［ｘ０］［ｙ０］値が１であることを示し、この場合、ＭＴＳインデックスをシグナリングすることができる。

前記変数は、ＭｔｓＤｃＯｎｌｙで表すことができ、変数ＭｔｓＤｃＯｎｌｙは、コーディングユニットレベルで最初に１に設定された後、レジデュアルコーディングレベルで現在ブロックのＤＣ領域を除外した領域に有効係数が存在することを示す場合、その値が０に変更されることができる。変数ＭｔｓＤｃＯｎｌｙが０である場合、ＭＴＳインデックスがシグナリングされるように映像情報が構成されることができる。

もし、ｔｕ＿ｃｂｆ＿ｌｕｍａ［ｘ０］［ｙ０］が０である場合は、表４の変換ユニットレベルでレジデュアルコーディングシンタックスの呼び出しが行われないため、変数ＭｔｓＤｃＯｎｌｙは、初期値１を維持するようになる。このような場合、変数ＭｔｓＤｃＯｎｌｙが０に変更されなかったため、ＭＴＳインデックスがシグナリングされないように映像情報が構成されることができる。即ち、ＭＴＳインデックスは、パーシング及びシグナリングされない。

一方、デコーディング装置は、表５の変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇを導出するために変換係数のカラーインデックス（ｃＩｄｘ）を判断することができる。カラーインデックス（ｃＩｄｘ）が０であることは、ルマ成分を意味する。

一例によって、現在ブロックのルマ成分にのみＭＴＳが適用されることができるため、デコーディング装置は、ＭＴＳインデックスのパーシング可否を決定する変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇを導出する時、カラーインデックスがルマであるかどうかを判断することができる。

変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、ＭＴＳ適用時にゼロアウトが実行されたかどうかを示す変数であって、ＭＴＳ実行後にゼロアウトにより最後の有効係数が存在できる左上端領域、即ち、左上端１６×１６領域以外の領域に変換係数が存在するかどうかを示す。変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、表３のようにコーディングユニットレベルで最初に１に設定され（ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ＝１）、１６×１６領域以外の領域に変換係数が存在すると、表５のようにレジデュアルコーディングレベルでその値が１から０へ変更されることができる（ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ＝０）。変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇの値が０である場合、ＭＴＳインデックスはシグナリングされない。

表５のように、レジデュアルコーディングレベルで、ＭＴＳに伴われるゼロアウトが実行されたかどうかによって０でない変換係数が存在できるノンゼロアウト領域が設定されることができ、この場合にも、カラーインデックス（ｃＩｄｘ）が０である場合、ノンゼロアウト領域は、現在ブロックの左上端１６×１６領域に設定されることができる。

このように、ＭＴＳインデックスのパーシング可否を決定する変数を導出する時は、カラー成分がルマであるかまたはクロマであるかを判断するが、現在ブロックのルマ成分またはクロマ成分の両方ともにＬＦＮＳＴが適用されることができるため、ＬＦＮＳＴインデックスのパーシング可否を決定する変数を導出する時はカラー成分を判断しない。

例えば、表３にはＬＦＮＳＴ適用時にゼロアウトが実行されたことを示すことができる変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇが示されている。変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、現在ブロックの左上端第１の領域を除外した第２の領域に有効係数が存在するかどうかを示し、この値は、最初に１に設定され、第２の領域に有効係数が存在すると、その値は、０に変更されることができる。最初設定された変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値が１に維持されてこそＬＦＮＳＴインデックスがパーシングされることができる。変数ＬｆｎｓｔＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値が１であるかどうかを判断及び導出する時、現在ブロックのルマ成分またはクロマ成分の両方ともにＬＦＮＳＴが適用されることができるため、現在ブロックのカラーインデックスは判断されない。

表３のように、コーディングユニット毎にＭＴＳインデックスがシグナリングされており、ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇが１である時のみｍｔｓ＿ｉｄｘ（ＭＴＳインデックス）をシグナリングするようになっている。

また、表５に示すように、ＭｔｓＺｅｒｏＯｕｔＣｏｅｆｆＦｌａｇ値は、レジデュアルコーディングレベルで特定条件（ｉｆ（（ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸ>１５||ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹ>１５）＆＆ｃＩｄｘ＝＝０））によって決定されることができる。

ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値は、最後の０でない係数に対するＸ座標（ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸ）値が１５より大きいまたは最後の０でない係数に対するＹ座標（ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹ）値が１５より大きい場合、０に設定される（ここで、Ｘ座標値は、該当変換ブロック内で左側から右側へ増加し、Ｙ座標値は、該当変換ブロック内で上側から下側へ増加する。該当変換ブロックの左上端位置は（０、０）である。

ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、表３で１に初期化されたため、表５で提示された条件を満たしてＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値が０に設定されない場合、１値がそのまま維持される。

水平方向に適用される１次変換（ｐｒｉｍａｒｙｔｒａｎｓｆｏｒｍ）をＡ、垂直方向に適用される１次変換をＢとするとき、１次変換は（Ａ、Ｂ）で表示されることができる。現在ＶＶＣ標準で、（ＤＳＴ－７、ＤＳＴ－７）、（ＤＳＴ－７、ＤＣＴ－８）、（ＤＣＴ－８、ＤＳＴ－７）、（ＤＣＴ－８、ＤＣＴ－８）である場合、該当変換ブロックの左上端１６×１６領域にのみ変換係数が存在するように制限している。したがって、表５の（ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸ>１５||ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹ>１５）条件は、最後の０でない係数が左上端１６×１６領域の外側に位置することを示す。表５において、変数ｃＩｄｘはカラー成分を示し、変数ｃＩｄｘ値が０である場合はルマ成分であることを意味する。

現在ＶＶＣ標準ではＭＴＳインデックス（ｍｔｓ＿ｉｄｘ）は、レジデュアルコーディングに対するパーシング以後にパーシングされる。より具体的に、表３は、コーディングユニットに対するシンタックスパーシング関数であるコーディングユニットであり、変換ツリー関数以後にＭＴＳインデックスがパーシングされ、変換ツリー関数内でレジデュアルコーディングパーシングを実行する関数が呼び出される。したがって、ＭＴＳインデックスは、レジデュアルに対するパーシング以後にパーシングされ（表５に示すレジデュアルパーシング関数が該当レジデュアルコーディングに対するパーシングを担当する）、レジデュアルコーディングが進行される間にデコーディング観点で見ると、ＭＴＳインデックス情報を知らないため、どのような１次変換が適用されるかを知ることができない。ただし、ＭＴＳが適用可能（ｅｎａｂｌｅ）であり、ＳＢＴまたはＩＳＰが適用される場合または暗黙的（ｉｍｐｌｉｃｉｔ）ＭＴＳが適用される場合には、ＭＴＳが暗黙的に適用されるため、レジデュアルコーディングに対するパーシング前に該当１次変換に対して知ることができる。

表５のような条件チェックが必要な理由は、現在ＶＶＣ標準で３２長さＤＳＴ－７または３２長さＤＣＴ－８の場合、順方向変換を適用したとき、１６個の変換係数のみを出力するように制限しているためである。例えば、ＭＴＳインデックス値が０より大きくて適用される１次変換が（ＤＳＴ－７、ＤＳＴ－７）、（ＤＳＴ－７、ＤＣＴ－８）、（ＤＣＴ－８、ＤＳＴ－７）、（ＤＣＴ－８、ＤＣＴ－８）のうち一つであることを指す場合、該当変換ブロックの左上端１６×１６領域にのみ０でない変換係数が存在できるようになる。

したがって、最後の０でない変換係数の位置が左上端１６×１６領域の外側である場合は、ＭＴＳインデックス値が０である場合に該当するため、表３のようにＭＴＳインデックスに対するシグナリングを省略することができる。しかしながら、最後の０でない変換係数の位置が左上端１６×１６領域の内部であるとしても、左上端１６×１６領域の外側に０でない係数が存在できるため、該当場合に対してはＭＴＳインデックス値が０である場合にも、ＭＴＳインデックスを０でシグナリングする状況が発生することができ、該当場合に対して説明すると、下記の通りである。

１次変換が（ＤＣＴ－２、ＤＣＴ－２）である場合、０でない最後の係数の位置が左上端１６×１６領域に存在すると同時に、左上端１６×１６外側にも０でない変換係数が存在できる。これは変換ブロック内でのスキャン順序上左上端１６×１６領域の外側、即ち、左上端１６×１６領域以外の領域をスキャンして、かつ左上端１６×１６領域をスキャンすることもでき、それに対して、左上端１６×１６領域をスキャンして、かつ左上端１６×１６領域の外側をスキャンすることができるためである。

図１２は、本文書の一例に係る３２×３２変換ブロックのスキャンを説明するための図であり、より具体的に、３２×３２変換ブロックが４×４係数グループ（ｃｏｅｆｆｉｃｉｅｎｔｇｒｏｕｐ、ＣＧ）に分けられてスキャンされることを示している。本文書ではＣＧに分けられてスキャンされるとき、該当ＣＧを“スキャンサブブロック”とも呼ばれる。

各ＣＧ毎に表示された数字は、順方向スキャン順序を示し、デコーディング装置では最後の０でない変換係数が存在する位置から逆方向スキャン順序によってスキャンされる。図１２では２５番ＣＧに最後の０でない変換係数が存在すると仮定することができ、該当２５番ＣＧは、左上端１６×１６領域内に存在する。

図１２のように２５番ＣＧに最後の０でない変換係数が存在する場合、デコーディング装置では逆方向スキャン順序によって最後の０でない変換係数が存在するＣＧからスキャンするため、図１２に表記された数字を基準にして、２５、２４、２３、...、３、２、１の順序によってＣＧをスキャンするようになる。２４、２３、２２、２１、２０、１７、１６、１５、１１番ＣＧは、左上端１６×１６領域の外側に位置しているため、表５のようにＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸとＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹが左上端１６×１６領域に該当するかをチェックすることだけでは、左上端１６×１６領域にのみ０でない係数が存在するかどうかを知ることができない。

したがって、レジデュアルコーディングに対するパーシングを実行するとき、０でない変換係数をスキャンする度に該当４×４係数グループが左上端１６×１６領域に属するかどうかをチェックすると、左上端１６×１６領域の外側に０でない係数が存在する場合に対してのみＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値を０に設定できる。これを反映したレジデュアルコーディングシンタックスは、以下の表の通りである。

表６のように０でない変換係数が発見される度に左上端１６×１６領域に位置するかをチェックして（ｉｆ（（ｘＣ>１５||ｙＣ>１５）＆＆ｃＩｄｘ＝＝０））ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値を０に設定するように構成できる。このとき、変換係数の存在可否を示すフラグ情報であるｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ［ｘＣ］［ｙＣ］値が１である場合に前記条件をチェックし（ｉｆ（ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ［ｘＣ］［ｙＣ］））、ｘＣとｙＣは、各々、現在変換ブロック内部でのサンプル単位Ｘ座標とＹ座標を指す。該当変換ブロックの左上端位置は（０、０）である。

表６には表５で提示した条件チェックとＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ更新部分（ｉｆ（（ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸ>１５||ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹ>１５）＆＆ｃＩｄｘ＝＝０）ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ＝０）が含まれている。もし、最後の０でない変換係数に対するｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ［ｘＣ］［ｙＣ］値が１と類推される場合、表６での該当条件チェックとＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ更新部分を除去することもできる。

整理すると、表６のようなシンタックス構成を介して、表３でＭＴＳインデックスをシグナリングする時は、どのような１次変換が適用されたかにかかわらず、ルマ変換ブロックの左上端１６×１６領域に０でない変換係数が存在する場合にのみＭＴＳインデックスをシグナリングするようになる。ＭＴＳインデックスがシグナリングされない場合、該当値は０と類推、即ち、（ＤＣＴ－２、ＤＣＴ－２）が適用される。

前述したように、ＭＴＳインデックスがシグナリングされる前に適用される１次変換を知ることができる場合は、下記の三つである。

１）サブブロック変換（ＳｕｂｂｌｏｃｋＴｒａｎｓｆｏｒｍ、ＳＢＴ）が適用される場合

２）イントラサブパーティション（ＩｎｔｒａＳｕｂ－Ｐａｒｔｉｔｉｏｎｓ、ＩＳＰ）が適用される場合

３）暗黙的ＭＴＳが適用される場合

（１）の場合、表３でＳＢＴ適用可否を指すｃｕ＿ｓｂｔ＿ｆｌａｇ値が０である場合にのみＭＴＳインデックスをシグナリングするように構成されているため、即ち、ＳＢＴが適用されない場合にのみＭＴＳインデックスがシグナリングされるため、ＳＢＴが適用される場合は、表６の修正と関係がない。

（２）の場合も、表３でＩＳＰが適用されない場合にのみＭＴＳインデックスがシグナリングされるため（表３でＭＴＳインデックスをシグナリングするとき、ＩｎｔｒａＳｕｂＰａｒｔｉｔｉｏｎｓＳｐｌｉｔ［ｘ０］［ｙ０］＝＝ＩＳＰ＿ＮＯ＿ＳＰＬＩＴ条件をチェックすることに該当）、ＩＳＰが適用される場合も表６の修正と関係がない。

（３）の場合に対しても、表３で明示的（ｅｘｐｌｉｃｉｔ）ＭＴＳが適用可能な（ｅｎａｂｌｅ）場合に対してのみＭＴＳインデックスをシグナリングするため、暗黙的ＭＴＳが適用される場合も表６の修正と関係がない。即ち、イントラ予測により生成される残差ブロックに適用されるＭＴＳ（イントラＭＴＳ）の場合は、ｓｐｓ＿ｅｘｐｌｉｃｉｔ＿ｍｔｓ＿ｉｎｔｒａ＿ｅｎａｂｌｅｄ＿ｆｌａｇ値が１であり、インター予測により生成される残差ブロックに適用されるＭＴＳ（インターＭＴＳ）の場合は、ｓｐｓ＿ｅｘｐｌｉｃｉｔ＿ｍｔｓ＿ｉｎｔｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ値が１である場合にのみ、ＭＴＳインデックスがシグナリングされるため、表６の修正は、暗黙的ＭＴＳが適用される場合に影響を与えない。

一方、他の例によって、以下の表のようにＣＧ単位で０でない係数が左上端１６×１６領域の外側に存在するかどうかをチェックすることができる。

表７のｘＳとｙＳは、現在の変換ブロック内部の各ＣＧ単位でのＸ座標位置とＹ座標位置を示し、変換係数が左上端１６×１６外側に位置するかを確認するために、ｘＳとｙＳをサンプル単位の座標に変換する必要がある。即ち、ｘＳとｙＳは、（ｘＳ<<ｌｏｇ２ＳｂＷ）、（ｙＳ<<ｌｏｇ２ＳｂＨ）のようにサンプル単位座標に変換される。このとき、ｌｏｇ２ＳｂＷとｌｏｇ２ＳｂＨは、各々、該当ＣＧの幅と高さに対するベース－２ログ値であり、Ｘ座標は左側から右側へ増加し、Ｙ座標は上側から下側へ増加する。該当変換ブロックの左上端位置に対する座標は（０、０）である。

表７に示すようにＣＧ単位でスキャンするとき、各ＣＧに対して該当ＣＧ内部に０でない変換係数が存在し（ｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇ［ｘＳ］［ｙＳ］値が１である場合）、該当ＣＧが該当変換ブロックの左上端１６×１６領域の外側に位置することが確認されると（（ｘＳ<<ｌｏｇ２ＳｂＷ）>１５||（ｙＳ<<ｌｏｇ２ＳｂＨ）>１５））、ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値は、０に設定される。

表３に示すように、変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値は１に初期化されるため、ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ値が０に設定されない場合は１値に維持される。もし、最後の０でない変換係数が属するＣＧのｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇ［ｘＳ］［ｙＳ］値が１と類推される場合、表７で表５での該当条件チェック部分とＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ更新部分（ｉｆ（（ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＸ>１５||ＬａｓｔＳｉｇｎｉｆｉｃａｎｔＣｏｅｆｆＹ>１５）＆＆ｃＩｄｘ＝＝０）ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇ＝０）を除去することもできる。

以下の図面は、本明細書の具体的な一例を説明するために作成された。図面に記載された具体的な装置の名称や具体的な信号／メッセージ／フィールドの名称は、例示的に提示されたものであるため、本明細書の技術的特徴が以下の図面に使われた具体的な名称に制限されない。

図１３は、本文書の一実施例に係るビデオデコーディング装置の動作を示す流れ図である。

図１３に開示された各ステップは、図１乃至図１２で詳述した内容のうち一部に基づいている。したがって、図１乃至図１２で詳述した内容と重複する具体的な内容は、説明を省略または簡単にする。

一実施例に係るデコーディング装置２００は、レジデュアル情報を含むビットストリームを受信し、ビットストリームから現在ブロック、即ち、変換対象になる変換ブロックに対するレジデュアル情報、例えば、量子化された変換係数を導出することができる（Ｓ１３１０）。

より具体的に、デコーディング装置２００は、ビットストリームから現在ブロックに対する量子化された変換係数に関する情報をデコーディングすることができ、現在ブロックに対する量子化された変換係数に関する情報に基づいて対象ブロックに対する量子化された変換係数を導出することができる。対象ブロックに対する量子化された変換係数に関する情報は、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）またはスライスヘッダ（ｓｌｉｃｅｈｅａｄｅｒ）に含まれることができ、簡素化変換（ＲＳＴ）が適用されるかどうかに対する情報、簡素化ファクターに関する情報、簡素化変換を適用する最小変換サイズに対する情報、簡素化変換を適用する最大変換サイズに対する情報、簡素化逆変換サイズ、変換セットに含まれている変換カーネルマトリクスのうちいずれか一つを指示する変換インデックスに対する情報のうち少なくとも一つを含むことができる。

デコーディング装置２００は、レジデュアル情報に基づいて現在ブロック内の最後の有効係数の位置及び現在ブロックに対する変換係数を導出することができる（Ｓ１３２０）。デコーディング装置２００は、現在ブロックに対する量子化された変換係数に対して逆量子化を実行して変換係数を導出することができる。

導出された変換係数は、現在ブロックに２次元配列されることができ、デコーディング装置は、このようなレジデュアルコーディングを介して現在ブロックで０でないデータ、即ち、０でない有効係数に対する情報を導出することができる。即ち、デコーディング装置は、現在ブロックで０でない有効係数の最後の位置情報を把握することができる。

Ｓ１３２０のレジデュアル情報に基づいて導出された変換係数は、前記のように逆量子化された変換係数であってもよく、量子化された変換係数であってもよい。即ち、変換係数は、量子化可否にかかわらず、現在ブロックで０でないデータであるかどうか及び有効係数の位置を把握することができるデータであればよい。

デコーディング装置は、変換係数にＬＦＮＳＴを適用して修正された変換係数を導出することもあり、ＬＦＮＳＴを実行しないこともある。

デコーディング装置は、変換係数または修正された変換係数を逆１次変換してレジデュアルサンプルを導出することができる。デコーディング装置は、逆１次変換のために通常的なＤＣＴ－２を変換カーネルとして使用することもでき、詳述されたＭＴＳを適用することもできる。

ＭＴＳは、暗黙的に実行されることもでき、明示的なＭＴＳインデックスのシグナリングに基づいて実行されることもできる。

デコーディング装置は、ＭＴＳインデックスをパーシングするために所定の条件をチェックすることができる。

一例によって、デコーディング装置は、スキャンサブブロック内に存在する有効係数が現在ブロックの左上端第１の領域を除外した第２の領域に存在するかどうかを判断することができる（Ｓ１３３０）。

このために、デコーディング装置は、現在ブロックの左上端第１の領域を除外した第２の領域に有効係数が存在するかどうかを示すフラグ情報を導出することができる。このとき、フラグ情報は、有効係数がスキャンされるスキャンサブブロック単位で有効係数が第２の領域に存在するかどうかを判断することによって導出されることができる。

一例によると、逆１次変換としてＭＴＳが適用される場合、デコーディング装置は、変換の対象になる現在ブロックの左上端第１の領域の変換係数を対象にして逆１次変換を実行することができる。即ち、現在ブロックの左上端第１の領域を除外した第２の領域は、ゼロアウトされて変換係数が存在しない。

一例によって、ＭＴＳが適用される場合、第１の領域は、現在ブロックの左上端１６×１６領域であり、この場合、第２の領域は、左上端１６×１６以外の領域を示すことができる。

スキャンサブブロックは、４×４ブロックであり、スキャンサブブロックは、図１２のように、現在ブロック内の前記最後の有効係数の位置から逆対角スキャン方向によってスキャンされることができる。

ゼロアウトされた領域に有効係数が存在するかどうかを判断した後、ＭＴＳインデックスをパーシングするために、デコーディング装置は、第２の領域に有効係数が存在するかどうかを示すフラグ情報を導出し、これに基づいてＭＴＳインデックスをパーシングすることができる。

このようなフラグ情報は、変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇであり、有効係数がスキャンされるスキャンサブブロック単位で有効係数が第２の領域に存在するかどうかが判断されることができる。

変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、表７のようにスキャンサブブロック内に有効係数が存在するかどうかを示すフラグ（ｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇまたはｓｂ＿ｃｏｄｅｄ＿ｆｌａｇ）値が１であり、スキャンサブブロック内に存在する有効係数が第２の領域に位置する場合（（（ｘＳ<<ｌｏｇ２ＳｂＷ）>１５||（ｙＳ<<ｌｏｇ２ＳｂＨ）>１５））、第２の領域に前記有効係数が存在することを指示することができる。

または、表６のように変換係数をスキャンする度に４×４スキャンサブブロックが第１の領域に属するかどうかをチェックすることによって、変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇが導出されることができる。即ち、スキャンサブブロック内に有効係数が存在するかどうかを示すフラグ（ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ）値が１であり、スキャンサブブロック内に存在する有効係数が第２の領域に位置する場合（ｉｆ（（ｘＣ>１５||ｙＣ>１５））、変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、第２の領域に有効係数が存在することを指示することができる。

または、変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、有効係数が存在するかどうかを示すフラグ値が１であり、スキャンサブブロック自体が第２の領域に位置する場合、第２の領域に有効係数が存在することを指示することもできる。

このような変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、最初１に設定されることができ、有効係数が第２の領域に位置しない場合、１に維持され、有効係数が第２の領域に位置する場合、０に変更されることができる。

デコーディング装置は、第２の領域に有効係数が存在しないことに基づいてビットストリームからＭＴＳインデックスをパーシングすることができる（Ｓ１３４０）。

即ち、最初１に設定された変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇがその値を維持するとき、ＭＴＳインデックスがパーシングされることができる。

この後、デコーディング装置は、ＭＴＳインデックスに基づいて導出された変換カーネルを第１の領域の変換係数に適用して現在ブロックに対するレジデュアルサンプルを導出することができる（Ｓ１３５０）。

次に、デコーディング装置２００は、現在ブロックに対するレジデュアルサンプル及び現在ブロックに対する予測サンプルに基づいて復元サンプルを生成することができる。

図１４は、本文書の一実施例に係るビデオエンコーディング装置の動作を示す流れ図である。

図１４に開示された各ステップは、図１乃至図１２で詳述した内容のうち一部に基づいている。したがって、図１乃至図１２で詳述した内容と重複する具体的な内容は、説明を省略または簡単にする。

一実施例に係るエンコーディング装置１００は、現在ブロックに適用されるイントラ予測モードに基づいて予測サンプルを導出することができる（Ｓ１４１０）。

一実施例に係るエンコーディング装置１００は、予測サンプルに基づいて現在ブロックに対するレジデュアルサンプルを導出することができる（Ｓ１４２０）。

一実施例に係るエンコーディング装置１００は、レジデュアルサンプルに対する１次変換に基づいて前記対象ブロックに対する変換係数を導出することができる（Ｓ１４３０）。

一例によって、エンコーディング装置は、１次変換のために、通常的なＤＣＴ－２を変換カーネルとして使用することもでき、詳述されたＭＴＳを適用することもできる。

エンコーディング装置は、１次変換に対してＭＴＳを実行するかどうかを決定することができ、ＭＴＳを実行することと決定されると、レジデュアルサンプルにＤＣＴ－８またはＤＳＴ－７を適用して変換係数を導出することができる。

一例によって、エンコーディング装置は、１次変換としてＭＴＳが適用される場合、現在ブロックの左上端第１の領域を除外した第２の領域をゼロアウトすることができる（Ｓ１４４０）。

一例によって、第１の領域は、現在ブロックの左上端１６×１６領域であり、この場合、第２の領域は、左上端１６×１６以外の領域を示すことができる。

このようなゼロアウトによって全体変換過程の実行に必要な計算量が減少され、変換過程の全体に必要な演算量が減少されることで、変換実行に必要な電力消費を減らすことができる。また、変換過程に伴われる遅延時間（ｌａｔｅｎｃｙ）が減少されて映像コーディング効率が増加されることができる。

エンコーディング装置は、有効係数がスキャンされるスキャンサブブロック単位で有効係数が第２の領域に存在しないことに基づいてＭＴＳインデックスがパーシングされるように映像情報を構成することができる（Ｓ１４５０）。

また、エンコーディング装置は、ＭＴＳインデックスがパーシング可否を決定するために、有効係数が第２の領域に存在するかどうかを示すフラグ情報が導出されるように映像情報を構成することができる。

即ち、エンコーディング装置は、表７または表８に示されている映像情報がデコーディング装置でパーシングされるように映像情報を構成することができる。

一例によって、スキャンサブブロックは、４×４ブロックであり、スキャンサブブロックは、デコーディング装置で、図１２のように、現在ブロック内の前記最後の有効係数の位置から逆対角スキャン方向によってスキャンされることができる。

フラグ情報は、変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇであり、有効係数がスキャンされるスキャンサブブロック単位で有効係数が第２の領域に存在するかどうかが判断されることができる。

変数ＭｔｓＺｅｒｏＯｕｔＳｉｇＣｏｅｆｆＦｌａｇは、表７のようにスキャンサブブロック内に有効係数が存在するかどうかを示すフラグ（ｃｏｄｅｄ＿ｓｕｂ＿ｂｌｏｃｋ＿ｆｌａｇ）値が１であり、スキャンサブブロック内に存在する有効係数が第２の領域に位置する場合（（（ｘＳ<<ｌｏｇ２ＳｂＷ）>１５||（ｙＳ<<ｌｏｇ２ＳｂＨ）>１５））、第２の領域に前記有効係数が存在することを指示することができる。

エンコーディング装置は、１次変換後に導出された変換係数にＬＦＮＳＴをさらに適用して修正された変換係数を導出することもできる。

エンコーディング装置は、現在ブロックに対する変換係数または修正された変換係数に基づいて導出されたレジデュアル情報及び第２の領域に有効係数が存在しないことに基づいてＭＴＳインデックスをエンコーディングすることができる（Ｓ１４６０）。

即ち、エンコーディング装置は、量子化された変換係数に対する情報を含むレジデュアル情報を生成することができる。レジデュアル情報は、詳述した変換関連情報／シンタックス要素を含むことができる。エンコーディング装置は、レジデュアル情報を含む映像／ビデオ情報をエンコーディングしてビットストリーム形態で出力できる。

より具体的に、エンコーディング装置１００は、量子化された変換係数に関する情報を生成し、生成された量子化された変換係数に関する情報をエンコーディングすることができる。

本文書において、量子化／逆量子化及び／又は変換／逆変換の少なくとも１つは省略され得る。前記量子化／逆量子化が省略される場合、前記量子化された変換係数は、変換係数と呼ばれ得る。前記変換／逆変換が省略される場合、前記変換係数は、係数又はレジデュアル係数と呼ばれることもあり、又は表現の統一性のために変換係数と依然として呼ばれることもある。

また、本文書において、量子化された変換係数及び変換係数は、それぞれ変換係数及びスケーリングされた（ｓｃａｌｅｄ）変換係数と指称され得る。この場合、レジデュアル情報は、変換係数に関する情報を含むことができ、前記変換係数に関する情報は、レジデュアルコーディングシンタックスを介してシグナリングされることができる。前記レジデュアル情報（又は前記変換係数に関する情報）に基づいて変換係数が導出でき、前記変換係数に対する逆変換（スケーリング）を介してスケーリングされた変換係数が導出できる。前記スケーリングされた変換係数に対する逆変換（変換）に基づいて、レジデュアルサンプルが導出できる。これは、本文書の別の部分でも同様に適用／表現できる。

前述した実施例において、方法は、一連のステップ又はブロックとしてフローチャートに基づいて説明されているが、本文書は、ステップの順序に限定されるわけではなく、あるステップは、前述したところと異なるステップと異なる順序で、又は同時に発生し得る。また、当業者であれば、フローチャートに示されているステップが排他的ではなく、別のステップが含まれるか、フローチャートの一つ又はそれ以上のステップが本文書の範囲に影響を与えずに削除され得ることを理解することができる。

前述した本文書に係る方法は、ソフトウェアの形態で具現されることができ、本文書に係るエンコード装置及び／又はデコード装置は、例えば、ＴＶ、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置等の画像処理を行う装置に含まれ得る。

本文書において、実施例がソフトウェアで具現されるとき、前述した方法は、前述した機能を行うモジュール（過程、機能等）で具現されることができる。モジュールはメモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部又は外部にあってもよく、よく知られている様々な手段でプロセッサと連結されてもよい。プロセッサは、ＡＳＩＣ（ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）、他のチップセット、論理回路及び／又はデータ処理装置を含むことができる。メモリは、ＲＯＭ（ｒｅａｄ－ｏｎｌｙｍｅｍｏｒｙ）、ＲＡＭ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、フラッシュメモリ、メモリカード、格納媒体及び／又は他の格納装置を含むことができる。即ち、本文書で説明した実施例は、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で具現されて実行されることができる。例えば、各図面で示している機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で具現されて実行されることができる。

また、本文書が適用されるデコード装置及びエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、オーダーメイド型ビデオ（ＶｏＤ）サービス提供装置、ＯＴＴビデオ（Ｏｖｅｒｔｈｅｔｏｐｖｉｄｅｏ）装置、インターネットストリーミングサービス提供装置、３次元（３Ｄ）ビデオ装置、画像電話ビデオ装置、及び医療用ビデオ装置等に含まれ得、ビデオ信号又はデータ信号を処理するために使用され得る。例えば、ＯＴＴビデオ（Ｏｖｅｒｔｈｅｔｏｐｖｉｄｅｏ）装置としては、ゲームコンソール、ブルーレイプレーヤー、インターネットアクセスＴＶ、ホームシアターシステム、スマートフォン、タブレットＰＣ、ＤＶＲ（ＤｉｇｉｔａｌＶｉｄｅｏＲｅｃｏｄｅｒ）等を含み得る。

また、本文書が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータが読み取ることができる記録媒体に格納されることができる。本文書に係るデータ構造を有するマルチメディアデータもまた、コンピュータが読み取ることができる記録媒体に格納されることができる。前記コンピュータが読み取ることができる記録媒体は、コンピュータで読み取ることができるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータが読み取ることができる記録媒体は、例えば、ブルーレイディスク（ＢＤ）、汎用直列バス（ＵＳＢ）、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＲＡＭ、ＣＤ－ＲＯＭ、磁気テープ、フロッピディスク、及び光学的データ格納装置を含み得る。また、前記コンピュータが読み取ることができる記録媒体は、搬送波（例えば、インターネットを介した送信）の形態で具現されたメディアを含む。また、エンコード方法で生成されたビットストリームが、コンピュータが読み取ることができる記録媒体に格納されるか、有無線通信ネットワークを介して送信されることができる。また、本文書の実施形態は、プログラムコードによるコンピュータプログラム製品で具現されることができ、前記プログラムコードは、本文書の実施形態によってコンピュータで実行されることができる。前記プログラムコードは、コンピュータによって読み取り可能なキャリア上に格納されることができる。

図１５は、本文書が適用できるビデオ／画像コーディングシステムの例を概略的に示す。

図１５を参照すると、ビデオ／画像コーディングシステムは、ソースデバイス及び受信デバイスを含むことができる。ソースデバイスは、エンコードされたビデオ（ｖｉｄｅｏ）／画像（ｉｍａｇｅ）情報またはデータをファイルまたはストリーミングの形態でデジタル格納媒体またはネットワークを介して受信デバイスに伝達することができる。

前記ソースデバイスは、ビデオソース、エンコード装置、送信部を含むことができる。前記受信デバイスは、受信部、デコード装置、及びレンダラーを含むことができる。前記エンコード装置は、ビデオ／画像エンコード装置と呼ばれ得、前記デコード装置は、ビデオ／画像デコード装置と呼ばれ得る。送信機は、エンコード装置に含まれることができる。受信機は、デコード装置に含まれることができる。レンダラーは、ディスプレイ部を含むこともでき、ディスプレイ部は、別個のデバイスまたは外部コンポーネントで構成されることもできる。

ビデオソースは、ビデオ／画像のキャプチャ、合成、または生成過程などを介してビデオ／画像を獲得できる。ビデオソースは、ビデオ／画像のキャプチャデバイス及び／又はビデオ／画像の生成デバイスを含むことができる。ビデオ／画像のキャプチャデバイスは、例えば、１つ以上のカメラ、以前にキャプチャされたビデオ／画像を含むビデオ／画像アーカイブなどを含むことができる。ビデオ／画像の生成デバイスは、例えば、コンピュータ、タブレット、及びスマートフォンなどを含むことができ、（電子的に）ビデオ／画像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ／画像が生成され得るし、この場合、関連データが生成される過程にビデオ／画像のキャプチャ過程が代替されることができる。

エンコード装置は、入力ビデオ／画像をエンコードすることができる。エンコード装置は、圧縮及びコーディング効率のために、予測、変換、量子化など、一連の手順を行うことができる。エンコードされたデータ（エンコードされたビデオ／画像情報）は、ビットストリーム（ｂｉｔｓｔｒｅａｍ）の形態で出力されることができる。

送信部は、ビットストリームの形態で出力されたエンコードされたビデオ／画像情報またはデータをファイルまたはストリーミングの形態でデジタル格納媒体またはネットワークを介して受信デバイスの受信部に伝達することができる。デジタル格納媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、様々な格納媒体を含むことができる。送信部は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送／通信ネットワークを介した送信のためのエレメントを含むことができる。受信部は、前記ビットストリームを受信／抽出してデコード装置に伝達することができる。

デコード装置は、エンコード装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を行ってビデオ／画像をデコードすることができる。

レンダラーは、デコードされたビデオ／画像をレンダリングすることができる。レンダリングされたビデオ／画像は、ディスプレイ部を介してディスプレイされることができる。

図１６は、本文書が適用されるコンテンツストリーミングシステムの構造図を例示的に示す。

また、本文書が適用されるコンテンツストリーミングシステムは、大きくエンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディアストレージ、ユーザ装置、及びマルチメディア入力装置を含むことができる。

前記エンコードサーバは、スマートフォン、カメラ、カムコーダ等のようなマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。別の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコードサーバは省略され得る。前記ビットストリームは、本文書が適用されるエンコード方法又はビットストリームの生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信又は受信する過程で、一時的に前記ビットストリームを格納することができる。

前記ストリーミングサーバは、ウェブサーバを介したユーザの要請に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体の役割をする。ユーザが前記ウェブサーバに所望のサービスを要請すると、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。そのとき、前記コンテンツストリーミングシステムは、別の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令／応答を制御する役割をする。

前記ストリーミングサーバは、メディアストレージ及び／又はエンコードサーバからコンテンツを受信することができる。例えば、前記エンコードサーバからコンテンツを受信することになる場合、前記コンテンツをリアルタイムで受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間格納することができる。

前記ユーザ装置の例としては、携帯電話、スマートフォン（ｓｍａｒｔｐｈｏｎｅ）、ラップトップコンピュータ（ｌａｐｔｏｐｃｏｍｐｕｔｅｒ）、デジタル放送用端末機、ＰＤＡ（ｐｅｒｓｏｎａｌｄｉｇｉｔａｌａｓｓｉｓｔａｎｔｓ）、ＰＭＰ（ｐｏｒｔａｂｌｅｍｕｌｔｉｍｅｄｉａｐｌａｙｅｒ）、ナビゲーション、スレートＰＣ（ｓｌａｔｅＰＣ）、タブレットＰＣ（ｔａｂｌｅｔＰＣ）、ウルトラブック（ｕｌｔｒａｂｏｏｋ）、ウェアラブルデバイス（ｗｅａｒａｂｌｅｄｅｖｉｃｅ、例えば、ウォッチ型端末機（ｓｍａｒｔｗａｔｃｈ）、グラス型端末機（ｓｍａｒｔｇｌａｓｓ）、ＨＭＤ（ｈｅａｄｍｏｕｎｔｅｄｄｉｓｐｌａｙ））、デジタルＴＶ、デスクトップコンピュータ、デジタルサイニジなどがあり得る。前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。

本明細書に記載された請求項は、多様な方式で組み合わせることができる。例えば、本明細書の方法請求項の技術的特徴が組み合わせられて装置として具現されることができ、本明細書の装置請求項の技術的特徴が組み合わせられて方法として具現されることができる。また、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて装置として具現されることができ、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて方法として具現されることができる。

Claims

デコーディング装置により実行される映像デコーディング方法において、
ビットストリームからレジデュアル情報を取得するステップと、
前記レジデュアル情報に基づいて現在ブロック内の最後の有効係数の位置及び前記現在ブロックに対する変換係数を導出するステップと、
前記現在ブロックの左上端第１の領域を除外した第２の領域に有効係数が存在するかどうかを判断するステップと、
前記第２の領域に前記有効係数が存在しないことに基づいて前記ビットストリームからＭＴＳインデックスをパーシングするステップと、
前記ＭＴＳインデックスに基づいて導出された変換カーネルを前記第１の領域の変換係数に適用して前記現在ブロックに対するレジデュアルサンプルを導出するステップと、を含み、
前記ＭＴＳインデックスは、前記有効係数がスキャンされるスキャンサブブロック内に存在する前記有効係数が前記第２の領域に存在しないことに基づいてパーシングされることを特徴とする映像デコーディング方法。
前記第２の領域に有効係数が存在するかどうかを判断するステップは、
前記スキャンサブブロック内に前記有効係数が存在するかどうかを示すフラグ値が１であるかどうかを判断するステップと、
前記スキャンサブブロック内に存在する有効係数が前記第２の領域に位置するかどうかを判断するステップと、を含むことを特徴とする請求項１に記載の映像デコーディング方法。
前記第２の領域に有効係数が存在するかどうかを判断するステップは、
前記スキャンサブブロック内に前記有効係数が存在するかどうかを示すフラグ値が１であるかどうかを判断するステップと、
前記スキャンサブブロックが前記第２の領域に位置するかどうかを判断するステップと、を含むことを特徴とする請求項１に記載の映像デコーディング方法。
前記第２の領域に有効係数が存在するかどうかを判断するステップは、
前記第２の領域に前記有効係数が存在するかどうかを示すフラグ情報を導出するステップを含み、
前記フラグ情報は、最初１に設定され、
前記有効係数が前記第２の領域に位置する場合、前記フラグ情報は、０に変更されることを特徴とする請求項１に記載の映像デコーディング方法。
前記第１の領域は、前記現在ブロックの左上端１６×１６領域であり、
前記スキャンサブブロックは、４×４ブロックであることを特徴とする請求項１に記載の映像デコーディング方法。
前記スキャンサブブロックは、前記現在ブロック内の前記最後の有効係数の位置から逆対角スキャン方向によってスキャンされることを特徴とする請求項５に記載の映像デコーディング方法。
映像エンコーディング装置により実行される映像エンコーディング方法において、
現在ブロックに対する予測サンプルを導出するステップと、
前記予測サンプルに基づいて前記現在ブロックに対するレジデュアルサンプルを導出するステップと、
前記レジデュアルサンプルに対する１次変換に基づいて前記現在ブロックに対する変換係数を導出するステップと、
前記現在ブロックの左上端第１の領域を除外した第２の領域をゼロアウトするステップと、
有効係数がスキャンされるスキャンサブブロック内に存在する前記有効係数が前記第２の領域に存在しないことに基づいてＭＴＳインデックスがパーシングされるように映像情報を構成するステップと、
前記現在ブロックに対する前記変換係数に基づいて導出されたレジデュアル情報及び前記ＭＴＳインデックスをエンコーディングするステップと、を含むことを特徴とする映像エンコーディング方法。
前記映像情報を構成するステップは、
前記スキャンサブブロック内に前記有効係数が存在するかどうかを示すフラグ値が１であるかどうかを判断するステップと、
前記スキャンサブブロック内に存在する有効係数が前記第２の領域に位置するかどうかを判断するステップと、を含むことを特徴とする請求項７に記載の映像エンコーディング方法。
前記映像情報を構成するステップは、
前記スキャンサブブロック内に前記有効係数が存在するかどうかを示すフラグ値が１であるかどうかを判断するステップと、
前記スキャンサブブロックが前記第２の領域に位置するかどうかを判断するステップと、を含むことを特徴とする請求項７に記載の映像エンコーディング方法。
前記映像情報を構成するステップは、
前記第２の領域に前記有効係数が存在するかどうかを示すフラグ情報を導出するステップを含み、
前記フラグ情報は、最初１に設定され、
前記有効係数が前記第２の領域に位置する場合、前記フラグ情報は、０に変更されることを特徴とする請求項７に記載の映像エンコーディング方法。
前記第１の領域は、前記現在ブロックの左上端１６×１６領域であり、
前記スキャンサブブロックは、４×４ブロックであることを特徴とする請求項７に記載の映像エンコーディング方法。
映像デコーディング方法を実行するようにする指示情報が格納されたコンピュータ読み取り可能なデジタル格納媒体であって、前記映像デコーディング方法は、
ビットストリームからレジデュアル情報を取得するステップと、
前記レジデュアル情報に基づいて現在ブロック内の最後の有効係数の位置及び前記現在ブロックに対する変換係数を導出するステップと、
前記現在ブロックの左上端第１の領域を除外した第２の領域に有効係数が存在するかどうかを判断するステップと、
前記第２の領域に前記有効係数が存在しないことに基づいて前記ビットストリームからＭＴＳインデックスをパーシングするステップと、
前記ＭＴＳインデックスに基づいて導出された変換カーネルを前記第１の領域の変換係数に適用して前記現在ブロックに対するレジデュアルサンプルを導出するステップと、を含み、
前記ＭＴＳインデックスは、前記有効係数がスキャンされるスキャンサブブロック内に存在する前記有効係数が前記第２の領域に存在しないことに基づいてパーシングされることを特徴とするデジタル格納媒体。