JP7436717B2

JP7436717B2 - シンタックスデザイン方法及びシンタックスを用いてコーディングを行う装置

Info

Publication number: JP7436717B2
Application number: JP2023021539A
Authority: JP
Inventors: ヒョンムンチャン; チョンハクナム; チェヒョンイム
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2018-10-08
Filing date: 2023-02-15
Publication date: 2024-02-22
Anticipated expiration: 2039-10-08
Also published as: WO2020076066A1; BR122022002075B1; US11575942B2; JP2024050869A; BR112021006580A2; BR122022002075A8; BR122022002075A2; BR122022002102A8; US20240080486A1; JP7230189B2; US20230131137A1; BR122022002096A8; US20220070498A1; BR122022002096A2; CN112956201B; US11206430B2; JP2022502969A; MX2021004008A; BR122022002102B1; BR112021006580A8

Description

本開示は、画像コーディング技術に関し、より詳細には、画像コーディングシステムにおいて、シンタックスデザイン方法及びシンタックスを用いてコーディングを行う装置に関する。

近年、４Ｋまたは８Ｋ以上のＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）画像／ビデオのような高解像度、高品質の画像／ビデオに対する需要が様々な分野で増加している。画像／ビデオデータが高解像度、高品質になるほど、既存の画像／ビデオデータに比べて相対的に送信される情報量またはビット量が増加するので、既存の有無線広帯域回線のような媒体を利用して画像データを送信するか、既存の格納媒体を利用して画像／ビデオデータを格納する場合、送信費用と格納費用が増加される。

また、近年、ＶＲ（ＶｉｒｔｕａｌＲｅａｌｉｔｙ）、ＡＲ（ＡｒｔｉｆｉｃｉａｌＲｅａｌｔｉｙ）コンテンツやホログラムなどの実感メディア（ＩｍｍｅｒｓｉｖｅＭｅｄｉａ）に対する関心及び需要が増加しており、ゲーム画像のように、現実画像と異なる画像特性を有する画像／ビデオに対する放送が増加している。

これにより、上記のような様々な特性を有する高解像度・高品質の画像／ビデオの情報を効果的に圧縮して送信するか、格納し、再生するために高効率の画像／ビデオ圧縮技術が求められる。

本開示の技術的課題は、画像コーディング効率を上げる方法及び装置を提供することにある。

本開示の他の技術的課題は、シンタックスデザイン方法及びシンタックスを用いてコーディングを行う装置を提供することにある。

本開示のさらに他の技術的課題は、ハイレベルシンタックス及びローレベルシンタックスデザイン方法及びシンタックスを用いてコーディングを行う装置を提供することにある。

本開示のさらに他の技術的課題は、サブブロックに基づいて動き予測を行うためのハイレベル及び／又はローレベルシンタックス要素を用いる方法及び装置を提供することにある。

本開示のさらに他の技術的課題は、アフィン（ａｆｆｉｎｅ）モデルに基づいて動き予測を行うためのハイレベル及び／又はローレベルシンタックス要素を用いる方法及び装置を提供することにある。

本開示のさらに他の技術的課題は、アフィンフラグ及びサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定する方法及び装置を提供することにある。

本開示の一実施形態によれば、デコード装置によって行われる画像デコード方法が提供される。上記方法は、ビットストリームに基づいて、現在ブロックにアフィン予測を適用できるか否かを表すアフィンフラグ及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグをデコードするステップ、前記デコードされたアフィンフラグ及び前記デコードされたサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定するステップ、前記既決定マージモードフラグをデコードするか否かに対する前記決定に基づいて、前記現在ブロックに対する予測サンプルを導出するステップ、及び前記現在ブロックに対する前記予測サンプルに基づいて前記現在ブロックに対する復元サンプルを生成するステップを含み、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをデコードすることと決定されることを特徴とする。

本開示の他の一実施形態によれば、画像デコードを行うデコード装置が提供される。前記デコード装置は、ビットストリームに基づいて、現在ブロックにアフィン予測を適用できるか否かを表すアフィンフラグ及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグをデコードし、前記デコードされたアフィンフラグ及び前記デコードされたサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定するエントロピーデコード部、前記既決定マージモードフラグをデコードするか否かに対する前記決定に基づいて、前記現在ブロックに対する予測サンプルを導出する予測部、及び前記現在ブロックに対する前記予測サンプルに基づいて前記現在ブロックに対する復元サンプルを生成する加算部を備え、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをデコードすることと決定されることを特徴とする。

本開示のさらに他の一実施形態によれば、エンコード装置によって行われる画像エンコード方法が提供される。前記方法は、現在ブロックにアフィン予測を適用できるか否か及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを決定するステップ、前記現在ブロックに前記アフィン予測を適用できるか否か及び前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かに対する前記決定に基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをエンコードするか否かを決定するステップ、及び前記既決定マージモードフラグをエンコードするか否かに対する前記決定に基づいて、前記現在ブロックに前記アフィン予測を適用できるか否かを表すアフィンフラグ、前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグ、及び前記既決定マージモードフラグをエンコードするステップを含み、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをエンコードすることと決定されることを特徴とする。

本開示のさらに他の一実施形態によれば、画像エンコードを行うエンコード装置が提供される。前記エンコード装置は、現在ブロックにアフィン予測を適用できるか否か及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを決定し、前記現在ブロックに前記アフィン予測を適用できるか否か及び前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かに対する前記決定に基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをエンコードするか否かを決定する予測部、及び前記既決定マージモードフラグをエンコードするか否かに対する前記決定に基づいて、前記現在ブロックに前記アフィン予測を適用できるか否かを表すアフィンフラグ、前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグ、及び前記既決定マージモードフラグをエンコードするエントロピーエンコード部を備え、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをエンコードすることと決定されることを特徴とする。

本開示のさらに他の一実施形態によれば、ビデオデコード装置が一部実施形態等に係るデコード方法を行うように引き起こす指示（ｉｎｓｔｒｕｃｔｉｏｎｓ）に関する情報を格納する、デコーダで読み取り可能な格納媒体が提供される。

本開示のさらに他の一実施形態によれば、ビデオデコード装置が一実施形態に係るデコード方法を行うように引き起こす指示に関する情報を格納する、デコーダで読み取り可能な格納媒体が提供される。前記一実施形態に係るデコード方法は、ビットストリームに基づいて、現在ブロックにアフィン予測を適用できるか否かを表すアフィンフラグ及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグをデコードするステップ、前記デコードされたアフィンフラグ及び前記デコードされたサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定するステップ、前記既決定マージモードフラグをデコードするか否かに対する前記決定に基づいて、前記現在ブロックに対する予測サンプルを導出するステップ、及び前記現在ブロックに対する前記予測サンプルに基づいて前記現在ブロックに対する復元サンプルを生成するステップを含み、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをデコードすることと決定されることを特徴とする。

本開示によれば、全般的な画像／ビデオ圧縮効率を上げることができる。

本開示によれば、ハイレベルシンタックス及びローレベルシンタックスデザインを介して画像コーディング効率を上げることができる。

本開示によれば、サブブロックに基づいて動き予測を行うためのハイレベル及び／又はローレベルシンタックス要素を用いることにより画像コーディング効率を上げることができる。

本開示によれば、アフィンモデルに基づいて動き予測を行うためのハイレベル及び／又はローレベルシンタックス要素を用いることにより画像コーディング効率を上げることができる。

本開示によれば、アフィンフラグ及びサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定することにより画像コーディング効率を上げることができる。

本開示が適用され得るビデオ／画像コーディングシステムの例を概略的に示す。本開示が適用され得るビデオ／画像エンコード装置の構成を概略的に説明する図である。本開示が適用され得るビデオ／画像デコード装置の構成を概略的に説明する図である。一実施形態に係るエンコード装置の動作を示すフローチャートである。一実施形態に係るエンコード装置の構成を示すブロック図である。一実施形態に係るデコード装置の動作を示すフローチャートである。一実施形態に係るデコード装置の構成を示すブロック図である。本文書の開示が適用され得るコンテンツストリーミングシステムの例を示す。

本開示は、様々な変更を加えることができ、種々の実施形態を有することができるところ、特定実施形態を図面に例示し、詳細に説明しようとする。しかしながら、これは、本開示を特定実施形態に限定しようとするものではない。本明細書において常用する用語は、単に特定の実施形態を説明するために使用されたものであって、本開示の技術的思想を限定しようとする意図で使用されるものではない。単数の表現は、文脈上明らかに異なるように意味しない限り、複数の表現を含む。本明細書において「含む」または「有する」などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものが存在することを指定しようとするものであり、１つまたはそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、またはこれらを組み合わせたものなどの存在または付加可能性を予め排除しないことと理解されるべきである。

一方、本開示において説明される図面上の各構成は、互いに異なる特徴的な機能等に関する説明の都合上、独立的に図示されたものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで実現されるということを意味するものではない。例えば、各構成のうち、２つ以上の構成が合わせられて１つの構成をなすことができ、１つの構成が複数の構成に分けられることもできる。各構成が統合及び／又は分離された実施形態も本開示の本質から逸脱しない限り、本開示の権利範囲に含まれる。

以下、添付した図面を参照して、本開示の望ましい実施形態をより詳細に説明しようとする。以下、図面上の同じ構成要素に対しては、同じ参照符号を使用し、同じ構成要素について重複した説明は省略されることができる。

図１は、本開示が適用され得るビデオ／画像コーディングシステムの例を概略的に示す。

図１に示すように、ビデオ／画像コーディングシステムは、第１の装置（ソースデバイス）及び第２の装置（受信デバイス）を備えることができる。ソースデバイスは、エンコードされたビデオ（ｖｉｄｅｏ）／画像（ｉｍａｇｅ）情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスに伝達することができる。

前記ソースデバイスは、ビデオソース、エンコード装置、送信部を備えることができる。前記受信デバイスは、受信部、デコード装置、及びレンダラを備えることができる。前記エンコード装置は、ビデオ／画像エンコード装置と呼ばれることができ、前記デコード装置は、ビデオ／画像デコード装置と呼ばれることができる。送信機は、エンコード装置に備えられることができる。受信機は、デコード装置に備えられることができる。レンダラは、ディスプレイ部を備えることができ、ディスプレイ部は、別個のデバイスまたは外部コンポーネントで構成されることもできる。

ビデオソースは、ビデオ／画像のキャプチャ、合成、または生成過程などを介してビデオ／画像を取得できる。ビデオソースは、ビデオ／画像キャプチャデバイス及び／又はビデオ／画像生成デバイスを含むことができる。ビデオ／画像キャプチャデバイスは、例えば、１つ以上のカメラ、以前にキャプチャされたビデオ／画像を含むビデオ／画像アーカイブなどを含むことができる。ビデオ／画像生成デバイスは、例えば、コンピュータ、タブレット、及びスマートフォンなどを含むことができ、（電子的に）ビデオ／画像を生成できる。例えば、コンピュータなどを介して仮像のビデオ／画像が生成され得るし、この場合、関連データが生成される過程にビデオ／画像キャプチャ過程が代替されることができる。

エンコード装置は、入力ビデオ／画像をエンコードすることができる。エンコード装置は、圧縮及びコーディング効率のために、予測、変換、量子化など、一連の手順を行うことができる。エンコードされたデータ（エンコードされたビデオ／画像情報）は、ビットストリーム（ｂｉｔｓｔｒｅａｍ）形態で出力されることができる。

送信部は、ビットストリーム形態で出力されたエンコードされたビデオ／画像情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスの受信部に伝達することができる。デジタル格納媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、様々な格納媒体を含むことができる。送信部は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送／通信ネットワークを介しての送信のためのエレメントを含むことができる。受信部は、前記ビットストリームを受信／抽出してデコード装置に伝達することができる。

デコード装置は、エンコード装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を行ってビデオ／画像をデコードすることができる。

レンダラは、デコードされたビデオ／画像をレンダリングすることができる。レンダリングされたビデオ／画像は、ディスプレイ部を介してディスプレイされることができる。

この文書は、ビデオ／画像コーディングに関するものである。例えば、この文書において開示された方法／実施形態は、ＶＶＣ（ｖｅｒｓａｔｉｌｅｖｉｄｅｏｃｏｄｉｎｇ）標準、ＥＶＣ（ｅｓｓｅｎｔｉａｌｖｉｄｅｏｃｏｄｉｎｇ）標準、ＡＶ１（ＡＯＭｅｄｉａＶｉｄｅｏ１）標準、ＡＶＳ２（２ｎｄｇｅｎｅｒａｔｉｏｎｏｆａｕｄｉｏｖｉｄｅｏｃｏｄｉｎｇｓｔａｎｄａｒｄ）、または次世代ビデオ／画像コーディング標準（例えば、Ｈ．２６７ｏｒＨ．２６８等）に開示される方法に適用されることができる。

この文書では、ビデオ／画像コーディングに関する様々な実施形態を提示し、他の言及がない限り、上記実施形態等は、互いに組み合わせられて行われることもできる。

この文書においてビデオ（ｖｉｄｅｏ）は、時間の流れによる一連の画像（ｉｍａｇｅ）等の集合を意味できる。ピクチャ（ｐｉｃｔｕｒｅ）は、一般的に特定時間帯の１つの画像を示す単位を意味し、スライス（ｓｌｉｃｅ）／タイル（ｔｉｌｅ）は、コーディングにおいてピクチャの一部を構成する単位である。スライス／タイルは、１つ以上のＣＴＵ（ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ）を含むことができる。１つのピクチャは、１つ以上のスライス／タイルで構成されることができる。１つのピクチャは、１つ以上のタイルグループで構成されることができる。１つのタイルグループは、１つ以上のタイルを含むことができる。ブリックは、ピクチャ内のタイル以内のＣＴＵ行の長方形領域を示すことができる（ａｂｒｉｃｋｍａｙｒｅｐｒｅｓｅｎｔａｒｅｃｔａｎｇｕｌａｒｒｅｇｉｏｎｏｆＣＴＵｒｏｗｓｗｉｔｈｉｎａｔｉｌｅｉｎａｐｉｃｔｕｒｅ）。タイルは、複数のブリックにパーティショニングされることができ、各ブリックは、前記タイル内の１つ以上のＣＴＵ行で構成されることができる（Ａｔｉｌｅｍａｙｂｅｐａｒｔｉｔｉｏｎｅｄｉｎｔｏｍｕｌｔｉｐｌｅｂｒｉｃｋｓ、ｅａｃｈｏｆｗｈｉｃｈｃｏｎｓｉｓｔｉｎｇｏｆｏｎｅｏｒｍｏｒｅＣＴＵｒｏｗｓｗｉｔｈｉｎｔｈｅｔｉｌｅ）。複数のブリックにパーティショニングされなかったタイルは、ブリックとも呼ばれることができる（Ａｔｉｌｅｔｈａｔｉｓｎｏｔｐａｒｔｉｔｉｏｎｅｄｉｎｔｏｍｕｌｔｉｐｌｅｂｒｉｃｋｓｍａｙｂｅａｌｓｏｒｅｆｅｒｒｅｄｔｏａｓａｂｒｉｃｋ）。ブリックスキャンは、ピクチャをパーティショニングするＣＴＵの特定の順次的オーダリングを示すことができ、前記ＣＴＵは、ブリック内でＣＴＵラスタスキャンで整列されることができ、タイル内のブリックは、前記タイルの前記ブリックのラスタスキャンで連続的に整列されることができ、そして、ピクチャ内のタイルは、前記ピクチャの前記タイルのラスタスキャンで連続的に整列されることができる（ＡｂｒｉｃｋｓｃａｎｉｓａｓｐｅｃｉｆｉｃｓｅｑｕｅｎｔｉａｌｏｒｄｅｒｉｎｇｏｆＣＴＵｓｐａｒｔｉｔｉｏｎｉｎｇａｐｉｃｔｕｒｅｉｎｗｈｉｃｈｔｈｅＣＴＵｓａｒｅｏｒｄｅｒｅｄｃｏｎｓｅｃｕｔｉｖｅｌｙｉｎＣＴＵｒａｓｔｅｒｓｃａｎｉｎａｂｒｉｃｋ、ｂｒｉｃｋｓｗｉｔｈｉｎａｔｉｌｅａｒｅｏｒｄｅｒｅｄｃｏｎｓｅｃｕｔｉｖｅｌｙｉｎａｒａｓｔｅｒｓｃａｎｏｆｔｈｅｂｒｉｃｋｓｏｆｔｈｅｔｉｌｅ、ａｎｄｔｉｌｅｓｉｎａｐｉｃｔｕｒｅａｒｅｏｒｄｅｒｅｄｃｏｎｓｅｃｕｔｉｖｅｌｙｉｎａｒａｓｔｅｒｓｃａｎｏｆｔｈｅｔｉｌｅｓｏｆｔｈｅｐｉｃｔｕｒｅ）。タイルは、特定タイル列及び特定タイル列以内のＣＴＵの長方形領域である（ＡｔｉｌｅｉｓａｒｅｃｔａｎｇｕｌａｒｒｅｇｉｏｎｏｆＣＴＵｓｗｉｔｈｉｎａｐａｒｔｉｃｕｌａｒｔｉｌｅｃｏｌｕｍｎａｎｄａｐａｒｔｉｃｕｌａｒｔｉｌｅｒｏｗｉｎａｐｉｃｔｕｒｅ）。前記タイル列は、ＣＴＵの長方形領域であり、前記長方形領域は、前記ピクチャの高さと同じ高さを有し、幅は、ピクチャパラメータセット内のシンタックス要素により明示されることができる（ＴｈｅｔｉｌｅｃｏｌｕｍｎｉｓａｒｅｃｔａｎｇｕｌａｒｒｅｇｉｏｎｏｆＣＴＵｓｈａｖｉｎｇａｈｅｉｇｈｔｅｑｕａｌｔｏｔｈｅｈｅｉｇｈｔｏｆｔｈｅｐｉｃｔｕｒｅａｎｄａｗｉｄｔｈｓｐｅｃｉｆｉｅｄｂｙｓｙｎｔａｘｅｌｅｍｅｎｔｓｉｎｔｈｅｐｉｃｔｕｒｅｐａｒａｍｅｔｅｒｓｅｔ）。前記タイル行は、ＣＴＵの長方形領域であり、前記長方形領域は、ピクチャパラメータセット内のシンタックス要素により明示される幅を有し、高さは、前記ピクチャの高さと同じであることができる（ＴｈｅｔｉｌｅｒｏｗｉｓａｒｅｃｔａｎｇｕｌａｒｒｅｇｉｏｎｏｆＣＴＵｓｈａｖｉｎｇａｈｅｉｇｈｔｓｐｅｃｉｆｉｅｄｂｙｓｙｎｔａｘｅｌｅｍｅｎｔｓｉｎｔｈｅｐｉｃｔｕｒｅｐａｒａｍｅｔｅｒｓｅｔａｎｄａｗｉｄｔｈｅｑｕａｌｔｏｔｈｅｗｉｄｔｈｏｆｔｈｅｐｉｃｔｕｒｅ）。タイルスキャンは、ピクチャをパーティショニングするＣＴＵの特定順次的オーダリングを示すことができ、前記ＣＴＵは、タイル内のＣＴＵラスタスキャンで連続的に整列されることができ、ピクチャ内のタイルは、前記ピクチャの前記タイルのラスタスキャンで連続的に整列されることができる（ＡｔｉｌｅｓｃａｎｉｓａｓｐｅｃｉｆｉｃｓｅｑｕｅｎｔｉａｌｏｒｄｅｒｉｎｇｏｆＣＴＵｓｐａｒｔｉｔｉｏｎｉｎｇａｐｉｃｔｕｒｅｉｎｗｈｉｃｈｔｈｅＣＴＵｓａｒｅｏｒｄｅｒｅｄｃｏｎｓｅｃｕｔｉｖｅｌｙｉｎＣＴＵｒａｓｔｅｒｓｃａｎｉｎａｔｉｌｅｗｈｅｒｅａｓｔｉｌｅｓｉｎａｐｉｃｔｕｒｅａｒｅｏｒｄｅｒｅｄｃｏｎｓｅｃｕｔｉｖｅｌｙｉｎａｒａｓｔｅｒｓｃａｎｏｆｔｈｅｔｉｌｅｓｏｆｔｈｅｐｉｃｔｕｒｅ）。スライスは、ピクチャの整数個のブリックを含むことができ、前記整数個のブリックは、１つのＮＡＬユニットに含まれることができる（ＡｓｌｉｃｅｉｎｃｌｕｄｅｓａｎｉｎｔｅｇｅｒｎｕｍｂｅｒｏｆｂｒｉｃｋｓｏｆａｐｉｃｔｕｒｅｔｈａｔｍａｙｂｅｅｘｃｌｕｓｉｖｅｌｙｃｏｎｔａｉｎｅｄｉｎａｓｉｎｇｌｅＮＡＬｕｎｉｔ）。スライスは、複数の完全なタイルで構成されることができ、または、１つのタイルの完全なブリックの連続的なシーケンスであることもできる（Ａｓｌｉｃｅｍａｙｃｏｎｓｉｓｔｓｏｆｅｉｔｈｅｒａｎｕｍｂｅｒｏｆｃｏｍｐｌｅｔｅｔｉｌｅｓｏｒｏｎｌｙａｃｏｎｓｅｃｕｔｉｖｅｓｅｑｕｅｎｃｅｏｆｃｏｍｐｌｅｔｅｂｒｉｃｋｓｏｆｏｎｅｔｉｌｅ）。この文書においてタイルグループとスライスとは混用されることができる。例えば、本文書においてｔｉｌｅｇｒｏｕｐ／ｔｉｌｅｇｒｏｕｐｈｅａｄｅｒは、ｓｌｉｃｅ／ｓｌｉｃｅｈｅａｄｅｒと呼ばれることができる。

ピクセル（ｐｉｘｅｌ）またはペル（ｐｅｌ）は、１つのピクチャ（または、画像）を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として、「サンプル（ｓａｍｐｌｅ）」が使用され得る。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、ルマ（ｌｕｍａ）成分のピクセル／ピクセル値のみを示すことができ、クロマ（ｃｈｒｏｍａ）成分のピクセル／ピクセル値のみを示すこともできる。

ユニット（ｕｎｉｔ）は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定領域及び当該領域に関連した情報のうち、少なくとも１つを含むことができる。１つのユニットは、１つのルマブロック及び２つのクロマ（例えば、ｃｂ、ｃｒ）ブロックを含むことができる。ユニットは、場合によって、ブロック（ｂｌｏｃｋ）または領域（ａｒｅａ）などの用語と混用して使用されることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列とＮ個の行とからなるサンプル（または、サンプルアレイ）または変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）の集合（または、アレイ）を含むことができる。

この文書において、「／」と「、」は、「及び／又は」と解釈される。例えば、「Ａ／Ｂ」は、「Ａ及び／又はＢ」と解釈され、「Ａ、Ｂ」は、「Ａ及び／又はＢ」と解釈される。追加的に、「Ａ／Ｂ／Ｃ」は、「Ａ、Ｂ及び／又はＣのうち、少なくとも１つ」を意味する。また、「Ａ、Ｂ、Ｃ」も「Ａ、Ｂ及び／又はＣのうち、少なくとも１つ」を意味する。（Ｉｎｔｈｉｓｄｏｃｕｍｅｎｔ，ｔｈｅｔｅｒｍ “／” ａｎｄ “，” ｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ “ａｎｄ／ｏｒ．” Ｆｏｒｉｎｓｔａｎｃｅ，ｔｈｅｅｘｐｒｅｓｓｉｏｎ “Ａ／Ｂ” ｍａｙｍｅａｎ “Ａａｎｄ／ｏｒＢ．” Ｆｕｒｔｈｅｒ， “Ａ，Ｂ” ｍａｙｍｅａｎ “Ａａｎｄ／ｏｒＢ．” Ｆｕｒｔｈｅｒ， “Ａ／Ｂ／Ｃ” ｍａｙｍｅａｎ “ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂ，ａｎｄ／ｏｒＣ．” Ａｌｓｏ， “Ａ／Ｂ／Ｃ” ｍａｙｍｅａｎ “ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂ，ａｎｄ／ｏｒＣ．”）

追加的に、本文書において「または」は、「及び／又は」と解釈される。例えば、「ＡまたはＢ」は、１）「Ａ」のみを意味し、２）「Ｂ」のみを意味するか、３）「Ａ及びＢ」を意味することができる。言い換えれば、本文書の「または」は、「追加的にまたは大体的に（ａｄｄｉｔｉｏｎａｌｌｙｏｒａｌｔｅｒｎａｔｉｖｅｌｙ）」を意味することができる。（Ｆｕｒｔｈｅｒ，ｉｎｔｈｅｄｏｃｕｍｅｎｔ，ｔｈｅｔｅｒｍ “ｏｒ” ｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ “ａｎｄ／ｏｒ．” Ｆｏｒｉｎｓｔａｎｃｅ，ｔｈｅｅｘｐｒｅｓｓｉｏｎ “ＡｏｒＢ” ｍａｙｃｏｍｐｒｉｓｅ１）ｏｎｌｙＡ，２）ｏｎｌｙＢ，ａｎｄ／ｏｒ３）ｂｏｔｈＡａｎｄＢ．Ｉｎｏｔｈｅｒｗｏｒｄｓ，ｔｈｅｔｅｒｍ “ｏｒ” ｉｎｔｈｉｓｄｏｃｕｍｅｎｔｓｈｏｕｌｄｂｅｉｎｔｅｒｐｒｅｔｅｄｔｏｉｎｄｉｃａｔｅ “ａｄｄｉｔｉｏｎａｌｌｙｏｒａｌｔｅｒｎａｔｉｖｅｌｙ．”）

図２は、本開示が適用され得るビデオ／画像エンコード装置の構成を概略的に説明する図である。以下、ビデオエンコード装置とは、画像エンコード装置を含むことができる。

図２に示すように、エンコード装置２００は、画像分割部（ｉｍａｇｅｐａｒｔｉｔｉｏｎｅｒ）２１０、予測部（ｐｒｅｄｉｃｔｏｒ）２２０、レジデュアル処理部（ｒｅｓｉｄｕａｌｐｒｏｃｅｓｓｏｒ）２３０、エントロピーエンコード部（ｅｎｔｒｏｐｙｅｎｃｏｄｅｒ）２４０、加算部（ａｄｄｅｒ）２５０、フィルタリング部（ｆｉｌｔｅｒ）２６０、及びメモリ（ｍｅｍｏｒｙ）２７０を備えて構成されることができる。予測部２２０は、インター予測部２２１及びイントラ予測部２２２を備えることができる。レジデュアル処理部２３０は、変換部（ｔｒａｎｓｆｏｒｍｅｒ）２３２、量子化部（ｑｕａｎｔｉｚｅｒ）２３３、逆量子化部（ｄｅｑｕａｎｔｉｚｅｒ）２３４、逆変換部（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍｅｒ）２３５を備えることができる。レジデュアル処理部２３０は、減算部（ｓｕｂｔｒａｃｔｏｒ、２３１）をさらに備えることができる。加算部２５０は、復元部（ｒｅｃｏｎｓｔｒｕｃｔｏｒ）または復元ブロック生成部（ｒｅｃｏｎｔｒｕｃｔｇｅｄｂｌｏｃｋｇｅｎｅｒａｔｏｒ）と呼ばれることができる。上述した画像分割部２１０、予測部２２０、レジデュアル処理部２３０、エントロピーエンコード部２４０、加算部２５０、及びフィルタリング部２６０は、実施形態によって１つ以上のハードウェアコンポーネント（例えば、エンコーダチップセットまたはプロセッサ）によって構成されることができる。また、メモリ２７０は、ＤＰＢ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を備えることができ、デジタル格納媒体によって構成されることもできる。前記ハードウェアコンポーネントは、メモリ２７０を内／外部コンポーネントとしてさらに備えることもできる。

画像分割部２１０は、エンコード装置２００に入力された入力画像（または、ピクチャ、フレーム）を１つ以上の処理ユニット（ｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）に分割することができる。一例として、前記処理ユニットは、コーディングユニット（ｃｏｄｉｎｇｕｎｉｔ、ＣＵ）と呼ばれることができる。この場合、コーディングユニットは、コーディングツリーユニット（ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ、ＣＴＵ）または最大コーディングユニット（ｌａｒｇｅｓｔｃｏｄｉｎｇｕｎｉｔ、ＬＣＵ）からＱＴＢＴＴＴ（Ｑｕａｄ－ｔｒｅｅｂｉｎａｒｙ－ｔｒｅｅｔｅｒｎａｒｙ－ｔｒｅｅ）構造によって再帰的に（ｒｅｃｕｒｓｉｖｅｌｙ）分割されることができる。例えば、１つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び／又はターナリ構造に基づいて下位（ｄｅｅｐｅｒ）デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び／又はターナリ構造がその後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて本開示に係るコーディング手順が行われ得る。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使用されることができ、または、必要に応じてコーディングユニットは、再帰的に（ｒｅｃｕｒｓｉｖｅｌｙ）もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット（ＰＵ：ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ）または変換ユニット（ＴＵ：ＴｒａｎｓｆｏｒｍＵｎｉｔ）をさらに備えることができる。この場合、前記予測ユニット及び前記変換ユニットは、各々上述した最終コーディングユニットから分割またはパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であることができ、前記変換ユニットは、変換係数を導く単位及び／又は変換係数からレジデュアル信号（ｒｅｓｉｄｕａｌｓｉｇｎａｌ）を導く単位であることができる。

ユニットは、場合によって、ブロック（ｂｌｏｃｋ）または領域（ａｒｅａ）などの用語と混用して使用されることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列とＮ個の行からなるサンプルまたは変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）等の集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、輝度（ｌｕｍａ）成分のピクセル／ピクセル値のみを示すことができ、彩度（ｃｈｒｏｍａ）成分のピクセル／ピクセル値のみを示すこともできる。サンプルは、１つのピクチャ（または、画像）をピクセル（ｐｉｘｅｌ）またはペル（ｐｅｌ）に対応する用語として使用することができる。

エンコード装置２００は、入力画像信号（原本ブロック、原本サンプルアレイ）でインター予測部２２１またはイントラ予測部２２２から出力された予測信号（予測されたブロック、予測サンプルアレイ）を減算してレジデュアル信号（ｒｅｓｉｄｕａｌｓｉｇｎａｌ、残余ブロック、残余サンプルアレイ）を生成でき、生成されたレジデュアル信号は、変換部２３２に送信される。この場合、図示されたように、エンコーダ２００内において入力画像信号（原本ブロック、原本サンプルアレイ）で予測信号（予測ブロック、予測サンプルアレイ）を減算するユニットは、減算部２３１と呼ばれることができる。予測部は、処理対象ブロック（以下、現在ブロックという）に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック（ｐｒｅｄｉｃｔｅｄｂｌｏｃｋ）を生成できる。予測部は、現在ブロックまたはＣＵ単位でイントラ予測が適用されるか、またはインター予測が適用されるか決定することができる。予測部は、各予測モードについての説明で後述するように、予測モード情報など、予測に関する様々な情報を生成してエントロピーエンコード部２４０に伝達することができる。予測に関する情報は、エントロピーエンコード部２４０でエンコードされてビットストリーム形態で出力されることができる。

イントラ予測部２２２は、現在ピクチャ内のサンプルを参照して現在ブロックを予測できる。前記参照されるサンプルは、予測モードによって前記現在ブロックの周辺（ｎｅｉｇｈｂｏｒ）に位置することができ、または、離れて位置することもできる。イントラ予測で予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。非方向性モードは、例えば、ＤＣモード及びプラナーモード（Ｐｌａｎａｒモード）を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、３３個の方向性予測モードまたは６５個の方向性予測モードを含むことができる。ただし、これは、例示であり、設定によってそれ以上またはそれ以下の個数の方向性予測モードが使用され得る。イントラ予測部２２２は、周辺ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。

インター予測部２２１は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、周辺ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、Ｂｉ予測等）情報をさらに含むことができる。インター予測の場合に、周辺ブロックは、現在ピクチャ内に存在する空間的周辺ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と参照ピクチャに存在する時間的周辺ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）とを含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的周辺ブロックを含む参照ピクチャとは同じであることができ、異なることもできる。前記時間的周辺ブロックは、同一位置参照ブロック（ｃｏｌｌｏｃａｔｅｄｒｅｆｅｒｅｎｃｅｂｌｏｃｋ）、同一位置ＣＵ（ｃｏｌＣＵ）などの名前で呼ばれることができ、前記時間的周辺ブロックを含む参照ピクチャは、同一位置ピクチャ（ｃｏｌｌｏｃａｔｅｄｐｉｃｔｕｒｅ、ｃｏｌＰｉｃ）と呼ばれることもできる。例えば、インター予測部２２１は、周辺ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び／又は参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成できる。様々な予測モードに基づいてインター予測が行われ得るし、例えば、スキップモードとマージモードとの場合に、インター予測部２２１は、周辺ブロックの動き情報を現在ブロックの動き情報として利用することができる。スキップモードの場合、マージモードとは異なり、レジデュアル信号が送信されないことがある。動き情報予測（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｉｏｎ、ＭＶＰ）モードの場合、周辺ブロックの動きベクトルを動きベクトル予測子（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）として用い、動きベクトル差分（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）をシグナリングすることにより、現在ブロックの動きベクトルを指示することができる。

予測部２２０は、後述する様々な予測方法に基づいて予測信号を生成できる。例えば、予測部は、１つのブロックに対する予測のために、イントラ予測またはインター予測を適用できるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、ｃｏｍｂｉｎｅｄｉｎｔｅｒａｎｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（ｉｎｔｒａｂｌｏｃｋｃｏｐｙ、ＩＢＣ）予測モードに基づくことができ、またはパレットモード（ｐａｌｅｔｔｅｍｏｄｅ）に基づくこともできる。前記ＩＢＣ予測モードまたはパレットモードは、例えば、ＳＣＣ（ｓｃｒｅｅｎｃｏｎｔｅｎｔｃｏｄｉｎｇ）などのように、ゲームなどのコンテンツ画像／動画コーディングのために使用されることができる。ＩＢＣは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と同様に行われることができる。すなわち、ＩＢＣは、本文書において説明されるインター予測技法のうち、少なくとも１つを用いることができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報に基づいてピクチャ内のサンプル値をシグナリングすることができる。

前記予測部（インター予測部２２１及び／又は前記イントラ予測部２２２を備える）を介して生成された予測信号は、復元信号を生成するために用いられるか、レジデュアル信号を生成するために用いられることができる。変換部２３２は、レジデュアル信号に変換技法を適用して変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔｓ）を生成できる。例えば、変換技法は、ＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）、ＤＳＴ（ＤｉｓｃｒｅｔｅＳｉｎｅＴｒａｎｓｆｏｒｍ）、ＫＬＴ（Ｋａｒｈｕｎｅｎ－ＬｏｅｖｅＴｒａｎｓｆｏｒｍ）、ＧＢＴ（Ｇｒａｐｈ－ＢａｓｅｄＴｒａｎｓｆｏｒｍ）、またはＣＮＴ（ＣｏｎｄｉｔｉｏｎａｌｌｙＮｏｎ－ｌｉｎｅａｒＴｒａｎｓｆｏｒｍ）のうち、少なくとも１つを含むことができる。ここで、ＧＢＴは、ピクセル間の関係情報をグラフで表現しようとするとき、このグラフから得られた変換を意味する。ＣＮＴは、以前に復元された全てのピクセル（ａｌｌｐｒｅｖｉｏｕｓｌｙｒｅｃｏｎｓｔｒｕｃｔｅｄｐｉｘｅｌ）を用いて予測信号を生成し、それに基づいて取得される変換を意味する。また、変換過程は、正方形の同じ大きさを有するピクセルブロックに適用されることができ、正方形でない可変大きさのブロックにも適用されることができる。

量子化部２３３は、変換係数を量子化してエントロピーエンコード部２４０に送信され、エントロピーエンコード部２４０は、量子化された信号（量子化された変換係数に関する情報）をエンコードしてビットストリームに出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部２３３は、係数スキャン順序（ｓｃａｎｏｒｄｅｒ）に基づいてブロック形態の量子化された変換係数を１次元ベクトル形態で再整列することができ、前記１次元ベクトル形態の量子化された変換係数に基づいて前記量子化された変換係数に関する情報を生成することもできる。エントロピーエンコード部２４０は、例えば、指数ゴロム（ｅｘｐｏｎｅｎｔｉａｌＧｏｌｏｍｂ）、ＣＡＶＬＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｖａｒｉａｂｌｅｌｅｎｇｔｈｃｏｄｉｎｇ）、ＣＡＢＡＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）などのような様々なエンコード方法を行うことができる。エントロピーエンコード部２４０は、量子化された変換係数の他に、ビデオ／イメージ復元に必要な情報（例えば、シンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔｓ）の値等）を共にまたは別にエンコードすることもできる。エンコードされた情報（例えば、エンコードされたビデオ／画像情報）は、ビットストリーム形態でＮＡＬ（ｎｅｔｗｏｒｋａｂｓｔｒａｃｔｉｏｎｌａｙｅｒ）ユニット単位で送信または格納されることができる。前記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）等、様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ／画像情報は、一般制限情報（ｇｅｎｅｒａｌｃｏｎｓｔｒａｉｎｔｉｎｆｏｒｍａｔｉｏｎ）をさらに含むことができる。本文書において、エンコード装置からデコード装置に伝達／シグナリングされる情報及び／又はシンタックス要素は、ビデオ／画像情報に含まれることができる。前記ビデオ／画像情報は、上述したエンコード手順を介してエンコードされて前記ビットストリームに含まれることができる。前記ビットストリームは、ネットワークを介して送信されることができ、またはデジタル格納媒体に格納されることができる。ここで、ネットワークは、放送網及び／又は通信網などを含むことができ、デジタル格納媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、様々な格納媒体を含むことができる。エントロピーエンコード部２４０から出力された信号は、送信する送信部（図示せず）及び／又は格納する格納部（図示せず）がエンコード装置２００の内／外部エレメントとして構成されることができ、または送信部は、エントロピーエンコード部２４０に含まれることもできる。

量子化部２３３から出力された量子化された変換係数は、予測信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部２３４及び逆変換部２３５を介して逆量子化及び逆変換を適用することにより、レジデュアル信号（レジデュアルブロックまたはレジデュアルサンプル）を復元できる。加算部１５５は、復元されたレジデュアル信号をインター予測部２２１またはイントラ予測部２２２から出力された予測信号に加えることにより、復元（ｒｅｃｏｎｓｔｒｕｃｔｅｄ）信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）が生成され得る。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部２５０は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て次のピクチャのインター予測のために使用されることもできる。

一方、ピクチャエンコード及び／又は復元過程でＬＭＣＳ（ｌｕｍａｍａｐｐｉｎｇｗｉｔｈｃｈｒｏｍａｓｃａｌｉｎｇ）が適用されることもできる。

フィルタリング部２６０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部２６０は、復元ピクチャに様々なフィルタリング方法を適用して修正された（ｍｏｄｉｆｉｅｄ）復元ピクチャを生成でき、前記修正された復元ピクチャをメモリ２７０、具体的に、メモリ２７０のＤＰＢに格納することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ）、適応的ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ）、両方向フィルタ（ｂｉｌａｔｅｒａｌｆｉｌｔｅｒ）などを含むことができる。フィルタリング部２６０は、各フィルタリング方法についての説明で後述するように、フィルタリングに関する様々な情報を生成してエントロピーエンコード部２４０に伝達することができる。フィルタリングに関する情報は、エントロピーエンコード部２４０でエンコードされてビットストリーム形態で出力されることができる。

メモリ２７０に送信された修正された復元ピクチャは、インター予測部２２１で参照ピクチャとして使用されることができる。エンコード装置は、これを介してインター予測が適用される場合、エンコード装置１００とデコード装置における予測ミスマッチを避けることができ、符号化効率も向上させることができる。

メモリ２７０のＤＰＢは、修正された復元ピクチャをインター予測部２２１における参照ピクチャとして使用するために格納することができる。メモリ２７０は、現在ピクチャ内の動き情報が導出された（または、エンコードされた）ブロックの動き情報及び／又は既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的周辺ブロックの動き情報または時間的周辺ブロックの動き情報として活用するために、インター予測部２２１に伝達することができる。メモリ２７０は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部２２２に伝達することができる。

図３は、本開示が適用され得るビデオ／画像デコード装置の構成を概略的に説明する図である。

図３に示すように、デコード装置３００は、エントロピーデコード部（ｅｎｔｒｏｐｙｄｅｃｏｄｅｒ）３１０、レジデュアル処理部（ｒｅｓｉｄｕａｌｐｒｏｃｅｓｓｏｒ）３２０、予測部（ｐｒｅｄｉｃｔｏｒ）３３０、加算部（ａｄｄｅｒ）３４０、フィルタリング部（ｆｉｌｔｅｒ）３５０、及びメモリ（ｍｅｍｏｅｒｙ）３６０を備えて構成されることができる。予測部３３０は、インター予測部３３１及びイントラ予測部３３２を備えることができる。レジデュアル処理部３２０は、逆量子化部（ｄｅｑｕａｎｔｉｚｅｒ）３２１及び逆変換部（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍｅｒ）３２１を備えることができる。上述したエントロピーデコード部３１０、レジデュアル処理部３２０、予測部３３０、加算部３４０、及びフィルタリング部３５０は、実施形態によって１つのハードウェアコンポーネント（例えば、デコーダチップセットまたはプロセッサ）により構成されることができる。また、メモリ３６０は、ＤＰＢ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を備えることができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ３６０を内／外部コンポーネントとしてさらに備えることもできる。

ビデオ／画像情報を含むビットストリームが入力されれば、デコード装置３００は、図３のエンコード装置でビデオ／画像情報が処理されたプロセスに対応して画像を復元できる。例えば、デコード装置３００は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット／ブロックを導出できる。デコード装置３００は、エンコード装置で適用された処理ユニットを用いてデコードを行うことができる。したがって、デコードの処理ユニットは、例えば、コーディングユニットであることができ、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットからクアッドツリー構造、バイナリツリー構造、及び／又はターナリツリー構造にしたがって分割されることができる。コーディングユニットから１つ以上の変換ユニットが導出され得る。そして、デコード装置３００を介してデコード及び出力された復元画像信号は、再生装置を介して再生されることができる。

デコード装置３００は、図３のエンコード装置から出力された信号をビットストリーム形態で受信することができ、受信された信号は、エントロピーデコード部３１０を介してデコードされることができる。例えば、エントロピーデコード部３１０は、前記ビットストリームをパーシングして画像復元（または、ピクチャ復元）に必要な情報（例えば、ビデオ／画像情報）を導出できる。前記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）など、様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ／画像情報は、一般制限情報（ｇｅｎｅｒａｌｃｏｎｓｔｒａｉｎｔｉｎｆｏｒｍａｔｉｏｎ）をさらに含むことができる。デコード装置は、前記パラメータセットに関する情報及び／又は前記一般制限情報に基づいてさらにピクチャをデコードすることができる。本文書において後述されるシグナリング／受信される情報及び／又はシンタックス要素は、前記デコード手順を介してデコードされて、前記ビットストリームから取得されることができる。例えば、エントロピーデコード部３１０は、指数ゴロム符号化、ＣＡＶＬＣ、またはＣＡＢＡＣなどのコーディング方法を基にビットストリーム内の情報をデコードし、画像復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値を出力できる。より具体的に、ＣＡＢＡＣエントロピーデコード方法は、ビットストリームで各シンタックス要素に該当するビンを受信し、デコード対象のシンタックス要素情報と周辺及びデコード対象ブロックのデコード情報あるいは以前ステップでデコードされたシンボル／ビンの情報を利用して文脈（ｃｏｎｔｅｘｔ）モデルを決定し、決定された文脈モデルによってビン（ｂｉｎ）の発生確率を予測してビンの算術デコード（ａｒｉｔｈｍｅｔｉｃｄｅｃｏｄｉｎｇ）を行い、各シンタックス要素の値に該当するシンボルを生成できる。このとき、ＣＡＢＡＣエントロピーデコード方法は、文脈モデル決定後、次のシンボル／ビンの文脈モデルのためにデコードされたシンボル／ビンの情報を利用して文脈モデルをアップデートすることができる。エントロピーデコード部３１０でデコードされた情報のうち、予測に関する情報は、予測部（インター予測部３３２及びイントラ予測部３３１）に提供され、エントロピーデコード部３１０でエントロピーデコードが行われたレジデュアル値、すなわち、量子化された変換係数及び関連パラメータ情報は、レジデュアル処理部３２０に入力されることができる。レジデュアル処理部３２０は、レジデュアル信号（レジデュアルブロック、レジデュアルサンプル、レジデュアルサンプルアレイ）を導出できる。また、エントロピーデコード部３１０でデコードされた情報のうち、フィルタリングに関する情報は、フィルタリング部３５０に提供されることができる。一方、エンコード装置から出力された信号を受信する受信部（図示せず）がデコード装置３００の内／外部エレメントとしてさらに構成されることができ、または受信部は、エントロピーデコード部３１０の構成要素であることもできる。一方、本文書に係るデコード装置は、ビデオ／画像／ピクチャデコード装置と呼ばれることができ、前記デコード装置は、情報デコーダ（ビデオ／画像／ピクチャ情報デコーダ）及びサンプルデコーダ（ビデオ／画像／ピクチャサンプルデコーダ）に区分することもできる。前記情報デコーダは、前記エントロピーデコード部３１０を備えることができ、前記サンプルデコーダは、前記逆量子化部３２１、逆変換部３２２、加算部３４０、フィルタリング部３５０、メモリ３６０、インター予測部３３２、及びイントラ予測部３３１のうち、少なくとも１つを備えることができる。

逆量子化部３２１では、量子化された変換係数を逆量子化して変換係数を出力できる。逆量子化部３２１は、量子化された変換係数を２次元のブロック形態で再整列することができる。この場合、前記再整列は、エンコード装置で行われた係数スキャン順序に基づいて再整列を行うことができる。逆量子化部３２１は、量子化パラメータ（例えば、量子化ステップサイズ情報）を用いて量子化された変換係数に対する逆量子化を行い、変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）を取得できる。

逆変換部３２２では、変換係数を逆変換してレジデュアル信号（レジデュアルブロック、レジデュアルサンプルアレイ）を取得するようになる。

予測部は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック（ｐｒｅｄｉｃｔｅｄｂｌｏｃｋ）を生成できる。予測部は、エントロピーデコード部３１０から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか、またはインター予測が適用されるか決定することができ、具体的なイントラ／インター予測モードを決定できる。

予測部３２０は、後述する様々な予測方法に基づいて予測信号を生成できる。例えば、予測部は、１つのブロックに対する予測のために、イントラ予測またはインター予測を適用できるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、ｃｏｍｂｉｎｅｄｉｎｔｅｒａｎｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（ｉｎｔｒａｂｌｏｃｋｃｏｐｙ、ＩＢＣ）予測モードに基づくことができ、またはパレットモード（ｐａｌｅｔｔｅｍｏｄｅ）に基づくこともできる。前記ＩＢＣ予測モードまたはパレットモードは、例えば、ＳＣＣ（ｓｃｒｅｅｎｃｏｎｔｅｎｔｃｏｄｉｎｇ）などのように、ゲームなどのコンテンツ画像／動画コーディングのために使用されることができる。ＩＢＣは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と同様に行われることができる。すなわち、ＩＢＣは、本文書において説明されるインター予測技法のうち、少なくとも１つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報が前記ビデオ／画像情報に含まれてシグナリングされることができる。

イントラ予測部３３１は、現在ピクチャ内のサンプルを参照して現在ブロックを予測できる。前記参照されるサンプルは、予測モードによって前記現在ブロックの周辺（ｎｅｉｇｈｂｏｒ）に位置することができ、または離れて位置することができる。イントラ予測において予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。イントラ予測部３３１は、周辺ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。

インター予測部３３２は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、周辺ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、Ｂｉ予測等）情報をさらに含むことができる。インター予測の場合に、周辺ブロックは、現在ピクチャ内に存在する空間的周辺ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と参照ピクチャに存在する時間的周辺ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）とを備えることができる。例えば、インター予測部３３２は、周辺ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び／又は参照ピクチャインデックスを導出できる。様々な予測モードに基づいてインター予測が行われ得るし、前記予測に関する情報は、前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。

加算部３４０は、取得されたレジデュアル信号を予測部（インター予測部３３２及び／又はイントラ予測部３３１を備える）から出力された予測信号（予測されたブロック、予測サンプルアレイ）に加えることにより、復元信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）を生成できる。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。

加算部３４０は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て出力されることができ、または次のピクチャのインター予測のために使用されることもできる。

一方、ピクチャデコード過程でＬＭＣＳ（ｌｕｍａｍａｐｐｉｎｇｗｉｔｈｃｈｒｏｍａｓｃａｌｉｎｇ）が適用されることもできる。

フィルタリング部３５０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部３５０は、復元ピクチャに様々なフィルタリング方法を適用して修正された（ｍｏｄｉｆｉｅｄ）復元ピクチャを生成でき、前記修正された復元ピクチャをメモリ３６０、具体的に、メモリ３６０のＤＰＢに送信することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ）、適応的ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ）、両方向フィルタ（ｂｉｌａｔｅｒａｌｆｉｌｔｅｒ）などを含むことができる。

メモリ３６０のＤＰＢに格納された（修正された）復元ピクチャは、インター予測部３３２で参照ピクチャとして使用されることができる。メモリ３６０は、現在ピクチャ内の動き情報が導出された（または、デコードされた）ブロックの動き情報及び／又は既に復元されたピクチャ内のブロックの動き情報を格納できる。前記格納された動き情報は、空間的周辺ブロックの動き情報または時間的周辺ブロックの動き情報として活用するために、インター予測部２６０に伝達することができる。メモリ３６０は、現在ピクチャ内の復元されたブロックの復元サンプルを格納でき、イントラ予測部３３１に伝達することができる。

本明細書において、エンコード装置１００のフィルタリング部２６０、インター予測部２２１、及びイントラ予測部２２２で説明された実施形態等は、各々デコード装置３００のフィルタリング部３５０、インター予測部３３２、及びイントラ予測部３３１にも同一または対応するように適用されることができる。

前述したように、ビデオコーディングを実行するにあたって圧縮効率を上げるために予測を実行する。それによって、コーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、前記予測されたブロックは、空間ドメイン（または、ピクセルドメイン）での予測サンプルを含む。前記予測されたブロックは、エンコード装置及びデコード装置で同様に導出され、前記エンコード装置は、原本ブロックの原本サンプル値自体でない前記原本ブロックと前記予測されたブロックとの間のレジデュアルに関する情報（レジデュアル情報）をデコード装置にシグナリングすることで画像コーディング効率を上げることができる。デコード装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、前記レジデュアルブロックと前記予測されたブロックを加算して復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。

前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコード装置は、前記原本ブロックと前記予測されたブロックとの間のレジデュアルブロックを導出し、前記レジデュアルブロックに含まれているレジデュアルサンプル（レジデュアルサンプルアレイ）に変換手順を実行して変換係数を導出し、前記変換係数に量子化手順を実行して量子化された変換係数を導出することで、関連したレジデュアル情報を（ビットストリームを介して）デコード装置にシグナリングすることができる。ここで、前記レジデュアル情報は、前記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコード装置は、前記レジデュアル情報に基づいて逆量子化／逆変換手順を実行してレジデュアルサンプル（または、レジデュアルブロック）を導出できる。デコード装置は、予測されたブロックと前記レジデュアルブロックに基づいて復元ピクチャを生成することができる。また、エンコード装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化／逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。

一実施形態では、サブブロック基盤の動き予測を制御するために、サブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグを用いることができる。前記サブブロックＴＭＶＰフラグは、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）レベルでシグナリングされることができ、サブブロック基盤の動き予測のオン（ｏｎ）／オフ（ｏｆｆ）を制御できる。前記サブブロックＴＭＶＰフラグは、例えば、下記の表１のように、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇと称されることができる。

また、アフィン動き予測方法を制御するために、現在ブロックにアフィン予測を適用できるか否かを表すアフィンフラグ（ａｆｆｉｎｅｆｌａｇ）を用いることができる。前記アフィンフラグは、ＳＰＳレベルでシグナリングされることができ、アフィン予測のオン／オフを制御できる。前記アフィンフラグは、例えば、下記の表１のように、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇと称されることができる。前記アフィンフラグの値が１である場合、アフィンタイプフラグを追加的にシグナリングして６パラメータアフィン（６ｐａｒａｍｔｅｒａｆｆｉｎｅ）予測の使用可否を追加的に決定することができる。

ＳＰＳレベルでシグナリングされるシンタックスの一例示は、下記の表１のとおりである。

一実施形態において、ローレベルコーディングシンタックス（ｌｏｗｌｅｖｅｌｃｏｄｉｎｇｓｙｎｔａｘ）では、下記の表２のように、現在ブロック（ｃｏｄｉｎｇｂｌｏｃｋ）のマージフラグｍｅｒｇｅ＿ｆｌａｇが１であれば、ＳＰＳのアフィンフラグが１である場合に現在ブロックの条件（例えば、ブロックサイズ、ブロック形状等）に基づいて、現在ブロックにアフィンマージ（ａｆｆｉｎｅｍｅｒｇｅ）が適用されるか、またはノーマルマージ（ｎｏｒｍａｌｍｅｒｇｅ）が適用されるかの可否を表すためのフラグ（例えば、マージアフィンフラグ）をシグナリングすることができる。前記マージアフィンフラグは、例えば、ｍｅｒｇｅ＿ａｆｆｉｎｅ＿ｆｌａｇと表すことができる。一例示において、ＳＰＳレベルでシグナリングされるアフィンフラグの値が０であり、コーディングユニットレベルでシグナリングされるｍｅｒｇｅ＿ｆｌａｇの値が１である場合、追加的なシンタックス要素のシグナリングなしに、現在ブロックにノーマルマージが適用されることと判断されることができる。

コーディングユニットレベルでシグナリングされるシンタックスの一例示は、下記の表２のとおりである。

一方、表１のハイレベルシンタックスデザインと表２のローレベルシンタックスデザインとが適用される場合、ＡＴＭＶＰがアフィンマージ候補（ａｆｆｉｎｅｍｅｒｇｅｃａｎｄｉｄａｔｅ）として使用されれば、デザインの問題、ロジカルの問題、概念的な問題などが生じ得る。一例示において、ＳＰＳレベルでシグナリングされるアフィンフラグの値が０であり、ＳＰＳレベルでシグナリングされるサブブロックＴＭＶＰフラグの値が１である場合、ＳＰＳでＡＴＭＶＰを使用するようにシグナリングしたにもかかわらず、ＡＴＭＶＰ候補は、いかなる候補としても利用され得ないこともある。上記のようなデザインの問題及びロジカルの問題の他にも、概念的な問題が存在しうる。ＡＴＭＶＰは、サブブロック（一例示において、ＳｕｂＰｕ）基盤の動き予測方法であって、ノーマルマージで非サブブロック基盤（一例示において、ｎｏｎＳｕｂＰｕ基盤）の動き予測候補とサブブロック基盤の動き予測候補との区分のために、サブブロック基盤で予測を行うアフィンマージモードの候補として使用させることにより、現在ブロックのマージであれば、サブブロックマージであるか、非サブブロックマージであるか区分するための目的が存在する。しかし、このような目的にもかかわらず、前記表２によるローレベルシンタックスデザインは、アフィンマージの使用可否によってサブブロックＡＴＭＶＰが制御されているものである。

上記したデザインの問題、ロジカルの問題、及び概念的な問題を補完するために、一実施形態では、下記の表３ないし表１１のうち、少なくとも１つに基づいたハイレベル及び／又はローレベルシンタックスデザインを提供できる。

一実施形態において、サブブロック基盤の動き予測を制御するためのフラグをＳＰＳレベルでシグナリングすることができる。前記サブブロック基盤の動き予測を制御するためのフラグは、例えば、ｓｐｓ＿ｓｕｂｐｕｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇと表すことができ、前記サブブロック基盤の動き予測のオン／オフ可否を決定するのに用いられることができる。前記ｓｐｓ＿ｓｕｂｐｕｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇ及びｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇが下記の表３のようにシグナリングされることができる。

表３のＳＰＳレベルシンタックスデザインを用いる場合、アフィン予測とＡＴＭＶＰの使用可能可否は、下記の表４のように表わされることができる。下記の表４において、１は、当該方法が使用可能であることを、０は、当該方法が使用不可であることを表す。

一実施形態では、ｓｐｓ＿ｓｕｂｐｕｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇに基づいてアフィン予測とＡＴＭＶＰとの使用可能可否を共に制御するためのハイレベルシンタックスデザインが提供され得る。本実施形態にしたがう場合、一例示において、ｓｐｓ＿ｓｕｂｐｕｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１であれば、アフィン予測とＡＴＭＶＰとが共に使用可能なことと決定されることができる。本実施形態に係るハイレベルシンタックスデザインは、下記の表５のとおりであることができる。

一実施形態では、前記表５にしたがってハイレベルシンタックスに含まれたｓｐｓ＿ｓｕｂｐｕｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇに基づき、アフィン予測とＡＴＭＶＰとの使用可能可否を共に制御するものの、各スライス単位でもＡＴＭＶＰの使用可能可否を細部的に制御するために、スライスヘッダシンタックス（ｓｌｉｃｅｈｅａｄｅｒｓｙｎｔａｘ）でｓｌｉｃｅ＿ｓｕｂｐｕｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇを用いる方法が提供され得る。本実施形態に係るスライスヘッダレベルのシンタックスは、例えば、下記の表６のとおりであることができる。

一実施形態において、アフィン予測方法が使用されず、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１である場合、ｍｅｒｇｅ＿ａｆｆｉｎｅ＿ｆｌａｇをシグナリングするものの、アフィン候補（ａｆｆｉｎｅｃａｎｄｉｄａｔｅ）は、候補として構成せず、ＡＴＭＶＰのみ候補として構成する方法が提供され得る。本実施形態を表すためのローレベルシンタックスの例示は、下記の表７のとおりであることができる。

前記表７において、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１であるか、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、マージアフィンモードの適用可否を表すマージアフィンフラグｍｅｒｇｅ＿ａｆｆｉｎｅ＿ｆｌａｇをデコードすることと決定されることができる。

一例示では、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１であるか、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、マージサブブロックモードの適用可否を表すマージサブブロックフラグｍｅｒｇｅ＿ｓｕｂｂｌｏｃｋ＿ｆｌａｇをデコードすることと決定されることができる。前記マージサブブロックモードでは、マージ候補がサブブロック単位に基づいて決定されることができる。

前記表７において、現在ブロックの幅（ｃｂＷｉｄｔｈ）及び高さ（ｃｂＨｅｉｇｈｔ）が各々８以上であり、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１であるか、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、マージアフィンフラグｍｅｒｇｅ＿ａｆｆｉｎｅ＿ｆｌａｇをデコードすることと決定されることができる。

一例示において、前記現在ブロックの前記サブブロックの最大マージ候補数が０より大きい場合、前記既決定マージモードフラグをデコードすることと決定されることができる。

一例示において、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記現在ブロックの前記サブブロックの前記最大マージ候補数が０より大きいことができる。

一例示において、前記既決定マージモードフラグをデコードするか否かは、ｉｆ（ＭａｘＮｕｍＳｕｂｂｌｏｃｋＭｅｒｇｅＣａｎｄ＞０＆＆ｃｂＷｉｄｔｈ＞＝８＆＆ｃｂＨｅｉｇｈｔ＞＝８）の満足可否に基づいて決定されることができる。ＭａｘＮｕｍＳｕｂｂｌｏｃｋＭｅｒｇｅＣａｎｄは、前記サブブロックの前記最大マージ候補数を表し、前記ｃｂＷｉｄｔｈは、前記現在ブロックの幅を表し、前記ｃｂＨｅｉｇｈｔは、前記現在ブロックの高さを表すことができる。

前記表７において、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が０であり、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、ｍｅｒｇｅ＿ａｆｆｉｎｅ＿ｉｄｘはシグナリングされず、０と推論（ｉｎｆｅｒ）されることができる。表７の実施形態にしたがうとき、アフィン予測とＡＴＭＶＰとの使用可能可否は、下記の表８のように表わされることができる。

一実施形態において、アフィン予測方法が使用されず、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、ＡＴＭＶＰがノーマルマージ候補として使用されるように制御する方法が提供され得る。本実施形態にしたがうとき、アフィン予測とＡＴＭＶＰとの使用可能可否は、下記の表９のように表すことができる。

一実施形態において、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇをａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合に限ってシグナリングするようにハイレベルシンタックスをデザインする方法が提供され得る。これは、ＡＴＭＶＰがアフィンマージ候補として使用されて、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が０である場合にはＡＴＭＶＰが使用され得ないようにデザインされたローレベルコーディングツールの構造を考慮したものであることができる。本実施形態に係るハイレベルシンタックスの例示は、下記の表１０のとおりである。

表１０による表１０のＳＰＳレベルシンタックスデザインを用いる場合、アフィン予測とＡＴＭＶＰとの使用可能可否は、下記の表１１のとおりに表わされることができる。

図４は、一実施形態に係るエンコード装置の動作を示すフローチャートであり、図５は、一実施形態に係るエンコード装置の構成を示すブロック図である。

図４及び図５によるエンコード装置は、図６及び図７によるデコード装置と対応する動作を行うことができる。したがって、図６及び図７において後述されるデコード装置の動作は、図４及び図５によるエンコード装置にも同様に適用されることができる。

図４に開示された各ステップは、図２に開示されたエンコード装置２００によって行われることができる。より具体的に、Ｓ４００及びＳ４１０は、図２に開示された予測部２２０によって行われることができ、Ｓ４２０は、図２に開示されたエントロピーエンコード部２４０によって行われることができる。さらに、Ｓ４００ないしＳ４２０による動作は、図３において前述された内容のうち一部に基づいたものである。したがって、図２及び図３において前述された内容と重複する具体的な内容は、説明を省略したり、簡単にする。

図５に示されたように、一実施形態に係るエンコード装置は、予測部２２０及びエントロピーエンコード部２４０を備えることができる。しかし、場合によっては、図５に示された構成要素の全てがエンコード装置の必須構成要素でないことがあり、エンコード装置は、図５に示された構成要素より多いか、少ない構成要素により実現されることができる。

一実施形態に係るエンコード装置において予測部２２０及びエントロピーエンコード部２４０は、各々別のチップ（ｃｈｉｐ）で実現されるか、少なくとも２つ以上の構成要素が１つのチップを介して実現されることもできる。

一実施形態に係るエンコード装置は、現在ブロックにアフィン予測を適用できるか否か及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを決定できる（Ｓ４００）。より具体的に、エンコード装置の予測部２２０は、現在ブロックにアフィン予測を適用できるか否か及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを決定できる。

一実施形態に係るエンコード装置は、前記現在ブロックに前記アフィン予測を適用できるか否か及び前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かに対する前記決定に基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをエンコードするか否かを決定できる（Ｓ４１０）。より具体的に、エンコード装置の予測部２２０は、前記現在ブロックに前記アフィン予測を適用できるか否か及び前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かに対する前記決定に基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをエンコードするか否かを決定できる。

一例示において、前記予め決定されたマージモードは、マージアフィンモードまたはマージサブブロックモードであることができ、前記既決定マージモードフラグは、マージアフィンフラグまたはマージサブブロックフラグであることができる。前記マージアフィンフラグは、ｍｅｒｇｅ＿ａｆｆｉｎｅ＿ｆｌａｇと表すことができ、前記マージサブブロックフラグは、ｍｅｒｇｅ＿ｓｕｂｂｌｏｃｋ＿ｆｌａｇと表すことができる。

一実施形態に係るエンコード装置は、前記既決定マージモードフラグをエンコードするか否かに対する前記決定に基づいて、前記現在ブロックに前記アフィン予測を適用できるか否かを表すアフィンフラグ、前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグ、及び前記既決定マージモードフラグをエンコードすることができる（Ｓ４２０）。より具体的に、エンコード装置のエントロピーエンコード部２４０は、前記既決定マージモードフラグをエンコードするか否かに対する前記決定に基づいて、前記現在ブロックに前記アフィン予測を適用できるか否かを表すアフィンフラグ、前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグ、及び前記既決定マージモードフラグをエンコードすることができる。

一実施形態において、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをエンコードすることと決定されることができる。

一実施形態において、前記現在ブロックの幅及び高さが各々８以上であり、前記アフィンフラグの値が１である第１条件を満たすか、前記サブブロックＴＭＶＰフラグの値が１である第２条件を満たす場合、前記既決定マージモードフラグをエンコードすることと決定されることができる。

一実施形態において、前記既決定マージモードフラグをエンコードするか否かは、下記の数式１に基づいて決定されることができる。

前記数式１においてｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、前記アフィンフラグを表し、前記ｃｂＷｉｄｔｈは、前記現在ブロックの前記幅を表し、前記ｃｂＨｅｉｇｈｔは、前記現在ブロックの前記高さを表し、前記ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、前記サブブロックＴＭＶＰフラグを表すことができる。

一実施形態において、前記既決定マージモードフラグは、前記現在ブロックにアフィンマージモードが適用されるか否かを表すマージアフィンフラグまたは前記現在ブロックの前記サブブロック単位でマージモードが適用されるか否かを表すマージサブブロックフラグであることができる。

一実施形態において、前記現在ブロックの前記サブブロックの最大マージ候補数が０より大きい場合、前記既決定マージモードフラグをエンコードすることと決定されることができる。

一実施形態において、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記現在ブロックの前記サブブロックの前記最大マージ候補数が０より大きいことを特徴とすることができる。

一実施形態において、前記既決定マージモードフラグをエンコードするか否かは、下記の数式２に基づいて決定されることができる。

前記数式２においてＭａｘＮｕｍＳｕｂｂｌｏｃｋＭｅｒｇｅＣａｎｄは、前記サブブロックの前記最大マージ候補数を表し、前記ｃｂＷｉｄｔｈは、前記現在ブロックの幅を表し、前記ｃｂＨｅｉｇｈｔは、前記現在ブロックの高さを表すことができる。

図４及び図５のエンコード装置及びエンコード装置の動作方法によれば、エンコード装置は、現在ブロックにアフィン予測を適用できるか否か及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを決定し（Ｓ４００）、前記現在ブロックに前記アフィン予測を適用できるか否か及び前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かに対する前記決定に基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをエンコードするか否かを決定し（Ｓ４１０）、前記既決定マージモードフラグをエンコードするか否かに対する前記決定に基づいて、前記現在ブロックに前記アフィン予測を適用できるか否かを表すアフィンフラグ、前記現在ブロックの前記サブブロックに基づいた前記時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグ、及び前記既決定マージモードフラグをエンコードするものの（Ｓ４２０）、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをエンコードすることと決定されることを特徴とすることができる。すなわち、アフィンフラグ及びサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定することにより、画像コーディング効率を上げることができる。

図６は、一実施形態に係るデコード装置の動作を示すフローチャートであり、図７は、一実施形態に係るデコード装置の構成を示すブロック図である。

図６に開示された各ステップは、図３に開示されたデコード装置３００によって行われることができる。より具体的に、Ｓ６００及びＳ６１０は、図３に開示されたエントロピーデコード部３１０によって行われることができ、Ｓ６２０は、図３に開示された予測部３３０によって行われることができ、Ｓ６３０は、図３に開示された加算部３４０によって行われることができる。さらに、Ｓ６００ないしＳ６３０による動作は、図３において前述された内容のうち一部に基づいたものである。したがって、図３において前述された内容と重複する具体的な内容は、説明を省略したり、簡単にする。

図７に示されたように、一実施形態に係るデコード装置は、エントロピーデコード部３１０、予測部３３０、及び加算部３４０を備えることができる。しかし、場合によっては、図７に示された構成要素の全てがデコード装置の必須構成要素でないことがあり、デコード装置は、図７に示された構成要素より多いか、少ない構成要素により実現されることができる。

一実施形態に係るデコード装置においてエントロピーデコード部３１０、予測部３３０、及び加算部３４０は、各々別のチップ（ｃｈｉｐ）で実現されるか、少なくとも２つ以上の構成要素が１つのチップを介して実現されることもできる。

一実施形態に係るデコード装置は、ビットストリームに基づいて、現在ブロックにアフィン予測を適用できるか否かを表すアフィンフラグ及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグをデコードすることができる（Ｓ６００）。より具体的に、デコード装置のエントロピーデコード部３１０は、ビットストリームに基づいて、現在ブロックにアフィン予測を適用できるか否かを表すアフィンフラグ及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグをデコードすることができる。

一例示において、前記アフィンフラグは、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇと表すことができ、前記サブブロックＴＭＶＰフラグは、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇと表すことができる。前記サブブロックＴＭＶＰフラグは、場合によって、サブＰＵＴＭＶＰフラグと称されることもできる。

一例示において、前記アフィンフラグ及び前記サブブロックＴＭＶＰフラグは、ＳＰＳレベルでシグナリングされることができる。

一実施形態に係るデコード装置は、前記デコードされたアフィンフラグ及び前記デコードされたサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定できる（Ｓ６１０）。より具体的に、デコード装置のエントロピーデコード部３１０は、前記デコードされたアフィンフラグ及び前記デコードされたサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定できる。

一実施形態に係るデコード装置は、前記既決定マージモードフラグをデコードするか否かに対する前記決定に基づいて、前記現在ブロックに対する予測サンプルを導出できる（Ｓ６２０）。より具体的に、デコード装置の予測部３３０は、前記既決定マージモードフラグをデコードするか否かに対する前記決定に基づいて、前記現在ブロックに対する予測サンプルを導出できる。

一実施形態に係るデコード装置は、前記既決定マージモードフラグをデコードするか否かに対する前記決定に基づいて前記現在ブロックに適用される予測モードを導出でき、前記導出された予測モードに基づいて現在ブロックに対する予測サンプルを導出できる。

一実施形態に係るデコード装置は、前記現在ブロックに対する前記予測サンプルに基づいて前記現在ブロックに対する復元サンプルを生成できる（Ｓ６３０）。より具体的に、デコード装置の加算部３４０は、前記現在ブロックに対する前記予測サンプルに基づいて前記現在ブロックに対する復元サンプルを生成できる。

一実施形態において、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをデコードすることと決定されることができる。

一例示において、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１であるか、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、前記既決定マージモードフラグをデコードすることと決定されることができる。

他の一例示において、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１であるか、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、マージアフィンフラグｍｅｒｇｅ＿ａｆｆｉｎｅ＿ｆｌａｇをデコードすることと決定されることができる。

さらに他の一例示において、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１であるか、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１である場合、マージサブブロックフラグｍｅｒｇｅ＿ｓｕｂｂｌｏｃｋ＿ｆｌａｇをデコードすることと決定されることができる。

一実施形態において、前記現在ブロックの幅及び高さが各々８以上であり、前記アフィンフラグの値が１である第１条件を満たすか、前記サブブロックＴＭＶＰフラグの値が１である第２条件を満たす場合、前記既決定マージモードフラグをデコードすることと決定されることができる。

一実施形態において、前記既決定マージモードフラグをデコードするか否かは、下記の数式３に基づいて決定されることができる。

前記数式３においてｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、前記アフィンフラグを表し、前記ｃｂＷｉｄｔｈは、前記現在ブロックの前記幅を表し、前記ｃｂＨｅｉｇｈｔは、前記現在ブロックの前記高さを表し、前記ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、前記サブブロックＴＭＶＰフラグを表すことができる。

一実施形態において、前記現在ブロックの前記サブブロックの最大マージ候補数が０より大きい場合、前記既決定マージモードフラグをデコードすることと決定されることができる。

一実施形態において、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記現在ブロックの前記サブブロックの前記最大マージ候補数が０より大きいことができる。

一実施形態において、前記既決定マージモードフラグをデコードするか否かは、下記の数式４に基づいて決定されることができる。

前記数式４においてＭａｘＮｕｍＳｕｂｂｌｏｃｋＭｅｒｇｅＣａｎｄは、前記サブブロックの前記最大マージ候補数を表し、前記ｃｂＷｉｄｔｈは、前記現在ブロックの幅を表し、前記ｃｂＨｅｉｇｈｔは、前記現在ブロックの高さを表すことができる。

図６及び図７に開示されたデコード装置及びデコード装置の動作方法によれば、デコード装置は、ビットストリームに基づいて、現在ブロックにアフィン予測を適用できるか否かを表すアフィンフラグ及び前記現在ブロックのサブブロックに基づいた時間的動きベクトル予測子を用いることができるか否かを表すサブブロックＴＭＶＰフラグをデコードし（Ｓ６００）、前記デコードされたアフィンフラグ及び前記デコードされたサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを前記現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定し（Ｓ６１０）、前記既決定マージモードフラグをデコードするか否かに対する前記決定に基づいて、前記現在ブロックに対する予測サンプルを導出し（Ｓ６２０）、前記現在ブロックに対する前記予測サンプルに基づいて前記現在ブロックに対する復元サンプルを生成するものの（Ｓ６３０）、前記アフィンフラグの値が１であるか、前記サブブロックＴＭＶＰフラグの値が１である場合、前記既決定マージモードフラグをデコードすることと決定されることを特徴とすることができる。すなわち、アフィンフラグ及びサブブロックＴＭＶＰフラグに基づいて、予め決定されたマージモードを現在ブロックに適用するか否かを表す既決定マージモードフラグをデコードするか否かを決定することにより、画像コーディング効率を上げることができる。

上述した実施形態において、方法は、一連のステップまたはブロックとして順序図を基に説明されているが、本開示は、ステップの順序に限定されるものではなく、あるステップは、上述したことと異なるステップと異なる順序とで、または同時に発生することができる。また、当業者であれば、順序図に示されたステップが排他的でなく、他のステップが含まれるか、順序図の１つまたはそれ以上のステップが本開示の範囲に影響を及ぼさずに削除され得ることが理解できるであろう。

上述した本開示に係る方法は、ソフトウェア形態で実現されることができ、本開示に係るエンコード装置及び／又はデコード装置は、例えば、ＴＶ、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの画像処理を行う装置に含まれることができる。

本開示において実施形態等がソフトウェアで実現されるとき、上述した方法は、上述した機能を果たすモジュール（過程、機能など）で実現されることができる。モジュールは、メモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサ内部または外部にあることができ、よく知られた様々な手段でプロセッサと連結されることができる。プロセッサは、ＡＳＩＣ（ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）、他のチップセット、論理回路、及び／又はデータ処理装置を含むことができる。メモリは、ＲＯＭ（ｒｅａｄ－ｏｎｌｙｍｅｍｏｒｙ）、ＲＡＭ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、フラッシュメモリ、メモリカード、格納媒体、及び／又は他の格納装置を含むことができる。すなわち、本開示において説明した実施形態等は、プロセッサ、マイクロプロセッサ、コントローラ、またはチップ上で実現されて行われることができる。例えば、各図面で図示した機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラ、またはチップ上で実現されて行われることができる。この場合、実現のための情報（例えば、ｉｎｆｏｒｍａｔｉｏｎｏｎｉｎｓｔｒｕｃｔｉｏｎｓ）またはアルゴリズムがデジタル格納媒体に格納されることができる。

また、本開示が適用されるデコード装置及びエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、注文型ビデオ（ＶｏＤ）サービス提供装置、ＯＴＴビデオ（Ｏｖｅｒｔｈｅｔｏｐｖｉｄｅｏ）装置、インターネットストリーミングサービス提供装置、３次元（３Ｄ）ビデオ装置、ＶＲ（ｖｉｒｔｕａｌｒｅａｌｉｔｙ）装置、ＡＲ（ａｒｇｕｍｅｎｔｅｒｅａｌｉｔｙ）装置、画像電話ビデオ装置、運送手段端末（例えば、車両（自律走行車両を含む）端末、飛行機端末、船舶端末等）及び医療用ビデオ装置などに含まれることができ、ビデオ信号またはデータ信号を処理するために使用されることができる。例えば、ＯＴＴビデオ（Ｏｖｅｒｔｈｅｔｏｐｖｉｄｅｏ）装置では、ゲームコンソール、ブルーレイプレーヤ、インターネット接続ＴＶ、ホームシアターシステム、スマートフォン、タブレットＰＣ、ＤＶＲ（ＤｉｇｉｔａｌＶｉｄｅｏＲｅｃｏｄｅｒ）などを含むことができる。

また、本開示が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータ読み取り可能な記録媒体に格納されることができる。本開示に係るデータ構造を有するマルチメディアデータもコンピュータ読み取り可能な記録媒体に格納されることができる。前記コンピュータ読み取り可能な記録媒体は、コンピュータで読むことができるデータが格納されるあらゆる種類の格納装置及び分散格納装置を含む。前記コンピュータ読み取り可能な記録媒体は、例えば、ブルーレイディスク（ＢＤ）、汎用直列バス（ＵＳＢ）、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＲＡＭ、ＣＤ－ＲＯＭ、磁気テープ、フロッピーディスク、及び光学的データ格納装置を含むことができる。また、前記コンピュータ読み取り可能な記録媒体は、搬送波（例えば、インターネットを介しての送信）の形態で実現されたメディアを含む。また、エンコード方法で生成されたビットストリームがコンピュータ読み取り可能な記録媒体に格納されるか、有無線通信ネットワークを介して送信されることができる。

また、本開示の実施形態は、プログラムコードによるコンピュータプログラム製品で実現されることができ、前記プログラムコードは、本開示の実施形態によりコンピュータで行われることができる。前記プログラムコードは、コンピュータにより読み取り可能なキャリア上に格納されることができる。

図８は、本文書の開示が適用され得るコンテンツストリーミングシステムの例を示す。

図８に示すように、本開示が適用されるコンテンツストリーミングシステムは、大別して、エンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディア格納所、ユーザ装置、及びマルチメディア入力装置を含むことができる。

前記エンコードサーバは、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置から入力されたコンテンツをデジタルデータで圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。他の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコードサーバは省略されることができる。

前記ビットストリームは、本開示が適用されるエンコード方法またはビットストリーム生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信または受信する過程で一時的に前記ビットストリームを格納することができる。

前記ストリーミングサーバは、ウェブサーバを介してのユーザ要請に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体役割をする。ユーザが前記ウェブサーバに所望のサービスを要請すれば、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。このとき、前記コンテンツストリーミングシステムは、別の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令／応答を制御する役割をする。

前記ストリーミングサーバは、メディア格納所及び／又はエンコードサーバからコンテンツを受信することができる。例えば、前記エンコードサーバからコンテンツを受信するようになる場合、前記コンテンツをリアルタイムに受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間の間、格納することができる。

前記ユーザ装置の例では、携帯電話、スマートフォン（ｓｍａｒｔｐｈｏｎｅ）、ノートブックコンピュータ（ｌａｐｔｏｐｃｏｍｐｕｔｅｒ）、デジタル放送用端末機、ＰＤＡ（ｐｅｒｓｏｎａｌｄｉｇｉｔａｌａｓｓｉｓｔａｎｔｓ）、ＰＭＰ（ｐｏｒｔａｂｌｅｍｕｌｔｉｍｅｄｉａｐｌａｙｅｒ）、ナビゲーション、スレートＰＣ（ｓｌａｔｅＰＣ）、タブレットＰＣ（ｔａｂｌｅｔＰＣ）、ウルトラブック（ｕｌｔｒａｂｏｏｋ）、ウェアラブルデバイス（ｗｅａｒａｂｌｅｄｅｖｉｃｅ、例えば、ウォッチ型端末機（ｓｍａｒｔｗａｔｃｈ）、グラス型端末機（ｓｍａｒｔｇｌａｓｓ）、ＨＭＤ（ｈｅａｄｍｏｕｎｔｅｄｄｉｓｐｌａｙ））、デジタルＴＶ、デスクトップコンピュータ、デジタルサイニジなどがありうる。

前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。

Claims

デコード装置によって行われる画像デコード方法において、
アフィンイネーブルフラグ情報とサブブロック時間的動きベクトル予測イネーブルフラグ情報を含む画像情報を受信するステップと、
サブブロックベース特定マージモードが現在ブロックに適用されるかに関連する特定フラグ情報を受信するか決定するステップと、
前記決定に基づいて前記特定フラグ情報を受信するステップと、
前記特定フラグ情報と、前記アフィンイネーブルフラグ情報と、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報とに基づいて、前記サブブロックベース特定マージモードに対する特定マージインデックスを受信するかをチェックするステップと、
前記決定の結果に基づいて前記現在ブロックの予測モードを導出するステップと、
前記導出された予測モードに基づいて前記現在ブロックにインター予測を適用することにより前記現在ブロックに対する予測サンプルを導出するステップと、
前記予測サンプルに基づいて再構成サンプルを生成するステップとを含み、
前記アフィンイネーブルフラグ情報と前記サブブロック時間的動きベクトル予測イネーブルフラグ情報の少なくとも一つに基づいて、前記特定フラグ情報の受信を実行するかを決定し、
前記特定フラグ情報の値が１に等しい場合に基づいて、前記アフィンイネーブルフラグ情報の値は０に等しく、前記サブブロック時間的動きベクトル予測エネーブルフラグ情報が１に等しい場合に基づいて、前記特定マージインデックスが受信されないことがチェックされる、画像デコード方法。
前記アフィンイネーブルフラグ情報の値が０と等しいことと、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報の値が１に等しいことに基づいて、前記特定フラグ情報を受信すると決定する、請求項１に記載の画像デコード方法。
前記アフィンイネーブルフラグ情報の値が１と等しいことと、前記現在ブロックの幅と高さが８に等しいかより大きいことに基づいて、前記特定フラグ情報を受信すると決定する、請求項１に記載の画像デコード方法。
前記特定フラグ情報が受信されるかを決定することは、以下の方程式に基づいて実行され、
（（ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＆＆ｃｂＷｉｄｔｈ＞＝８＆＆ｃｂＨｅｉｇｈｔ＞＝８）｜｜ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）
ここで、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、前記アフィンイネーブルフラグ情報を表し、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報を表し、ｃｂＷｉｄｔｈとｃｂＨｅｉｇｈｔは、それぞれ、前記現在ブロックの幅及び高さを表す、請求項１に記載の画像デコード方法。
前記サブブロックベース特定マージモードは、アフィンマージモード又はサブブロックベースマージモードである、請求項１に記載の画像デコード方法。
エンコーディング装置が実行する画像エンコード方法であって、
アフィンイネーブルフラグ情報とサブブロック時間的動きベクトル予測イネーブルフラグ情報を導出するステップと、
サブブロックベース特定マージモードが現在ブロックに適用されるかに関連する特定フラグ情報をシグナリングする(signal)か決定するステップと、
前記決定に基づいて前記特定フラグ情報を導出するステップと、
前記特定フラグ情報と、前記アフィンイネーブルフラグ情報と、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報とに基づいて、前記サブブロックベース特定マージモードに対する特定マージインデックスをシグナルするかをチェックするステップと、
前記アフィンイネーブルフラグ情報と、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報と、前記特定フラグ情報と、前記特定マージインデックスの少なくとも一つを含む画像情報をエンコーディングするステップとを含み、
前記特定フラグ情報をシグナリングする(signal)かを決定するステップは、前記アフィンイネーブルフラグ情報と前記サブブロック時間的動きベクトル予測イネーブルフラグ情報の少なくとも一つに基づいて実行され、
前記特定フラグ情報の値が１に等しい場合に基づいて、前記アフィンイネーブルフラグ情報の値は０に等しく、前記サブブロック時間的動きベクトル予測エネーブルフラグ情報が１に等しい場合に基づいて、前記特定マージインデックスが受信されないことがチェックされる、画像エンコード方法。
前記アフィンイネーブルフラグ情報の値が０と等しいことと、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報の値が１に等しいことに基づいて、前記特定フラグ情報を受信すると決定する、請求項６に記載の画像エンコード方法。
前記アフィンイネーブルフラグ情報の値が１と等しいことと、前記現在ブロックの幅と高さが８に等しいかより大きいことに基づいて、前記特定フラグ情報をシグナリングする(signal)と決定する、請求項６に記載の画像エンコード方法。
前記特定フラグ情報がシグナリング（signal）されるかを決定することは、以下の方程式に基づいて実行され、
（（ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＆＆ｃｂＷｉｄｔｈ＞＝８＆＆ｃｂＨｅｉｇｈｔ＞＝８）｜｜ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）
ここで、ｓｐｓ＿ａｆｆｉｎｅ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、前記アフィンイネーブルフラグ情報を表し、ｓｐｓ＿ｓｂｔｍｖｐ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報を表し、ｃｂＷｉｄｔｈとｃｂＨｅｉｇｈｔは、それぞれ、前記現在ブロックの幅及び高さを表す、請求項６に記載の画像エンコード方法。
前記サブブロックベース特定マージモードは、アフィンマージモード又はサブブロックベースマージモードである、請求項６に記載の画像エンコード方法。
画像に対するデータを送信する方法であって、
ビットストリームを取得するステップであって、前記ビットストリームは、アフィンイネーブルフラグ情報とサブブロック時間的動きベクトル予測イネーブルフラグ情報を導出し、サブブロックベース特定マージモードが現在ブロックに適用されるかに関連する特定フラグ情報をシグナルするか決定し、前記決定に基づいて前記特定フラグ情報を導出し、前記特定フラグ情報と、前記アフィンイネーブルフラグ情報と、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報とに基づいて、前記サブブロックベース特定マージモードに対する特定マージインデックスをシグナルするかをチェックすることに基づいて生成される、ステップと、
前記アフィンイネーブルフラグ情報と、前記サブブロック時間的動きベクトル予測イネーブルフラグ情報と、前記特定フラグ情報と前記特定マージインデックスの少なくとも一つを含む画像情報をエンコーディングすることにより前記ビットストリームを生成するステップと、
前記ビットストリームを含む前記データを送信するステップと含み、
前記アフィンイネーブルフラグ情報と前記サブブロック時間的動きベクトル予測イネーブルフラグ情報の少なくとも一つに基づいて、前記特定フラグ情報をシグナルすることを実行するかを決定し、
前記特定フラグ情報の値が１に等しい場合に基づいて、前記アフィンイネーブルフラグ情報の値は０に等しく、前記サブブロック時間的動きベクトル予測エネーブルフラグ情報が１に等しい場合に基づいて、前記特定マージインデックスが受信されないことがチェックされる、方法。