JP7342153B2

JP7342153B2 - 動きベクトルを用いた画像コーディング方法および装置

Info

Publication number: JP7342153B2
Application number: JP2021576744A
Authority: JP
Inventors: ネリパク; チョンハクナム; ヒョンムンチャン
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2019-06-24
Filing date: 2020-06-24
Publication date: 2023-09-11
Anticipated expiration: 2040-06-24
Also published as: US11659199B2; US20220116651A1; JP2023155412A; WO2020262918A1; KR20240029111A; KR20210158398A; JP2022538841A; US20230283801A1; US20220385936A1; US11451821B2; KR102640263B1

Description

本文書は、動きベクトルを用いた画像コーディング方法および装置に関する。

近年、４Ｋまたは８Ｋ以上のＵＨＤ（Ultra High Definition）画像／ビデオのような高解像度、高品質の画像／ビデオに対する需要が様々な分野で増加している。画像／ビデオデータが高解像度、高品質になるほど、既存（従来）の画像／ビデオデータに比べて相対的に送信される情報量またはビット量が増加するので、既存の有無線広帯域回線のような媒体を利用して画像データを送信するか、既存の記憶（格納）媒体を利用して画像／ビデオデータを記憶する場合、送信コスト（費用）および記憶コストが増加する。

また、近年、ＶＲ（Virtual Reality）、ＡＲ（Artificial Reality）コンテンツやホログラムなどの没入型（実感）メディア（Immersive Media）に対する関心および需要が増加しており、ゲーム画像のように、現実画像と異なる画像特性を有する画像／ビデオに対する放送が増加している。

これにより、上記のような様々な特性を有する高解像度・高品質の画像／ビデオの情報を効果的に圧縮して送信するか、記憶し、再生するために高効率の画像／ビデオ圧縮技術が求められる。

また、画像／ビデオコーディング（符号化）（coding）におけるインター予測は、ＳＭＶＤ（Symmetric Motion Vector Difference）参照インデックスのための手順および／またはＭＭＶＤ（Merge Motion Vector Difference）のための手順を含むことができ、参照ピクチャマーキング（例えば、ショートタームまたはロングターム参照）を考慮して上記手順を行う技術に対する議論がある。

本文書の一実施形態によると、画像／ビデオコーディング効率を上げる方法および装置が提供される。

本文書の一実施形態によると、画像／ビデオコーディングシステムにおいて効率的なインター予測を行う方法および装置が提供される。

本文書の一実施形態によると、インター予測において動きベクトル差分に関する情報をシグナリングする方法および装置が提供される。

本文書の一実施形態によると、現（現在）ブロックに双予測が適用される場合、Ｌ０動きベクトル差分およびＬ１動きベクトル差分に関する情報をシグナリングする方法および装置が提供される。

本文書の実施形態によると、ＳＭＶＤフラグをシグナリングする方法および装置が提供される。

本文書の一実施形態によると、双予測のための参照ピクチャのタイプに基づいて予測手順が行われ得る。

本文書の一実施形態によると、参照ピクチャマーキングに基づいてＳＭＶＤ参照インデックスに関する手順が行われ得る。

本文書の一実施形態によると、ショートターム参照ピクチャ（ショートターム参照のために使用されるとマーキングされたピクチャ）を用いてＳＭＶＤ参照インデックスに関する手順が行われ得る。

本文書の一実施形態によると、デコード（復号）（decoding）装置により実行されるビデオ／画像デコード方法が提供される。

本文書の一実施形態によると、ビデオ／画像デコードを実行するデコード装置が提供される。

本文書の一実施形態によると、エンコード（符号化）（encoding）装置により実行されるビデオ／画像エンコード方法が提供される。

本文書の一実施形態によると、ビデオ／画像エンコードを実行するエンコード装置が提供される。

本文書の一実施形態によると、本文書の実施形態のうちの少なくとも１つに開示されたビデオ／画像エンコード方法によって生成されたエンコードされたビデオ／画像情報が記憶されたコンピュータ読み取り可能なデジタル記憶媒体が提供される。

本文書の一実施形態によると、デコード装置により本文書の実施形態のうちの少なくとも１つに開示されたビデオ／画像デコード方法を実行するようにするエンコードされた情報またはエンコードされたビデオ／画像情報が記憶されたコンピュータ読み取り可能なデジタル記憶媒体が提供される。

本文書によると、全般的な画像／ビデオ圧縮効率を上げることができる。

本文書によると、動きベクトル差分に関する情報を効率的にシグナリングすることができる。

本文書によると、現ブロックに双予測が適用される場合、Ｌ１動きベクトル差分を効率的に導出することができる。

本文書によると、Ｌ１動きベクトル差分の導出に利用される情報は、参照ピクチャのタイプに基づいてシグナリングされ、したがって、コーディンの複雑度を下げることができる。

本文書の実施形態によると、ＳＭＶＤのための参照ピクチャインデックスの導出のためにショートターム参照ピクチャを用いることにより、効率的なインター予測が実行されることができる。

本文書の具体的な一例を介して得ることができる効果は、以上で羅列された効果に制限されない。例えば、関連する技術分野の通常の知識を有する者が（a person having ordinary skill in the related art）本文書から理解し、または誘導できる多様な技術的効果が存在することができる。それによって、本文書の具体的な効果は、本文書に明示的に記載されたものに制限されずに、本文書の技術的特徴から理解され、または誘導されることができる多様な効果を含むことができる。

本文書の実施形態に適用されることができるビデオ／画像コーディングシステムの例を概略的に示す図である。本文書の実施形態に適用されることができるビデオ／画像エンコード装置の構成を概略的に説明する図である。本文書の実施形態に適用されることができるビデオ／画像デコード装置の構成を概略的に説明する図である。インター予測ベースのビデオ／画像エンコード方法の例を示す図である。インター予測ベースのビデオ／画像デコード方法の例を示す図である。インター予測手順を例示的に示す図である。本文書に係るマージ候補リストを構成する方法を概略的に示す図である。本文書に係るＭＶＰ候補リストを構成する方法を概略的に示す図である。ＳＭＶＤを説明する図である。インター予測において動きベクトルを導出する方法を説明する図である。本文書の一実施形態に係るＭＭＶＤのＭＶＤ導出（誘導）過程（処理、プロセス）を示す図である。本文書の他の実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す図である。本文書の他の実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す図である。本文書の一実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す図である。本文書の一実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す図である。本文書の一実施形態によってＳＭＶＤを説明する図である。本文書の一実施形態に係るＭＭＶＤの導出方法を示すフローチャートである。本文書の一実施形態に係るＭＭＶＤの導出方法を示すフローチャートである。本文書の一実施形態に係るＭＭＶＤの導出方法を示すフローチャートである。本文書の実施形態に係るビデオ／画像エンコード方法および関連のコンポーネントの一例を概略的に示す図である。本文書の実施形態に係るビデオ／画像エンコード方法および関連のコンポーネントの一例を概略的に示す図である。本文書の実施形態に係る画像／ビデオデコード方法および関連のコンポーネントの一例を概略的に示す図である。本文書の実施形態に係る画像／ビデオデコード方法および関連のコンポーネントの一例を概略的に示す図である。本文書で開示された実施形態が適用されることができるコンテンツストリーミングシステムの例を示す図である。

本文書の開示は、様々な変更を加えることができ、様々な実施形態を有することができるが、特定の実施形態を図面に例示し、詳細に説明する。しかしながら、これは、本開示を特定の実施形態に限定しようとするわけではない。本文書で使用する用語は、単に特定の実施形態を説明するために使用されたものであって、本文書における実施形態の技術的思想を限定しようとする意図に使用されるものではない。単数の表現は、文脈上明らかに異なる意味ではない限り、複数の表現を含む。本文書において、「含む」または「有する」などの用語は、文書上に記載された特徴、数字、段階、動作、構成要素、部品またはこれらを組み合わせたものが存在することを指定しようとするものであり、１つもしくは複数の異なる特徴や、数字、段階、動作、構成要素、部品またはこれらを組み合わせたものの存在もしくは付加の可能性を予め排除しないものと理解されるべきである。

一方、本文書で説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の便宜のために独立して示すものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで具現されることを意味するのではない。例えば、各構成のうち、２つ以上の構成を合わせて１つの構成をなすこともあり、１つの構成が複数の構成に分けられることもある。各構成が統合および／または分離された実施形態も、本文書の開示範囲に含まれる。

以下、添付図を参照して、本文書の実施形態を説明する。以下、図面上の同じ構成要素に対しては同じ参照符号を使用し得、同じ構成要素に対して重複する説明は省略され得る。

図１は、本文書の実施形態が適用されることができるビデオ／画像コーディングシステムの例を概略的に示す。

図１に示すように、ビデオ／画像コーディングシステムは、第１の装置（ソースデバイス）および第２の装置（受信デバイス）を備えることができる。ソースデバイスは、エンコードされたビデオ（video）／画像（image）情報またはデータを、ファイルまたはストリーミング形態でデジタル記憶媒体またはネットワークを介して受信デバイスに伝達することができる。

上記ソースデバイスは、ビデオソース、エンコード装置、送信部を備えることができる。上記受信デバイスは、受信部、デコード装置、およびレンダラを備えることができる。上記エンコード装置は、ビデオ／画像エンコード装置と呼ばれることができ、上記デコード装置は、ビデオ／画像デコード装置と呼ばれることができる。送信器は、エンコード装置に備えられることができる。受信器は、デコード装置に備えられることができる。レンダラは、ディスプレイ部を備えることができ、ディスプレイ部は、別個のデバイスまたは外部コンポーネントで構成されることもできる。

ビデオソースは、ビデオ／画像のキャプチャ、合成、または生成過程などを介してビデオ／画像を取得することができる。ビデオソースは、ビデオ／画像キャプチャデバイスおよび／またはビデオ／画像生成デバイスを含むことができる。ビデオ／画像キャプチャデバイスは、例えば、１つまたは複数のカメラ、以前にキャプチャされたビデオ／画像を含むビデオ／画像アーカイブなどを含むことができる。ビデオ／画像生成デバイスは、例えば、コンピュータ、タブレット、およびスマートフォンなどを含むことができ、（電子的に）ビデオ／画像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ／画像が生成され得るし、この場合、関連データが生成される過程にビデオ／画像キャプチャ過程が代替されることができる。

エンコード装置は、入力ビデオ／画像をエンコードすることができる。エンコード装置は、圧縮およびコーディング効率のために、予測、変換、量子化など、一連の手順を行うことができる。エンコードされたデータ（エンコードされたビデオ／画像情報）は、ビットストリーム（bitstream）形態で出力されることができる。

送信部は、ビットストリーム形態で出力されたエンコードされたビデオ／画像情報またはデータを、ファイルまたはストリーミング形態でデジタル記憶媒体またはネットワークを介して受信デバイスの受信部に伝達することができる。デジタル記憶媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、様々な記憶媒体を含むことができる。送信部は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送／通信ネットワークを介しての送信のためのエレメントを含むことができる。受信部は、上記ビットストリームを受信／抽出してデコード装置に伝達することができる。

デコード装置は、エンコード装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を行ってビデオ／画像をデコードすることができる。

レンダラは、デコードされたビデオ／画像をレンダリングすることができる。レンダリングされたビデオ／画像は、ディスプレイ部を介して表示（ディスプレイ）されることができる。

本文書は、ビデオ／画像コーディングに関する。例えば、本文書で開示された方法／実施形態は、ＶＶＣ（Versatile Video Coding）標準で開示される方法に適用されることができる。また、本文書で開示された方法／実施形態は、ＥＶＣ（Essential Video Coding）標準、ＡＶ１（AOMedia Video 1）標準、ＡＶＳ２（2nd generation of Audio Video coding Standard）または次世代ビデオ／画像コーディング標準（例えば、Ｈ．２６７またはＨ．２６８など）で開示される方法に適用されることができる。

本文書では、ビデオ／画像コーディングに関する多様な実施形態を提示し、別の言及がない限り、上記実施形態は互いに組み合わせて行うこともある。

本文書で、ビデオ（video）は、時間の流れによる一連の画像（image）の集合を意味することができる。ピクチャ（picture）は、一般的に特定の時間帯の１つの画像を示す単位を意味し、スライス（slice）／タイル（tile）は、コーディングにおいてピクチャの一部を構成する単位である。スライス／タイルは、１つまたは複数のＣＴＵ（Coding Tree Unit）を含むことができる。１つのピクチャは、１つまたは複数のスライス／タイルで構成されることができる。タイルは、ピクチャ内の特定のタイル列および特定のタイル行（列）内のＣＴＵの四角領域である（A tile is a rectangular region of CTUs within a particular tile column and a particular tile row in a picture）。上記タイル列は、ＣＴＵの四角領域であり、上記四角領域は、上記ピクチャの高さと同じ高さを有し、幅はピクチャパラメータセット内のシンタックス要素により明示され得る（The tile column is a rectangular region of CTUs having a height equal to the height of the picture and a width specified by syntax elements in the picture parameter set）。上記タイル行は、ＣＴＵの四角領域であり、上記四角領域は、ピクチャパラメータセット内のシンタックス要素によって明示される高さ（幅）を有し、幅（高さ）は、上記ピクチャの幅（高さ）と同一であり得る（The tile row is a rectangular region of CTUs having a height specified by syntax elements in the picture parameter set and a width equal to the width of the picture）。タイルのスキャンは、ピクチャをパーティショニングするＣＴＵの特定のシーケンシャル（順次）オーダリングを示し得、上記ＣＴＵは、タイル内のＣＴＵラスタスキャンで連続して整列され得、ピクチャ内のタイルは、上記ピクチャの上記タイルのラスタスキャンで連続して整列され得る（A tile scan is a specific sequential ordering of CTUs partitioning a picture in which the CTUs are ordered consecutively in CTU raster scan in a tile whereas tiles in a picture are ordered consecutively in a raster scan of the tiles of the picture）。スライスは、単一のＮＡＬユニットに排他的に含まれ得る、整数個の完全なタイルまたはピクチャのタイル内の整数個の連続する完全なＣＴＵ行を含み得る（A slice includes an integer number of complete tiles or an integer number of consecutive complete CTU rows within a tile of a picture that may be exclusively contained in a single NAL unit）

一方、１つのピクチャは、２つ以上のサブピクチャに区分されることができる。サブピクチャは、ピクチャ内の１つまたは複数のスライスの四角領域であり得る（an rectangular region of one or more slices within a picture）。

ピクセル（pixel）またはペル（pel）は、１つのピクチャ（または、画像）を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として、「サンプル（sample）」が使用され得る。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、ルマ（luma）成分のピクセル／ピクセル値のみを示すことができ、クロマ（chroma）成分のピクセル／ピクセル値のみを示すこともできる。

ユニット（unit）は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定領域および当該領域に関連する情報のうちの少なくとも１つを含むことができる。１つのユニットは、１つのルマブロックおよび２つのクロマ（例えば、ｃｂ、ｃｒ）ブロックを含むことができる。ユニットは、場合によって、ブロック（block）または領域（area）などの用語と混用されることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列およびＮ個の行とからなるサンプル（または、サンプルアレイ）または変換係数（transform coefficient）の集合（または、アレイ）を含むことができる。

本文書において、「ＡまたはＢ（A or B）」は、「ただＡ」、「ただＢ」、または「ＡおよびＢ両方」を意味し得る。言い換えると、本文書において、「ＡまたはＢ（A or B）」は、「Ａおよび／またはＢ（A and/or B）」と解釈され得る。例えば、本文書において、「Ａ、ＢまたはＣ（A, B or C）」は、「ただＡ」、「ただＢ」、「ただＣ」、または「Ａ、ＢおよびＣの任意の全ての組み合わせ（any combination of A, B and C）」を意味し得る。

本文書で使用されるスラッシュ（／）や休止符（comma）は、「および／または（and/or）」を意味し得る。例えば、「Ａ／Ｂ」は、「Ａおよび／またはＢ」を意味し得る。これによって、「Ａ／Ｂ」は、「ただＡ」、「ただＢ」、または「ＡおよびＢ両方」を意味し得る。例えば、「Ａ、Ｂ、Ｃ」は、「Ａ、ＢまたはＣ」を意味し得る。

本文書において、「少なくとも１つのＡおよびＢ（at least one of A and B）」は、「ただＡ」、「ただＢ」または「ＡおよびＢ両方」を意味し得る。また、本文書において、「少なくとも１つのＡまたはＢ（at least one of A or B）」や「少なくとも１つのＡおよび／またはＢ（at least one of A and/or B）」という表現は、「少なくとも１つのＡおよびＢ（at least one of A and B）」と同様に解釈され得る。

また、本文書において、「少なくとも１つのＡ、ＢおよびＣ（at least one of A, B and C）」は、「ただＡ」、「ただＢ」、「ただＣ」、または「Ａ、ＢおよびＣの任意の全ての組み合わせ（any combination of A, B and C）」を意味し得る。また、「少なくとも１つのＡ、ＢまたはＣ（at least one of A, B or C）」や「少なくとも１つのＡ、Ｂおよび／またはＣ（at least one of A, B and/or C）」は、「少なくとも１つのＡ、ＢおよびＣ（at least one of A, B and C）」を意味し得る。

また、本文書で使用される括弧は、「例えば（for example）」を意味し得る。具体的には、「予測（イントラ予測）」と表示された場合、「予測」の一例として「イントラ予測」が提案されたものであり得る。言い換えると、本文書の「予測」は、「イントラ予測」に制限（limit）されず、「イントラ予測」が「予測」の一例として提案されたものであり得る。また、「予測（すなわち、イントラ予測）」と表示された場合にも、「予測」の一例として「イントラ予測」が提案されたものであり得る。

本文書において１つの図面内で個別に説明される技術的特徴は、個別に具現されてもよく、同時に具現されてもよい。

図２は、本文書の実施形態が適用されることができるビデオ／画像エンコード装置の構成を概略的に説明する図である。以下、エンコード装置というのは、画像エンコード装置および／またはビデオエンコード装置を含むことができる。

図２に示すように、エンコード装置２００は、画像分割部（image partitioner）２１０、予測部（predictor）２２０、残差（レジデュアル）処理部（residual processor）２３０、エントロピ符号化（エンコーディング、エンコード）部（entropy encoder）２４０、加算部（adder）２５０、フィルタリング部（filter）２６０、およびメモリ（memory）２７０を備えて構成されることができる。予測部２２０は、インター予測部２２１およびイントラ予測部２２２を備えることができる。残差処理部２３０は、変換部（transformer）２３２、量子化部（quantizer）２３３、逆量子化部（dequantizer）２３４、逆変換部（inverse transformer）２３５を備えることができる。残差処理部２３０は、減算部（subtractor、２３１）をさらに備えることができる。加算部２５０は、復元部（reconstructor）または復元ブロック生成部（reconstructed block generator）と呼ばれることができる。上述した画像分割部２１０、予測部２２０、残差処理部２３０、エントロピ符号化部２４０、加算部２５０、およびフィルタリング部２６０は、実施形態によって１つまたは複数のハードウェアコンポーネント（例えば、エンコーダチップセットまたはプロセッサ）によって構成されることができる。また、メモリ２７０は、ＤＰＢ（Decoded Picture Buffer）を備えることができ、デジタル記憶媒体によって構成されることもできる。上記ハードウェアコンポーネントは、メモリ２７０を内／外部コンポーネントとしてさらに備えられることもできる。

画像分割部２１０は、エンコード装置２００に入力された入力画像（または、ピクチャ、フレーム）を１つまたは複数の処理ユニット（processing unit）に分割することができる。一例として、上記処理ユニットは、コーディングユニット（Coding Unit、ＣＵ）と呼ばれることができる。この場合、コーディングユニットは、コーディングツリーユニット（Coding Tree Unit、ＣＴＵ）または最大コーディングユニット（Largest Coding Unit、ＬＣＵ）からＱＴＢＴＴＴ（Quad-Tree Binary-Tree Ternary-Tree）構造によって再帰的に（recursively）分割されることができる。例えば、１つのコーディングユニットは、四分木（クアッドツリー）構造、二分木（バイナリツリー）構造、および／または三分木（ターナリ）構造に基づいて下位（deeper）デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、四分木構造が先に適用され、二分木構造および／または三分木構造がその後に適用されることができる。あるいは、二分木構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて、本開示に係るコーディング手順が行われ得る。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使用されることができ、または、必要に応じてコーディングユニットは、再帰的に（recursively）より下位デプスのコーディングユニットに分割されて最適なサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、および復元などの手順を含むことができる。他の例として、上記処理ユニットは、予測ユニット（ＰＵ：Prediction Unit）または変換ユニット（ＴＵ：Transform Unit）をさらに備えることができる。この場合、上記予測ユニットおよび上記変換ユニットは、各々上述した最終コーディングユニットから分割またはパーティショニングされることができる。上記予測ユニットは、サンプル予測の単位であることができ、上記変換ユニットは、変換係数を導く単位および／または変換係数から残差信号（residual signal）を導く単位であることができる。

ユニットは、場合によって、ブロック（block）または領域（area）などの用語と混用されることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列およびＮ個の行からなるサンプルまたは変換係数（transform coefficient）などの集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、輝度（luma）成分のピクセル／ピクセル値のみを示すことができ、彩度（chroma）成分のピクセル／ピクセル値のみを示すこともできる。サンプルは、１つのピクチャ（または、画像）をピクセル（pixel）またはペル（pel）に対応する用語として使用することができる。

エンコード装置２００は、入力画像信号（オリジナル（原本）ブロック、オリジナルサンプルアレイ）から、インター予測部２２１またはイントラ予測部２２２から出力された予測信号（予測されたブロック、予測サンプルアレイ）を減算して残差信号（residual signal、残差（残余）ブロック、残差サンプルアレイ）を生成することができ、生成された残差信号は、変換部２３２に送信される。この場合、図示されたように、エンコーダ２００内において入力画像信号（オリジナルブロック、オリジナルサンプルアレイ）から予測信号（予測ブロック、予測サンプルアレイ）を減算するユニットは、減算部２３１と呼ばれることができる。予測部は、処理対象ブロック（以下、現ブロックという）に対する予測を行い、上記現ブロックに対する予測サンプルを含む予測されたブロック（predicted block）を生成することができる。予測部は、現ブロックもしくはＣＵ単位で、イントラ予測が適用されるか、またはインター予測が適用されるか、を決定することができる。予測部は、各予測モードについての説明で後述するように、予測モード情報など、予測に関する様々な情報を生成してエントロピ符号化部２４０に伝達することができる。予測に関する情報は、エントロピ符号化部２４０でエンコードされてビットストリーム形態で出力されることができる。

イントラ予測部２２２は、現ピクチャ内のサンプルを参照して現ブロックを予測できる。上記参照されるサンプルは、予測モードによって上記現ブロックの隣接（neighbor）に位置することができ、または、離れて位置することもできる。イントラ予測において、予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。非方向性モードは、例えば、ＤＣモードおよび平面（プラナー）モード（Ｐｌａｎａｒモード）を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、３３個の方向性予測モードまたは６５個の方向性予測モードを含むことができる。ただし、これは、例示であり、設定によってそれ以上またはそれ以下の個数の方向性予測モードが使用され得る。イントラ予測部２２２は、隣接ブロックに適用された予測モードを用いて、現ブロックに適用される予測モードを決定することもできる。

インター予測部２２１は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現ブロックとの間の動き情報の相関性に基づいて、動き情報を、ブロック、サブブロック、またはサンプル単位で予測することができる。上記動き情報は、動きベクトルおよび参照ピクチャインデックスを含むことができる。上記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、ＢＩ予測など）情報をさらに含むことができる。インター予測の場合に、隣接ブロックは、現ピクチャ内に存在する空間隣接ブロック（spatial neighboring block）と参照ピクチャに存在する時間隣接ブロック（temporal neighboring block）とを含むことができる。上記参照ブロックを含む参照ピクチャと上記時間隣接ブロックを含む参照ピクチャとは同じであることができ、異なることもできる。上記時間隣接ブロックは、コロケート（同一位置）参照ブロック（collocated reference block）、コロケートＣＵ（ｃｏｌＣＵ）などの名前で呼ばれることができ、上記時間隣接ブロックを含む参照ピクチャは、コロケートピクチャ（collocated picture、ｃｏｌＰｉｃ）と呼ばれることもできる。例えば、インター予測部２２１は、隣接ブロックに基づいて動き情報候補リストを構成し、上記現ブロックの動きベクトルおよび／または参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が行われ得るし、例えば、スキップモードおよびマージモードの場合に、インター予測部２２１は、隣接ブロックの動き情報を現ブロックの動き情報として利用することができる。スキップモードの場合、マージモードとは異なり、残差信号が送信されないことがある。動き情報予測（Motion Vector Prediction、ＭＶＰ）モードの場合、隣接ブロックの動きベクトルを動きベクトル予測子（motion vector predictor）として用い、動きベクトル差分（motion vector difference）をシグナリングすることにより、現ブロックの動きベクトルを指示することができる。

予測部２２０は、後述する様々な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、１つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、ＣｏｍｂｉｎｅｄＩｎｔｅｒａｎｄＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（Intra Block Copy、ＩＢＣ）予測モードに基づくことができ、またはパレットモード（palette mode）に基づくこともできる。上記ＩＢＣ予測モードまたはパレットモードは、例えば、ＳＣＣ（Screen Content Coding）などのように、ゲームなどのコンテンツ画像／動画コーディングのために使用されることができる。ＩＢＣは、基本的に現ピクチャ内で予測を行うが、現ピクチャ内で参照ブロックを導出する点においてインター予測と同様に行われることができる。すなわち、ＩＢＣは、本文書において説明されるインター予測技法のうちの少なくとも１つを用いることができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブルおよびパレットインデックスに関する情報に基づいて、ピクチャ内のサンプル値をシグナリングすることができる。

上記予測部（インター予測部２２１および／または上記イントラ予測部２２２を含む）を介して生成された予測信号は、復元信号を生成するために用いられるか、残差信号を生成するために用いられることができる。変換部２３２は、残差信号に変換技法を適用して、変換係数（transform coefficients）を生成することができる。例えば、変換技法は、ＤＣＴ（Discrete Cosine Transform）、ＤＳＴ（Discrete Sine Transform）、ＧＢＴ（Graph-Based Transform）、およびＣＮＴ（Conditionally Non-linear Transform）の少なくとも１つを含むことができる。ここで、ＧＢＴは、ピクセル間の関係情報をグラフで表現する際に、このグラフから得られた変換を意味する。ＣＮＴは、以前に復元された全てのピクセル（all previously reconstructed pixel）を用いて予測信号を生成し、それに基づいて獲得される変換を意味する。また、変換過程は、正方形の同じサイズを有するピクセルブロックに適用されてもよく、正方形ではない可変サイズのブロックに適用されてもよい。

量子化部２３３は、変換係数を量子化してエントロピ符号化部２４０に送信され、エントロピ符号化部２４０は、量子化された信号（量子化された変換係数に関する情報）をエンコードしてビットストリームに出力することができる。上記量子化された変換係数に関する情報は、残差情報と呼ばれることができる。量子化部２３３は、係数スキャン順序（scan order）に基づいてブロック形態の量子化された変換係数を１次元ベクトル形態で再整列することができ、上記１次元ベクトル形態の量子化された変換係数に基づいて上記量子化された変換係数に関する情報を生成することもできる。エントロピ符号化部２４０は、例えば、指数ゴロム（exponential Golomb）、ＣＡＶＬＣ（Context-Adaptive Variable Length Coding）、ＣＡＢＡＣ（Context-Adaptive Binary Arithmetic Coding）などの様々なエンコード方法を行うことができる。エントロピ符号化部２４０は、量子化された変換係数の他に、ビデオ／イメージ復元に必要な情報（例えば、シンタックス要素（syntax elements）の値など）を共にまたは別にエンコードすることもできる。エンコードされた情報（例えば、エンコードされたビデオ／画像情報）は、ビットストリーム形態でＮＡＬ（Network Abstraction Layer）ユニット単位で送信または記憶されることができる。上記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）など、様々なパラメータセットに関する情報をさらに含むことができる。また、上記ビデオ／画像情報は、一般制限情報（general constraint information）をさらに含むことができる。本文書において、エンコード装置からデコード装置に伝達／シグナリングされる情報および／またはシンタックス要素は、ビデオ／画像情報に含まれることができる。上記ビデオ／画像情報は、上述したエンコード手順を介してエンコードされて上記ビットストリームに含まれることができる。上記ビットストリームは、ネットワークを介して送信されることができ、またはデジタル記憶媒体に記憶されることができる。ここで、ネットワークは、放送網および／または通信網などを含むことができ、デジタル記憶媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、様々な記憶媒体を含むことができる。エントロピ符号化部２４０から出力された信号は、送信する送信部（図示せず）および／もしくは記憶する記憶部（図示せず）がエンコード装置２００の内／外部エレメントとして構成されることができ、または送信部は、エントロピ符号化部２４０に含まれることもできる。

量子化部２３３から出力された量子化された変換係数は、予測信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部２３４および逆変換部２３５を介して逆量子化および逆変換を適用することにより、残差信号（残差ブロックまたは残差サンプル）を復元できる。加算部１５５は、復元された残差信号をインター予測部２２１またはイントラ予測部２２２から出力された予測信号に加えることにより、復元（reconstructed）信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）を生成し得る。スキップモードが適用された場合のように、処理対象ブロックに対する残差がない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部２５０は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て次のピクチャのインター予測のために使用されることもできる。

一方、ピクチャエンコードおよび／または復元過程でＬＭＣＳ（Luma Mapping with Chroma Scaling）が適用されることもできる。

フィルタリング部２６０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部２６０は、復元ピクチャに様々なフィルタリング方法を適用して修正された（modified）復元ピクチャを生成することができ、上記修正された復元ピクチャを、メモリ２７０、具体的には、メモリ２７０のＤＰＢに記憶することができる。上記様々なフィルタリング方法は、例えば、デブロックフィルタリング、サンプル適応オフセット（sample adaptive offset）、適応ループフィルタ（adaptive loop filter）、両方向フィルタ（bilateral filter）などを含むことができる。フィルタリング部２６０は、各フィルタリング方法についての説明で後述するように、フィルタリングに関する様々な情報を生成してエントロピ符号化部２４０に伝達することができる。フィルタリングに関する情報は、エントロピ符号化部２４０でエンコードされてビットストリーム形態で出力されることができる。

メモリ２７０に送信された修正された復元ピクチャは、インター予測部２２１で参照ピクチャとして使用されることができる。エンコード装置は、これを介してインター予測が適用される場合、エンコード装置１００とデコード装置とにおける予測ミスマッチを避けることができ、符号化効率も向上させることができる。

メモリ２７０のＤＰＢは、修正された復元ピクチャをインター予測部２２１における参照ピクチャとして使用するために記憶することができる。メモリ２７０は、現ピクチャ内の動き情報が導出された（または、エンコードされた）ブロックの動き情報および／または既に復元されたピクチャ内のブロックの動き情報を記憶することができる。上記記憶された動き情報は、空間隣接ブロックの動き情報または時間隣接ブロックの動き情報として活用されるために、インター予測部２２１に伝達されることができる。メモリ２７０は、現ピクチャ内の復元されたブロックの復元サンプルを記憶することができ、イントラ予測部２２２に伝達することができる。

図３は、本文書の実施形態が適用されることができるビデオ／画像デコード装置の構成を概略的に説明する図である。以下、デコード装置というのは、画像デコード装置および／またはビデオデコード装置を含むことができる。

図３に示すように、デコード装置３００は、エントロピ復号（デコード、デコーディング）部（entropy decoder）３１０、残差処理部（residual processor）３２０、予測部（predictor）３３０、加算部（adder）３４０、フィルタリング部（filter）３５０、およびメモリ（memory）３６０を備えて構成されることができる。予測部３３０は、イントラ予測部３３１およびインター予測部３３２を備えることができる。残差処理部３２０は、逆量子化部（dequantizer）３２１および逆変換部（inverse transformer）３２１を備えることができる。上述したエントロピ復号部３１０、残差処理部３２０、予測部３３０、加算部３４０、およびフィルタリング部３５０は、実施形態によって１つのハードウェアコンポーネント（例えば、デコーダチップセットまたはプロセッサ）により構成されることができる。また、メモリ３６０は、ＤＰＢ（Decoded Picture Buffer）を備えることができ、デジタル記憶媒体により構成されることもできる。上記ハードウェアコンポーネントは、メモリ３６０を内／外部コンポーネントとしてさらに備えられることもできる。

ビデオ／画像情報を含むビットストリームが入力されると、デコード装置３００は、図２のエンコード装置でビデオ／画像情報が処理されたプロセスに対応して画像を復元できる。例えば、デコード装置３００は、上記ビットストリームから取得したブロック分割関連情報に基づいてユニット／ブロックを導出できる。デコード装置３００は、エンコード装置で適用された処理ユニットを用いてデコードを行うことができる。したがって、デコードの処理ユニットは、例えば、コーディングユニットであることができ、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットから、四分木構造、二分木構造、および／または三分木ツリー構造に従って分割されることができる。コーディングユニットから１つまたは複数の変換ユニットが導出され得る。そして、デコード装置３００を介してデコードおよび出力された復元画像信号は、再生装置を介して再生されることができる。

デコード装置３００は、図２のエンコード装置から出力された信号をビットストリーム形態で受信することができ、受信した信号は、エントロピ復号部３１０を介してデコードされることができる。例えば、エントロピ復号部３１０は、上記ビットストリームをパージングして画像復元（または、ピクチャ復元）に必要な情報（例えば、ビデオ／画像情報）を導出できる。上記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）など、様々なパラメータセットに関する情報をさらに含むことができる。また、上記ビデオ／画像情報は、一般制限情報（general constraint information）をさらに含むことができる。デコード装置は、上記パラメータセットに関する情報および／または上記一般制限情報に基づいてさらにピクチャをデコードすることができる。本文書において後述されるシグナリング／受信される情報および／またはシンタックス要素は、上記デコード手順を介してデコードされて、上記ビットストリームから取得されることができる。例えば、エントロピ復号部３１０は、指数ゴロム符号化、ＣＡＶＬＣ、またはＣＡＢＡＣなどのコーディング方法を基にビットストリーム内の情報をデコードし、画像復元に必要なシンタックスエレメントの値、残差に関する変換係数の量子化された値を出力できる。より具体的には、ＣＡＢＡＣエントロピ復号方法は、ビットストリームで各シンタックス要素に該当するビンを受信し、デコード対象のシンタックス要素情報と隣接およびデコード対象ブロックのデコード情報または以前ステップでデコードされたシンボル／ビンの情報とを利用してコンテキスト（文脈）（context）モデルを決定し、決定されたコンテキストモデルによってビン（bin）の発生確率を予測してビンの算術デコード（arithmetic decoding）を行い、各シンタックス要素の値に該当するシンボルを生成することができる。このとき、ＣＡＢＡＣエントロピ復号方法は、コンテキストモデルの決定後、次のシンボル／ビンのコンテキストモデルのためにデコードされたシンボル／ビンの情報を利用してコンテキストモデルをアップデートすることができる。エントロピ復号部３１０でデコードされた情報のうち、予測に関する情報は、予測部（インター予測部３３２およびイントラ予測部３３１）に提供され、エントロピ復号部３１０でエントロピ復号が行われた残差値、すなわち、量子化された変換係数および関連パラメータ情報は、残差処理部３２０に入力されることができる。残差処理部３２０は、残差信号（残差ブロック、残差サンプル、残差サンプルアレイ）を導出できる。また、エントロピ復号部３１０でデコードされた情報のうち、フィルタリングに関する情報は、フィルタリング部３５０に提供されることができる。一方、エンコード装置から出力された信号を受信する受信部（図示せず）が、デコード装置３００の内／外部エレメントとしてさらに構成されることができ、または受信部は、エントロピ復号部３１０の構成要素であることもできる。一方、本文書に係るデコード装置は、ビデオ／画像／ピクチャデコード装置と呼ばれることができ、上記デコード装置は、情報デコーダ（ビデオ／画像／ピクチャ情報デコーダ）およびサンプルデコーダ（ビデオ／画像／ピクチャサンプルデコーダ）に区分することもできる。上記情報デコーダは、上記エントロピ復号部３１０を備えることができ、上記サンプルデコーダは、上記逆量子化部３２１、逆変換部３２２、加算部３４０、フィルタリング部３５０、メモリ３６０、インター予測部３３２、およびイントラ予測部３３１のうちの少なくとも１つを備えることができる。

逆量子化部３２１では、量子化された変換係数を逆量子化して変換係数を出力できる。逆量子化部３２１は、量子化された変換係数を２次元のブロック形態で再整列することができる。この場合、上記再整列は、エンコード装置で行われた係数スキャン順序に基づいて再整列を行うことができる。逆量子化部３２１は、量子化パラメータ（例えば、量子化ステップサイズ情報）を用いて量子化された変換係数に対する逆量子化を行い、変換係数（transform coefficient）を取得することができる。

逆変換部３２２では、変換係数を逆変換して残差信号（残差ブロック、残差サンプルアレイ）を取得する。

予測部は、現ブロックに対する予測を行い、上記現ブロックに対する予測サンプルを含む予測されたブロック（predicted block）を生成することができる。予測部は、エントロピ復号部３１０から出力された上記予測に関する情報に基づいて、上記現ブロックにイントラ予測が適用されるか、またはインター予測が適用されるか、を決定することができ、具体的なイントラ／インター予測モードを決定できる。

予測部３３０は、後述する様々な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、１つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、ＣｏｍｂｉｎｅｄＩｎｔｅｒａｎｄＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（Intra Block Copy、ＩＢＣ）予測モードに基づくことができ、またはパレットモード（palette mode）に基づくこともできる。上記ＩＢＣ予測モードまたはパレットモードは、例えば、ＳＣＣ（Screen Content Coding）などのように、ゲームなどのコンテンツ画像／動画コーディングのために使用されることができる。ＩＢＣは、基本的に現ピクチャ内で予測を行うが、現ピクチャ内で参照ブロックを導出する点においてインター予測と同様に行われることができる。すなわち、ＩＢＣは、本文書において説明されるインター予測技法のうちの少なくとも１つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブルおよびパレットインデックスに関する情報が上記ビデオ／画像情報に含まれてシグナリングされることができる。

イントラ予測部３３１は、現ピクチャ内のサンプルを参照して現ブロックを予測できる。上記参照されるサンプルは、予測モードによって上記現ブロックの隣接（neighbor）に位置することができ、または離れて位置することができる。イントラ予測において予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。イントラ予測部３３１は、隣接ブロックに適用された予測モードを用いて、現ブロックに適用される予測モードを決定することもできる。

インター予測部３３２は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。上記動き情報は、動きベクトルおよび参照ピクチャインデックスを含むことができる。上記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、ＢＩ予測など）情報をさらに含むことができる。インター予測の場合に、隣接ブロックは、現ピクチャ内に存在する空間隣接ブロック（spatial neighboring block）と参照ピクチャに存在する時間隣接ブロック（temporal neighboring block）とを備えることができる。例えば、インター予測部３３２は、隣接ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて上記現ブロックの動きベクトルおよび／または参照ピクチャインデックスを導出できる。様々な予測モードに基づいてインター予測が行われ得るし、上記予測に関する情報は、上記現ブロックに対するインター予測のモードを指示する情報を含むことができる。

加算部３４０は、取得された残差信号を予測部（インター予測部３３２および／またはイントラ予測部３３１を備える）から出力された予測信号（予測されたブロック、予測サンプルアレイ）に加えることにより、復元信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）を生成することができる。スキップモードが適用された場合のように、処理対象ブロックに対する残差がない場合、予測されたブロックが復元ブロックとして使用されることができる。

加算部３４０は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て出力されることができ、または次のピクチャのインター予測のために使用されることもできる。

一方、ピクチャデコード過程でＬＭＣＳ（Luma Mapping with Chroma Scaling）が適用されることもできる。

フィルタリング部３５０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部３５０は、復元ピクチャに様々なフィルタリング方法を適用して修正された（modified）復元ピクチャを生成することができ、上記修正された復元ピクチャを、メモリ３６０、具体的には、メモリ３６０のＤＰＢに送信することができる。上記様々なフィルタリング方法は、例えば、デブロックフィルタリング、サンプル適応オフセット（sample adaptive offset）、適応ループフィルタ（adaptive loop filter）、両方向フィルタ（bilateral filter）などを含むことができる。

メモリ３６０のＤＰＢに記憶された（修正された）復元ピクチャは、インター予測部３３２で参照ピクチャとして使用されることができる。メモリ３６０は、現ピクチャ内の動き情報が導出された（または、デコードされた）ブロックの動き情報および／または既に復元されたピクチャ内のブロックの動き情報を記憶できる。上記記憶された動き情報は、空間隣接ブロックの動き情報または時間隣接ブロックの動き情報として活用されるために、インター予測部２６０に伝達されることができる。メモリ３６０は、現ピクチャ内の復元されたブロックの復元サンプルを記憶でき、イントラ予測部３３１に伝達することができる。

本明細書において、エンコード装置２００のフィルタリング部２６０、インター予測部２２１、およびイントラ予測部２２２で説明された実施形態などは、各々、デコード装置３００のフィルタリング部３５０、インター予測部３３２、およびイントラ予測部３３１にも同一または対応するように適用されることができる。

前述したように、ビデオコーディングを実行するにあたって、圧縮効率を上げるために予測を実行する。これを介してコーディング対象ブロックである現ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、上記予測されたブロックは、空間領域（ドメイン）（または、ピクセル領域）における予測サンプルを含む。上記予測されたブロックは、エンコード装置およびデコード装置で同じく導出され、上記エンコード装置は、オリジナルブロックのオリジナルサンプル値自体でない、上記オリジナルブロックと上記予測されたブロックとの間の残差に関する情報（残差情報）をデコード装置にシグナリングすることで、画像コーディング効率を上げることができる。デコード装置は、上記残差情報に基づいて残差サンプルを含む残差ブロックを導出し、上記残差ブロックと上記予測されたブロックとを合わせて復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。

上記残差情報は、変換および量子化手順を介して生成されることができる。例えば、エンコード装置は、上記オリジナルブロックと上記予測されたブロックとの間の残差ブロックを導出し、上記残差ブロックに含まれている残差サンプル（残差サンプルアレイ）に変換手順を実行して変換係数を導出し、上記変換係数に量子化手順を実行して量子化された変換係数を導出することで、関連する残差情報を（ビットストリームを介して）デコード装置にシグナリングできる。ここで、上記残差情報は、上記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコード装置は、上記残差情報に基づいて逆量子化／逆変換の手順を実行して残差サンプル（または、残差ブロック）を導出することができる。デコード装置は、予測されたブロックと上記残差ブロックとに基づいて復元ピクチャを生成することができる。また、エンコード装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化／逆変換して残差ブロックを導出し、これに基づいて復元ピクチャを生成することができる。

本文書において、量子化／逆量子化および／または変換／逆変換のうちの少なくとも１つは、省略されることができる。上記量子化／逆量子化が省略される場合、上記量子化された変換係数は、変換係数と呼ばれることができる。上記変換／逆変換が省略される場合、上記変換係数は、係数もしくは残差係数と呼ばれることもでき、または、表現の統一性のために、依然として変換係数と呼ばれることもできる。

本文書において、量子化された変換係数および変換係数は、各々、変換係数およびスケーリングされた（scaled）変換係数と呼ばれることができる。この場合、残差情報は、変換係数（１つまたは複数（ら））に関する情報を含むことができ、上記変換係数（１つまたは複数）に関する情報は、残差コーディングシンタックスを介してシグナリングされることができる。上記残差情報（または、上記変換係数（１つまたは複数）に関する情報）に基づいて変換係数が導出されることができ、上記変換係数に対する逆変換（スケーリング）を介してスケーリングされた変換係数が導出されることができる。上記スケーリングされた変換係数に対する逆変換（変換）に基づいて残差サンプルが導出されることができる。これは、本文書の他の部分でも同様に適用／表現されることができる。

イントラ予測は、現ブロックが属するピクチャ（以下、現ピクチャという）内の参照サンプルに基づいて、現ブロックに対する予測サンプルを生成する予測を示すことができる。現ブロックにイントラ予測が適用される場合、現ブロックのイントラ予測に使用する隣接参照サンプルが導出されることができる。上記現ブロックの隣接参照サンプルは、大きさｎＷ×ｎＨの現ブロックの左側（left）境界に隣接するサンプルおよび左下側（bottom-left）に隣接する合計２×ｎＨ個のサンプル、現ブロックの上側（top）境界に隣接するサンプルおよび右上側（top-right）に隣接する合計２×ｎＷ個のサンプルならびに現ブロックの左上側（top-left）に隣接する１個のサンプルを含むことができる。あるいは、上記現ブロックの隣接参照サンプルは、複数列の上側隣接サンプルおよび複数行の左側隣接サンプルを含むこともできる。また、上記現ブロックの隣接参照サンプルは、大きさｎＷ×ｎＨの現ブロックの右側（right）境界に隣接する合計ｎＨ個のサンプル、現ブロックの下側（bottom）境界に隣接する合計ｎＷ個のサンプルおよび現ブロックの右下側（bottom-right）に隣接する１個のサンプルを含むこともできる。

ただし、現ブロックの隣接参照サンプルのうちの一部は、まだデコードされない、または利用可能でない場合がある。この場合、デコーダは、利用可能なサンプルとして利用可能でないサンプルを代替（substitution）して予測に使用する隣接参照サンプルを構成することができる。あるいは、利用可能なサンプルの補間（interpolation）を介して予測に使用する隣接参照サンプルを構成することができる。

隣接参照サンプルが導出された場合、（ｉ）現ブロックの隣接（neighboring）参照サンプルの平均（average）または補間（interpolation）に基づいて予測サンプルを導出（誘導）することができ、（ii）現ブロックの隣接参照サンプルのうち、予測サンプルに対して特定（予測）方向に存在する参照サンプルに基づいて上記予測サンプルを導出することもできる。（ｉ）の場合は、非方向性（non-directional）モードまたは非角度（non-angular）モードと呼ばれ、（ii）の場合は、方向性（directional）モードまたは角度（angular）モードと呼ばれることができる。

また、上記隣接参照サンプルのうち、上記現ブロックの予測サンプルを基準にして、上記現ブロックのイントラ予測モードの予測方向に位置する第１の隣接サンプルと上記予測方向の反対方向に位置する第２の隣接サンプルとの補間を介して上記予測サンプルが生成されることもできる。前述した場合は、線形補間イントラ予測（Linear Interpolation Intra Prediction、ＬＩＰ）と呼ばれることができる。また、線形モデル（linear model）を利用してルマサンプルに基づいてクロマ予測サンプルが生成されることもできる。この場合は、ＬＭモードと呼ばれることができる。

また、フィルタリングされた隣接参照サンプルに基づいて上記現ブロックの一時予測サンプルを導出し、上記既存の隣接参照サンプル、すなわち、フィルタリングされない隣接参照サンプルのうち、上記イントラ予測モードによって導出された少なくとも１つの参照サンプルと上記一時予測サンプルとを加重和（weighted sum）して上記現ブロックの予測サンプルを導出することもできる。前述した場合は、ＰＤＰＣ（Position Dependent Intra Prediction）と呼ばれることができる。

また、現ブロックの隣接多重参照サンプルラインの中から最も予測精度（正確度）が高い参照サンプルラインを選択して、該当ラインで予測方向に位置する参照サンプルを利用して予測サンプルを導出し、このときに使われた参照サンプルラインをデコード装置に指示（シグナリング）する方法でイントラ予測符号化を実行することができる。前述した場合は、多重参照ライン（Multi-Reference Line）イントラ予測またはＭＲＬベースのイントラ予測と呼ばれることができる。

また、現ブロックを垂直または水平のサブパーティションに分けて同じイントラ予測モードに基づいてイントラ予測を実行し、上記サブパーティション単位で隣接参照サンプルを導出して利用できる。すなわち、この場合、現ブロックに対するイントラ予測モードが上記サブパーティションに同じく適用され、上記サブパーティション単位で隣接参照サンプルを導出して利用することによって、場合によって、イントラ予測性能を高めることができる。このような予測方法は、ＩＳＰ（Intra Sub-Partitions）ベースのイントラ予測と呼ばれることができる。

前述したイントラ予測方法は、イントラ予測モードと区分してイントラ予測タイプと呼ばれることができる。上記イントラ予測タイプは、イントラ予測技法または付加イントラ予測モードなど、多様な用語で呼ばれることができる。例えば、上記イントラ予測タイプ（または、付加イントラ予測モードなど）は、前述したＬＩＰ、ＰＤＰＣ、ＭＲＬ、ＩＳＰのうちの少なくとも１つを含むことができる。上記ＬＩＰ、ＰＤＰＣ、ＭＲＬ、ＩＳＰなどの特定イントラ予測タイプを除外した一般イントラ予測方法は、ノーマルイントラ予測タイプと呼ばれることができる。ノーマルイントラ予測タイプは、上記のような特定イントラ予測タイプが適用されない場合、一般的に適用されることができ、前述したイントラ予測モードに基づいて予測が実行されることができる。一方、必要によって、導出された予測サンプルに対する後処理フィルタリングが実行されることもできる。

具体的には、イントラ予測手順は、イントラ予測モード／タイプ決定ステップ、隣接参照サンプル導出ステップ、イントラ予測モード／タイプベースの予測サンプル導出ステップを含むことができる。また、必要によって、導出された予測サンプルに対する後処理フィルタリング（post-filtering）ステップが実行されることもできる。

イントラ予測が適用される場合、隣接ブロックのイントラ予測モードを利用して現ブロックに適用されるイントラ予測モードが決定されることができる。例えば、デコード装置は、現ブロックの隣接ブロック（例えば、左側および／または上側隣接ブロック）のイントラ予測モードおよび追加的な候補モードに基づいて導出されたＭＰＭ（Most Probable Mode）リスト内のＭＰＭ候補のうちの１つを、受信したＭＰＭインデックスに基づいて選択でき、または、上記ＭＰＭ候補（および平面モード）に含まれない残りのイントラ予測モードのうちの１つを、残りの（リメイニング）イントラ予測モード情報に基づいて選択できる。上記ＭＰＭリストは、平面モードを候補として含む場合または含まない場合で構成されることができる。例えば、上記ＭＰＭリストが平面モードを候補として含む場合、上記ＭＰＭリストは、６個の候補を有することができ、上記ＭＰＭリストが平面モードを候補として含まない場合、上記ＭＰＭリストは、５個の候補を有することができる。上記ＭＰＭリストが平面モードを候補として含まない場合、現ブロックのイントラ予測モードが平面モードでないことを示すｎｏｔ平面フラグ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｎｏｔ＿ｐｌａｎａｒ＿ｆｌａｇ）がシグナリングされることができる。例えば、ＭＰＭフラグが先にシグナリングされ、ＭＰＭインデックスおよびｎｏｔ平面フラグは、ＭＰＭフラグの値が１である場合にシグナリングされることができる。また、上記ＭＰＭインデックスは、上記ｎｏｔ平面フラグの値が１である場合にシグナリングされることができる。ここで、上記ＭＰＭリストが平面モードを候補として含まないように構成されることは、上記平面モードがＭＰＭでないことを意味するより、ＭＰＭとして常に平面モードが考慮されるため、先にフラグ（not planar flag）をシグナリングして平面モードであるかどうかを先に確認するためである。

例えば、現ブロックに適用されるイントラ予測モードがＭＰＭ候補（および平面モード）内にあるか、または、残りのモード内にあるかは、ＭＰＭフラグ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇ）に基づいて指示されることができる。ＭＰＭフラグの値１は、上記現ブロックに対するイントラ予測モードがＭＰＭ候補（および平面モード）内にあることを示すことができ、ＭＰＭｆｌａｇの値０は、上記現ブロックに対するイントラ予測モードがＭＰＭ候補（および平面モード）内に無いことを示すことができる。上記ｎｏｔ平面フラグ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｎｏｔ＿ｐｌａｎａｒ＿ｆｌａｇ）値０は、上記現ブロックに対するイントラ予測モードが平面モードであることを示すことができ、上記ｎｏｔ平面フラグ値１は、上記現ブロックに対するイントラ予測モードが平面モードでないことを示すことができる。上記ＭＰＭインデックスは、ｍｐｍ＿ｉｄｘまたはｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｉｄｘシンタックス要素の形態でシグナリングされることができ、上記残りのイントラ予測モード情報は、ｒｅｍ＿ｉｎｔｒａ＿ｌｕｍａ＿ｐｒｅｄ＿ｍｏｄｅまたはｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｒｅｍａｉｎｄｅｒシンタックス要素の形態でシグナリングされることができる。例えば、上記残りのイントラ予測モード情報は、全イントラ予測モードのうち上記ＭＰＭ候補（および平面モード）に含まれない残りのイントラ予測モードを予測モード番号順にインデキシングしてそのうちの１つを指すことができる。上記イントラ予測モードは、ルマ成分（サンプル）に対するイントラ予測モードである。以下、イントラ予測モード情報は、上記ＭＰＭｆｌａｇ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇ）、上記ｎｏｔｐｌａｎａｒｆｌａｇ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｎｏｔ＿ｐｌａｎａｒ＿ｆｌａｇ）、上記ＭＰＭインデックス（例えば、ｍｐｍ＿ｉｄｘまたはｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｉｄｘ）、上記残りのイントラ予測モード情報（ｒｅｍ＿ｉｎｔｒａ＿ｌｕｍａ＿ｐｒｅｄ＿ｍｏｄｅまたはｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｒｅｍａｉｎｄｅｒ）のうちの少なくとも１つを含むことができる。本文書において、ＭＰＭリストは、ＭＰＭ候補リスト、ｃａｎｄＭｏｄｅＬｉｓｔなど、多様な用語で呼ばれることができる。ＭＩＰが現ブロックに適用される場合、ＭＩＰのための別途のｍｐｍｆｌａｇ（例えば、ｉｎｔｒａ＿ｍｉｐ＿ｍｐｍ＿ｆｌａｇ）、ｍｐｍインデックス（例えば、ｉｎｔｒａ＿ｍｉｐ＿ｍｐｍ＿ｉｄｘ）、残りのイントラ予測モード情報（例えば、ｉｎｔｒａ＿ｍｉｐ＿ｍｐｍ＿ｒｅｍａｉｎｄｅｒ）がシグナリングされることができ、上記ｎｏｔｐｌａｎａｒｆｌａｇは、シグナリングされない。

すなわち、一般的に画像に対するブロック分割になると、コーディングしようとする現ブロックと隣接（neighboring）ブロックとは、類似する画像特性を有するようになる。したがって、現ブロックと隣接ブロックとは、互いに同じまたは類似するイントラ予測モードを有する確率が高い。したがって、エンコーダは、現ブロックのイントラ予測モードをエンコードするために、隣接ブロックのイントラ予測モードを利用することができる。

例えば、エンコーダ／デコーダは、現ブロックに対するＭＰＭ（Most Probable Modes）リストを構成することができる。上記ＭＰＭリストは、ＭＰＭ候補リストと示すこともできる。ここで、ＭＰＭとは、イントラ予測モードコーディング時、現ブロックと隣接ブロックとの類似性を考慮してコーディング効率を向上させるために利用されるモードを意味することができる。前述したように、ＭＰＭリストは、平面モードを含んで構成されることもでき、または、平面モードを除外して構成されることもできる。例えば、ＭＰＭリストが平面モードを含む場合、ＭＰＭリストの候補の個数は６個である。そして、ＭＰＭリストが平面モードを含まない場合、ＭＰＭリストの候補の個数は５個である。

エンコーダ／デコーダは、５個または６個のＭＰＭを含むＭＰＭリストを構成することができる。

ＭＰＭリストを構成するために、デフォルトイントラモード（Default intra modes）、隣接イントラモード（Neighbour intra modes）、および導出されたイントラモード（Derived intra modes）の３つの種類のモードが考慮されることができる。

上記隣接イントラモードのために、２つの隣接ブロック、すなわち、左側隣接ブロックおよび上側隣接ブロックが考慮されることができる。

前述したように、ＭＰＭリストが平面モードを含まないように構成される場合、上記リストから平面（planar）モードが除外され、上記ＭＰＭリスト候補の個数は、５個に設定されることができる。

また、イントラ予測モードのうち、非方向性モード（または、非角度モード）は、現ブロックの隣接（neighboring）参照サンプルの平均（average）ベースのＤＣモードまたは補間（interpolation）ベースの平面（planar）モードを含むことができる。

インター予測が適用される場合、エンコード装置／デコード装置の予測部は、ブロック単位でインター予測を行って予測サンプルを導出することができる。インター予測は、現ピクチャ以外のピクチャのデータ要素（例えば、サンプル値、または動き情報）に依存する方法で導出される予測を示すことができる。現ブロックにインター予測が適用される場合、参照ピクチャのインデックスの指す参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現ブロックに対する予測されたブロック（予測サンプルアレイ）を導出することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現ブロックとの間の動き情報の相関性に基づいて、現ブロックの動き情報をブロック、サブブロックまたはサンプル単位で予測することができる。上記動き情報は、動きベクトルおよび参照ピクチャのインデックスを含むことができる。上記動き情報は、インター予測タイプ（Ｌ０予測、Ｌ１予測、ＢＩ予測など）の情報をさらに含むことができる。インター予測が適用される場合、隣接ブロックは、現ピクチャ内に存在する空間隣接ブロック（spatial neighboring block）と、参照ピクチャに存在する時間隣接ブロック（temporal neighboring block）と、を含むことができる。上記参照ブロックを含む参照ピクチャと、上記時間隣接ブロックを含む参照ピクチャと、は同一であってもよく、異なってもよい。上記時間隣接ブロックは、コロケート（同じ位置）参照ブロック（collocated reference block）、コロケートＣＵ（ｃｏｌＣＵ）などの名称で呼ばれ得、上記時間隣接ブロックを含む参照ピクチャは、コロケートピクチャ（collocated picture、ｃｏｌＰｉｃ）と呼ばれることもある。例えば、現ブロックの隣接ブロックに基づいて動き情報の候補リストが構成されることができ、上記現ブロックの動きベクトルおよび／または参照ピクチャのインデックスを導出するために、どの候補が選択（使用）されるかを指示するフラグまたはインデックス情報がシグナリングされることができる。様々な予測モードに基づいてインター予測が行われ、例えば、スキップモードおよびマージモードの場合、現ブロックの動き情報は、選択された隣接ブロックの動き情報と同一であり得る。スキップモードの場合、マージモードと異なり、残差信号が送信されないことがある。動き情報予測（Motion Vector Prediction、ＭＶＰ）モードの場合、選択された隣接ブロックの動きベクトルを動きベクトル予測子（motion vector predictor）として利用し、動きベクトル差分（motion vector difference）が、シグナリングされることができる。この場合、上記動きベクトル予測子と動きベクトル差分との和を用いて、上記現ブロックの動きベクトルを導出することができる。

上記動き情報は、インター予測タイプ（Ｌ０予測、Ｌ１予測、ＢＩ予測など）に応じて、Ｌ０動き情報および／またはＬ１動き情報を含むことができる。Ｌ０方向の動きベクトルは、Ｌ０動きベクトルまたはＭＶＬ０と呼ばれ得、Ｌ１方向の動きベクトルは、Ｌ１動きベクトルまたはＭＶＬ１と呼ばれ得る。Ｌ０動きベクトルに基づいた予測は、Ｌ０予測と呼ばれ得、Ｌ１動きベクトルに基づいた予測は、Ｌ１予測と呼ばれ得、上記Ｌ０動きベクトルおよび上記Ｌ１動きベクトルの両方に基づいた予測は、双（Ｂｉ）予測と呼ばれ得る。ここで、Ｌ０動きベクトルは、参照ピクチャリストＬ０（Ｌ０）に関連する動きベクトルを示すことができ、Ｌ１動きベクトルは、参照ピクチャリストＬ１（Ｌ１）に関連する動きベクトルを示すことができる。参照ピクチャリストＬ０は、上記現ピクチャよりも、出力順序上、以前のピクチャを参照ピクチャに含むことができ、参照ピクチャリストＬ１は、上記現ピクチャよりも、出力順序上、以後のピクチャを含むことができる。上記以前のピクチャは、順方向（参照）ピクチャと呼ばれ得、上記以後のピクチャは、逆方向（参照）ピクチャと呼ばれ得る。上記参照ピクチャリストＬ０は、上記現ピクチャよりも、出力順序上、以後のピクチャを参照ピクチャにさらに含むことができる。この場合、上記参照ピクチャリストＬ０内で上記以前のピクチャが先にインデキシングされ、上記以後のピクチャは、その後にインデキシングされ得る。上記参照ピクチャリストＬ１は、上記現ピクチャよりも、出力順序上、以前のピクチャを参照ピクチャにさらに含むことができる。この場合、上記参照ピクチャリスト１内で上記以後のピクチャが先にインデキシングされ、上記以前のピクチャは、その後にインデキシングされ得る。ここで、出力順序は、ＰＯＣ（Picture Order Count）順序（order）に対応し得る。

インター予測に基づくビデオ／画像エンコード手順は、概略的に、例えば以下を含む。

図４は、インター予測ベースのビデオ／画像エンコード方法の例を示す。

エンコード装置は、現ブロックに対するインター予測を行う（Ｓ４００）。エンコード装置は、現ブロックのインター予測モードおよび動き情報を導出し、上記ブロックの予測サンプルを生成する。ここで、インター予測モード決定、動き情報導出および予測サンプル生成の手順は、同時に行われてもよく、ある１つの手順が他の手順より先に行われてもよい。例えば、エンコード装置のインター予測部は、予測モード決定部、動き情報導出部、予測サンプル導出部を含み、予測モード決定部において上記現ブロックに対する予測モードを決定し、動き情報導出部において上記現ブロックの動き情報を導出し、予測サンプル導出部において上記現ブロックの予測サンプルを導出する。例えば、エンコード装置のインター予測部は、動き推定（motion estimation）により参照ピクチャの一定領域（サーチ領域）内において上記現ブロックと類似したブロックをサーチし、上記現ブロックとの差が最小または一定基準以下である参照ブロックを導出する。これに基づいて上記参照ブロックが位置する参照ピクチャを指す参照ピクチャインデックスを導出し、上記参照ブロックと上記現ブロックとの位置差に基づいて動きベクトルを導出することができる。エンコード装置は、様々な予測モードのうち、上記現ブロックに対して適用されるモードを決定する。エンコード装置は、上記様々な予測モードに対するＲＤｃｏｓｔを比較し、上記現ブロックに対する最適な予測モードを決定することができる。

例えば、エンコード装置は、上記現ブロックにスキップモードまたはマージモードが適用される場合、後述するマージ候補リストを構成し、上記マージ候補リストに含まれるマージ候補が指す参照ブロックのうち、上記現ブロックとの差が最小または一定基準以下である参照ブロックを導出することができる。この場合、上記導出された参照ブロックに関連するマージ候補が選択され、上記選択されたマージ候補を指すマージインデックス情報が生成されてデコード装置にシグナリングされる。上記選択されたマージ候補の動き情報を利用して上記現ブロックの動き情報が導出されることができる。

他の例として、エンコード装置は、上記現ブロックに（Ａ）ＭＶＰモードが適用される場合、後述する（Ａ）ＭＶＰ候補リストを構成し、上記（Ａ）ＭＶＰ候補リストに含まれるｍｖｐ（motion vector predictor）候補のうち、選択されたｍｖｐ候補の動きベクトルを上記現ブロックのｍｖｐとして利用できる。この場合、例えば、前述の動き推定により導出された参照ブロックを指す動きベクトルが上記現ブロックの動きベクトルとして利用されることができ、上記ｍｖｐ候補のうち、上記現ブロックの動きベクトルとの差が最も小さい動きベクトルを有するｍｖｐ候補が上記選択されたｍｖｐ候補となり得る。上記現ブロックの動きベクトルから上記ｍｖｐを引いた差分であるＭＶＤ（Motion Vector Difference）が導出されることができる。その場合、上記ＭＶＤに関する情報がデコード装置にシグナリングされることができる。また、（Ａ）ＭＶＰモードが適用される場合、上記参照ピクチャインデックスの値は、参照ピクチャインデックス情報で構成され、別途に上記デコード装置にシグナリングされる。

エンコード装置は、上記予測サンプルに基づいて残差（レジデュアル）サンプルを導出する（Ｓ４１０）。エンコード装置は、上記現ブロックのオリジナルサンプルと上記予測サンプルとを比較することにより、上記残差サンプルを導出することができる。

エンコード装置は、予測情報や残差情報を含む画像情報をエンコードする（Ｓ４２０）。エンコード装置は、エンコードされた画像情報をビットストリーム形態で出力する。上記予測情報は、上記予測手順に関連する情報であり、予測モード情報（例えは、ｓｋｉｐｆｌａｇ、ｍｅｒｇｅｆｌａｇまたはｍｏｄｅｉｎｄｅｘなど）および動き情報に関する情報を含む。上記動き情報に関する情報は、動きベクトルを導出するための情報である候補選択情報（例えば、ｍｅｒｇｅｉｎｄｅｘ、ｍｖｐｆｌａｇまたはｍｖｐｉｎｄｅｘ）を含む。また、上記動き情報に関する情報は、前述のＭＶＤに関する情報および／または参照ピクチャインデックス情報を含む。また、上記動き情報に関する情報は、Ｌ０予測、Ｌ１予測、または双（ｂｉ）予測が適用されるか否かを示す情報を含む（The information on the motion information may include information indicating whether L0 prediction, L1 prediction, or bi prediction is applied）。上記残差情報は、上記残差サンプルに関する情報である。上記残差情報は、上記残差サンプルに対する量子化された変換係数に関する情報を含む。

出力されたビットストリームは、（デジタル）記憶媒体に記憶されてデコード装置に伝達されてもよく、また、ネットワークを介してデコード装置に伝達されてもよい。

一方、前述のように、エンコード装置は、上記参照サンプルおよび上記残差サンプルに基づいて復元ピクチャ（復元サンプルおよび復元ブロックを含む）を生成する。これは、デコード装置で行われるのと同一の予測結果をエンコード装置から導出するためであり、これにより、コーディング効率を高めることができるからである。したがって、エンコード装置は、復元ピクチャ（または、復元サンプル、復元ブロック）をメモリに記憶し、インター予測のための参照ピクチャとして活用することができる。上記復元ピクチャにインループフィルタリング手順などがさらに適用されることができることは前述の通りである。

インター予測に基づくビデオ／画像デコード手順は、概略的に、例えば以下を含む。

図５は、インター予測ベースのビデオ／画像デコード方法の例を示す。

図５に示すように、デコード装置は、上記エンコード装置で行われた動作と対応する動作を行う。デコード装置は、受信した予測情報に基づいて現ブロックで予測を行い、予測サンプルを導出することができる。

具体的には、デコード装置は、受信した予測情報に基づいて上記現ブロックに対する予測モードを決定する（Ｓ５００）。デコード装置は、上記予測情報内の予測モード情報に基づいて上記現ブロックにどのインター予測モードが適用されるかを決定することができる。

例えば、上記ｍｅｒｇｅｆｌａｇに基づいて上記現ブロックに上記マージモードが適用されるか否か、または、（Ａ）ＭＶＰモードが決定されるか否かを決定することができる。あるいは、上記ｍｏｄｅｉｎｄｅｘに基づいて様々なインター予測モード候補のいずれか１つを選択することができる。上記インター予測モード候補は、スキップモード、マージモードおよび／または（Ａ）ＭＶＰモードを含み、または、後述する様々なインター予測モードを含む。

デコード装置は、上記決定されたインター予測モードに基づいて上記現ブロックの動き情報を導出する（Ｓ５１０）。例えば、デコード装置は、上記現ブロックにスキップモードまたはマージモードが適用される場合、後述するマージ候補リストを構成し、上記マージ候補リストに含まれるマージ候補のいずれか１つのマージ候補を選択する。上記選択は、前述の選択情報（merge index）に基づいて行われる。上記選択されたマージ候補の動き情報を利用して上記現ブロックの動き情報を導出することができる。上記選択されたマージ候補の動き情報が上記現ブロックの動き情報として利用されることができる。

他の例として、デコード装置は、上記現ブロックに（Ａ）ＭＶＰモードが適用される場合、後述の（Ａ）ＭＶＰ候補リストを構成し、上記（Ａ）ＭＶＰ候補リストに含まれるｍｖｐ（motion vector predictor）候補のうちの選択されたｍｖｐ候補の動きベクトルを上記現ブロックのｍｖｐとして利用できる。上記選択は、前述の選択情報（ｍｖｐｆｌａｇまたはｍｖｐｉｎｄｅｘ）に基づいて行われる。この場合、上記ＭＶＤに関する情報に基づいて上記現ブロックのＭＶＤを導出することができ、上記現ブロックのｍｖｐと上記ＭＶＤとに基づいて上記現ブロックの動きベクトルを導出することができる。また、上記参照ピクチャインデックス情報に基づいて上記現ブロックの参照ピクチャインデックスを導出することができる。上記現ブロックに関する参照ピクチャリスト内において上記参照ピクチャインデックスが指すピクチャが、上記現ブロックのインター予測のために参照される参照ピクチャとして導出されることができる。

一方、後述のように候補リストの構成なしで上記現ブロックの動き情報が導出されることができ、この場合、後述の予測モードにおいて開示された手順に従って上記現ブロックの動き情報が導出されることができる。この場合、前述のような候補リスト構成は省略されてもよい。

デコード装置は、上記現ブロックの動き情報に基づいて上記現ブロックに対する予測サンプルを生成する（Ｓ５２０）。この場合、上記現ブロックの参照ピクチャインデックスに基づいて上記参照ピクチャを導出し、上記現ブロックの動きベクトルが上記参照ピクチャ上で指す参照ブロックのサンプルを利用して上記現ブロックの予測サンプルを導出することができる。この場合、後述のように、場合によって、上記現ブロックの予測サンプルのうちの全部または一部に対する予測サンプルフィルタリングの手順がさらに行われることがある。

例えば、デコード装置のインター予測部は、予測モード決定部、動き情報導出部、予測サンプル導出部を含み、予測モード決定部で受信した予測モード情報に基づいて上記現ブロックに対する予測モードを決定し、動き情報導出部で受信した動き情報に関する情報に基づいて上記現ブロックの動き情報（動きベクトルおよび／または参照ピクチャインデックスなど）を導出し、予測サンプル導出部から上記現ブロックの予測サンプルを導出することができる。

デコード装置は、受信した残差（レジデュアル）情報に基づいて上記現ブロックに対する残差サンプルを生成する（Ｓ５３０）。デコード装置は、上記予測サンプルおよび上記残差サンプルに基づいて上記現ブロックに対する復元サンプルを生成し、これに基づいて復元ピクチャを生成する（Ｓ５４０）。以後、上記復元ピクチャにインループフィルタリング手順などがさらに適用されることができることは前述の通りである。

図６は、インター予測手順を例示的に示す。

図６を参照すると、前述のように、インター予測手順は、インター予測モード決定ステップ、決定された予測モードに応じる動き情報の導出ステップ、導出された動き情報に基づく予測実行（予測サンプル生成）ステップを含む。上記インター予測手順は、前述のように、エンコード装置およびデコード装置において行われる。本文書において、コーディング装置とは、エンコード装置および／またはデコード装置を含む。

図６に示すように、コーディング装置は、現ブロックに対するインター予測モードを決定する（Ｓ６００）。ピクチャ内の現ブロックの予測のために様々なインター予測モードが使用されることができる。例えば、マージモード、スキップモード、ＭＶＰ（Motion Vector Prediction）モード、アフィン（Affine）モード、サブブロックマージモード、ＭＭＶＤ（Merge with MVD）モードなどの様々なモードが使用されることができる。ＤＭＶＲ（Decoder side Motion Vector Refinement）モード、ＡＭＶＲ（Adaptive Motion Vector Resolution）モード、Ｂｉ－ｐｒｅｄｉｃｔｉｏｎｗｉｔｈＣＵ－ｌｅｖｅｌＷｅｉｇｈｔ（ＢＣＷ）、Ｂｉ－ＤｉｒｅｃｔｉｏｎａｌＯｐｔｉｃａｌＦｌｏｗ（ＢＤＯＦ）などが付随的なモードとしてさらにまたは代わりに使用されることができる。アフィンモードは、アフィン動き予測（affine motion prediction）モードと呼ばれてもよい。ＭＶＰモードは、「ＡＭＶＰ（Advanced Motion Vector Prediction）モードと呼ばれてもよい。本文書において、一部のモードおよび／または一部のモードにより導出された動き情報候補は、他のモードの動き情報関連候補の１つとして含まれることもある。例えば、ＨＭＶＰ候補は、上記マージ／スキップモードのマージ候補として追加されてもよく、または上記ＭＶＰモードのｍｖｐ候補として追加されてもよい。上記ＨＭＶＰ候補が上記マージモードまたはスキップモードの動き情報候補として使用される場合、上記ＨＭＶＰ候補は、ＨＭＶＰマージ候補と呼ばれてもよい。

現ブロックのインター予測モードを指す予測モード情報が、エンコード装置からデコード装置にシグナリングされることができる。上記予測モード情報は、ビットストリームに含まれてデコード装置によって受信されることができる。上記予測モード情報は、多数の候補モードのうちの１つを指示するインデックス情報を含む。あるいは、フラグ情報の階層的シグナリングを介してインター予測モードを指示することもできる。この場合、上記予測モード情報は、１つまたは複数のフラグを含む。例えば、スキップフラグをシグナリングしてスキップモードが適用されるか否かを指示し、スキップモードが適用されない場合にマージフラグをシグナリングしてマージモードが適用されるか否かを指示し、マージモードが適用されない場合にＭＶＰモードが適用されると指示するか、追加的な区分のためのフラグをさらにシグナリングすることもできる。アフィンモードは、独立したモードでシグナリングされてもよく、またはマージモードもしくはＭＶＰモードなどに従属的なモードでシグナリングされてもよい。例えば、アフィンモードは、アフィンマージモードおよびアフィンＭＶＰモードを含む。

一方、現ブロックに前述のＬｉｓｔ０（Ｌ０）予測、Ｌｉｓｔ１（Ｌ１）予測、または双予測（bi-prediction）が現ブロック（現コーディングユニット）に使用されるか否かを示す情報がシグナリングされることができる。上記情報は、動き予測方向情報、インター予測方向情報またはインター予測指示情報と呼ばれてもよく、例えば、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃシンタックス要素の形態で構成／エンコード／シグナリングされることができる。すなわち、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃシンタックス要素は、前述のＬｉｓｔ０（Ｌ０）予測、Ｌｉｓｔ１（Ｌ１）予測、または双予測（bi-prediction）が現ブロック（現コーディングユニット）に使用されるか否かを示すことができる。本文書においては、説明の便宜のために、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃシンタックス要素が指すインター予測タイプ（Ｌ０予測、Ｌ１予測、またはＢＩ予測）は、動き予測方向であると表示されてもよい。Ｌ０予測はｐｒｅｄ＿Ｌ０、Ｌ１予測はｐｒｅｄ＿Ｌ１、双予測はｐｒｅｄ＿ＢＩと表されてもよい。例えば、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃシンタックス要素の値によって以下のような予測タイプを示すことができる。

＜表１＞

前述のように、１つのピクチャは、１つまたは複数のスライスを含む。スライスは、Ｉ（Intra）スライス、Ｐ（Predictive）スライスおよびＢ（Bi-Predictive）スライスを含むスライスタイプのうちの１つのタイプを有することができる。上記スライスタイプは、スライスタイプの情報に基づいて指示される。Ｉスライス内のブロックに対しては、予測のためにインター予測は使われずにイントラ予測のみが使用される。もちろん、この場合にも予測なしでオリジナルサンプル値をコーディングしてシグナリングすることもできる。Ｐスライス内のブロックに対してはイントラ予測またはインター予測が使用され、インター予測が使用される場合は、単（uni）予測のみが使用されることができる。一方、Ｂスライス内のブロックに対してはイントラ予測またはインター予測が使用され、インター予測が使用される場合は、最大双（ｂｉ）予測まで使用されることができる。

Ｌ０およびＬ１は、現ピクチャより以前にエンコード／デコードされた参照ピクチャを含む。例えば、Ｌ０は、ＰＯＣ順序上、現ピクチャより以前および／または以後の参照ピクチャを含み、Ｌ１は、ＰＯＣ順序上、現ピクチャより以後および／または以前の参照ピクチャを含む。この場合、Ｌ０には、ＰＯＣ順序上、現ピクチャより以前の参照ピクチャに相対的にさらに低い参照ピクチャインデックスが割り当てられ、Ｌ１には、ＰＯＣ順序上、現ピクチャより以後の参照ピクチャに相対的にさらに低い参照ピクチャインデックスが割り当てられる。Ｂスライスの場合、双予測が適用され、この場合にも単方向双予測が適用されてもよく、または双方向双予測が適用されてもよい。双方向双予測は、真（true）双予測とも呼ばれる。

次の表は、本文書の一実施形態によるコーディングユニットに関するシンタックスを示す。

＜表２＞

コーディング装置は、上記現ブロックに対する動き情報を導出する（Ｓ６１０）。上記動き情報の導出を上記インター予測モードに基づいて導出することができる。

コーディング装置は、現ブロックの動き情報を利用してインター予測を行うことができる。エンコード装置は、動き推定（motion estimation）手順を介して現ブロックに対する最適な動き情報を導出することができる。例えば、エンコード装置は、現ブロックに対するオリジナルピクチャ内のオリジナルブロックを利用して相関性の高い類似した参照ブロックを、参照ピクチャ内の決められた探索（サーチ）範囲内において端数（分数）（fractional）ピクセル単位で探索し、これにより動き情報を導出することができる。ブロックの類似性は、位相（phase）ベースのサンプル値の差に基づいて導出することができる。例えば、ブロックの類似性は、現ブロック（または、現ブロックのテンプレート）と参照ブロック（または、参照ブロックのテンプレート）との間のＳＡＤ（Sum of Absolute Differences）に基づいて計算されることができる。この場合、探索領域内のＳＡＤが最も小さい参照ブロックに基づいて動き情報を導出することができる。導出された動き情報は、インター予測モードに基づいて様々な方法によってデコード装置にシグナリングされる。

コーディング装置は、上記現ブロックに対する動き情報に基づいてインター予測を行う（Ｓ６２０）。コーディング装置は、上記動き情報に基づいて上記現ブロックに対する予測サンプル（１つまたは複数）を導出することができる。上記予測サンプルを含む現ブロックは、予測されたブロックと呼ばれてもよい。

マージモード（merge mode）が適用される場合、現予測ブロックの動き情報が直接送信されることなく、周辺予測ブロックの動き情報を利用して上記現予測ブロックの動き情報を導出する。したがって、マージモードを利用したことを示すフラグ情報および周辺のどの予測ブロックを利用したかを示すマージインデックスを送信することにより、現予測ブロックの動き情報を指示することができる。上記マージモードは、ｒｅｇｕｌａｒｍｅｒｇｅｍｏｄｅと呼ばれてもよい。

エンコーダは、マージモードを行うために、現予測ブロックの動き情報を導出するために用いられるマージ候補ブロック（merge candidate block）をサーチしなければならない。例えば、上記マージ候補ブロックは、最大５個まで利用されることができるが、本文書の実施形態はこれに限定されない。そして、上記マージ候補ブロックの最大個数は、スライスヘッダまたはタイルグループヘッダにおいて送信される。上記マージ候補ブロックを見つけた後、エンコーダは、マージ候補リストを生成し、これらのうちの最小コストを有するマージ候補ブロックを最終マージ候補ブロックとして選択することができる。

上記マージ候補リストは、例えば、５つのマージ候補ブロックを利用することができる。例えば、４つの空間マージ候補（spatial merge candidate）と１つの時間マージ候補（temporal merge candidate）とを利用することができる。以下、上記空間マージ候補または後述する空間ＭＶＰ候補は、ＳＭＶＰと呼ばれてもよく、上記時間マージ候補または後述する時間ＭＶＰ候補は、ＴＭＶＰと呼ばれてもよい。

図７は、本文書に係るマージ候補リストを構成する方法を概略的に示す。

コーディング装置（エンコーダ／デコーダ）は、現ブロックの空間周辺ブロックを探索して導出された空間マージ候補をマージ候補リストに挿入する（Ｓ７００）。例えば、上記空間周辺ブロックは、上記現ブロックの左下側コーナ周辺ブロック、左側周辺ブロック、右上側コーナ周辺ブロック、上側周辺ブロック、左上側コーナ周辺ブロックを含む。ただし、これは例示であり、前述の空間周辺ブロック以外にも右側周辺ブロック、下側周辺ブロック、右下側周辺ブロックなどの追加的な周辺ブロックが、さらに上記空間周辺ブロックとして使用されることができる。コーディング装置は、上記空間周辺ブロックを優先順位に基づいて探索して使用可能な（可用の）ブロックを検出し、検出されたブロックの動き情報を上記空間マージ候補として導出することができる。

コーディング装置は、上記現ブロックの時間周辺ブロックを探索して導出された時間マージ候補を上記マージ候補リストに挿入する（Ｓ７１０）。上記時間周辺ブロックは、上記現ブロックが位置する現ピクチャとは異なるピクチャである参照ピクチャ上に位置し得る。上記時間周辺ブロックが位置する参照ピクチャは、コロケーテッド（コロケート）（collocated）ピクチャまたはｃｏｌピクチャと呼ばれてもよい。上記時間周辺ブロックは、上記ｃｏｌピクチャ上における上記現ブロックに対するコロケートブロック（co-located block）の右下側コーナ周辺ブロックおよび右下側センタブロックの順で探索されることができる。一方、モーションデータの圧縮（motion data compression）が適用される場合、上記ｃｏｌピクチャにおいて一定記憶単位ごとに特定の動き情報を代表動き情報として記憶する。この場合、上記一定記憶単位内の全てのブロックに対する動き情報を記憶する必要がなく、これによりモーションデータの圧縮の効果が得られる。この場合、一定記憶単位は、例えば、１６×１６サンプル単位または８×８サンプル単位などに予め定められてもよく、あるいはエンコーダからデコーダに上記一定記憶単位に関するサイズ情報がシグナリングされてもよい。上記モーションデータの圧縮が適用される場合、上記時間周辺ブロックの動き情報は、上記時間周辺ブロックが位置する上記一定記憶単位の代表動き情報に置き換えられることができる。すなわち、この場合、実現の側面から見ると、上記時間周辺ブロックの座標に位置する予測ブロックではなく、上記時間周辺ブロックの座標（左上端サンプル位置（ポジション））に基づいて一定値の分だけ算術的右シフトした後、算術的左シフトした位置をカバーする予測ブロックの動き情報に基づいて上記時間マージ候補が導出される。例えば、上記一定記憶単位が２ｎ×２ｎサンプル単位である場合、上記時間周辺ブロックの座標が（ｘＴｎｂ，ｙＴｎｂ）であれば、修正された位置である（（ｘＴｎｂ＞＞ｎ）＜＜ｎ），（ｙＴｎｂ＞＞ｎ）＜＜ｎ））に位置する予測ブロックの動き情報が上記時間マージ候補のために使用される。具体的には、例えば、上記一定記憶単位が１６×１６サンプル単位である場合、上記時間周辺ブロックの座標が（ｘＴｎｂ，ｙＴｎｂ）であれば、修正された位置である（（ｘＴｎｂ＞＞４）＜＜４），（ｙＴｎｂ＞＞４）＜＜４））に位置する予測ブロックの動き情報が上記時間マージ候補のために使用される。あるいは、例えば、上記一定記憶単位が８×８サンプル単位である場合、上記時間周辺ブロックの座標が（ｘＴｎｂ，ｙＴｎｂ）であれば、修正された位置である（（ｘＴｎｂ＞＞３）＜＜３），（ｙＴｎｂ＞＞３）＜＜３））に位置する予測ブロックの動き情報が上記時間マージ候補のために使用される。

コーディング装置は、現マージ候補数（現在マージ候補の個数）が最大マージ候補数（最大マージ候補の個数）より小さいか否かを確認できる（Ｓ７２０）。上記最大マージ候補数は、予め定義されるかエンコーダからデコーダにシグナリングされることができる。例えば、エンコーダは、上記最大マージ候補数に関する情報を生成し、エンコードしてビットストリーム形態で上記デコーダに伝達する。上記最大マージ候補数が満たされ（充填され）ると、以後の候補追加過程は行われなくてもよい。

上記確認の結果、上記現マージ候補数が上記最大マージ候補数より小さい場合、コーディング装置は、追加マージ候補を上記マージ候補リストに挿入する（Ｓ７３０）。

上記確認の結果、上記現マージ候補数が上記最大マージ候補数より小さくない場合、コーディング装置は、上記マージ候補リストの構成を終了する（Ｓ７４０）。この場合、エンコーダは、ＲＤ（Rate-Distortion）コストに基づいて上記マージ候補リストを構成するマージ候補のうちの最適なマージ候補を選択することができ、上記選択されたマージ候補を指す選択情報（例えば、merge index）をデコーダにシグナリングすることができる。デコーダは、上記マージ候補リストおよび上記選択情報に基づいて上記最適マージ候補を選択する。

上記選択されたマージ候補の動き情報が上記現ブロックの動き情報として使用されることができ、上記現ブロックの動き情報に基づいて上記現ブロックの予測サンプルを導出できることは、前述の通りである。エンコーダは、上記予測サンプルに基づいて上記現ブロックの残差サンプルを導出し、上記残差サンプルに関する残差情報をデコーダにシグナリングすることができる。デコーダは、上記残差情報に基づいて導出された残差サンプルおよび上記予測サンプルに基づいて復元サンプルを生成し、これに基づいて復元ピクチャを生成できることは、前述の通りである。

スキップモード（skip mode）が適用される場合、前述のマージモードが適用される場合と同一の方法で上記現ブロックの動き情報を導出することができる。ただし、スキップモードが適用される場合、該当ブロックに対する残差信号が省略され、したがって、予測サンプルが直ちに復元サンプルとして利用されることができる。

ＭＶＰモードが適用される場合、復元された空間周辺ブロックの動きベクトルおよび／または時間周辺ブロック（または、Ｃｏｌブロック）に対応する動きベクトルを用いて、動きベクトル予測子（motion vector predictor、ｍｖｐ）候補リストが生成される。すなわち、復元された空間周辺ブロックの動きベクトルおよび／または時間周辺ブロックに対応する動きベクトルは、動きベクトル予測子候補として使用されることができる。双予測が適用される場合、Ｌ０動き情報導出のためのｍｖｐ候補リストとＬ１動き情報導出のためのｍｖｐ候補リストとが個別に生成されて利用されることができる。前述の予測情報（または、予測に関する情報）は、上記リストに含まれる動きベクトル予測子候補のうちの選択された最適な動きベクトル予測子候補を指示する選択情報（例えば、ＭＶＰフラグまたはＭＶＰインデックス）を含む。ここで、予測部は、上記選択情報を利用して、動きベクトル候補リストに含まれる動きベクトル予測子候補のうち、現ブロックの動きベクトル予測子を選択することができる。エンコード装置の予測部は、現ブロックの動きベクトルと動きベクトル予測子との間の動きベクトル差分（ＭＶＤ）を求めることができ、これをエンコードしてビットストリーム形態で出力する。すなわち、ＭＶＤは、現ブロックの動きベクトルから上記動きベクトル予測子を引いた値として求められる。ここで、デコード装置の予測部は、上記予測に関する情報に含まれる動きベクトル差分を取得し、上記動きベクトル差分と上記動きベクトル予測子との加算により、現ブロックの上記動きベクトルを導出することができる。デコード装置の予測部は、参照ピクチャを指示する参照ピクチャインデックスなどを上記予測に関する情報から取得または導出することができる。

図８は、動きベクトル予測子候補リストを構成する方法を示すフローチャート（順序図）である。

図８に示すように、一実施形態では、まず動きベクトル予測のための空間候補ブロックを探索して予測候補リストに挿入する（Ｓ８００）。以降、一実施形態では、空間候補ブロックの個数が２より小さいか否かを判断する（Ｓ８１０）。例えば、一実施形態では、空間候補ブロックの個数が２より小さい場合、時間候補ブロックを探索して予測候補リストに追加挿し（Ｓ８２０）、時間候補ブロックが使用不可である場合は、ゼロ動きベクトルを使用する。すなわち、ゼロ動きベクトルを予測候補リストに追加挿入することができる（Ｓ８３０）。以降、一実施形態では、予備候補リストの構成を終了する（Ｓ８４０）。あるいは、一実施形態では、空間候補ブロックの個数が２より小さくない場合、予備候補リストの構成を終了する（Ｓ８４０）。ここで、予備候補リストは、ＭＶＰ候補リストを示す。

一方、ＭＶＰモードが適用される場合、参照ピクチャインデックスが明示的にシグナリングされる。この場合、Ｌ０予測のための参照ピクチャインデックス（ｒｅｆｉｄｘＬ０）とＬ１予測のための参照ピクチャインデックス（ｒｅｆｉｄｘＬ１）とに区分されてシグナリングされることができる。例えば、ＭＶＰモードが適用され、双予測（BI prediction）が適用される場合、上記ｒｅｆｉｄｘＬ０に関する情報、およびｒｅｆｉｄｘＬ１に関する情報が両方ともシグナリングされることができる。

ＭＶＰモードが適用される場合、前述のように、エンコード装置から導出されたＭＶＤに関する情報がデコード装置にシグナリングされる。ＭＶＤに関する情報は、例えば、ＭＶＤの絶対値および符号に対するｘ、ｙ成分を示す情報を含むことができる。この場合、ＭＶＤの絶対値が０より大きいか否か、および１より大きいか否か、ＭＶＤの残り（remainder）を示す情報が段階的にシグナリングされることができる。例えば、ＭＶＤの絶対値が１より大きいか否かを示す情報は、ＭＶＤの絶対値が０より大きいか否かを示すｆｌａｇ情報の値が１である場合に限りシグナリングされることができる。

例えば、ＭＶＤに関する情報は、以下の表のようなシンタックスで構成されてエンコード装置においてエンコードされてデコード装置にシグナリングされる。

＜表３＞

例えば、表３においてａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ０＿ｆｌａｇシンタックス要素は、差分（ＭＶＤ）が０より大きいか否かに関する情報を示し、ａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ１＿ｆｌａｇシンタックス要素は、差分（ＭＶＤ）が１より大きいか否かに関する情報を示す。また、ａｂｓ＿ｍｖｄ＿ｍｉｎｕｓ２シンタックス要素は、差分（ＭＶＤ）に－２をした値に関する情報を示し、ｍｖｄ＿ｓｉｇｎ＿ｆｌａｇシンタックス要素は、差分（ＭＶＤ）の符号に関する情報を示す。また、表３において各シンタックス要素の［０］は、Ｌ０に関する情報であることを示し、［１］は、Ｌ１に関する情報であることを示す。

例えば、ＭＶＤ［ｃｏｍｐＩｄｘ］は、ａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ０＿ｆｌａｇ［ｃｏｍｐＩｄｘ］＊（ａｂｓ＿ｍｖｄ＿ｍｉｎｕｓ２［ｃｏｍｐＩｄｘ］＋２）＊（１－２＊ｍｖｄ＿ｓｉｇｎ＿ｆｌａｇ［ｃｏｍｐＩｄｘ］）に基づいて導出される。ここで、ｃｏｍｐＩｄｘ（または、ｃｐＩｄｘ）は、各成分のインデックスを示し、０または１の値を有することができる。ｃｏｍｐＩｄｘ０は、ｘ成分を示し、ｃｏｍｐＩｄｘ１は、ｙ成分を示す。ただし、これは例示であり、ｘ、ｙ座標系ではなく、他の座標系を使って各成分別に値を表すこともできる。

一方、Ｌ０予測のためのＭＶＤ（ＭＶＤＬ０）とＬ１予測のためのＭＶＤ（ＭＶＤＬ１）とを区分してシグナリングされてもよく、上記ＭＶＤに関する情報は、ＭＶＤＬ０に関する情報および／またはＭＶＤＬ１に関する情報を含んでもよい。例えば、現ブロックにＭＶＰモードが適用され、ＢＩ予測が適用される場合、上記ＭＶＤＬ０に関する情報およびＭＶＤＬ１に関する情報が両方ともシグナリングされる。

図９は、ＳＭＶＤ（Symmetric Motion Vector Differences）を説明する図である。

ＢＩ予測が適用される場合、コーディング効率を考慮してＳＭＶＤ（Symmetric MVD）が使用されてもよい。この場合は、動き情報のうちの一部のシグナリングが省略されてもよい。例えば、ＳＭＶＤが現ブロックに適用される場合、ｒｅｆｉｄｘＬ０に関する情報、ｒｅｆｉｄｘＬ１に関する情報、ＭＶＤＬ１に関する情報がエンコード装置からデコード装置にシグナリングされることなく、内部的に導出されることができる。例えば、現ブロックにＭＶＰモードおよびＢＩ予測が適用される場合、ＳＭＶＤの適用が可能か否かを指示するフラグ情報（例えば、ＳＭＶＤフラグ情報またはｓｙｍ＿ｍｖｄ＿ｆｌａｇシンタックス要素）がシグナリングされ、上記フラグ情報の値が１である場合、デコード装置は、上記現ブロックにＳＭＶＤが適用されると判断する。

ＳＭＶＤモードが適用される場合（すなわち、ＳＭＶＤフラグ情報の値が１である場合）、ｍｖｐ＿ｌ０＿ｆｌａｇ、ｍｖｐ＿ｌ１＿ｆｌａｇ、およびＭＶＤＬ０（動きベクトル差分Ｌ０）に関する情報が明示的に（explicitly）シグナリングされ、前述のように、ｒｅｆｉｄｘＬ０に関する情報、ｒｅｆｉｄｘ１に関する情報、およびＭＶＤＬ１（動きベクトル差分Ｌ１）に関する情報のシグナリングが省略され、内部的に導出されることができる。例えば、ｒｅｆｉｄｘＬ０は、参照ピクチャリスト（reference picture list）０（Ｌｉｓｔ０またはＬ０と呼ばれてもよい）内においてＰＯＣ手順上、現ピクチャに最も近い以前参照ピクチャを指すインデックスとして導出されることができる。ｒｅｆｉｄｘＬ１は、参照ピクチャリスト（reference picture list）１（Ｌｉｓｔ１またはＬ１と呼ばれてもよい）内におけるＰＯＣ手順上、現ピクチャに最も近い以後参照ピクチャを指すインデックスとして導出されることができる。あるいは、例えば、ｒｅｆｉｄｘＬ０およびｒｅｆｉｄｘＬ１は、両方ともそれぞれ０として導出されることができる。あるいは、例えば、上記ｒｅｆｉｄｘＬ０およびｒｅｆｉｄｘＬ１は、現ピクチャとの関係において同一のＰＯＣ差を有する最小インデックスとしてそれぞれ導出されることができる。具体的には、例えば、“［現ピクチャのＰＯＣ］－［ｒｅｆｉｄｘＬ０が指示する第１参照ピクチャのＰＯＣ］”を第１ＰＯＣ差分といい、”［現ピクチャのＰＯＣ］－［ｒｅｆｉｄｘＬ１が指示する第２参照ピクチャのＰＯＣ］”を第２ＰＯＣ差分というとき、上記第１ＰＯＣ差分と第２ＰＯＣ差分とが同一である場合に限り、上記第１参照ピクチャを指すｒｅｆｉｄｘＬ０の値が上記現ブロックのｒｅｆｉｄｘＬ０として導出され、上記第２参照ピクチャを指すｒｅｆｉｄｘＬ１の値が上記現ブロックのｒｅｆｉｄｘＬ１として導出されることもある。また、例えば、上記第１ＰＯＣ差分と第２ＰＯＣ差分とが同一である複数のセットがある場合、それらのうちの差分が最小であるセットのｒｅｆｉｄｘＬ０、ｒｅｆｉｄｘＬ１が、現ブロックのｒｅｆｉｄｘＬ０、ｒｅｆｉｄｘＬ１として導出されることができる。

図９に示すように、参照ピクチャリスト０、参照ピクチャリスト１、およびＭＶＤＬ０、ＭＶＤＬ１が示されている。ここで、ＭＶＤＬ１は、ＭＶＤＬ０と対称的である。

ＭＶＤＬ１は、マイナス（－）ＭＶＤＬ０として導出されることができる。例えば、現ブロックに対する最終（改善または修正された）動き情報（動きベクトル：ＭＶ）は、次の数式に基づいて導出される。

＜数式１＞

数式１において、ｍｖｘ０およびｍｖｙ０は、Ｌ０動き情報またはＬ０予測のための動きベクトルのｘ成分およびｙ成分を示し、ｍｖｘ１およびｍｖｙ１は、Ｌ１動き情報またはＬ１予測のための動きベクトルのｘ成分およびｙ成分を示す。また、ｍｖｐｘ０およびｍｖｐｙ０は、Ｌ０予測のための動きベクトル予測子のｘ成分およびｙ成分を示し、ｍｖｐｘ１およびｍｖｐｙ１は、Ｌ１予測のための動きベクトル予測子のｘ成分およびｙ成分を示す。また、ｍｖｄｘ０およびｍｖｄｙ０は、Ｌ０予測のための動きベクトル差分のｘ成分およびｙ成分を示す。

一方、ＭＭＶＤモードは、マージモードにＭＶＤ（Motion Vector Difference）を適用する方法として、現ブロック（すなわち、現ＣＵ）の予測サンプルの生成に直接使われる動き情報が内在的に（implicitly）導出されることができる。例えば、現ブロック（すなわち、現ＣＵ）にＭＭＶＤを使用するか否かを示すＭＭＶＤフラグ（例えば、ｍｍｖｄ＿ｆｌａｇ）がシグナリングされ、このＭＭＶＤフラグに基づいてＭＭＶＤが行われることができる。ＭＭＶＤが現ブロックに適用される場合（例えば、ｍｍｖｄ＿ｆｌａｇが１である場合）、ＭＭＶＤに関する追加情報がシグナリングされることができる。

ここで、ＭＭＶＤに関する追加情報は、マージ候補リスト内の第１候補または第２候補がＭＶＤと共に使用されるか否かを指示するマージ候補フラグ（例えば、ｍｍｖｄ＿ｃａｎｄ＿ｆｌａｇ）、動きの大きさ（motion magnitude）を示すための距離インデックス（例えば、ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）、動き方向（motion direction）を示すための方向インデックス（ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）を含む。

ＭＭＶＤモードでは、マージ候補リスト内の候補のうちの１番目および２番目のエントリに位置する２つの候補（すなわち、第１候補または第２候補）を使用することができ、上記２つの候補（すなわち、第１候補または第２候補）のいずれか１つが、ベースＭＶとして使用されることができる。例えば、マージ候補フラグ（例えば、ｍｍｖｄ＿ｃａｎｄ＿ｆｌａｇ）が、マージ候補リスト内の２つの候補（すなわち、第１候補または第２候補）のいずれか１つを示すためにシグナリングされることができる。

また、距離インデックス（例えば、ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）は、動きの大きさの情報を示し、開始ポイントから予め定められたオフセット（offset）を指示することができる。上記オフセットは、開始動きベクトルの水平成分または垂直成分に加えられてもよい。距離インデックスと予め定められたオフセットとの関係は、次の表のように示すことができる。

＜表４＞

上記表４を参照すると、距離インデックス（例えば、ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）の値によってＭＶＤの距離（例えば、ＭｍｖｄＤｉｓｔａｎｃｅ）が定められており、ＭＶＤの距離（例えば、ＭｍｖｄＤｉｓｔａｎｃｅ）は、ｔｉｌｅ＿ｇｒｏｕｐ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値に基づいて整数サンプル単位（integer sample precision）または端数サンプル単位（fractional sample precision）を使用して導出されることができる。例えば、ｔｉｌｅ＿ｇｒｏｕｐ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１である場合、ＭＶＤの距離は、現タイルグループ（または、ピクチャヘッダ）において整数サンプル単位を使用して導出されることを示し、ｔｉｌｅ＿ｇｒｏｕｐ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０である場合、ＭＶＤの距離は、タイルグループ（または、ピクチャヘッダ）において端数サンプル単位を使用して導出されることを示す。表１において、タイルグループのための情報（フラグ）は、ピクチャヘッダのための情報に置き換えられることができ、例えば、ｔｉｌｅ＿ｇｒｏｕｐ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、ｐｈ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ（または、ｐｈ＿ｍｍｖｄ＿ｆｕｌｌｐｅｌ＿ｏｎｌｙ＿ｆｌａｇ）に置き換えられることができる。

また、方向インデックス（例えば、ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）は、開始ポイントを基準にＭＶＤの方向を示し、以下の表５に示すように４方向を示す。ここで、ＭＶＤの方向は、ＭＶＤの符号を示すことができる。方向インデックスとＭＶＤ符号との関係は、以下の表のように示される。

＜表５＞

上記表５を参照すると、方向インデックス（例えば、ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）の値によってＭＶＤの符号（例えば、ＭｍｖｄＳｉｇｎ）が定められており、ＭＶＤの符号（例えば、ＭｍｖｄＳｉｇｎ）は、Ｌ０参照ピクチャおよびＬ１参照ピクチャに対して導出される。

前述のような距離インデックス（例えば、ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）および方向インデックス（例えば、ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）に基づいて次の数式のようにＭＶＤのオフセットを計算することができる。

＜数式２＞

＜数式３＞

数式２および数式３において、ＭＭＶＤ距離（ＭｍｖｄＤｉｓｔａｎｃｅ［ｘ０］［ｙ０］）およびＭＭＶＤ符号（ＭｍｖｄＳｉｇｎ［ｘ０］［ｙ０］［０］、ＭｍｖｄＳｉｇｎ［ｘ０］［ｙ０］［１］）は、表４および／または表５に基づいて導出される。まとめると、ＭＭＶＤモードでは、周辺ブロックに基づいて導出されたマージ候補リストのマージ候補子のうち、マージ候補フラグ（例えば、ｍｍｖｄ＿ｃａｎｄ＿ｆｌａｇ）により指示されるマージ候補を選択し、上記選択されたマージ候補をベース（base）候補（例えば、ＭＶＰ）として使用することができる。そして、ベース候補に基づいて距離インデックス（例えば、ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）および方向インデックス（例えば、ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）を用いて導出されたＭＶＤを加えて、現ブロックの動き情報（すなわち、動きベクトル）を導出することができる。

予測モードによって導出された動き情報に基づいて、現ブロックに対する予測されたブロックを導出することができる。上記予測されたブロックは、上記現ブロックの予測サンプル（予測サンプルアレイ）を含む。現在のブロックの動きベクトルが端数サンプル単位を指す場合、補間（interpolation）手順が行われることができ、これにより参照ピクチャ内において端数サンプル単位の参照サンプルに基づいて上記現在のブロックの予測サンプルが導出されることができる。双予測が適用される場合、Ｌ０予測（すなわち、参照ピクチャリストＬ０内の参照ピクチャおよびＭＶＬ０を用いた予測）に基づいて導出された予測サンプルとＬ１予測（すなわち、参照ピクチャリストＬ１内の参照ピクチャおよびＭＶＬ１を用いた予測）に基づいて導出された予測サンプルとの（位相に応じた）加重和または加重平均により導出された予測サンプルが、現在のブロックの予測サンプルとして利用されることができる。双予測が適用される場合、Ｌ０予測に利用された参照ピクチャとＬ１予測に利用された参照ピクチャとが現ピクチャを基準に互いに異なる時間方向に位置する場合（すなわち、双予測でありながら双方向予測に該当する場合）、これを真（true）双予測と呼んでもよい。

導出された予測サンプルに基づいて復元サンプルおよび復元ピクチャが生成され、その後、インループフィルタリングなどの手順が実行されることができることは、前述の通りである。

前述のように本文書によれば、現ブロックに双予測が適用される場合、加重平均（weighted average）に基づいて予測サンプルを導出することができる。従来、双予測信号（すなわち、双予測サンプル）は、Ｌ０予測信号（Ｌ０予測サンプル）とＬ１予測信号（Ｌ１予測サンプル）との単純平均により導出されていた。すなわち、双予測サンプルは、Ｌ０参照ピクチャおよびＭＶＬ０に基づくＬ０予測サンプルとＬ１参照ピクチャおよびＭＶＬ１に基づくＬ１予測サンプルとの平均として導出された。しかしながら、本文書によると、双予測が適用される場合、次のように、Ｌ０予測信号とＬ１予測信号との加重平均により双予測信号（双予測サンプル）を導出することができる。

前述のＭＭＶＤに関連する実施形態において、ＭＭＶＤのＭＶＤ導出過程においてロングターム参照ピクチャを考慮した方法が提案されることができ、これにより、様々なアプリケーションにおいて圧縮効率を維持および増加させることができるようにする。また、本文書の実施形態において提案する方法は、ＭＥＲＧＥにおいて使用されるＭＭＶＤ技術以外に、インターモード（ＭＶＰモード）において使用される対称的（Symmetric）ＭＶＤ技術であるＳＭＶＤにおいても同様に適用されることができる。

図１０は、インター予測において動きベクトルを導出する方法を説明する図である。

本文書の一実施形態において、時間動き候補（Temporal motion candidate、temporal merge candidate、またはtemporal mvp candidate）の動きベクトルスケーリング（MV scaling）の過程でロングターム参照ピクチャを考慮したＭＶ導出方法が使われている。時間動き候補は、ｍｖＣｏｌ（ｍｖＬＸＣｏｌ）に対応できる。時間動き候補は、「ＴＭＶＰ」と呼ばれてもよい。

次の表は、ロングターム参照ピクチャの定義を説明する。

＜表６＞

上記表６を参照すると、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（ａＰｉｃ、ａＰｂ、ｒｅｆＩｄｘ、ＬＸ）が１（真、ｔｒｕｅ）である場合、対応する参照ピクチャは、ロングターム参照のために使われる（ｕｓｅｄｆｏｒｌｏｎｇ－ｔｅｒｍｒｅｆｅｒｅｎｃｅ）ものとマーキングされる。例えば、ロングターム参照のために使われるとマーキングされていない参照ピクチャは、ショートターム参照のために使われる（ｕｓｅｄｆｏｒｓｈｏｒｔ－ｔｅｒｍｒｅｆｅｒｅｎｃｅ）ものとマーキングされた参照ピクチャであり得る。他の例において、ロングターム参照のために使用されるものとマーキングされず、使用されていないものとマーキングされていない参照ピクチャは、ショートターム参照のために使用されるものとマーキングされた参照ピクチャであり得る。以下、ロングターム参照のために使用されるものとマーキングされた参照ピクチャは、ロングターム参照ピクチャと称されてもよく、ショートターム参照のために使用されるものとマーキングされた参照ピクチャは、ショートターム参照ピクチャと称されてもよい。

次の表は、ＴＭＶＰ（ｍｖＬＸＣｏｌ）の導出を説明する。

＜表７＞

図１０および表７を参照すると、現ピクチャが指す参照ピクチャタイプ（例えば、ｌｏｎｇ－ｔｅｒｍｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅ（ＬＴＲＰ）であるかまたはｓｈｏｒｔ－ｔｅｒｍｒｅｆｒｅｎｃｅｐｉｃｔｕｒｅ（ＳＴＲＰ）であるかを指す）とコロケーテッドピクチャ（collocated picture）が指すコロケーテッド参照ピクチャ（collocated reference picture）のタイプとが同一でない場合、時間動きベクトル（ｍｖＬＸＣｏｌ）は使用されない。すなわち、全てがロングターム参照ピクチャであるか、全てがショートターム参照ピクチャである場合は、ｃｏｌＭＶを導出し、他のタイプを有する場合は、ｃｏｌＭＶを導出しない。また、全てがロングターム参照ピクチャである場合と、現ピクチャと現ピクチャの参照ピクチャとのＰＯＣ差分がコロケーテッドピクチャとコロケーテッドピクチャの参照ピクチャとの間のＰＯＣ差分と同一である場合と、において、スケーリングなしでコロケーテッドの動きベクトルをそのまま使用することができる。ショートターム参照ピクチャであり、ＰＯＣ差分が異なる場合、スケーリングされたコロケーテッドブロックの動きベクトルが使用される。

本文書の実施形態において、ＭＥＲＧＥ／ＳＫＩＰモードにおいて使用されるＭＭＶＤは、１つのコーディングブロックに対して、ベース動きベクトルインデックス（base MV index）、距離インデックス（distance index）、方向インデックス（direction index）を、ＭＶＤ情報を導出するための情報としてシグナリングする。単方向予測を行う場合、動き情報からＭＶＤを導出し、双方向予測の場合、ミラーリング（mirroring）およびスケーリング方法を用いて対称的なＭＶＤ情報を生成する。

双方向予測を行う場合、Ｌ０またはＬ１のためのＭＶＤ情報は、スケーリングされてＬ１またはＬ０のＭＶＤを生成するが、ロングターム参照ピクチャを参照する場合、ＭＶＤ導出過程における変更が必要である。

図１１は、本文書の一実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す。図１１に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

図１１を参照すると、Ｌ０参照ピクチャとの距離とＬ１参照ピクチャとの距離とが同一である場合、導出されたＭｍｖｄＯｆｆｓｅｔをそのままＭＶＤとして使用することができ、ＰＯＣ差分（Ｌ０参照ピクチャと現ピクチャとの間のＰＯＣ差分とＬ１参照ピクチャと現ピクチャとの間のＰＯＣ差分と）が異なるとき、ＰＯＣ差分とロングターム参照ピクチャであるかまたはショートターム参照ピクチャであるかとによって（according to the POC difference and whether it is a long-term or short-term reference picture）、スケーリングするか単純ミラーリング（すなわち、－１＊ＭｍｖｄＯｆｆｓｅｔ）してＭＶＤを導出することができる。

一例として、双方向予測が適用されるブロックに対してＭＭＶＤを用いて対称的なＭＶＤを導出する方法は、ロングターム参照ピクチャを使用するブロックには適合せず、特に、各方向の参照ピクチャタイプが異なる場合、ＭＭＶＤ使用時の性能向上は期待しにくい。したがって、次の図および実施形態においては、Ｌ０とＬ１との参照ピクチャタイプが異なる場合、ＭＭＶＤが適用されないように実現される例が紹介される。

図１２は、本文書の他の実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す。図１２に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

図１２を参照すると、現ピクチャ（または、現スライス、現ブロック）により参照される参照ピクチャがＬＴＲＰ（Long-Term Reference Picture）であるかまたはＳＴＲＰ（Short-Term Reference Picture）であるかによって異なるＭＶＤ導出方法が適用される。一例において、図１２による実施形態の方法が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

＜表８＞

図１３は、本文書の他の実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す。図１３に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

上記図１３を参照すると、現ピクチャ（または、現スライス、現ブロック）により参照される参照ピクチャがＬＴＲＰ（Long-Term Reference Picture）であるかまたはＳＴＲＰ（Short-Term Reference Picture）であるかによって異なるＭＶＤ導出方法が適用される。一例において、図１３による実施形態の方法が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

＜表９＞

まとめると、各方向の参照ピクチャタイプが異なる場合にＭＶＤを導出しないＭＭＶＤのＭＶＤ導出過程が説明されている。

本文書による一実施形態において、ロングターム参照ピクチャを参照する全ての場合にＭＶＤが導出されるものではない。すなわち、Ｌ０、Ｌ１参照ピクチャが１つでもロングターム参照ピクチャであるときは、ＭＶＤを０に設定し、ショートターム参照ピクチャを有する場合にのみ、ＭＶＤが導出されることができる。以下の図面および表で具体的に説明する。

図１４は、本文書の一実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す。図１４に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

上記図１４を参照すると、最優先条件（ＲｅｆＰｉｃＬ０！＝ＬＴＲＰ＆＆ＲｅｆＰｉｃＬ１！＝ＳＴＲＰ）に基づいて現ピクチャ（または、現スライス、現ブロック）がショートターム参照ピクチャのみを参照する場合にＭＭＶＤのためのＭＶＤが導出されることができる。一例において、図１４による実施形態の方法が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

＜表１０＞

本文書による一実施形態において、各方向の参照ピクチャタイプが異なる場合、ショートターム参照ピクチャを有する場合は、ＭＶＤを導出し、ロングターム参照ピクチャを有する場合は、ＭＶＤが０に導出される。以下の図面および表で具体的に説明する。

図１５は、本文書の一実施形態に係るＭＭＶＤのＭＶＤ導出過程を示す。図１５に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

上記図１５を参照すると、各方向の参照ピクチャタイプが異なる場合、現ピクチャから距離の近い参照ピクチャ（ショートターム参照ピクチャ）を参照するとき、ＭｍｖｄＯｆｆｓｅｔが適用され、現ピクチャから距離の遠い参照ピクチャ（ロングターム参照ピクチャ）を参照するとき、ＭＶＤは、０値を有する。ここで、現ピクチャに近いピクチャは、ショートターム参照ピクチャを有するとみなすことができるが、近いピクチャがロングターム参照ピクチャである場合は、ショートターム参照ピクチャを指すリストの動きベクトルにｍｍｖｄＯｆｆｓｅｔを適用することができる。

＜表１１＞

例えば、上記表１１に含まれる４つの段落は、上記図１５に含まれるフローチャートの一番下のブロック（内容）を順次置き換えることができる。

一例において、図１５による実施形態の方法が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

＜表１２＞

次の表は、本文書に含まれる実施形態間の比較表を示す。

＜表１３＞

表１３を参照すると、図１１ないし図１５による実施形態において説明されたＭＭＶＤのＭＶＤ導出のために、参照ピクチャタイプを考慮してオフセットを適用する方法間の比較が示される。表１３において、実施形態Ａは、既存のＭＭＶＤに関するものであり、実施形態Ｂは、図１１ないし図１３による実施形態を示し、実施形態Ｃは、図１４による実施形態を示し、実施形態Ｄは、図１５による実施形態を示す。

すなわち、図１１、図１２および図１３による実施形態においては、両方向の参照ピクチャタイプが同一である場合にのみＭＶＤを導出する方法、図１４による実施形態においては、両方向ともショートターム参照ピクチャである場合にのみＭＶＤを導出する方法について記述した。図１４による実施形態の場合、単方向予測に対してロングターム参照ピクチャであればＭＶＤを０に設定する。また、図１５による実施形態においては、両方向の参照ピクチャタイプが異なる場合、一方向にのみＭＶＤを導出する方法について記述した。このような実施形態間の相違点は、本文書で説明される技術の様々な特徴を示し、上記特徴に基づいて本文書による実施形態が達成しようとする効果が実現されることができることが本明細書の属する技術分野の通常の知識を有する者により理解できる。

本文書による実施形態においては、参照ピクチャタイプがロングターム参照ピクチャである場合、別途のプロセスを有する。ロングターム参照ピクチャを含む場合、ＰＯＣ差分（ＰＯＣＤｉｆｆ）ベースのスケーリングまたはミラーリングは性能向上に影響がないため、ショートターム参照ピクチャを有する方向のＭＶＤは、ＭｍｖｄＯｆｆｓｅｔ値が割り当てられ、ロングターム参照ピクチャを有する方向のＭＶＤは、０値が割り当てられるようにする。一例において、本実施形態が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

＜表１４＞

他の例において、上記表１４の一部分は、次の表に置き換えることができる。表１５を参照すると、ＰＯＣＤｉｆｆではなく、参照ピクチャタイプを基準としてＯｆｆｓｅｔが適用される。

＜表１５＞

さらに他の例において、上記表１４の一部分は、次の表に置き換えることができる。表１６を参照すると、参照ピクチャタイプを考慮せずに、常に、Ｌ０にＭｍｖｄＯｆｆｓｅｔを、Ｌ１に－ＭｍｖｄＯｆｆｓｅｔを設定することができる。

＜表１６＞

本文書の一実施形態によると、前述のＭＥＲＧＥモードにおいて使用されるＭＭＶＤに類似して、インターモードにおけるＳＭＶＤが行われることができる。双方向予測を行う場合、対称的ＭＶＤ導出が可能か否かがエンコード装置からデコード装置にシグナリングされ、関連フラグ（例えば、ｓｙｍ＿ｍｖｄ＿ｆｌａｇ）が真（または、その値が１）であるとき、第１方向ＭＶＤ（例えば、ＭＶＤＬ０）のミラーリングにより第２方向ＭＶＤ（例えば、ＭＶＤＬ１）が導出される。この場合、第１方向ＭＶＤに対するスケーリングは行われない場合がある。

＜表１７＞

＜表１８＞

上記表１７および表１８を参照すると、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃ＝＝ＰＲＥＤ＿ＢＩであり、そして、Ｌ０およびＬ１の参照ピクチャが使用可能（available）である場合（例えば、ＲｅｆＩｄｘＳｙｍＬ０＞－１＆＆ＲｅｆＩｄｘＳｙｍＬ１＞－１）、ｓｙｍ＿ｍｖｄ＿ｆｌａｇがシグナリングされる。

次の表は、一例によるＭＭＶＤ参照インデックスのためのデコード手順を示す。

＜表１９＞

表１９を参照すると、Ｌ０およびＬ１の参照ピクチャの使用可能性（availability）導出手順が説明される。すなわち、Ｌ０参照ピクチャのうちフォワード方向（forward direction）の参照ピクチャが存在する場合、現ピクチャに最も近い参照ピクチャインデックスをＲｅｆＩｄｘＳｙｍＬ０に設定し、該当値は、Ｌ０の参照インデックスに設定される。また、Ｌ１参照ピクチャのうちバックワード方向（backward direction）の参照ピクチャが存在する場合、現ピクチャに最も近い参照ピクチャインデックスをＲｅｆＩｄｘＳｙｍＬ１に設定し、該当値は、Ｌ１の参照インデックスに設定される。

以下の表２０は、他の例によるＭＭＶＤ参照インデックスのためのデコード手順を示す。

＜表２０＞

表２０を参照すると、図１１、図１２、図１３と共に説明された実施形態のようにＬ０またはＬ１参照ピクチャタイプが異なる場合、すなわち、ロングターム参照ピクチャとショートターム参照ピクチャとが使用される場合、ＳＭＶＤを防ぐためにＳＭＶＤのための参照インデックス導出以後、Ｌ０とＬ１との参照ピクチャタイプが異なる場合、ＳＭＶＤを使用しないようにする（表２０の一番下の段落参照）。

本文書の一実施形態において、マージモードで使用されるＭＭＶＤに類似して、インターモードでは、ＳＭＶＤが適用されることができる。図１４とともに説明された実施形態のように、ロングターム参照ピクチャが使用される場合、ＳＭＶＤを防ぐために以下の表のようにＳＭＶＤのための参照インデックス導出の過程でロングターム参照ピクチャを除外することができる。

＜表２１＞

本実施形態の他の例による次の表は、ＳＭＶＤのための参照ピクチャインデックス導出以後にロングターム参照ピクチャを使用する場合、ＳＭＶＤを適用しないように処理する例を示す。

＜表２２＞

本文書の一実施形態において、ＴＭＶＰのｃｏｌＭＶ導出過程で現ピクチャの参照ピクチャタイプとコロケーテッドピクチャの参照ピクチャタイプとが異なる場合、動きベクトルＭＶは０に設定されるが、ＭＭＶＤ、ＳＭＶＤの場合の導出方法と異なるので、これが統一されるようにする。

現ピクチャの参照ピクチャタイプがロングターム参照ピクチャであり、コロケーテッドピクチャの参照ピクチャタイプがロングターム参照ピクチャである場合も、動きベクトルは、コロケーテッド動きベクトル値をそのまま使用しているが、ＭＭＶＤ、ＳＭＶＤにおいて、この場合は、ＭＶを０に設定する。ここで、ＴＭＶＰも追加導出なしでＭＶを０に設定する。

また、参照ピクチャタイプが異なっても、現ピクチャとの距離が近いロングターム参照ピクチャが存在し得るので、これを考慮してＭＶを０に設定する代わりにスケーリングなしでｃｏｌＭＶをＭＶとして使用することができる。

図１６は、本文書の一実施形態によってＳＭＶＤを説明する図である。

ＳＭＶＤの導出のために、図１６のような方法が使用されることができる。すなわち、ＳＴＲＰ（ショートターム参照ピクチャ）および／またはＬＴＲＰ（ロングターム参照ピクチャ）に基づいてＳＭＶＤが導出されることができる。ミラーリングされたＬ０ＭＶＤをＬ１ＭＶＤに使用する場合に、参照ピクチャのタイプが異なれば、不正確なＭＶＤが導出され得る。これは、距離の比率（参照ピクチャ０と現ピクチャとの間の距離および参照ピクチャ１と現ピクチャとの間の距離）が大きくなり、各方向に対する動きベクトルの相関度が下がるためである。

本文書の一実施形態によると、参照ピクチャの使用可能性がチェックされ、そして条件を満たせば、ｓｙｍ＿ｍｖｄ＿ｆｌａｇがパージングされ得る。ｓｙｍ＿ｍｖｄ＿ｆｌａｇが真であれば、Ｌ１のＭＶＤ（ＭＶＤＬ１）がミラーリングされた（mirrored）ＭＶＤＬ０（Ｌ０のＭＶＤ）として導出されることができる。

次の表は、本実施形態に係るコーディングユニットシンタックスの一部分を示す。

＜表２３＞

表２３に基づいて、本実施形態に係るｓｙｍ＿ｍｖｄ＿ｆｌａｇの導出手順を説明できる。

本実施形態では、ＳＭＶＤのための参照ピクチャインデックス（ＲｅｆＩｄｘＳｙｍＬＸｗｉｔｈＸ＝０，１）が導出されることができる。ＲｅｆＩｄｘＳｙｍＬ０は、現ピクチャのＰＯＣよりも小さいＰＯＣを有する最も近い参照ピクチャ（のインデックス）を示すことができる。ＲｅｆＩｄｘＳｙｍＬ１は、現ピクチャのＰＯＣよりも大きいＰＯＣを有する最も近い参照ピクチャ（のインデックス）を示すことができる。

次の表は、本実施形態によって、ＳＭＶＤのための参照ピクチャインデックスを導出する方法を標準文書の形式で記述する。

＜表２４＞

次の表は、実施形態の間の比較結果を示す。表２５に含まれる実施形態によって参照ピクチャタイプが考慮されることによって、ＳＭＶＤにおけるＭＶＤの精度が向上することができる。表２５において、ＭＶＤは、ＭＶＤ０（Ｌ０のＭＶＤ）を示すことができる。

＜表２５＞

表２５を参照すると、実施例Ｐは、既存のＳＭＶＤの導出方法を示す。実施例Ｑでは、Ｌ０およびＬ１で混合された参照ピクチャタイプ（例えば、ＳＴＲＰ／ＬＴＲＰまたはＬＴＲＰ／ＳＴＲＰ）が使用される場合にＳＭＶＤが制限され得る。実施例Ｒでは、ロングターム参照ピクチャ（ＬＴＲＰ）を参照する場合にＳＭＶＤが制限され得る。

次の表は、表２５の実施例ＱによってＳＭＶＤのための参照ピクチャインデックスを導出する方法を標準文書の形式で記述する。

＜表２６＞

＜表２７＞

＜表２８＞

表２７および／または表２８を参照すると、ロングターム参照ピクチャ（ＬＴＲＰ）を参照する場合にＳＭＶＤが制限され得る。例えば、表２７を参照すると、参照ピクチャチェック手順（reference picture checking process）でロングターム参照ピクチャが排除されることができる。これによって、他の参照ピクチャ（例えば、ロングターム参照ピクチャではない）がＳＭＶＤのために考慮されることができる。表２８を参照すると、現ピクチャから最も近い参照ピクチャがロングターム参照ピクチャである場合に、ＳＭＶＤが実行されないことがある。例えば、参照ピクチャリストにショートターム参照ピクチャが含まれているとしても、現ピクチャから最も近い参照ピクチャがロングターム参照ピクチャである場合には、ＳＭＶＤが実行されないことがある。

本文書の一実施形態に係る一例において、ＭＭＶＤ手順でＬ０のＰＯＣ距離がＬ１のＰＯＣ以上である場合に、Ｌ１ＭＶＤがスケーリングされたまたはミラーリングされたＬ０ＭＶＤとして導出されることができる。ＭＭＶＤ手順でＬ０のＰＯＣ距離がＬ１のＰＯＣよりも小さい場合に、ＭＭＶＤ手順でＬ０ＭＶＤがスケーリングされたまたはミラーリングされたＬ１ＭＶＤとして導出されることができる。

図１７は、本文書の一実施形態に係るＭＭＶＤの導出方法を示すフローチャートである。

本文書の一実施形態において、ＰＯＣ差分および／または参照ピクチャタイプを考慮し、ＭＭＶＤでＭＶＤが導出されることができる。図１７を参照すると、ｃｕｒｒＰｏｃＤｉｆｆＬＸは、現ピクチャのＰＯＣと参照ピクチャＬＸのＰＯＣとの間の差を意味することができる。ＣｕｒｒＰｏｃＤｉｆｆＬ０とｃｕｒｒＰｏｃＤｉｆｆＬ１とは、互いに比較されることができ、そして参照ピクチャのタイプがチェックされることができる（“ｒｅｆＰｉｃＬｉｓｔ０！＝ＬＴＲＰ”または“ｒｅｆＰｉｃＬｉｓｔ１！＝ＬＴＲＰ”）。条件を考慮して、ＭｍｖｄＯｆｆｓｅｔ（ｍｍｖｄ＿ｃａｎｄ＿ｆｌａｇ、ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ、および／またはｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘを用いて導出される）は、ｍＭｖｄＬＸと同じ値、ミラーリングされた値またはスケーリングされた値として割り当てられることができる。

次の表は、本実施形態に係る標準文書の一部分を示す。

＜表２９＞

現ピクチャが一つまたは複数のロングターム参照ピクチャ（ＬＴＲＰ）を参照する場合には、ＰＯＣ距離を考慮するミラーリング手順が必要ではないことがある。これは、他のＭＶＤよりも非常に遠い距離の参照ピクチャから取得されたミラーリングＭＶＤは、精度の側面で効果的ではないためである。これを解決するための案が以下で説明される。

次の表は、実施例間の比較結果を示す。

＜表３０＞

表３０を参照すると、実施例Ｘは、既存のＭＭＶＤの導出方法を示す。実施例Ｙでは、一つまたは複数のロングターム参照ピクチャが現ブロックに参照される場合にＭＭＶＤ手順が制限され得る。すなわち、実施例Ｙでは、ロングターム参照ピクチャのためのＰＯＣ距離の比較手順が省略され得る。実施例Ｚでは、全ての場合に対して、ＭＭＶＤの導出手順が制限され得る。すなわち、実施例Ｚでは、全ての場合に対して、ＰＯＣ距離を比較する手順が省略され得る。表３０において、ｏｆｆｓｅｔは、ＭｍｖｄＯｆｆｓｅｔを呼称（指称）し得る。

図１８は、本文書の一実施形態に係るＭＭＶＤの導出方法を示すフローチャートである。図１８のフローチャートは、前述の実施例ＹによるＭＭＶＤの導出方法を示すことができる。

図１８を参照すると、参照ピクチャタイプがロングターム参照ピクチャである場合にＰＯＣ差分を比較する条件が除去され得、そして、ミラーリング手順のために使用されるアンカ（anchor）ＭＶＤは、Ｌ０ＭＶＤに固定されることができる。

次の表は、表３０の実施例ＹによってＭＭＶＤを導出する方法を標準文書の形式で記述する。

＜表３１＞

図１９は、本文書の一実施形態に係るＭＭＶＤの導出方法を示すフローチャートである。図１９のフローチャートは、前述の実施例ＺによるＭＭＶＤの導出方法を示すことができる。

図１９を参照すると、実施例Ｚでは、全ての場合に対して、ＭＭＶＤの導出手順が制限され得る。全ての場合に対して、ＰＯＣ差分を比較する条件が除去され得、そして、ミラーリングまたはスケーリング手順のために使用されるアンカ（anchor）ＭＶＤは、Ｌ０ＭＶＤに固定されることができる。

次の表は、表３０の実施例ＺによってＭＭＶＤを導出する方法を標準文書の形式で記述する。

＜表３２＞

また、本実施形態の一例において、全ての場合に対して、ＰＯＣ差分を比較する条件が除去され得、そして、ただミラーリングする案のみが使用されることもある。次の表は、本例示において、ＭＭＶＤを導出する方法を標準文書の形式で記述する。

＜表３３＞

以下の図面は、本明細書の具体的な一例を説明するために作成された。図面に記載された具体的な装置の名称や具体的な信号／メッセージ／フィールドの名称は、例示的に提示されたものであるので、本明細書の技術的特徴は、以下の図面に用いられた具体的な名称に制限されない。

図２０および２１は、本文書の実施形態に係るビデオ／画像エンコード方法および関連のコンポーネントの一例を概略的に示す。図２０において開示された方法は、図２において開示されたエンコード装置によって実行されることができる。具体的には、例えば、図２０のＳ２０００ないしＳ２０４０は、上記エンコード装置の予測部２２０により実行されることができ、Ｓ２０５０は、上記エンコード装置の残差（レジデュアル）処理部２３０によって実行されることができる。Ｓ２０６０は、上記エンコード装置のエントロピ符号化（エンコーディング）部２４０によって実行されることができる。図２０において開示された方法は、本文書で前述した実施形態を含むことができる。

図２０を参照すると、エンコード装置は、現ピクチャ内の現ブロックのためにインター予測モードを導出する（Ｓ２０００）。ここで、インター予測モードは、前述したマージモード、ＡＭＶＰモード（動きベクトル予測子候補を用いたモード）、ＭＭＶＤ、ＳＭＶＤを含むことができる。

エンコード装置は、上記インター予測モードのための参照ピクチャを導出する（Ｓ２０１０）。一例において、参照ピクチャは、参照ピクチャリスト０（またはＬ０、参照ピクチャリストＬ０）または参照ピクチャリスト１（またはＬ１、参照ピクチャリストＬ１）に含まれ得る。例えば、エンコード装置は、現ピクチャに含まれるスライスのそれぞれごとに参照ピクチャリストを構成することができる。

エンコード装置は、上記インター予測モードに基づいて、上記現ブロックの予測のための動き情報を導出する（Ｓ２０２０）。上記動き情報は、参照ピクチャインデックスおよび動きベクトルを含むことができる。例えば、エンコード装置は、ＳＭＶＤのための参照インデックス（対称動きベクトル参照インデックス）を導出することができる。ＳＭＶＤのための参照インデックスは、ＳＭＶＤの適用のための参照ピクチャを指すことができる。ＳＭＶＤのための参照インデックスは、参照インデックスＬ０（RefIdxSumL0）および参照インデックスＬ１（RefIdxSumL1）を含むことができる。

エンコード装置は、動きベクトル予測子候補リストを構成し、そして、上記リストに基づいて動きベクトル予測子を導出することができる。エンコード装置は、対称的なＭＶＤと上記動きベクトル予測子とに基づいて動きベクトルを導出することができる。

エンコード装置は、上記動き情報に基づいて予測サンプルを生成する（Ｓ２０３０）。エンコード装置は、上記動き情報に含まれる動きベクトルと参照ピクチャインデックスとに基づいて上記予測サンプルを生成することができる。例えば、上記予測サンプルは、上記参照ピクチャインデックスが指す上記参照ピクチャ内のブロック（またはサンプル）のうち、上記動きベクトルにより指示されるブロック（またはサンプル）に基づいて生成されることができる。

エンコード装置は、上記インター予測モードを含む予測関連情報を生成する（Ｓ２０４０）。上記予測関連情報は、ＭＭＶＤに関する情報、ＳＭＶＤに関する情報などを含むことができる。

エンコード装置は、上記予測サンプルに基づいて残差（レジデュアル）情報を導出する（Ｓ２０５０）。具体的には、エンコード装置は、上記予測サンプルとオリジナルサンプルとに基づいて、残差サンプルを導出することができる。エンコード装置は、上記残差サンプルに基づいて、残差情報が導出されることができる。上記残差情報の導出のために、前述した変換および量子化過程を行うことができる。

エンコード装置は、上記予測関連情報および上記残差情報を含む画像／ビデオ情報をエンコードする（Ｓ２０６０）。エンコードされた画像／ビデオ情報は、ビットストリームの形態で出力されることができる。上記ビットストリームは、ネットワークまたは（デジタル）記憶媒体を介してデコード装置に送信されることができる。

上記画像／ビデオ情報は、本文書の実施形態に係る多様な情報を含むことができる。例えば、上記画像／ビデオ情報は、前述した表１ないし３３のうちの少なくとも一つに開示された情報を含むことができる。

一実施形態において、上記予測関連情報は、上記現ピクチャ内の上記現ブロックに双予測が適用されるか否かを示すインター予測タイプ情報を含むことができる。例えば、上記インター予測タイプ情報に基づいて、上記予測関連情報は、対称動きベクトル差分参照の適用が可能か否かを示す対称動きベクトル差分参照フラグ情報を含むことができる。また、上記参照ピクチャは、ショートターム参照ピクチャを含むことができる。上記対称動きベクトル差分参照フラグ情報に基づいて、ショートターム参照ピクチャを指す参照インデックスから対称動きベクトル差分参照インデックスが導出されることができる。上記動き情報は、上記現ブロックに対する動きベクトル、および上記対称動きベクトル差分参照インデックスを含むことができる。上記動きベクトルおよび上記対称動きベクトル差分参照インデックスに基づいて、上記予測サンプルが生成されることができる。

一実施形態において、上記ショートターム参照ピクチャのそれぞれと上記現ピクチャとの間のＰＯＣ差分に基づいて、上記対称動きベクトル差分参照インデックスが導出されることができる。ここで、一例によると、現ピクチャと現ピクチャから以前の参照ピクチャとの間のＰＯＣ差分は、０よりも大きいことがある。別の例において、現ピクチャと現ピクチャから以後の参照ピクチャとの間のＰＯＣ差分は、０よりも小さいことがある。ただし、これは例示にすぎない。

一実施形態において、エンコード装置は、Ｌ０予測のための参照ピクチャリストＬ０（または参照ピクチャリスト０）およびＬ１予測のための参照ピクチャリストＬ１（または参照ピクチャリスト０）を構成することができる。一例として、上記ショートターム参照ピクチャは、上記参照ピクチャリストＬ０に含まれるショートターム参照ピクチャＬ０、および上記参照ピクチャリストＬ１に含まれるショートターム参照ピクチャＬ１を含むことができる。上記ＰＯＣ差分は、上記ショートターム参照ピクチャＬ０と上記現ピクチャとの間の第１ＰＯＣ差分、および上記ショートターム参照ピクチャＬ１と上記現ピクチャとの間の第２ＰＯＣ差分を含むことができる。例えば、上記対称動きベクトル差分参照インデックスは、対称動きベクトル差分参照インデックスＬ０および対称動きベクトル差分参照インデックスＬ１を含むことができる。上記第１ＰＯＣ差分に基づいて、上記対称動きベクトル差分参照インデックスＬ０が導出されることができる。上記第２ＰＯＣ差分に基づいて、上記対称動きベクトル差分参照インデックスＬ１が導出されることができる。

一実施形態において、上記第１ＰＯＣ差分は、上記第２ＰＯＣ差分と同一であり得る。

一実施形態において、エンコード装置は、Ｌ０予測のための参照ピクチャリストＬ０を構成することができる。上記ショートターム参照ピクチャは、上記参照ピクチャリストＬ０に含まれる第１のショートターム参照ピクチャＬ０、および第２のショートターム参照ピクチャＬ０を含むことができる。一例として、上記ＰＯＣ差分は、上記第１のショートターム参照ピクチャＬ０と上記現ピクチャとの間の第３ＰＯＣ差分、および上記第２のショートターム参照ピクチャＬ０と上記現ピクチャとの間の第４ＰＯＣ差分を含むことができる。例えば、上記対称動きベクトル差分参照インデックスは、対称動きベクトル差分参照インデックスＬ０を含むことができる。上記第３および第４ＰＯＣ差分の間の比較に基づいて、上記第１のショートターム参照ピクチャＬ０を指す参照ピクチャインデックスが、上記対称動きベクトル差分参照インデックスＬ０として使用されることができる。

一実施形態において、上記第３ＰＯＣ差分が上記第４ＰＯＣ差分よりもさらに小さい場合、上記第１のショートターム参照ピクチャＬ０を指す上記参照ピクチャインデックスが、上記対称動きベクトル差分参照インデックスＬ０として使用されることができる。

一実施形態において、上記画像情報は、ＭＶＤ（Motion Vector Differences）に関する情報を含むことができる。上記動き情報は、ＭＶ（Motion Vector）を含むことができる。上記ＭＶＤに関する情報に基づいて、Ｌ０予測のためのＭＶＤＬ０が導出されることができる。上記ＭＶは、上記ＭＶＤＬ０および上記ＭＶＤＬ１に基づいて導出されることができる。

一実施形態において、上記ＭＶＤＬ１の大きさは、上記ＭＶＤＬ０の大きさと同一であり得る。上記ＭＶＤＬ１の符号は、上記ＭＶＤＬ０の符号と反対であり得る。

図２２および２３は、本文書の実施形態に係る画像／ビデオデコード方法および関連のコンポーネントの一例を概略的に示す。図２２において開示された方法は、図３において開示されたデコード装置によって実行されることができる。具体的には、例えば、図２２のＳ２２００は、上記デコード装置のエントロピ復号（デコーディング）部３１０によって実行されることができ、Ｓ２２１０ないしＳ２２３０は、上記デコード装置の予測部３３０によって実行されることができ、Ｓ２２４０は、上記デコード装置の残差（レジデュアル）処理部３２０によって実行されることができ、Ｓ２２５０は、上記デコード装置の加算部３４０によって実行されることができる。図２２において開示された方法は、本文書で前述した実施形態を含むことができる。

図２２を参照すると、デコード装置は、画像／ビデオ情報を受信／取得する（Ｓ２２００）。デコード装置は、ビットストリームを介して上記画像／ビデオ情報を受信／取得することができる。上記画像／ビデオ情報は、予測関連情報（予測モード情報を含む）および残差情報を含むことができる。上記予測関連情報は、ＭＭＶＤに関する情報、ＳＭＶＤに関する情報などを含むことができる。また、上記画像／ビデオ情報は、本文書の実施形態に係る多様な情報を含むことができる。例えば、上記画像／ビデオ情報は、図１ないし１９と共に説明された情報および／または前述した表１ないし３３のうちの少なくとも一つに開示された情報を含むことができる。

デコード装置は、上記予測関連情報に基づいて現ブロックに対するインター予測モードを導出する（Ｓ２２１０）。ここで、インター予測モードは、前述したマージモード、ＡＭＶＰモード（動きベクトル予測子候補を用いたモード）、ＭＭＶＤ、ＳＭＶＤを含むことができる。

デコード装置は、上記インター予測モードに基づいて上記現ブロックの予測のための動き情報を導出する（Ｓ２２２０）。上記動き情報は、参照ピクチャインデックスおよび動きベクトルを含むことができる。例えば、デコード装置は、ＳＭＶＤのための参照インデックスを導出することができる。ＳＭＶＤのための参照インデックスは、ＳＭＶＤの適用のための参照ピクチャを指すことができる。ＳＭＶＤのための参照インデックスは、参照インデックスＬ０（RefIdxSumL0）および参照インデックスＬ１（RefIdxSumL1）を含むことができる。

デコード装置は、動きベクトル予測子候補リストを構成し、そして、上記リストに基づいて動きベクトル予測子を導出することができる。デコード装置は、対称的なＭＶＤと上記動きベクトル予測子とに基づいて動きベクトルを導出することができる。

デコード装置は、上記動き情報に基づいて予測サンプルを生成する（Ｓ２２３０）。デコード装置は、上記動き情報に含まれる動きベクトルと参照ピクチャインデックスとに基づいて、上記予測サンプルを生成することができる。例えば、上記予測サンプルは、上記参照ピクチャインデックスが指す上記参照ピクチャ内のブロック（またはサンプル）のうち、上記動きベクトルにより指示されるブロック（またはサンプル）に基づいて生成されることができる。

デコード装置は、上記残差（レジデュアル）情報に基づいて残差サンプルを生成する（Ｓ２２４０）。具体的には、デコード装置は、上記残差情報に基づいて量子化された変換係数を導出することができる。量子化された変換係数は、係数スキャン順序に基づいて、１次元ベクトルの形態を有することができる。デコード装置は、上記量子化された変換係数に対する逆量子化手順に基づいて変換係数を導出することができる。デコード装置は、上記変換係数に対する逆変換手順に基づいて残差サンプルを導出することができる。

デコード装置は、上記予測サンプルおよび上記残差サンプルに基づいて現ピクチャの復元サンプルを生成する（Ｓ２２５０）。デコード装置は、（修正された）復元サンプルを生成するためにフィルタリング手順をさらに実行することもできる。

一実施形態において、上記予測関連情報は、上記現ピクチャ内の上記現ブロックに双予測が適用されるか否かを示すインター予測タイプ情報を含むことができる。例えば、上記インター予測タイプ情報に基づいて、上記予測関連情報は、対称動きベクトル差分参照の適用が可能か否かを示す対称動きベクトル差分参照フラグ情報を含むことができる。また、上記参照ピクチャは、ショートターム参照ピクチャを含むことができる。上記対称動きベクトル差分参照フラグ情報に基づいて、ショートターム参照ピクチャを指す参照インデックスから対称動きベクトル差分参照インデックスが導出されることができる。上記動き情報は、上記現ブロックに対する動きベクトルおよび上記対称動きベクトル差分参照インデックスを含むことができる。上記動きベクトルおよび上記対称動きベクトル差分参照インデックスに基づいて、上記予測サンプルが生成されることができる。

前述した実施形態において、方法は、一連のステップまたはブロックとしてフローチャートに基づいて説明されているが、該当実施形態は、ステップの順序に限定されるわけではなく、あるステップは、前述したのと異なるステップおよび異なる順序で、または同時に発生し得る。また、当業者であれば、フローチャートに示されているステップが排他的ではなく、異なるステップが含まれるか、フローチャートの１つまたは複数のステップが本文書の実施形態の範囲に影響を与えずに削除され得ることを理解することができる。

前述した本文書の実施形態に係る方法は、ソフトウェアの形態で具現されることができ、本文書に係るエンコード装置および／またはデコード装置は、例えば、ＴＶ、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの画像処理を行う装置に含まれ得る。

本文書で、実施形態がソフトウェアで具現される際、前述した方法は、前述した機能を行うモジュール（過程、機能など）で具現されることができる。モジュールは、メモリに記憶され、プロセッサにより実行されることができる。メモリは、プロセッサの内部または外部にあってもよく、よく知られている様々な手段でプロセッサと連結されてもよい。プロセッサは、ＡＳＩＣ（Application-Specific Integrated Circuit）、他のチップセット、論理回路および／またはデータ処理装置を含むことができる。メモリは、ＲＯＭ（Read-Only Memory）、ＲＡＭ（Random Access Memory）、フラッシュメモリ、メモリカード、記憶媒体および／または他の記憶装置を含むことができる。すなわち、本文書で説明した実施形態は、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で具現されて行われ得る。例えば、各図面で示している機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラまたはチップ上で具現されて行われ得る。この場合、具現のための情報（例えば、information on instructions）またはアルゴリズムがデジタル記憶媒体に記憶されることができる。

また、本文書の実施形態が適用されるデコード装置およびエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信などのリアルタイム通信装置、モバイルストリーミング装置、記憶媒体、カムコーダ、ビデオオンデマンド（オーダーメイド型ビデオ）（ＶｏＤ）サービス提供装置、ＯＴＴビデオ（Over The Top video）装置、インターネットストリーミングサービス提供装置、３次元（３Ｄ）ビデオ装置、ＶＲ（Virtual Reality）装置、ＡＲ（Augmented (Argumente) Reality）装置、画像電話ビデオ装置、運送手段端末（例えば、車両（自律走行車両を含む）端末、飛行機端末、船舶端末など）および医療用ビデオ装置などに含まれ得、ビデオ信号またはデータ信号を処理するために使用され得る。例えば、ＯＴＴビデオ（Over The Top video）装置としては、ゲームコンソール、ブルーレイプレーヤ、インターネットアクセスＴＶ、ホームシアターシステム、スマートフォン、タブレットＰＣ、ＤＶＲ（Digital Video Recorder）などを含み得る。

また、本文書の実施形態が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータが読み取ることができる記録媒体に記憶されることができる。本文書の実施形態に係るデータ構造を有するマルチメディアデータもまた、コンピュータが読み取ることができる記録媒体に記憶されることができる。上記コンピュータが読み取ることができる記録媒体は、コンピュータで読み取られるデータが記憶される全ての種類の記憶装置および分散記憶装置を含む。上記コンピュータが読み取ることができる記録媒体は、例えば、ブルーレイディスク（ＢＤ）、ユニバーサルシリアル（汎用直列）バス（ＵＳＢ）、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＲＡＭ、ＣＤ－ＲＯＭ、磁気テープ、フロッピディスク、および光学データ記憶装置を含み得る。また、上記コンピュータが読み取ることができる記録媒体は、搬送波（例えば、インターネットを介した送信）の形態で具現されたメディアを含む。また、エンコード方法で生成されたビットストリームが、コンピュータが読み取られる記録媒体に記憶されるか、有無線通信ネットワークを介して送信されることができる。

また、本文書の実施形態は、プログラムコードによるコンピュータプログラム製品で具現されることができ、上記プログラムコードは、本文書の実施形態によってコンピュータで実行されることができる。上記プログラムコードは、コンピュータによって読み取り可能なキャリア上に記憶されることができる。

図２４は、本文書に開示された実施形態が適用されることができるコンテンツストリーミングシステムの例を示す。

図２４を参照すると、本文書の実施形態が適用されるコンテンツストリーミングシステムは、大まかに、エンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディアストレージ、ユーザ装置、およびマルチメディア入力装置を含むことができる。

上記エンコードサーバは、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを上記ストリーミングサーバに送信する役割をする。別の例として、スマートフォン、カメラ、カムコーダなどのマルチメディア入力装置がビットストリームを直接生成する場合、上記エンコードサーバは省略され得る。

上記ビットストリームは、本文書の実施形態が適用されるエンコード方法またはビットストリームの生成方法により生成されることができ、上記ストリーミングサーバは、上記ビットストリームを送信または受信する過程で、一時的に上記ビットストリームを記憶することができる。

上記ストリーミングサーバは、ウェブサーバを介してのユーザ要求（要請）に基づいてマルチメディアデータをユーザ装置に送信し、上記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体の役割をする。ユーザが上記ウェブサーバに所望のサービスを要求すれば、上記ウェブサーバは、これをストリーミングサーバに伝達し、上記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。このとき、上記コンテンツストリーミングシステムは、別の制御サーバを含むことができ、この場合、上記制御サーバは、上記コンテンツストリーミングシステム内の各装置間の命令／応答を制御する役割をする。

上記ストリーミングサーバは、メディア記憶装置（格納所）および／またはエンコードサーバからコンテンツを受信することができる。例えば、上記エンコードサーバからコンテンツを受信する場合、上記コンテンツをリアルタイムに受信することができる。この場合、円滑なストリーミングサービスを提供するために、上記ストリーミングサーバは、上記ビットストリームを一定時間の間、記憶することができる。

上記ユーザ装置の例では、携帯電話、スマートフォン（smart phone）、ノートブックコンピュータ（laptop computer）、デジタル放送用端末機、ＰＤＡ（Personal Digital Assistants）、ＰＭＰ（Portable Multimedia Player）、ナビゲーション、スレートＰＣ（slate PC）、タブレットＰＣ（tablet PC）、ウルトラブック（ULTRABOOK（登録商標））、ウェアラブルデバイス（wearable device、例えば、スマートウォッチ（ウォッチ型端末機）（smartwatch）、スマートグラス（グラス型端末機）（smart glass）、ＨＭＤ（Head Mounted Display））、デジタルＴＶ、デスクトップコンピュータ、デジタル署名（サイニジ）などがありうる。

上記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運用されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。

本明細書に記載された請求項は、多様な方式で組み合わせることができる。例えば、本明細書の方法請求項の技術的特徴が組み合わせられて装置として具現されることができ、本明細書の装置請求項の技術的特徴が組み合わせられて方法として具現されることができる。また、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて装置として具現されることができ、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて方法として具現されることができる。

Claims

デコード装置によって実行される画像デコード方法であって、
ビットストリームから予測関連情報および残差情報を有する画像情報を受信するステップと、
前記予測関連情報に基づいて、現ピクチャ内の現ブロックのためにインター予測モードを導出するステップと、
前記インター予測モードに基づいて、前記現ブロックに対する動き情報を導出するステップと、
前記動き情報に基づいて予測サンプルを生成するステップと、
前記残差情報に基づいて残差サンプルを生成するステップと、
前記予測サンプルおよび前記残差サンプルに基づいて、前記現ピクチャの復元サンプルを生成するステップと、を有し、
前記予測関連情報は、前記現ブロックに双予測が適用されるか否かを示すインター予測タイプ情報を有し、
前記インター予測タイプ情報に基づいて、前記予測関連情報は、対称動きベクトル差分参照が適用されるか否かを示す対称動きベクトル差分参照フラグ情報をさらに有し、
前記動き情報は、前記現ブロックに対する動きベクトルおよび前記対称動きベクトル差分参照インデックスを有し、
前記対称動きベクトル差分参照インデックスは、ショートターム参照ピクチャを指す参照インデックスと前記ショートターム参照ピクチャのそれぞれと前記現ピクチャとの間のピクチャオーダカウント（Picture Order Count；ＰＯＣ）差分とから導出され、
前記動きベクトルおよび前記対称動きベクトル差分参照インデックスに基づいて、前記予測サンプルが生成される、画像デコード方法。
エンコード装置によって実行される画像エンコード方法であって、
現ピクチャ内の現ブロックのためにインター予測モードを導出するステップと、
前記インター予測モードのための参照ピクチャを導出するステップと、
前記インター予測モードに基づいて、前記現ブロックの予測のための動き情報を導出するステップと、
前記動き情報に基づいて予測サンプルを生成するステップと、
前記インター予測モードに関する情報を有する予測関連情報を生成するステップと、
前記予測サンプルに基づいて残差情報を生成するステップと、
前記予測関連情報および前記残差情報を有する画像情報をエンコードするステップと、を有し、
前記予測関連情報は、前記現ブロックに双予測が適用されるか否かを示すインター予測タイプ情報を有し、
前記インター予測タイプ情報に基づいて、前記予測関連情報は、対称動きベクトル差分参照が適用されるか否かを示す対称動きベクトル差分参照フラグ情報をさらに有し、
前記参照ピクチャは、ショートターム参照ピクチャを有し、
前記動き情報は、前記現ブロックに対する動きベクトルおよび前記対称動きベクトル差分参照インデックスを有し、
前記対称動きベクトル差分参照インデックスは、ショートターム参照ピクチャを指す参照インデックスと前記ショートターム参照ピクチャのそれぞれと前記現ピクチャとの間のピクチャオーダカウント（Picture Order Count；ＰＯＣ）差分とから導出され、
前記動きベクトルおよび前記対称動きベクトル差分参照インデックスに基づいて、前記予測サンプルが生成される、画像エンコード方法。
画像に関するデータの送信方法であって、
前記データのビットストリームを取得するステップであって、前記ビットストリームは、
現ピクチャ内の現ブロックのためにインター予測モードを導出するステップと、
前記インター予測モードのための参照ピクチャを導出するステップと、
前記インター予測モードに基づいて、前記現ブロックの予測のための動き情報を導出するステップと、
前記動き情報に基づいて予測サンプルを生成するステップと、
前記インター予測モードに関する情報を有する予測関連情報を生成するステップと、
前記予測サンプルに基づいて残差情報を生成するステップと、
前記予測関連情報および前記残差情報を有する画像情報をエンコードするステップと、に基づいて生成される、ステップと、
前記ビットストリームを有する前記データを送信するステップと、を有し、
前記予測関連情報は、前記現ブロックに双予測が適用されるか否かを示すインター予測タイプ情報を有し、
前記インター予測タイプ情報に基づいて、前記予測関連情報は、対称動きベクトル差分参照が適用されるか否かを示す対称動きベクトル差分参照フラグ情報をさらに有し、
前記参照ピクチャは、ショートターム参照ピクチャを有し、
前記動き情報は、前記現ブロックに対する動きベクトルおよび前記対称動きベクトル差分参照インデックスを有し、
前記対称動きベクトル差分参照インデックスは、ショートターム参照ピクチャを指す参照インデックスと前記ショートターム参照ピクチャのそれぞれと前記現ピクチャとの間のピクチャオーダカウント（Picture Order Count；ＰＯＣ）差分とから導出され、
前記動きベクトルおよび前記対称動きベクトル差分参照インデックスに基づいて、前記予測サンプルが生成される、送信方法。