JP2022536379A

JP2022536379A - インター予測に基づく画像コーディング方法及び装置

Info

Publication number: JP2022536379A
Application number: JP2021573930A
Authority: JP
Inventors: ネリパク; チョンハクナム; ヒョンムンチャン
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2019-06-14
Filing date: 2020-06-15
Publication date: 2022-08-15
Anticipated expiration: 2040-06-15
Also published as: US20220109828A1; US20230388486A1; KR20210158857A; JP2023139236A; KR20240136477A; WO2020251323A1; US20220417502A1; KR102622468B1; JP7566990B2; KR102706378B1; US11902511B2; MX2021015530A; EP3975561A1; KR20240006016A; EP3975561A4; JP7323649B2; CN114080810A; US11457208B2

Abstract

【課題】画像／ビデオコーディング効率を上げる方法及び装置を提供する。
【解決手段】本文書に係る画像デコード方法は、前記エンコードされた情報からインター予測モードを導出するステップ、前記参照ピクチャリストを構成するステップ、前記参照ピクチャリスト内に含まれた参照ピクチャに基づいてＳＭＶＤ（ｓｙｍｍｅｔｒｉｃｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅｓ）のための参照ピクチャインデックスを含む動き情報を導出するステップ、前記動き情報に基づいて予測サンプルを生成するステップを含むことができ、前記ＳＭＶＤのための参照ピクチャインデックスは、前記参照ピクチャリスト内に含まれたショートターム（ｓｈｏｒｔ－ｔｅｒｍ）参照ピクチャに基づいて導出されることができる。
【選択図】図１７

Description

本文書は、インター予測に基づく画像コーディング方法及び装置に関する。

近年、４Ｋまたは８Ｋ以上のＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）画像／ビデオのような高解像度、高品質の画像／ビデオに対する需要が様々な分野で増加している。画像／ビデオデータが高解像度、高品質になるほど、既存の画像／ビデオデータに比べて相対的に送信される情報量またはビット量が増加するので、既存の有無線広帯域回線のような媒体を利用して画像データを送信するか、既存の格納媒体を利用して画像／ビデオデータを格納する場合、送信費用と格納費用が増加される。

また、近年、ＶＲ（ＶｉｒｔｕａｌＲｅａｌｉｔｙ）、ＡＲ（ＡｒｔｉｆｉｃｉａｌＲｅａｌｔｉｙ）コンテンツやホログラムなどの実感メディア（ＩｍｍｅｒｓｉｖｅＭｅｄｉａ）に対する関心及び需要が増加しており、ゲーム画像のように、現実画像と異なる画像特性を有する画像／ビデオに対する放送が増加している。

これにより、上記のような様々な特性を有する高解像度・高品質の画像／ビデオの情報を効果的に圧縮して送信するか、格納し、再生するために高効率の画像／ビデオ圧縮技術が求められる。

また、画像/ビデオコーディングにおけるインター予測は、ＳＭＶＤ（ｓｙｍｍｅｔｒｉｃｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）参照インデックスのための手順及び／又はＭＭＶＤ（ｍｅｒｇｅｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）のための手順を含むことができ、ＳＭＶＤ参照インデックスのための手順において、参照ピクチャマーキング（ｅｘ．ショートタームまたはロングターム参照）を考慮して関連技術を適用する議論が進まれている。

本文書の一実施形態によると、画像／ビデオコーディング効率を上げる方法及び装置を提供する。

本文書の一実施形態によると、画像／ビデオコーディングシステムにおいて効率的なインター予測を行う方法及び装置を提供する。

本文書の一実施形態によると、インター予測において動きベクトル差分に関する情報をシグナリングする方法及び装置を提供する。

本文書の一実施形態によると、現在ブロックに双予測が適用される場合、Ｌ０動きベクトル差分及びＬ１動きベクトル差分に関する情報をシグナリングする方法及び装置を提供する。

本文書の実施形態によると、ＳＭＶＤフラグをシグナリングする方法及び装置を提供する。

本文書の一実施形態によると、ＳＭＶＤフラグに基づいてＬ１動きベクトル差分を導出する方法及び装置を提供する。

本文書の一実施形態によると、参照ピクチャマーキングに基づいてＳＭＶＤ参照インデックスに関する手順が行われ得る。

本文書の一実施形態によると、ショートターム参照ピクチャ（ショートターム参照のために使用されることとマーキングされたピクチャ）を用いてＳＭＶＤ参照インデックスに関する手順が行われ得る。

本文書の一実施形態によると、デコード装置により実行されるビデオ／画像デコード方法を提供する。

本文書の一実施形態によると、ビデオ／画像デコードを実行するデコード装置を提供する。

本文書の一実施形態によると、エンコード装置により実行されるビデオ／画像エンコード方法を提供する。

本文書の一実施形態によると、ビデオ／画像エンコードを実行するエンコード装置を提供する。

本文書の一実施形態によると、本文書の実施形態のうち少なくとも１つに開示されたビデオ／画像エンコード方法によって生成されたエンコードされたビデオ／画像情報が格納されたコンピュータ読み取り可能なデジタル格納媒体を提供する。

本文書の一実施形態によると、デコード装置により本文書の実施形態のうち少なくとも１つに開示されたビデオ／画像デコード方法を実行するようにするエンコードされた情報またはエンコードされたビデオ／画像情報が格納されたコンピュータ読み取り可能なデジタル格納媒体を提供する。

本文書によると、全般的な画像／ビデオ圧縮効率を上げることができる。

本文書によると、動きベクトル差分に関する情報を効率的にシグナリングすることができる。

本文書によると、現在ブロックに双予測が適用される場合、Ｌ１動きベクトル差分を効率的に導出することができる。

本文書によると、Ｌ１動きベクトル差分を導出するのに利用される情報を効率的にシグナリングしてコーディングシステムの複雑度を減らすことができる。

本文書の実施形態によると、ＳＭＶＤのための参照ピクチャインデックスの導出のために、ショートターム参照ピクチャを用いることにより効率的なインター予測が行われ得る。

本文書の具体的な一例を介して得ることができる効果は、以上で羅列された効果に制限されない。例えば、関連した技術分野の通常の知識を有する者が（ａｐｅｒｓｏｎｈａｖｉｎｇｏｒｄｉｎａｒｙｓｋｉｌｌｉｎｔｈｅｒｅｌａｔｅｄａｒｔ）が本文書から理解し、または誘導できる多様な技術的効果が存在できる。それによって、本文書の具体的な効果は、本文書に明示的に記載されたものに制限されずに、本文書の技術的特徴から理解され、または誘導されることができる多様な効果を含むことができる。

本文書の実施形態に適用されることができるビデオ／画像コーディングシステムの例を概略的に示す。本文書の実施形態に適用されることができるビデオ／画像エンコード装置の構成を概略的に説明する図である。本文書の実施形態に適用されることができるビデオ／画像デコード装置の構成を概略的に説明する図である。インター予測ベースのビデオ／画像エンコード方法の例を示す。インター予測ベースのビデオ／画像デコード方法の例を示す。インター予測手順を例示的に示す。本文書に係るＭＶＰ候補リストを構成する方法を概略的に示す。ＳＭＶＤを説明するための図である。インター予測において動きベクトルを導出する方法を説明するための図である。本文書の一実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。本文書の他の実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。本文書の他の実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。本文書の一実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。本文書の一実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。本文書の実施形態（ら）によるビデオ／画像エンコード方法及び関連コンポーネントの一例を概略的に示す。本文書の実施形態（ら）によるビデオ／画像エンコード方法及び関連コンポーネントの一例を概略的に示す。本文書の実施形態（ら）による画像／ビデオデコード方法及び関連コンポーネントの一例を概略的に示す。本文書の実施形態（ら）による画像／ビデオデコード方法及び関連コンポーネントの一例を概略的に示す。本文書に開示された実施形態が適用されることができるコンテンツストリーミングシステムの例を示す。

本文書の開示は、様々な変更を加えることができ、様々な実施形態を有することができるが、特定の実施形態を図面に例示し、詳細に説明しようとする。しかし、これは、本開示を特定の実施形態に限定しようとするわけではない。本文書で使用する用語は、単に特定の実施形態を説明するために使用されたものであって、本文書における実施形態の技術的思想を限定しようとする意図に使用されるものではない。単数の表現は、文脈上明らかに異なる意味ではない限り、複数の表現を含む。本文書において、「含む」又は「有する」等の用語は、文書上に記載された特徴、数字、段階、動作、構成要素、部品又はこれらを組み合わせたものが存在することを指定しようとするものであり、１つ又はそれ以上の異なる特徴や、数字、段階、動作、構成要素、部品又はこれらを組み合わせたものの存在又は付加の可能性を予め排除しないものと理解されるべきである。

一方、本文書で説明される図面上の各構成は、互いに異なる特徴的な機能に関する説明の便宜のために独立して示すものであって、各構成が互いに別個のハードウェアや別個のソフトウェアで具現されるということを意味するのではない。例えば、各構成のうち、２つ以上の構成を合わせて１つの構成をなすこともあり、１つの構成が複数の構成に分けられることもある。各構成が統合及び／又は分離された実施形態も、本文書の開示範囲に含まれる。

以下、添付図を参照として、本文書の実施形態を説明しようとする。以下、図面上の同じ構成要素に対しては同じ参照符号を使用し得、同じ構成要素に対して重複した説明は省略され得る。

図１は、本文書の実施形態が適用できるビデオ／画像コーディングシステムの例を概略的に示す。

図１に示すように、ビデオ／画像コーディングシステムは、第１の装置（ソースデバイス）及び第２の装置（受信デバイス）を備えることができる。ソースデバイスは、エンコードされたビデオ（ｖｉｄｅｏ）／画像（ｉｍａｇｅ）情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスに伝達することができる。

前記ソースデバイスは、ビデオソース、エンコード装置、送信部を備えることができる。前記受信デバイスは、受信部、デコード装置、及びレンダラを備えることができる。前記エンコード装置は、ビデオ／画像エンコード装置と呼ばれることができ、前記デコード装置は、ビデオ／画像デコード装置と呼ばれることができる。送信機は、エンコード装置に備えられることができる。受信機は、デコード装置に備えられることができる。レンダラは、ディスプレイ部を備えることができ、ディスプレイ部は、別個のデバイスまたは外部コンポーネントで構成されることもできる。

ビデオソースは、ビデオ／画像のキャプチャ、合成、または生成過程などを介してビデオ／画像を取得することができる。ビデオソースは、ビデオ／画像キャプチャデバイス及び／又はビデオ／画像生成デバイスを含むことができる。ビデオ／画像キャプチャデバイスは、例えば、１つ以上のカメラ、以前にキャプチャされたビデオ／画像を含むビデオ／画像アーカイブなどを含むことができる。ビデオ／画像生成デバイスは、例えば、コンピュータ、タブレット、及びスマートフォンなどを含むことができ、（電子的に）ビデオ／画像を生成することができる。例えば、コンピュータなどを介して仮想のビデオ／画像が生成され得るし、この場合、関連データが生成される過程にビデオ／画像キャプチャ過程が代替されることができる。

エンコード装置は、入力ビデオ／画像をエンコードすることができる。エンコード装置は、圧縮及びコーディング効率のために、予測、変換、量子化など、一連の手順を行うことができる。エンコードされたデータ（エンコードされたビデオ／画像情報）は、ビットストリーム（ｂｉｔｓｔｒｅａｍ）形態で出力されることができる。

送信部は、ビットストリーム形態で出力されたエンコードされたビデオ／画像情報またはデータをファイルまたはストリーミング形態でデジタル格納媒体またはネットワークを介して受信デバイスの受信部に伝達することができる。デジタル格納媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、様々な格納媒体を含むことができる。送信部は、予め決められたファイルフォーマットを介してメディアファイルを生成するためのエレメントを含むことができ、放送／通信ネットワークを介しての送信のためのエレメントを含むことができる。受信部は、前記ビットストリームを受信／抽出してデコード装置に伝達することができる。

デコード装置は、エンコード装置の動作に対応する逆量子化、逆変換、予測など、一連の手順を行ってビデオ／画像をデコードすることができる。

レンダラは、デコードされたビデオ／画像をレンダリングすることができる。レンダリングされたビデオ／画像は、ディスプレイ部を介してディスプレイされることができる。

本文書は、ビデオ／画像コーディングに関する。例えば、本文書で開示された方法／実施形態は、ＶＶＣ（ｖｅｒｓａｔｉｌｅｖｉｄｅｏｃｏｄｉｎｇ）標準に開示される方法に適用されることができる。また、本文書で開示された方法／実施形態は、ＥＶＣ（ｅｓｓｅｎｔｉａｌｖｉｄｅｏｃｏｄｉｎｇ）標準、ＡＶ１（ＡＯＭｅｄｉａＶｉｄｅｏ１）標準、ＡＶＳ２（２ｎｄｇｅｎｅｒａｔｉｏｎｏｆａｕｄｉｏｖｉｄｅｏｃｏｄｉｎｇｓｔａｎｄａｒｄ）又は次世代ビデオ／画像コーディング標準（例えば、２６７又はＨ．２６８等）に開示される方法に適用されることができる。

本文書では、ビデオ／画像コーディングに関する多様な実施形態を提示し、別の言及がない限り、前記実施形態は互いに組み合わせて行うこともある。

本文書で、ビデオ（ｖｉｄｅｏ）は、時間の流れによる一連の画像（ｉｍａｇｅ）の集合を意味することができる。ピクチャ（ｐｉｃｔｕｒｅ）は、一般的に特定の時間帯の１つの画像を示す単位を意味し、スライス（ｓｌｉｃｅ）／タイル（ｔｉｌｅ）は、コーディングにおいてピクチャの一部を構成する単位である。スライス／タイルは、１つ以上のＣＴＵ（ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ）を含むことができる。１つのピクチャは、１つ以上のスライス／タイルで構成されることができる。タイルは、ピクチャ内の特定のタイル列及び特定のタイル列以内のＣＴＵの四角領域である（ＡｔｉｌｅｉｓａｒｅｃｔａｎｇｕｌａｒｒｅｇｉｏｎｏｆＣＴＵｓｗｉｔｈｉｎａｐａｒｔｉｃｕｌａｒｔｉｌｅｃｏｌｕｍｎａｎｄａｐａｒｔｉｃｕｌａｒｔｉｌｅｒｏｗｉｎａｐｉｃｔｕｒｅ）。前記タイル列は、ＣＴＵの四角領域であり、前記四角領域は、前記ピクチャの高さと同じ高さを有し、幅はピクチャパラメータセット内のシンタックス要素により明示され得る（ＴｈｅｔｉｌｅｃｏｌｕｍｎｉｓａｒｅｃｔａｎｇｕｌａｒｒｅｇｉｏｎｏｆＣＴＵｓｈａｖｉｎｇａｈｅｉｇｈｔｅｑｕａｌｔｏｔｈｅｈｅｉｇｈｔｏｆｔｈｅｐｉｃｔｕｒｅａｎｄａｗｉｄｔｈｓｐｅｃｉｆｉｅｄｂｙｓｙｎｔａｘｅｌｅｍｅｎｔｓｉｎｔｈｅｐｉｃｔｕｒｅｐａｒａｍｅｔｅｒｓｅｔ）。前記タイル行はＣＴＵの四角領域であり、前記四角領域はピクチャパラメータセット内のシンタックス要素によって明示される幅を有し、高さは前記ピクチャの高さと同一であり得る（ＴｈｅｔｉｌｅｒｏｗｉｓａｒｅｃｔａｎｇｕｌａｒｒｅｇｉｏｎｏｆＣＴＵｓｈａｖｉｎｇａｈｅｉｇｈｔｓｐｅｃｉｆｉｅｄｂｙｓｙｎｔａｘｅｌｅｍｅｎｔｓｉｎｔｈｅｐｉｃｔｕｒｅｐａｒａｍｅｔｅｒｓｅｔａｎｄａｗｉｄｔｈｅｑｕａｌｔｏｔｈｅｗｉｄｔｈｏｆｔｈｅｐｉｃｔｕｒｅ）。タイルのスキャンはピクチャをパーティショニングするＣＴＵの特定の順次オーダリングを示し得、前記ＣＴＵはタイル内のＣＴＵラスタースキャンに連続的に整列され得、ピクチャ内のタイルは、前記ピクチャの前記タイルのラスタースキャンに連続的に整列され得る（ＡｔｉｌｅｓｃａｎｉｓａｓｐｅｃｉｆｉｃｓｅｑｕｅｎｔｉａｌｏｒｄｅｒｉｎｇｏｆＣＴＵｓｐａｒｔｉｔｉｏｎｉｎｇａｐｉｃｔｕｒｅｉｎｗｈｉｃｈｔｈｅＣＴＵｓａｒｅｏｒｄｅｒｅｄｃｏｎｓｅｃｕｔｉｖｅｌｙｉｎＣＴＵｒａｓｔｅｒｓｃａｎｉｎａｔｉｌｅｗｈｅｒｅａｓｔｉｌｅｓｉｎａｐｉｃｔｕｒｅａｒｅｏｒｄｅｒｅｄｃｏｎｓｅｃｕｔｉｖｅｌｙｉｎａｒａｓｔｅｒｓｃａｎｏｆｔｈｅｔｉｌｅｓｏｆｔｈｅｐｉｃｔｕｒｅ）。スライスは単一のＮＡＬユニットに排他的に含まれ得る、整数個の完全なタイル又はピクチャのタイル内の整数個の連続的な完全なＣＴＵ行を含み得る（ＡｓｌｉｃｅｉｎｃｌｕｄｅｓａｎｉｎｔｅｇｅｒｎｕｍｂｅｒｏｆｃｏｍｐｌｅｔｅｔｉｌｅｓｏｒａｎｉｎｔｅｇｅｒｎｕｍｂｅｒｏｆｃｏｎｓｅｃｕｔｉｖｅｃｏｍｐｌｅｔｅＣＴＵｒｏｗｓｗｉｔｈｉｎａｔｉｌｅｏｆａｐｉｃｔｕｒｅｔｈａｔｍａｙｂｅｅｘｃｌｕｓｉｖｅｌｙｃｏｎｔａｉｎｅｄｉｎａｓｉｎｇｌｅＮＡＬｕｎｉｔ）

一方、１つのピクチャは、２つ以上のサブピクチャに区分されることができる。サブピクチャは、ピクチャ内の１つ以上のスライスの四角領域であり得る（ａｎｒｅｃｔａｎｇｕｌａｒｒｅｇｉｏｎｏｆｏｎｅｏｒｍｏｒｅｓｌｉｃｅｓｗｉｔｈｉｎａｐｉｃｔｕｒｅ）。

ピクセル（ｐｉｘｅｌ）またはペル（ｐｅｌ）は、１つのピクチャ（または、画像）を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として、「サンプル（ｓａｍｐｌｅ）」が使用され得る。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、ルマ（ｌｕｍａ）成分のピクセル／ピクセル値のみを示すことができ、クロマ（ｃｈｒｏｍａ）成分のピクセル／ピクセル値のみを示すこともできる。

ユニット（ｕｎｉｔ）は、画像処理の基本単位を示すことができる。ユニットは、ピクチャの特定領域及び当該領域に関連した情報のうち、少なくとも１つを含むことができる。１つのユニットは、１つのルマブロック及び２つのクロマ（例えば、ｃｂ、ｃｒ）ブロックを含むことができる。ユニットは、場合によって、ブロック（ｂｌｏｃｋ）または領域（ａｒｅａ）などの用語と混用して使用されることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列とＮ個の行とからなるサンプル（または、サンプルアレイ）または変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）の集合（または、アレイ）を含むことができる。

本文書において、「Ａ又はＢ（ＡｏｒＢ）」は、「ただＡ」、「ただＢ」、又は「Ａ及びＢ両方」を意味し得る。言い換えると、本文書において、「Ａ又はＢ（ＡｏｒＢ）」は、「Ａ及び／又はＢ（Ａａｎｄ／ｏｒＢ）」と解釈され得る。例えば、本文書において、「Ａ、Ｂ又はＣ（Ａ，ＢｏｒＣ）」は、「ただＡ」、「ただＢ」、「ただＣ」、又は「Ａ、Ｂ及びＣの任意の全ての組み合わせ（ａｎｙｃｏｍｂｉｎａｔｉｏｎｏｆＡ，ＢａｎｄＣ）」を意味し得る。

本文書で使用されるスラッシュ（／）や休止符（ｃｏｍｍａ）は、「及び／又は（ａｎｄ／ｏｒ）」を意味し得る。例えば、「Ａ／Ｂ」は、「Ａ及び／又はＢ」を意味し得る。これによって、「Ａ／Ｂ」は、「ただＡ」、「ただＢ」、又は「Ａ及びＢ両方」を意味し得る。例えば、「Ａ、Ｂ、Ｃ」は、「Ａ、Ｂ又はＣ」を意味し得る。

本文書において、「少なくとも１つのＡ及びＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄＢ）」は、「ただＡ」、「ただＢ」又は「Ａ及びＢ両方」を意味し得る。また、本文書において、「少なくとも１つのＡ又はＢ（ａｔｌｅａｓｔｏｎｅｏｆＡｏｒＢ）」や「少なくとも１つのＡ及び／又はＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄ／ｏｒＢ）」という表現は、「少なくとも１つのＡ及びＢ（ａｔｌｅａｓｔｏｎｅｏｆＡａｎｄＢ）」と同様に解釈され得る。

また、本文書において、「少なくとも１つのＡ、Ｂ及びＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢａｎｄＣ）」は、「ただＡ」、「ただＢ」、「ただＣ」、又は「Ａ、Ｂ及びＣの任意の全ての組み合わせ（ａｎｙｃｏｍｂｉｎａｔｉｏｎｏｆＡ，ＢａｎｄＣ）」を意味し得る。また、「少なくとも１つのＡ、Ｂ又はＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢｏｒＣ）」や「少なくとも１つのＡ、Ｂ及び／又はＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，Ｂａｎｄ／ｏｒＣ）」は、「少なくとも１つのＡ、Ｂ及びＣ（ａｔｌｅａｓｔｏｎｅｏｆＡ，ＢａｎｄＣ）」を意味し得る。

また、本文書で使用される括弧は、「例えば（ｆｏｒｅｘａｍｐｌｅ）」を意味し得る。具体的に、「予測（イントラ予測）」と表示された場合、「予測」の一例として「イントラ予測」が提案されたものであり得る。言い換えると、本文書の「予測」は、「イントラ予測」に制限（ｌｉｍｉｔ）されず、「イントラ予測」が「予測」の一例として提案されたものであり得る。また、「予測（即ち、イントラ予測）」と表示された場合にも、「予測」の一例として「イントラ予測」が提案されたものであり得る。

本文書において１つの図面内で個別的に説明される技術的特徴は、個別的に具現されてもよく、同時に具現されてもよい。

図２は、本文書の実施形態が適用できるビデオ／画像エンコード装置の構成を概略的に説明する図である。以下、エンコード装置というのは、画像エンコード装置及び／又はビデオエンコード装置を含むことができる。

図２に示すように、エンコード装置２００は、画像分割部（ｉｍａｇｅｐａｒｔｉｔｉｏｎｅｒ）２１０、予測部（ｐｒｅｄｉｃｔｏｒ）２２０、レジデュアル処理部（ｒｅｓｉｄｕａｌｐｒｏｃｅｓｓｏｒ）２３０、エントロピーエンコード部（ｅｎｔｒｏｐｙｅｎｃｏｄｅｒ）２４０、加算部（ａｄｄｅｒ）２５０、フィルタリング部（ｆｉｌｔｅｒ）２６０、及びメモリ（ｍｅｍｏｒｙ）２７０を備えて構成されることができる。予測部２２０は、インター予測部２２１及びイントラ予測部２２２を備えることができる。レジデュアル処理部２３０は、変換部（ｔｒａｎｓｆｏｒｍｅｒ）２３２、量子化部（ｑｕａｎｔｉｚｅｒ）２３３、逆量子化部（ｄｅｑｕａｎｔｉｚｅｒ）２３４、逆変換部（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍｅｒ）２３５を備えることができる。レジデュアル処理部２３０は、減算部（ｓｕｂｔｒａｃｔｏｒ、２３１）をさらに備えることができる。加算部２５０は、復元部（ｒｅｃｏｎｓｔｒｕｃｔｏｒ）または復元ブロック生成部（ｒｅｃｏｎｔｒｕｃｔｇｅｄｂｌｏｃｋｇｅｎｅｒａｔｏｒ）と呼ばれることができる。上述した画像分割部２１０、予測部２２０、レジデュアル処理部２３０、エントロピーエンコード部２４０、加算部２５０、及びフィルタリング部２６０は、実施形態によって１つ以上のハードウェアコンポーネント（例えば、エンコーダチップセットまたはプロセッサ）によって構成されることができる。また、メモリ２７０は、ＤＰＢ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を備えることができ、デジタル格納媒体によって構成されることもできる。前記ハードウェアコンポーネントは、メモリ２７０を内／外部コンポーネントとしてさらに備えることもできる。

画像分割部２１０は、エンコード装置２００に入力された入力画像（または、ピクチャ、フレーム）を１つ以上の処理ユニット（ｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）に分割することができる。一例として、前記処理ユニットは、コーディングユニット（ｃｏｄｉｎｇｕｎｉｔ、ＣＵ）と呼ばれることができる。この場合、コーディングユニットは、コーディングツリーユニット（ｃｏｄｉｎｇｔｒｅｅｕｎｉｔ、ＣＴＵ）または最大コーディングユニット（ｌａｒｇｅｓｔｃｏｄｉｎｇｕｎｉｔ、ＬＣＵ）からＱＴＢＴＴＴ（Ｑｕａｄ－ｔｒｅｅｂｉｎａｒｙ－ｔｒｅｅｔｅｒｎａｒｙ－ｔｒｅｅ）構造によって再帰的に（ｒｅｃｕｒｓｉｖｅｌｙ）分割されることができる。例えば、１つのコーディングユニットは、クアッドツリー構造、バイナリツリー構造、及び／又はターナリ構造に基づいて下位（ｄｅｅｐｅｒ）デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造及び／又はターナリ構造がその後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて本開示に係るコーディング手順が行われ得る。この場合、画像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使用されることができ、または、必要に応じてコーディングユニットは、再帰的に（ｒｅｃｕｒｓｉｖｅｌｙ）もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使用されることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。他の例として、前記処理ユニットは、予測ユニット（ＰＵ：ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ）または変換ユニット（ＴＵ：ＴｒａｎｓｆｏｒｍＵｎｉｔ）をさらに備えることができる。この場合、前記予測ユニット及び前記変換ユニットは、各々上述した最終コーディングユニットから分割またはパーティショニングされることができる。前記予測ユニットは、サンプル予測の単位であることができ、前記変換ユニットは、変換係数を導く単位及び／又は変換係数からレジデュアル信号（ｒｅｓｉｄｕａｌｓｉｇｎａｌ）を導く単位であることができる。

ユニットは、場合によって、ブロック（ｂｌｏｃｋ）または領域（ａｒｅａ）などの用語と混用して使用されることができる。一般的な場合、Ｍ×Ｎブロックは、Ｍ個の列とＮ個の行からなるサンプルまたは変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）等の集合を示すことができる。サンプルは、一般的にピクセルまたはピクセルの値を示すことができ、輝度（ｌｕｍａ）成分のピクセル／ピクセル値のみを示すことができ、彩度（ｃｈｒｏｍａ）成分のピクセル／ピクセル値のみを示すこともできる。サンプルは、１つのピクチャ（または、画像）をピクセル（ｐｉｘｅｌ）またはペル（ｐｅｌ）に対応する用語として使用することができる。

エンコード装置２００は、入力画像信号（原本ブロック、原本サンプルアレイ）でインター予測部２２１またはイントラ予測部２２２から出力された予測信号（予測されたブロック、予測サンプルアレイ）を減算してレジデュアル信号（ｒｅｓｉｄｕａｌｓｉｇｎａｌ、残余ブロック、残余サンプルアレイ）を生成することができ、生成されたレジデュアル信号は、変換部２３２に送信される。この場合、図示されたように、エンコーダ２００内において入力画像信号（原本ブロック、原本サンプルアレイ）で予測信号（予測ブロック、予測サンプルアレイ）を減算するユニットは、減算部２３１と呼ばれることができる。予測部は、処理対象ブロック（以下、現在ブロックという）に対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック（ｐｒｅｄｉｃｔｅｄｂｌｏｃｋ）を生成することができる。予測部は、現在ブロックまたはＣＵ単位でイントラ予測が適用されるか、またはインター予測が適用されるか決定することができる。予測部は、各予測モードについての説明で後述するように、予測モード情報など、予測に関する様々な情報を生成してエントロピーエンコード部２４０に伝達することができる。予測に関する情報は、エントロピーエンコード部２４０でエンコードされてビットストリーム形態で出力されることができる。

イントラ予測部２２２は、現在ピクチャ内のサンプルを参照して現在ブロックを予測できる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接（ｎｅｉｇｈｂｏｒ）に位置することができ、または、離れて位置することもできる。イントラ予測で予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。非方向性モードは、例えば、ＤＣモード及びプラナーモード（Ｐｌａｎａｒモード）を含むことができる。方向性モードは、予測方向の細かい程度によって、例えば、３３個の方向性予測モードまたは６５個の方向性予測モードを含むことができる。ただし、これは、例示であり、設定によってそれ以上またはそれ以下の個数の方向性予測モードが使用され得る。イントラ予測部２２２は、隣接ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。

インター予測部２２１は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、ＢＩ予測等）情報をさらに含むことができる。インター予測の場合に、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と参照ピクチャに存在する時間的隣接ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）とを含むことができる。前記参照ブロックを含む参照ピクチャと前記時間的隣接ブロックを含む参照ピクチャとは同じであることができ、異なることもできる。前記時間的隣接ブロックは、同一位置参照ブロック（ｃｏｌｌｏｃａｔｅｄｒｅｆｅｒｅｎｃｅｂｌｏｃｋ）、同一位置ＣＵ（ｃｏｌＣＵ）などの名前で呼ばれることができ、前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ（ｃｏｌｌｏｃａｔｅｄｐｉｃｔｕｒｅ、ｃｏｌＰｉｃ）と呼ばれることもできる。例えば、インター予測部２２１は、隣接ブロックに基づいて動き情報候補リストを構成し、前記現在ブロックの動きベクトル及び／又は参照ピクチャインデックスを導出するために、どの候補が使用されるかを指示する情報を生成することができる。様々な予測モードに基づいてインター予測が行われ得るし、例えば、スキップモードとマージモードとの場合に、インター予測部２２１は、隣接ブロックの動き情報を現在ブロックの動き情報として利用することができる。スキップモードの場合、マージモードとは異なり、レジデュアル信号が送信されないことがある。動き情報予測（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｉｏｎ、ＭＶＰ）モードの場合、隣接ブロックの動きベクトルを動きベクトル予測子（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）として用い、動きベクトル差分（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）をシグナリングすることにより、現在ブロックの動きベクトルを指示することができる。

予測部２２０は、後述する様々な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、１つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、ｃｏｍｂｉｎｅｄｉｎｔｅｒａｎｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（ｉｎｔｒａｂｌｏｃｋｃｏｐｙ、ＩＢＣ）予測モードに基づくことができ、またはパレットモード（ｐａｌｅｔｔｅｍｏｄｅ）に基づくこともできる。前記ＩＢＣ予測モードまたはパレットモードは、例えば、ＳＣＣ（ｓｃｒｅｅｎｃｏｎｔｅｎｔｃｏｄｉｎｇ）などのように、ゲームなどのコンテンツ画像／動画コーディングのために使用されることができる。ＩＢＣは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と同様に行われることができる。即ち、ＩＢＣは、本文書において説明されるインター予測技法のうち、少なくとも１つを用いることができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報に基づいてピクチャ内のサンプル値をシグナリングすることができる。

前記予測部（インター予測部２２１及び／又は前記イントラ予測部２２２を含む）を介して生成された予測信号は、復元信号を生成するために用いられるか、レジデュアル信号を生成するために用いられることができる。変換部２３２は、レジデュアル信号に変換技法を適用して、変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔｓ）を生成することができる。例えば、変換技法は、ＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）、ＤＳＴ（ＤｉｓｃｒｅｔｅＳｉｎｅＴｒａｎｓｆｏｒｍ）、ＧＢＴ（Ｇｒａｐｈ－ＢａｓｅｄＴｒａｎｓｆｏｒｍ）、又はＣＮＴ（ＣｏｎｄｉｔｉｏｎａｌｌｙＮｏｎ－ｌｉｎｅａｒＴｒａｎｓｆｏｒｍ）の少なくとも１つを含むことができる。ここで、ＧＢＴは、ピクセル間の関係情報をグラフで表現するという際に、このグラフから得られた変換を意味する。ＣＮＴは、以前に復元された全てのピクセル（ａｌｌｐｒｅｖｉｏｕｓｌｙｒｅｃｏｎｓｔｒｕｃｔｅｄｐｉｘｅｌ）を用いて予測信号を生成し、それに基づいて獲得される変換を意味する。また、変換過程は正方形の同じサイズを有するピクセルブロックに適用されてもよく、正方形ではない可変サイズのブロックに適用されてもよい。

量子化部２３３は、変換係数を量子化してエントロピーエンコード部２４０に送信され、エントロピーエンコード部２４０は、量子化された信号（量子化された変換係数に関する情報）をエンコードしてビットストリームに出力することができる。前記量子化された変換係数に関する情報は、レジデュアル情報と呼ばれることができる。量子化部２３３は、係数スキャン順序（ｓｃａｎｏｒｄｅｒ）に基づいてブロック形態の量子化された変換係数を１次元ベクトル形態で再整列することができ、前記１次元ベクトル形態の量子化された変換係数に基づいて前記量子化された変換係数に関する情報を生成することもできる。エントロピーエンコード部２４０は、例えば、指数ゴロム（ｅｘｐｏｎｅｎｔｉａｌＧｏｌｏｍｂ）、ＣＡＶＬＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｖａｒｉａｂｌｅｌｅｎｇｔｈｃｏｄｉｎｇ）、ＣＡＢＡＣ（ｃｏｎｔｅｘｔ－ａｄａｐｔｉｖｅｂｉｎａｒｙａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇ）などのような様々なエンコード方法を行うことができる。エントロピーエンコード部２４０は、量子化された変換係数の他に、ビデオ／イメージ復元に必要な情報（例えば、シンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔｓ）の値等）を共にまたは別にエンコードすることもできる。エンコードされた情報（例えば、エンコードされたビデオ／画像情報）は、ビットストリーム形態でＮＡＬ（ｎｅｔｗｏｒｋａｂｓｔｒａｃｔｉｏｎｌａｙｅｒ）ユニット単位で送信または格納されることができる。前記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）等、様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ／画像情報は、一般制限情報（ｇｅｎｅｒａｌｃｏｎｓｔｒａｉｎｔｉｎｆｏｒｍａｔｉｏｎ）をさらに含むことができる。本文書において、エンコード装置からデコード装置に伝達／シグナリングされる情報及び／又はシンタックス要素は、ビデオ／画像情報に含まれることができる。前記ビデオ／画像情報は、上述したエンコード手順を介してエンコードされて前記ビットストリームに含まれることができる。前記ビットストリームは、ネットワークを介して送信されることができ、またはデジタル格納媒体に格納されることができる。ここで、ネットワークは、放送網及び／又は通信網などを含むことができ、デジタル格納媒体は、ＵＳＢ、ＳＤ、ＣＤ、ＤＶＤ、ブルーレイ、ＨＤＤ、ＳＳＤなど、様々な格納媒体を含むことができる。エントロピーエンコード部２４０から出力された信号は、送信する送信部（図示せず）及び／又は格納する格納部（図示せず）がエンコード装置２００の内／外部エレメントとして構成されることができ、または送信部は、エントロピーエンコード部２４０に含まれることもできる。

量子化部２３３から出力された量子化された変換係数は、予測信号を生成するために用いられることができる。例えば、量子化された変換係数に逆量子化部２３４及び逆変換部２３５を介して逆量子化及び逆変換を適用することにより、レジデュアル信号（レジデュアルブロックまたはレジデュアルサンプル）を復元できる。加算部１５５は、復元されたレジデュアル信号をインター予測部２２１またはイントラ予測部２２２から出力された予測信号に加えることにより、復元（ｒｅｃｏｎｓｔｒｕｃｔｅｄ）信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）が生成され得る。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。加算部２５０は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て次のピクチャのインター予測のために使用されることもできる。

一方、ピクチャエンコード及び／又は復元過程でＬＭＣＳ（ｌｕｍａｍａｐｐｉｎｇｗｉｔｈｃｈｒｏｍａｓｃａｌｉｎｇ）が適用されることもできる。

フィルタリング部２６０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部２６０は、復元ピクチャに様々なフィルタリング方法を適用して修正された（ｍｏｄｉｆｉｅｄ）復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ２７０、具体的に、メモリ２７０のＤＰＢに格納することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ）、適応的ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ）、両方向フィルタ（ｂｉｌａｔｅｒａｌｆｉｌｔｅｒ）などを含むことができる。フィルタリング部２６０は、各フィルタリング方法についての説明で後述するように、フィルタリングに関する様々な情報を生成してエントロピーエンコード部２４０に伝達することができる。フィルタリングに関する情報は、エントロピーエンコード部２４０でエンコードされてビットストリーム形態で出力されることができる。

メモリ２７０に送信された修正された復元ピクチャは、インター予測部２２１で参照ピクチャとして使用されることができる。エンコード装置は、これを介してインター予測が適用される場合、エンコード装置１００とデコード装置における予測ミスマッチを避けることができ、符号化効率も向上させることができる。

メモリ２７０のＤＰＢは、修正された復元ピクチャをインター予測部２２１における参照ピクチャとして使用するために格納することができる。メモリ２７０は、現在ピクチャ内の動き情報が導出された（または、エンコードされた）ブロックの動き情報及び／又は既に復元されたピクチャ内のブロックの動き情報を格納することができる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するために、インター予測部２２１に伝達することができる。メモリ２７０は、現在ピクチャ内の復元されたブロックの復元サンプルを格納することができ、イントラ予測部２２２に伝達することができる。

図３は、本文書の実施形態が適用できるビデオ／画像デコード装置の構成を概略的に説明する図である。以下、デコード装置というのは、画像デコード装置及び／又はビデオデコード装置を含むことができる。

図３に示すように、デコード装置３００は、エントロピーデコード部（ｅｎｔｒｏｐｙｄｅｃｏｄｅｒ）３１０、レジデュアル処理部（ｒｅｓｉｄｕａｌｐｒｏｃｅｓｓｏｒ）３２０、予測部（ｐｒｅｄｉｃｔｏｒ）３３０、加算部（ａｄｄｅｒ）３４０、フィルタリング部（ｆｉｌｔｅｒ）３５０、及びメモリ（ｍｅｍｏｅｒｙ）３６０を備えて構成されることができる。予測部３３０は、イントラ予測部３３１及びインター予測部３３２を備えることができる。レジデュアル処理部３２０は、逆量子化部（ｄｅｑｕａｎｔｉｚｅｒ）３２１及び逆変換部（ｉｎｖｅｒｓｅｔｒａｎｓｆｏｒｍｅｒ）３２１を備えることができる。上述したエントロピーデコード部３１０、レジデュアル処理部３２０、予測部３３０、加算部３４０、及びフィルタリング部３５０は、実施形態によって１つのハードウェアコンポーネント（例えば、デコーダチップセットまたはプロセッサ）により構成されることができる。また、メモリ３６０は、ＤＰＢ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ）を備えることができ、デジタル格納媒体により構成されることもできる。前記ハードウェアコンポーネントは、メモリ３６０を内／外部コンポーネントとしてさらに備えることもできる。

ビデオ／画像情報を含むビットストリームが入力されれば、デコード装置３００は、図３のエンコード装置でビデオ／画像情報が処理されたプロセスに対応して画像を復元できる。例えば、デコード装置３００は、前記ビットストリームから取得したブロック分割関連情報に基づいてユニット／ブロックを導出できる。デコード装置３００は、エンコード装置で適用された処理ユニットを用いてデコードを行うことができる。したがって、デコードの処理ユニットは、例えば、コーディングユニットであることができ、コーディングユニットは、コーディングツリーユニットまたは最大コーディングユニットからクアッドツリー構造、バイナリツリー構造、及び／又はターナリツリー構造にしたがって分割されることができる。コーディングユニットから１つ以上の変換ユニットが導出され得る。そして、デコード装置３００を介してデコード及び出力された復元画像信号は、再生装置を介して再生されることができる。

デコード装置３００は、図３のエンコード装置から出力された信号をビットストリーム形態で受信することができ、受信された信号は、エントロピーデコード部３１０を介してデコードされることができる。例えば、エントロピーデコード部３１０は、前記ビットストリームをパーシングして画像復元（または、ピクチャ復元）に必要な情報（例えば、ビデオ／画像情報）を導出できる。前記ビデオ／画像情報は、アダプテーションパラメータセット（ＡＰＳ）、ピクチャパラメータセット（ＰＰＳ）、シーケンスパラメータセット（ＳＰＳ）、またはビデオパラメータセット（ＶＰＳ）など、様々なパラメータセットに関する情報をさらに含むことができる。また、前記ビデオ／画像情報は、一般制限情報（ｇｅｎｅｒａｌｃｏｎｓｔｒａｉｎｔｉｎｆｏｒｍａｔｉｏｎ）をさらに含むことができる。デコード装置は、前記パラメータセットに関する情報及び／又は前記一般制限情報に基づいてさらにピクチャをデコードすることができる。本文書において後述されるシグナリング／受信される情報及び／又はシンタックス要素は、前記デコード手順を介してデコードされて、前記ビットストリームから取得されることができる。例えば、エントロピーデコード部３１０は、指数ゴロム符号化、ＣＡＶＬＣ、またはＣＡＢＡＣなどのコーディング方法を基にビットストリーム内の情報をデコードし、画像復元に必要なシンタックスエレメントの値、レジデュアルに関する変換係数の量子化された値を出力できる。より具体的に、ＣＡＢＡＣエントロピーデコード方法は、ビットストリームで各シンタックス要素に該当するビンを受信し、デコード対象のシンタックス要素情報と隣接及びデコード対象ブロックのデコード情報または以前ステップでデコードされたシンボル／ビンの情報を利用して文脈（ｃｏｎｔｅｘｔ）モデルを決定し、決定された文脈モデルによってビン（ｂｉｎ）の発生確率を予測してビンの算術デコード（ａｒｉｔｈｍｅｔｉｃｄｅｃｏｄｉｎｇ）を行い、各シンタックス要素の値に該当するシンボルを生成することができる。このとき、ＣＡＢＡＣエントロピーデコード方法は、文脈モデル決定後、次のシンボル／ビンの文脈モデルのためにデコードされたシンボル／ビンの情報を利用して文脈モデルをアップデートすることができる。エントロピーデコード部３１０でデコードされた情報のうち、予測に関する情報は、予測部（インター予測部３３２及びイントラ予測部３３１）に提供され、エントロピーデコード部３１０でエントロピーデコードが行われたレジデュアル値、即ち、量子化された変換係数及び関連パラメータ情報は、レジデュアル処理部３２０に入力されることができる。レジデュアル処理部３２０は、レジデュアル信号（レジデュアルブロック、レジデュアルサンプル、レジデュアルサンプルアレイ）を導出できる。また、エントロピーデコード部３１０でデコードされた情報のうち、フィルタリングに関する情報は、フィルタリング部３５０に提供されることができる。一方、エンコード装置から出力された信号を受信する受信部（図示せず）がデコード装置３００の内／外部エレメントとしてさらに構成されることができ、または受信部は、エントロピーデコード部３１０の構成要素であることもできる。一方、本文書に係るデコード装置は、ビデオ／画像／ピクチャデコード装置と呼ばれることができ、前記デコード装置は、情報デコーダ（ビデオ／画像／ピクチャ情報デコーダ）及びサンプルデコーダ（ビデオ／画像／ピクチャサンプルデコーダ）に区分することもできる。前記情報デコーダは、前記エントロピーデコード部３１０を備えることができ、前記サンプルデコーダは、前記逆量子化部３２１、逆変換部３２２、加算部３４０、フィルタリング部３５０、メモリ３６０、インター予測部３３２、及びイントラ予測部３３１のうち、少なくとも１つを備えることができる。

逆量子化部３２１では、量子化された変換係数を逆量子化して変換係数を出力できる。逆量子化部３２１は、量子化された変換係数を２次元のブロック形態で再整列することができる。この場合、前記再整列は、エンコード装置で行われた係数スキャン順序に基づいて再整列を行うことができる。逆量子化部３２１は、量子化パラメータ（例えば、量子化ステップサイズ情報）を用いて量子化された変換係数に対する逆量子化を行い、変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）を取得することができる。

逆変換部３２２では、変換係数を逆変換してレジデュアル信号（レジデュアルブロック、レジデュアルサンプルアレイ）を取得するようになる。

予測部は、現在ブロックに対する予測を行い、前記現在ブロックに対する予測サンプルを含む予測されたブロック（ｐｒｅｄｉｃｔｅｄｂｌｏｃｋ）を生成することができる。予測部は、エントロピーデコード部３１０から出力された前記予測に関する情報に基づいて、前記現在ブロックにイントラ予測が適用されるか、またはインター予測が適用されるか決定することができ、具体的なイントラ／インター予測モードを決定できる。

予測部３３０は、後述する様々な予測方法に基づいて予測信号を生成することができる。例えば、予測部は、１つのブロックに対する予測のために、イントラ予測またはインター予測を適用することができるだけでなく、イントラ予測とインター予測とを同時に適用することができる。これは、ｃｏｍｂｉｎｅｄｉｎｔｅｒａｎｄｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ（ＣＩＩＰ）と呼ばれることができる。また、予測部は、ブロックに対する予測のために、イントラブロックコピー（ｉｎｔｒａｂｌｏｃｋｃｏｐｙ、ＩＢＣ）予測モードに基づくことができ、またはパレットモード（ｐａｌｅｔｔｅｍｏｄｅ）に基づくこともできる。前記ＩＢＣ予測モードまたはパレットモードは、例えば、ＳＣＣ（ｓｃｒｅｅｎｃｏｎｔｅｎｔｃｏｄｉｎｇ）などのように、ゲームなどのコンテンツ画像／動画コーディングのために使用されることができる。ＩＢＣは、基本的に現在ピクチャ内で予測を行うが、現在ピクチャ内で参照ブロックを導出する点においてインター予測と同様に行われることができる。即ち、ＩＢＣは、本文書において説明されるインター予測技法のうち、少なくとも１つを利用することができる。パレットモードは、イントラコーディングまたはイントラ予測の一例と見なすことができる。パレットモードが適用される場合、パレットテーブル及びパレットインデックスに関する情報が前記ビデオ／画像情報に含まれてシグナリングされることができる。

イントラ予測部３３１は、現在ピクチャ内のサンプルを参照して現在ブロックを予測できる。前記参照されるサンプルは、予測モードによって前記現在ブロックの隣接（ｎｅｉｇｈｂｏｒ）に位置することができ、または離れて位置することができる。イントラ予測において予測モードは、複数の非方向性モードと複数の方向性モードとを含むことができる。イントラ予測部３３１は、隣接ブロックに適用された予測モードを用いて、現在ブロックに適用される予測モードを決定することもできる。

インター予測部３３２は、参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロックを導くことができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて動き情報をブロック、サブブロック、またはサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャインデックスを含むことができる。前記動き情報は、インター予測方向（Ｌ０予測、Ｌ１予測、ＢＩ予測等）情報をさらに含むことができる。インター予測の場合に、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と参照ピクチャに存在する時間的隣接ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）とを備えることができる。例えば、インター予測部３３２は、隣接ブロックに基づいて動き情報候補リストを構成し、受信した候補選択情報に基づいて前記現在ブロックの動きベクトル及び／又は参照ピクチャインデックスを導出できる。様々な予測モードに基づいてインター予測が行われ得るし、前記予測に関する情報は、前記現在ブロックに対するインター予測のモードを指示する情報を含むことができる。

加算部３４０は、取得されたレジデュアル信号を予測部（インター予測部３３２及び／又はイントラ予測部３３１を備える）から出力された予測信号（予測されたブロック、予測サンプルアレイ）に加えることにより、復元信号（復元ピクチャ、復元ブロック、復元サンプルアレイ）を生成することができる。スキップモードが適用された場合のように、処理対象ブロックに対するレジデュアルがない場合、予測されたブロックが復元ブロックとして使用されることができる。

加算部３４０は、復元部または復元ブロック生成部と呼ばれることができる。生成された復元信号は、現在ピクチャ内の次の処理対象ブロックのイントラ予測のために使用されることができ、後述するように、フィルタリングを経て出力されることができ、または次のピクチャのインター予測のために使用されることもできる。

一方、ピクチャデコード過程でＬＭＣＳ（ｌｕｍａｍａｐｐｉｎｇｗｉｔｈｃｈｒｏｍａｓｃａｌｉｎｇ）が適用されることもできる。

フィルタリング部３５０は、復元信号にフィルタリングを適用して主観的／客観的画質を向上させることができる。例えば、フィルタリング部３５０は、復元ピクチャに様々なフィルタリング方法を適用して修正された（ｍｏｄｉｆｉｅｄ）復元ピクチャを生成することができ、前記修正された復元ピクチャをメモリ３６０、具体的に、メモリ３６０のＤＰＢに送信することができる。前記様々なフィルタリング方法は、例えば、デブロッキングフィルタリング、サンプル適応的オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ）、適応的ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ）、両方向フィルタ（ｂｉｌａｔｅｒａｌｆｉｌｔｅｒ）などを含むことができる。

メモリ３６０のＤＰＢに格納された（修正された）復元ピクチャは、インター予測部３３２で参照ピクチャとして使用されることができる。メモリ３６０は、現在ピクチャ内の動き情報が導出された（または、デコードされた）ブロックの動き情報及び／又は既に復元されたピクチャ内のブロックの動き情報を格納できる。前記格納された動き情報は、空間的隣接ブロックの動き情報または時間的隣接ブロックの動き情報として活用するために、インター予測部２６０に伝達することができる。メモリ３６０は、現在ピクチャ内の復元されたブロックの復元サンプルを格納でき、イントラ予測部３３１に伝達することができる。

本明細書において、エンコード装置２００のフィルタリング部２６０、インター予測部２２１、及びイントラ予測部２２２で説明された実施形態等は、各々デコード装置３００のフィルタリング部３５０、インター予測部３３２、及びイントラ予測部３３１にも同一または対応するように適用されることができる。

前述したように、ビデオコーディングを実行するにあたって、圧縮効率を上げるために予測を実行する。これを介してコーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、前記予測されたブロックは、空間ドメイン（または、ピクセルドメイン）での予測サンプルを含む。前記予測されたブロックは、エンコード装置及びデコード装置で同じく導出され、前記エンコード装置は、原本ブロックの原本サンプル値自体でない前記原本ブロックと前記予測されたブロックとの間のレジデュアルに対する情報（レジデュアル情報）をデコード装置にシグナリングすることで画像コーディング効率を上げることができる。デコード装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、前記レジデュアルブロックと前記予測されたブロックとを合わせて復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。

前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコード装置は、前記原本ブロックと前記予測されたブロックとの間のレジデュアルブロックを導出し、前記レジデュアルブロックに含まれているレジデュアルサンプル（レジデュアルサンプルアレイ）に変換手順を実行して変換係数を導出し、前記変換係数に量子化手順を実行して量子化された変換係数を導出することで、関連したレジデュアル情報を（ビットストリームを介して）デコード装置にシグナリングできる。ここで、前記レジデュアル情報は、前記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコード装置は、前記レジデュアル情報に基づいて逆量子化／逆変換の手順を実行してレジデュアルサンプル（または、レジデュアルブロック）を導出することができる。デコード装置は、予測されたブロックと前記レジデュアルブロックに基づいて復元ピクチャを生成することができる。また、エンコード装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化／逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。

本文書において、量子化／逆量子化及び／または変換／逆変換のうち少なくとも１つは、省略されることができる。前記量子化／逆量子化が省略される場合、前記量子化された変換係数は、変換係数と呼ばれることができる。前記変換／逆変換が省略される場合、前記変換係数は、係数またはレジデュアル係数と呼ばれることもでき、または、表現の統一性のために、依然として変換係数と呼ばれることもできる。

本文書において、量子化された変換係数及び変換係数は、各々、変換係数及びスケーリングされた（ｓｃａｌｅｄ）変換係数と呼ばれることができる。この場合、レジデュアル情報は、変換係数（ら）に関する情報を含むことができ、前記変換係数（ら）に関する情報は、レジデュアルコーディングシンタックスを介してシグナリングされることができる。前記レジデュアル情報（または、前記変換係数（ら）に関する情報）に基づいて変換係数が導出されることができ、前記変換係数に対する逆変換（スケーリング）を介してスケーリングされた変換係数が導出されることができる。前記スケーリングされた変換係数に対する逆変換（変換）に基づいてレジデュアルサンプルが導出されることができる。これは本文書の他の部分でも同様に適用／表現されることができる。

イントラ予測は、現在ブロックが属するピクチャ（以下、現在ピクチャという）内の参照サンプルに基づいて現在ブロックに対する予測サンプルを生成する予測を示すことができる。現在ブロックにイントラ予測が適用される場合、現在ブロックのイントラ予測に使用する隣接参照サンプルが導出されることができる。前記現在ブロックの隣接参照サンプルは、ｎＷ×ｎＨ大きさの現在ブロックの左側（ｌｅｆｔ）境界に隣接したサンプル及び左下側（ｂｏｔｔｏｍ－ｌｅｆｔ）に隣接した総２×ｎＨ個のサンプル、現在ブロックの上側（ｔｏｐ）境界に隣接したサンプル及び右上側（ｔｏｐ－ｒｉｇｈｔ）に隣接した総２×ｎＷ個のサンプル及び現在ブロックの左上側（ｔｏｐ－ｌｅｆｔ）に隣接した１個のサンプルを含むことができる。または、前記現在ブロックの隣接参照サンプルは、複数列の上側隣接サンプル及び複数行の左側隣接サンプルを含むこともできる。また、前記現在ブロックの隣接参照サンプルは、ｎＷ×ｎＨ大きさの現在ブロックの右側（ｒｉｇｈｔ）境界に隣接した総ｎＨ個のサンプル、現在ブロックの下側（ｂｏｔｔｏｍ）境界に隣接した総ｎＷ個のサンプル及び現在ブロックの右下側（ｂｏｔｔｏｍ－ｒｉｇｈｔ）に隣接した１個のサンプルを含むこともできる。

ただし、現在ブロックの隣接参照サンプルのうち一部は、まだデコードされない、または利用可能でない場合がある。この場合、デコーダは、利用可能なサンプルとして利用可能でないサンプルを代替（ｓｕｂｓｔｉｔｕｔｉｏｎ）して予測に使用する隣接参照サンプルを構成することができる。または、利用可能なサンプルの補間（ｉｎｔｅｒｐｏｌａｔｉｏｎ）を介して予測に使用する隣接参照サンプルを構成することができる。

隣接参照サンプルが導出された場合、（ｉ）現在ブロックの隣接（ｎｅｉｇｈｂｏｒｉｎｇ）参照サンプルの平均（ａｖｅｒａｇｅ）または補間（ｉｎｔｅｒｐｏｌａｔｉｏｎ）に基づいて予測サンプルを誘導することができ、（ｉｉ）現在ブロックの隣接参照サンプルのうち、予測サンプルに対して特定（予測）方向に存在する参照サンプルに基づいて前記予測サンプルを誘導することもできる。（ｉ）の場合は、非方向性（ｎｏｎ－ｄｉｒｅｃｔｉｏｎａｌ）モードまたは非角度（ｎｏｎ－ａｎｇｕｌａｒ）モードと呼ばれ、（ｉｉ）の場合は、方向性（ｄｉｒｅｃｔｉｏｎａｌ）モードまたは角度（ａｎｇｕｌａｒ）モードと呼ばれることができる。

また、前記隣接参照サンプルのうち前記現在ブロックの予測サンプルを基準にして、前記現在ブロックのイントラ予測モードの予測方向に位置する第１の隣接サンプルと前記予測方向の反対方向に位置する第２の隣接サンプルとの補間を介して前記予測サンプルが生成されることもできる。前述した場合は、線形補間イントラ予測（Ｌｉｎｅａｒｉｎｔｅｒｐｏｌａｔｉｏｎｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ、ＬＩＰ）と呼ばれることができる。また、線形モデル（ｌｉｎｅａｒｍｏｄｅｌ）を利用してルマサンプルに基づいてクロマ予測サンプルが生成されることもできる。この場合は、ＬＭモードと呼ばれることができる。

また、フィルタリングされた隣接参照サンプルに基づいて前記現在ブロックの臨時予測サンプルを導出し、前記既存の隣接参照サンプル、即ち、フィルタリングされない隣接参照サンプルのうち、前記イントラ予測モードによって導出された少なくとも１つの参照サンプルと前記臨時予測サンプルとを加重和（ｗｅｉｇｈｔｅｄｓｕｍ）して前記現在ブロックの予測サンプルを導出することもできる。前述した場合は、ＰＤＰＣ（Ｐｏｓｉｔｉｏｎｄｅｐｅｎｄｅｎｔｉｎｔｒａｐｒｅｄｉｃｔｉｏｎ）と呼ばれることができる。

また、現在ブロックの隣接多重参照サンプルラインの中から最も予測正確度が高い参照サンプルラインを選択して該当ラインで予測方向に位置する参照サンプルを利用して予測サンプルを導出し、この時に使われた参照サンプルラインをデコード装置に指示（シグナリング）する方法でイントラ予測符号化を実行することができる。前述した場合は、多重参照ライン（ｍｕｌｔｉ－ｒｅｆｅｒｅｎｃｅｌｉｎｅ）イントラ予測またはＭＲＬベースのイントラ予測と呼ばれることができる。

また、現在ブロックを垂直または水平のサブパーティションに分けて同じイントラ予測モードに基づいてイントラ予測を実行し、前記サブパーティション単位で隣接参照サンプルを導出して利用できる。即ち、この場合、現在ブロックに対するイントラ予測モードが前記サブパーティションに同じく適用され、前記サブパーティション単位で隣接参照サンプルを導出して利用することによって、場合によって、イントラ予測性能を高めることができる。このような予測方法は、ＩＳＰ（ｉｎｔｒａｓｕｂ－ｐａｒｔｉｔｉｏｎｓ）ベースのイントラ予測と呼ばれることができる。

前述したイントラ予測方法は、イントラ予測モードと区分してイントラ予測タイプと呼ばれることができる。前記イントラ予測タイプは、イントラ予測技法または付加イントラ予測モードなど、多様な用語で呼ばれることができる。例えば、前記イントラ予測タイプ（または、付加イントラ予測モードなど）は、前述したＬＩＰ、ＰＤＰＣ、ＭＲＬ、ＩＳＰのうち少なくとも１つを含むことができる。前記ＬＩＰ、ＰＤＰＣ、ＭＲＬ、ＩＳＰなどの特定イントラ予測タイプを除外した一般イントラ予測方法は、ノーマルイントラ予測タイプと呼ばれることができる。ノーマルイントラ予測タイプは、前記のような特定イントラ予測タイプが適用されない場合、一般的に適用されることができ、前述したイントラ予測モードに基づいて予測が実行されることができる。一方、必要によって、導出された予測サンプルに対する後処理フィルタリングが実行されることもできる。

具体的に、イントラ予測手順は、イントラ予測モード／タイプ決定ステップ、隣接参照サンプル導出ステップ、イントラ予測モード／タイプベースの予測サンプル導出ステップを含むことができる。また、必要によって、導出された予測サンプルに対する後処理フィルタリング（ｐｏｓｔ－ｆｉｌｔｅｒｉｎｇ）ステップが実行されることもできる。

イントラ予測が適用される場合、隣接ブロックのイントラ予測モードを利用して現在ブロックに適用されるイントラ予測モードが決定されることができる。例えば、デコード装置は、現在ブロックの隣接ブロック（例えば、左側及び／または上側隣接ブロック）のイントラ予測モード及び追加的な候補モードに基づいて導出されたＭＰＭ（ｍｏｓｔｐｒｏｂａｂｌｅｍｏｄｅ）リスト内のＭＰＭ候補のうち１つを、受信されたＭＰＭインデックスに基づいて選択でき、または、前記ＭＰＭ候補（及びプラナーモード）に含まれない残りのイントラ予測モードのうち１つを、リメイニングイントラ予測モード情報に基づいて選択できる。前記ＭＰＭリストは、プラナーモードを候補として含む場合または含まない場合で構成されることができる。例えば、前記ＭＰＭリストがプラナーモードを候補として含む場合、前記ＭＰＭリストは、６個の候補を有することができ、前記ＭＰＭリストがプラナーモードを候補として含まない場合、前記ＭＰＭリストは、５個の候補を有することができる。前記ＭＰＭリストがプラナーモードを候補として含まない場合、現在ブロックのイントラ予測モードがプラナーモードでないかことを示すｎｏｔプラナーフラグ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｎｏｔ＿ｐｌａｎａｒ＿ｆｌａｇ）がシグナリングされることができる。例えば、ＭＰＭフラグが先にシグナリングされ、ＭＰＭインデックス及びｎｏｔプラナーフラグは、ＭＰＭフラグの値が１である場合にシグナリングされることができる。また、前記ＭＰＭインデックスは、前記ｎｏｔプラナーフラグの値が１である場合にシグナリングされることができる。ここで、前記ＭＰＭリストがプラナーモードを候補として含まないように構成されることは、前記プラナーモードがＭＰＭでないことを意味するより、ＭＰＭとして常にプラナーモードが考慮されるため、先にフラグ（ｎｏｔｐｌａｎａｒｆｌａｇ）をシグナリングしてプラナーモードであるかどうかを先に確認するためである。

例えば、現在ブロックに適用されるイントラ予測モードがＭＰＭ候補（及びプラナーモード）内にあるか、または、リメイニングモード内にあるかは、ＭＰＭフラグ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇ）に基づいて指示されることができる。ＭＰＭフラグの値１は、前記現在ブロックに対するイントラ予測モードがＭＰＭ候補（及びプラナーモード）内にあることを示すことができ、ＭＰＭｆｌａｇの値０は、前記現在ブロックに対するイントラ予測モードがＭＰＭ候補（及びプラナーモード）内に無いことを示すことができる。前記ｎｏｔプラナーフラグ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｎｏｔ＿ｐｌａｎａｒ＿ｆｌａｇ）値０は、前記現在ブロックに対するイントラ予測モードがプラナーモードであることを示すことができ、前記ｎｏｔプラナーフラグ値１は、前記現在ブロックに対するイントラ予測モードがプラナーモードでないことを示すことができる。前記ＭＰＭインデックスは、ｍｐｍ＿ｉｄｘまたはｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｉｄｘシンテックス要素の形態でシグナリングされることができ、前記リメイニングイントラ予測モード情報は、ｒｅｍ＿ｉｎｔｒａ＿ｌｕｍａ＿ｐｒｅｄ＿ｍｏｄｅまたはｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｒｅｍａｉｎｄｅｒシンテックス要素の形態でシグナリングされることができる。例えば、前記リメイニングイントラ予測モード情報は、全体イントラ予測モードのうち前記ＭＰＭ候補（及びプラナーモード）に含まれない残りのイントラ予測モードを予測モード番号順にインデキシングしてそのうち１つを指すことができる。前記イントラ予測モードは、ルマ成分（サンプル）に対するイントラ予測モードである。以下、イントラ予測モード情報は、前記ＭＰＭｆｌａｇ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｆｌａｇ）、前記ｎｏｔｐｌａｎａｒｆｌａｇ（例えば、ｉｎｔｒａ＿ｌｕｍａ＿ｎｏｔ＿ｐｌａｎａｒ＿ｆｌａｇ）、前記ＭＰＭインデックス（例えば、ｍｐｍ＿ｉｄｘまたはｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｉｄｘ）、前記リメイニングイントラ予測モード情報（ｒｅｍ＿ｉｎｔｒａ＿ｌｕｍａ＿ｐｒｅｄ＿ｍｏｄｅまたはｉｎｔｒａ＿ｌｕｍａ＿ｍｐｍ＿ｒｅｍａｉｎｄｅｒ）のうち少なくとも１つを含むことができる。本文書において、ＭＰＭリストは、ＭＰＭ候補リスト、ｃａｎｄＭｏｄｅＬｉｓｔなど、多様な用語で呼ばれることができる。ＭＩＰが現在ブロックに適用される場合、ＭＩＰのための別途のｍｐｍｆｌａｇ（例えば、ｉｎｔｒａ＿ｍｉｐ＿ｍｐｍ＿ｆｌａｇ）、ｍｐｍインデックス（例えば、ｉｎｔｒａ＿ｍｉｐ＿ｍｐｍ＿ｉｄｘ）、リメイニングイントラ予測モード情報（例えば、ｉｎｔｒａ＿ｍｉｐ＿ｍｐｍ＿ｒｅｍａｉｎｄｅｒ）がシグナリングされることができ、前記ｎｏｔｐｌａｎａｒｆｌａｇはシグナリングされない。

即ち、一般的に画像に対するブロック分割になると、コーディングしようとする現在ブロックと隣接（ｎｅｉｇｈｂｏｒｉｎｇ）ブロックは、類似する画像特性を有するようになる。したがって、現在ブロックと隣接ブロックは、互いに同じまたは類似するイントラ予測モードを有する確率が高い。したがって、エンコーダは、現在ブロックのイントラ予測モードをエンコードするために、隣接ブロックのイントラ予測モードを利用することができる。

例えば、エンコーダ／デコーダは、現在ブロックに対するＭＰＭ（ｍｏｓｔｐｒｏｂａｂｌｅｍｏｄｅｓ）リストを構成することができる。前記ＭＰＭリストは、ＭＰＭ候補リストと示すこともできる。ここで、ＭＰＭとは、イントラ予測モードコーディング時、現在ブロックと隣接ブロックの類似性を考慮してコーディング効率を向上させるために利用されるモードを意味することができる。前述したように、ＭＰＭリストは、プラナーモードを含んで構成されることもでき、または、プラナーモードを除外して構成されることもできる。例えば、ＭＰＭリストがプラナーモードを含む場合、ＭＰＭリストの候補の個数は６個である。そして、ＭＰＭリストがプラナーモードを含まない場合、ＭＰＭリストの候補の個数は５個である。

エンコーダ／デコーダは、５個または６個のＭＰＭを含むＭＰＭリストを構成することができる。

ＭＰＭリストを構成するために、デフォルトイントラモード（Ｄｅｆａｕｌｔｉｎｔｒａｍｏｄｅｓ）、隣接イントラモード（Ｎｅｉｇｈｂｏｕｒｉｎｔｒａｍｏｄｅｓ）、及び導出されたイントラモード（Ｄｅｒｉｖｅｄｉｎｔｒａｍｏｄｅｓ）の３つの種類のモードが考慮されることができる。

前記隣接イントラモードのために、２つの隣接ブロック、即ち、左側隣接ブロック及び上側隣接ブロックが考慮されることができる。

前述したように、もし、ＭＰＭリストがプラナーモードを含まないように構成する場合、前記リストからプラナー（ｐｌａｎａｒ）モードが除外され、前記ＭＰＭリスト候補の個数は、５個に設定されることができる。

また、イントラ予測モードのうち、非方向性モード（または、非角度モード）は、現在ブロックの隣接（ｎｅｉｇｈｂｏｒｉｎｇ）参照サンプルの平均（ａｖｅｒａｇｅ）ベースのＤＣモードまたは補間（ｉｎｔｅｒｐｏｌａｔｉｏｎ）ベースのプラナー（ｐｌａｎａｒ）モードを含むことができる。

インター予測が適用される場合、エンコード装置／デコード装置の予測部は、ブロック単位でインター予測を行って予測サンプルを導出することができる。インター予測は、現在ピクチャ以外のピクチャのデータ要素（例えば、サンプル値、又は動き情報）に依存的な方法で導出される予測を示すことができる。現在ブロックにインター予測が適用される場合、参照ピクチャのインデックスの指す参照ピクチャ上で動きベクトルにより特定される参照ブロック（参照サンプルアレイ）に基づいて、現在ブロックに対する予測されたブロック（予測サンプルアレイ）を誘導することができる。このとき、インター予測モードで送信される動き情報の量を減らすために、隣接ブロックと現在ブロックとの間の動き情報の相関性に基づいて、現在ブロックの動き情報をブロック、サブブロック又はサンプル単位で予測することができる。前記動き情報は、動きベクトル及び参照ピクチャのインデックスを含むことができる。前記動き情報は、インター予測タイプ（Ｌ０予測、Ｌ１予測、ＢＩ予測等）の情報を更に含むことができる。インター予測が適用される場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック（ｓｐａｔｉａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）と、参照ピクチャに存在する時間的隣接ブロック（ｔｅｍｐｏｒａｌｎｅｉｇｈｂｏｒｉｎｇｂｌｏｃｋ）とを含むことができる。前記参照ブロックを含む参照ピクチャと、前記時間的隣接ブロックを含む参照ピクチャとは同一であってもよく、異なってもよい。前記時間的隣接ブロックは、同じ位置参照ブロック（ｃｏｌｌｏｃａｔｅｄｒｅｆｅｒｅｎｃｅｂｌｏｃｋ）、同じ位置ＣＵ（ｃｏｌＣＵ）等の名称で呼ばれ得、前記時間的隣接ブロックを含む参照ピクチャは、同じ位置ピクチャ（ｃｏｌｌｏｃａｔｅｄｐｉｃｔｕｒｅ、ｃｏｌＰｉｃ）と呼ばれることもある。例えば、現在ブロックの隣接ブロックに基づいて動き情報の候補リストが構成されることができ、前記現在ブロックの動きベクトル及び／又は参照ピクチャのインデックスを導出するために、どの候補が選択（使用）されるかを指示するフラグ又はインデックス情報がシグナリングされることができる。様々な予測モードに基づいてインター予測が行われ、例えば、スキップモードとマージモードの場合、現在ブロックの動き情報は、選択された隣接ブロックの動き情報を同一であり得る。スキップモードの場合、マージモードと異なり、レジデュアル信号が送信されないことがある。動き情報予測（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｉｏｎ、ＭＶＰ）モードの場合、選択された隣接ブロックの動きベクトルを動きベクトル予測子（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）として利用し、動きベクトル差分（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）はシグナリングされることができる。この場合、前記動きベクトル予測子及び動きベクトル差分の和を用いて、前記現在ブロックの動きベクトルを導出することができる。

前記動き情報は、インター予測タイプ（Ｌ０予測、Ｌ１予測、ＢＩ予測等）に応じて、Ｌ０動き情報及び／又はＬ１動き情報を含むことができる。Ｌ０方向の動きベクトルは、Ｌ０動きベクトル又はＭＶＬ０と呼ばれ得、Ｌ１方向の動きベクトルは、Ｌ１動きベクトル又はＭＶＬ１と呼ばれ得る。Ｌ０動きベクトルに基づいた予測は、Ｌ０予測と呼ばれ得、Ｌ１動きベクトルに基づいた予測をＬ１予測と呼ばれ得、前記Ｌ０動きベクトル及び前記Ｌ１動きベクトルの両方に基づいた予測を双（Ｂｉ）予測と呼ばれ得る。ここで、Ｌ０動きベクトルは、参照ピクチャリストＬ０（Ｌ０）に関連した動きベクトルを示すことができ、Ｌ１動きベクトルは、参照ピクチャリストＬ１（Ｌ１）に関連した動きベクトルを示すことができる。参照ピクチャリストＬ０は、前記現在ピクチャよりも、出力順序上、以前のピクチャを参照ピクチャに含むことができ、参照ピクチャリストＬ１は、前記現在ピクチャよりも、出力順序上、以後のピクチャを含むことができる。前記以前のピクチャは、順方向（参照）ピクチャと呼ばれ得、前記以後のピクチャは、逆方向（参照）ピクチャと呼ばれ得る。前記参照ピクチャリストＬ０は、前記現在ピクチャよりも、出力順序上、以後のピクチャを参照ピクチャにさらに含むことができる。この場合、前記参照ピクチャリストＬ０内で前記以前のピクチャが先にインデキシングされ、前記以後のピクチャは、その後にインデキシングされ得る。前記参照ピクチャリストＬ１は、前記現在ピクチャよりも、出力順序上、以前のピクチャを参照ピクチャにさらに含むことができる。この場合、前記参照ピクチャリスト１内で前記以後のピクチャが先にインデキシングされ、前記以前のピクチャは、その後にインデキシングされ得る。ここで、出力順序は、ＰＯＣ（ｐｉｃｔｕｒｅｏｒｄｅｒｃｏｕｎｔ）順序（ｏｒｄｅｒ）に対応し得る。

インター予測に基づくビデオ／画像エンコード手順は概略的に、例えば以下を含む。

図４は、インター予測ベースのビデオ／画像エンコード方法の例を示す。

エンコード装置は、現在ブロックに対するインター予測を行う（Ｓ４００）。エンコード装置は、現在ブロックのインター予測モード及び動き情報を導出し、前記ブロックの予測サンプルを生成する。ここで、インター予測モード決定、動き情報導出及び予測サンプル生成の手順は同時に行われてもよく、ある１つの手順が他の手順より先に行われてもよい。例えば、エンコード装置のインター予測部は、予測モード決定部、動き情報導出部、予測サンプル導出部を含み、予測モード決定部において前記現在ブロックに対する予測モードを決定し、動き情報導出部において前記現在ブロックの動き情報を導出し、予測サンプル導出部において前記現在ブロックの予測サンプルを導出する。例えば、エンコード装置のインター予測部は、動き推定（ｍｏｔｉｏｎｅｓｔｉｍａｔｉｏｎ）により参照ピクチャの一定領域（サーチ領域）内において前記現在ブロックと類似したブロックをサーチし、前記現在ブロックとの差が最小又は一定基準以下である参照ブロックを導出する。これに基づいて前記参照ブロックが位置する参照ピクチャを指す参照ピクチャインデックスを導出し、前記参照ブロックと前記現在ブロックの位置差に基づいて動きベクトルを導出することができる。エンコード装置は、様々な予測モードのうち前記現在ブロックに対して適用されるモードを決定する。エンコード装置は、前記様々な予測モードに対するＲＤｃｏｓｔを比較し、前記現在ブロックに対する最適の予測モードを決定することができる。

例えば、エンコード装置は、前記現在ブロックにスキップモード又はマージモードが適用される場合、後述するマージ候補リストを構成し、前記マージ候補リストに含まれるマージ候補が指す参照ブロックのうち前記現在ブロックとの差が最小又は一定基準以下である参照ブロックを導出することができる。この場合、前記導出された参照ブロックに関連するマージ候補が選択され、前記選択されたマージ候補を指すマージインデックス情報が生成されてデコード装置にシグナリングされる。前記選択されたマージ候補の動き情報を利用して前記現在ブロックの動き情報が導出されることができる。

他の例として、エンコード装置は、前記現在ブロックに（Ａ）ＭＶＰモードが適用される場合、後述する（Ａ）ＭＶＰ候補リストを構成し、前記（Ａ）ＭＶＰ候補リストに含まれるｍｖｐ（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）候補のうち選択されたｍｖｐ候補の動きベクトルを前記現在ブロックのｍｖｐとして利用できる。この場合、例えば、前述の動き推定により導出された参照ブロックを指す動きベクトルが前記現在ブロックの動きベクトルとして利用されることができ、前記ｍｖｐ候補のうち前記現在ブロックの動きベクトルとの差が最も小さい動きベクトルを有するｍｖｐ候補が前記選択されたｍｖｐ候補となり得る。前記現在ブロックの動きベクトルから前記ｍｖｐを引いた差分であるＭＶＤ（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）が導出されることができる。その場合、前記ＭＶＤに関する情報がデコード装置にシグナリングされることができる。また、（Ａ）ＭＶＰモードが適用される場合、前記参照ピクチャインデックスの値は参照ピクチャインデックス情報で構成され、別途に前記デコード装置にシグナリングされる。

エンコード装置は、前記予測サンプルに基づいてレジデュアルサンプルを導出する（Ｓ４１０）。エンコード装置は、前記現在ブロックの原本サンプルと前記予測サンプルを比較することにより、前記レジデュアルサンプルを導出することができる。

エンコード装置は、予測情報やレジデュアル情報を含む画像情報をエンコードする（Ｓ４２０）。エンコード装置は、エンコードされた画像情報をビットストリーム形態で出力する。前記予測情報は、前記予測手順に関連する情報であり、予測モード情報（例えは、ｓｋｉｐｆｌａｇ、ｍｅｒｇｅｆｌａｇ又はｍｏｄｅｉｎｄｅｘなど）及び動き情報に関する情報を含む。前記動き情報に関する情報は、動きベクトルを導出するための情報である候補選択情報（例えば、ｍｅｒｇｅｉｎｄｅｘ、ｍｖｐｆｌａｇ又はｍｖｐｉｎｄｅｘ）を含む。また、前記動き情報に関する情報は、前述のＭＶＤに関する情報及び／又は参照ピクチャインデックス情報を含む。また、前記動き情報に関する情報は、Ｌ０予測、Ｌ１予測、又は双（ｂｉ）予測が適用されるか否かを示す情報を含む。前記レジデュアル情報は、前記レジデュアルサンプルに関する情報である。前記レジデュアル情報は、前記レジデュアルサンプルに対する量子化された変換係数に関する情報を含む。

出力されたビットストリームは、（デジタル）格納媒体に格納されてデコード装置に伝達されてもよく、また、ネットワークを介してデコード装置に伝達されてもよい。

一方、前述のように、エンコード装置は、前記参照サンプル及び前記レジデュアルサンプルに基づいて復元ピクチャ（復元サンプル及び復元ブロックを含む）を生成する。これは、デコード装置で行われるのと同一の予測結果をエンコード装置から導出するためであり、これにより、コーディング効率を高めることができるからである。従って、エンコード装置は、復元ピクチャ（又は、復元サンプル、復元ブロック）をメモリに格納し、インター予測のための参照ピクチャとして活用することができる。前記復元ピクチャにインループフィルタリング手順などがさらに適用できることは前述の通りである。

インター予測に基づくビデオ／画像デコード手順は、概略的に、例えば以下を含む。

図５は、インター予測ベースのビデオ／画像デコード方法の例を示す。

図５に示すように、デコード装置は、前記エンコード装置で行われた動作と対応する動作を行う。デコード装置は、受信された予測情報に基づいて現在ブロックで予測を行い、予測サンプルを導出することができる。

具体的に、デコード装置は、受信された予測情報に基づいて前記現在ブロックに対する予測モードを決定する（Ｓ５００）。デコード装置は、前記予測情報内の予測モード情報に基づいて前記現在ブロックにどのインター予測モードが適用されるかを決定することができる。

例えば、前記ｍｅｒｇｅｆｌａｇに基づいて前記現在ブロックに前記マージモードが適用されるか、又は、（Ａ）ＭＶＰモードが決定されるか否かを決定することができる。または、前記ｍｏｄｅｉｎｄｅｘに基づいて様々なインター予測モード候補のいずれか１つを選択することができる。前記インター予測モード候補は、スキップモード、マージモード及び／又は（Ａ）ＭＶＰモードを含み、または、後述する様々なインター予測モードを含む。

デコード装置は、前記決定されたインター予測モードに基づいて前記現在ブロックの動き情報を導出する（Ｓ５１０）。例えば、デコード装置は、前記現在ブロックにスキップモード又はマージモードが適用される場合、後述するマージ候補リストを構成し、前記マージ候補リストに含まれたマージ候補のいずれか１つのマージ候補を選択する。前記選択は、前述の選択情報（ｍｅｒｇｅｉｎｄｅｘ）に基づいて行われる。前記選択されたマージ候補の動き情報を利用して前記現在ブロックの動き情報を導出することができる。前記選択されたマージ候補の動き情報が前記現在ブロックの動き情報として利用されることができる。

他の例として、デコード装置は、前記現在ブロックに（Ａ）ＭＶＰモードが適用される場合、後述の（Ａ）ＭＶＰ候補リストを構成し、前記（Ａ）ＭＶＰ候補リストに含まれたｍｖｐ（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）候補のうち選択されたｍｖｐ候補の動きベクトルを前記現在ブロックのｍｖｐとして利用できる。前記選択は、前述の選択情報（ｍｖｐｆｌａｇ又はｍｖｐｉｎｄｅｘ）に基づいて行われる。この場合、前記ＭＶＤに関する情報に基づいて前記現在ブロックのＭＶＤを導出することができ、前記現在ブロックのｍｖｐと前記ＭＶＤに基づいて前記現在ブロックの動きベクトルを導出することができる。また、前記参照ピクチャインデックス情報に基づいて前記現在ブロックの参照ピクチャインデックスを導出することができる。前記現在ブロックに関する参照ピクチャリスト内において前記参照ピクチャインデックスが指すピクチャが前記現在ブロックのインター予測のために参照される参照ピクチャとして導出されることができる。

一方、後述のように候補リストの構成なしに前記現在ブロックの動き情報が導出されることができ、この場合、後述の予測モードにおいて開示された手順に従って前記現在ブロックの動き情報が導出されることができる。この場合、前述のような候補リスト構成は省略されてもよい。

デコード装置は、前記現在ブロックの動き情報に基づいて前記現在ブロックに対する予測サンプルを生成する（Ｓ５２０）。この場合、前記現在ブロックの参照ピクチャインデックスに基づいて前記参照ピクチャを導出し、前記現在ブロックの動きベクトルが前記参照ピクチャ上で指す参照ブロックのサンプルを利用して前記現在ブロックの予測サンプルを導出することができる。この場合、後述のように、場合によって、前記現在ブロックの予測サンプルのうち全部又は一部に対する予測サンプルフィルタリングの手順がさらに行われることがある。

例えば、デコード装置のインター予測部は、予測モード決定部、動き情報導出部、予測サンプル導出部を含み、予測モード決定部で受信された予測モード情報に基づいて前記現在ブロックに対する予測モードを決定し、動き情報導出部で受信された動き情報に関する情報に基づいて前記現在ブロックの動き情報（動きベクトル及び／又は参照ピクチャインデックスなど）を導出し、予測サンプル導出部から前記現在ブロックの予測サンプルを導出することができる。

デコード装置は、受信されたレジデュアル情報に基づいて前記現在ブロックに対するレジデュアルサンプルを生成する（Ｓ５３０）。デコード装置は、前記予測サンプル及び前記レジデュアルサンプルに基づいて前記現在ブロックに対する復元サンプルを生成し、これに基づいて復元ピクチャを生成する（Ｓ５４０）。以後、前記復元ピクチャにインループフィルタリング手順などがさらに適用できることは前述の通りである。

図６は、インター予測手順を例示的に示す。

図６を参照すると、前述のように、インター予測手順は、インター予測モード決定ステップ、決定された予測モードに応じる動き情報の導出ステップ、導出された動き情報に基づく予測実行（予測サンプル生成）ステップを含む。前記インター予測手順は、前述のように、エンコード装置及びデコード装置において行われる。本文書において、コーディング装置とは、エンコード装置及び／又はデコード装置を含む。

図６に示すように、コーディング装置は現在ブロックに対するインター予測モードを決定する（Ｓ６００）。ピクチャ内の現在ブロックの予測のために様々なインター予測モードが使用できる。例えば、マージモード、スキップモード、ＭＶＰ（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｉｏｎ）モード、アフィン（Ａｆｆｉｎｅ）モード、サブブロックマージモード、ＭＭＶＤ（ｍｅｒｇｅｗｉｔｈＭＶＤ）モードなどの様々なモードが使用できる。ＤＭＶＲ（Ｄｅｃｏｄｅｒｓｉｄｅｍｏｔｉｏｎｖｅｃｔｏｒｒｅｆｉｎｅｍｅｎｔ）モード、ＡＭＶＲ（ａｄａｐｔｉｖｅｍｏｔｉｏｎｖｅｃｔｏｒｒｅｓｏｌｕｔｉｏｎ）モード、Ｂｉ－ｐｒｅｄｉｃｔｉｏｎｗｉｔｈＣＵ－ｌｅｖｅｌｗｅｉｇｈｔ（ＢＣＷ）、Ｂｉ－ｄｉｒｅｃｔｉｏｎａｌｏｐｔｉｃａｌｆｌｏｗ（ＢＤＯＦ）などが付随的なモードとしてさらに又は代わりに使用されることができる。アフィンモードは、アフィン動き予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）モードと呼ばれてもよい。ＭＶＰモードは、「ＡＭＶＰ（ａｄｖａｎｃｅｄｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｉｏｎ）モードと呼ばれてもよい。本文書において、一部のモード及び／又は一部のモードにより導出された動き情報候補は、他のモードの動き情報関連候補の１つとして含まれることもある。例えば、ＨＭＶＰ候補は前記マージ／スキップモードのマージ候補として追加されてもよく、または前記ＭＶＰモードのｍｖｐ候補として追加されてもよい。前記ＨＭＶＰ候補が前記マージモード又はスキップモードの動き情報候補として使用される場合、前記ＨＭＶＰ候補はＨＭＶＰマージ候補と呼ばれてもよい。

現在ブロックのインター予測モードを指す予測モード情報がエンコード装置からデコード装置にシグナリングされることができる。前記予測モード情報はビットストリームに含まれてデコード装置に受信されることができる。前記予測モード情報は、多数の候補モードのうち１つを指示するインデックス情報を含む。または、フラグ情報の階層的シグナリングを介してインター予測モードを指示することもできる。この場合、前記予測モード情報は１つ以上のフラグを含む。例えば、スキップフラグをシグナリングしてスキップモードが適用されるか否かを指示し、スキップモードが適用されない場合にマージフラグをシグナリングしてマージモードが適用されるか否かを指示し、マージモードが適用されない場合にＭＶＰモードが適用されると指示するか、追加的な区分のためのフラグをさらにシグナリングすることもできる。アフィンモードは独立的なモードでシグナリングされてもよく、またはマージモード又はＭＶＰモードなどに従属的なモードでシグナリングされてもよい。例えば、アフィンモードは、アフィンマージモード及びアフィンＭＶＰモードを含む。

一方、現在ブロックに前述のｌｉｓｔ０（Ｌ０）予測、ｌｉｓｔ１（Ｌ１）予測、または双予測（ｂｉ－ｐｒｅｄｉｃｔｉｏｎ）が現在ブロック（現在コーディングユニット）に使用されるか否かを示す情報がシグナリングされることができる。前記情報は、動き予測方向情報、インター予測方向情報またはインター予測指示情報と呼ばれてもよく、例えば、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃシンタックス要素の形態で構成／エンコード／シグナリングされることができる。すなわち、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃシンタックス要素は、前述のｌｉｓｔ０（Ｌ０）予測、ｌｉｓｔ１（Ｌ１）予測、または双予測（ｂｉ－ｐｒｅｄｉｃｔｉｏｎ）が現在ブロック（現在コーディングユニット）に使用されるか否かを示すことができる。本文書においては、説明の便宜のために、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃシンタックス要素が指すインター予測タイプ（Ｌ０予測、Ｌ１予測、又はＢＩ予測）は動き予測方向であると表示されてもよい。Ｌ０予測はｐｒｅｄ＿Ｌ０、Ｌ１予測はｐｒｅｄ＿Ｌ１、双予測はｐｒｅｄ＿ＢＩと表されてもよい。例えば、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃシンタックス要素の値によって以下のような予測タイプを示すことができる。

前述のように、１つのピクチャは１つ以上のスライスを含む。スライスは、Ｉ（ｉｎｔｒａ）スライス、Ｐ（ｐｒｅｄｉｃｔｉｖｅ）スライス及びＢ（ｂｉ－ｐｒｅｄｉｃｔｉｖｅ）スライスを含むスライスタイプのうち１つのタイプを有することができる。前記スライスタイプは、スライスタイプの情報に基づいて指示される。Ｉスライス内のブロックに対しては予測のためにインター予測は使われずにイントラ予測のみが使用される。もちろん、この場合にも予測なしに原本サンプル値をコーディングしてシグナリングすることもできる。Ｐスライス内のブロックに対してはイントラ予測又はインター予測が使用され、インター予測が使用される場合は単（ｕｎｉ）予測のみが使用されることができる。一方、Ｂスライス内のブロックに対してはイントラ予測又はインター予測が使用され、インター予測が使用される場合は最大双（ｂｉ）予測まで使用されることができる。

Ｌ０及びＬ１は現在ピクチャより以前にエンコード／デコードされた参照ピクチャを含む。例えば、Ｌ０はＰＯＣ順序上、現在ピクチャより以前及び／又は以後の参照ピクチャを含み、Ｌ１はＰＯＣ順序上、現在ピクチャより以後及び／又は以前の参照ピクチャを含む。この場合、Ｌ０にはＰＯＣ順序上、現在ピクチャより以前の参照ピクチャに相対的にさらに低い参照ピクチャインデックスが割り当てられ、Ｌ１にはＰＯＣ順序上、現在ピクチャより以後の参照ピクチャに相対的にさらに低い参照ピクチャインデックスが割り当てられる。Ｂスライスの場合、双予測が適用され、この場合にも単方向双予測が適用されてもよく、または双方向双予測が適用されてもよい。双方向双予測は真（ｔｒｕｅ）双予測とも呼ばれる。

コーディング装置は、前記現在ブロックに対する動き情報を導出する（Ｓ６１０）。前記動き情報の導出を前記インター予測モードに基づいて導出することができる。

コーディング装置は、現在ブロックの動き情報を利用してインター予測を行うことができる。エンコード装置は、動き推定（ｍｏｔｉｏｎｅｓｔｉｍａｔｉｏｎ）手順を介して現在ブロックに対する最適の動き情報を導出することができる。例えば、エンコード装置は、現在ブロックに対する原本ピクチャ内の原本ブロックを利用して相関性の高い類似した参照ブロックを参照ピクチャ内の決められた探索範囲内において分数ピクセル単位で探索し、これにより動き情報を導出することができる。ブロックの類似性は、位相（ｐｈａｓｅ）ベースのサンプル値の差に基づいて導出することができる。例えば、ブロックの類似性は、現在ブロック（又は、現在ブロックのテンプレート）と参照ブロック（又は、参照ブロックのテンプレート）間のＳＡＤ（ｓｕｍｏｆａｂｓｏｌｕｔｅｄｉｆｆｅｒｅｎｃｅｓ）に基づいて計算されることができる。この場合、探索領域内のＳＡＤが最も小さい参照ブロックに基づいて動き情報を導出することができる。導出された動き情報は、インター予測モードに基づいて様々な方法によってデコード装置にシグナリングされる。

コーディング装置は、前記現在ブロックに対する動き情報に基づいてインター予測を行う（Ｓ６２０）。コーディング装置は、前記動き情報に基づいて前記現在ブロックに対する予測サンプル（ら）を導出することができる。前記予測サンプルを含む現在ブロックは、予測されたブロックと呼ばれてもよい。

マージモード（ｍｅｒｇｅｍｏｄｅ）が適用される場合、現在予測ブロックの動き情報が直接的に送信されることなく、周辺予測ブロックの動き情報を利用して前記現在予測ブロックの動き情報を誘導する。従って、マージモードを利用したことを示すフラグ情報及び周辺のどの予測ブロックを利用したのかを示すマージインデックスを送信することにより、現在予測ブロックの動き情報を指示することができる。前記マージモードはｒｅｇｕｌａｒｍｅｒｇｅｍｏｄｅと呼ばれてもよい。

エンコーダは、マージモードを行うために、現在予測ブロックの動き情報を誘導するために用いられるマージ候補ブロック（ｍｅｒｇｅｃａｎｄｉｄａｔｅｂｌｏｃｋ）をサーチしなければならない。例えば、前記マージ候補ブロックは最大５個まで利用できるが、本文書の実施形態はこれに限定されない。そして、前記マージ候補ブロックの最大個数はスライスヘッダ又はタイルグループヘッダにおいて送信される。前記マージ候補ブロックを見つけた後、エンコーダはマージ候補リストを生成し、これらのうち最小費用を有するマージ候補ブロックを最終マージ候補ブロックとして選択することができる。

前記マージ候補リストは、例えば、５つのマージ候補ブロックを利用することができる。例えば、４つの空間的マージ候補（ｓｐａｔｉａｌｍｅｒｇｅｃａｎｄｉｄａｔｅ）と１つの時間的マージ候補（ｔｅｍｐｏｒａｌｍｅｒｇｅｃａｎｄｉｄａｔｅ）を利用することができる。以下、前記空間的マージ候補又は後述する空間的ＭＶＰ候補はＳＭＶＰと呼ばれてもよく、前記時間的マージ候補又は後述する時間的ＭＶＰ候補はＴＭＶＰと呼ばれてもよい。

以下、マージ候補リストを構成する方法を説明する。

コーディング装置（エンコーダ／デコーダ）は、現在ブロックの空間的周辺ブロックを探索して導出された空間的マージ候補をマージ候補リストに挿入する。例えば、前記空間的周辺ブロックは、前記現在ブロックの左下側コーナー周辺ブロック、左側周辺ブロック、右上側コーナー周辺ブロック、上側周辺ブロック、左上側コーナー周辺ブロックを含む。ただし、これは例示であり、前述の空間的周辺ブロック以外にも右側周辺ブロック、下側周辺ブロック、右下側周辺ブロックなどの追加的な周辺ブロックがさらに前記空間的周辺ブロックとして使用されることができる。コーディング装置は、前記空間的周辺ブロックを優先順位に基づいて探索して可用のブロックを検出し、検出されたブロックの動き情報を前記空間的マージ候補として導出することができる。

コーディング装置は、前記現在ブロックの時間的周辺ブロックを探索して導出された時間的マージ候補を前記マージ候補リストに挿入する。前記時間的周辺ブロックは、前記現在ブロックが位置する現在ピクチャとは異なるピクチャである参照ピクチャ上に位置し得る。前記時間的周辺ブロックが位置する参照ピクチャは、コロケーテッド（ｃｏｌｌｏｃａｔｅｄ）ピクチャ又はｃｏｌピクチャと呼ばれてもよい。前記時間的周辺ブロックは、前記ｃｏｌピクチャ上での前記現在ブロックに対する同一位置ブロック（ｃｏ－ｌｏｃａｔｅｄｂｌｏｃｋ）の右下側コーナー周辺ブロック及び右下側センターブロックの順で探索されることができる。一方、モーションデータ圧縮（ｍｏｔｉｏｎｄａｔａｃｏｍｐｒｅｓｓｉｏｎ）が適用される場合、前記ｃｏｌピクチャに一定格納単位ごとに特定の動き情報を代表動き情報として格納する。この場合、前記一定格納単位内の全てのブロックに対する動き情報を格納する必要がなく、これによりモーションデータ圧縮効果が得られる。この場合、一定格納単位は、例えば、１６×１６サンプル単位又は８×８サンプル単位などに予め定まってもよく、あるいはエンコーダからデコーダに前記一定格納単位に関するサイズ情報がシグナリングされてもよい。前記モーションデータ圧縮が適用される場合、前記時間的周辺ブロックの動き情報は、前記時間的周辺ブロックが位置する前記一定格納単位の代表動き情報に置き換えられることができる。すなわち、この場合、実現の側面から見ると、前記時間的周辺ブロックの座標に位置する予測ブロックではなく、前記時間的周辺ブロックの座標（左上端サンプルポジション）に基づいて一定値の分だけ算術的右シフトした後、算術的左シフトした位置をカバーする予測ブロックの動き情報に基づいて前記時間的マージ候補が導出される。例えば、前記一定格納単位が２ｎ×２ｎサンプル単位である場合、前記時間的周辺ブロックの座標が（ｘＴｎｂ、ｙＴｎｂ）であれば、修正された位置である（（ｘＴｎｂ＞ｎ）＜＜ｎ）、（ｙＴｎｂ＞ｎ）＜＜ｎ））に位置する予測ブロックの動き情報が前記時間的マージ候補のために使用される。具体的に、例えば、前記一定格納単位が１６×１６サンプル単位である場合、前記時間的周辺ブロックの座標が（ｘＴｎｂ、ｙＴｎｂ）であれば、修正された位置である（（ｘＴｎｂ＞４）＜＜４）、（ｙＴｎｂ＞４）＜＜４））に位置する予測ブロックの動き情報が前記時間的マージ候補のために使用される。または、例えば、前記一定格納単位が８×８サンプル単位である場合、前記時間的周辺ブロックの座標が（ｘＴｎｂ、ｙＴｎｂ）であれば、修正された位置である（（ｘＴｎｂ＞３）＜＜３）、（ｙＴｎｂ＞３）＜＜３））に位置する予測ブロックの動き情報が前記時間的マージ候補のために使用される。

コーディング装置は、現在マージ候補の個数が最大マージ候補の個数より小さいか否かを確認できる。前記最大マージ候補の個数は予め定義されるかエンコーダからデコーダにシグナリングされることができる。例えば、エンコーダは、前記最大マージ候補の個数に関する情報を生成し、エンコードしてビットストリーム形態で前記デコーダに伝達する。前記最大マージ候補の個数が充填されると、以後の候補追加過程は行われなくてもよい。

前記確認の結果、前記現在マージ候補の個数が前記最大マージ候補の個数より小さい場合、コーディング装置は追加マージ候補を前記マージ候補リストに挿入する。

前記確認の結果、前記現在マージ候補の個数が前記最大マージ候補の個数より小さくない場合、コーディング装置は前記マージ候補リストの構成を終了する。この場合、エンコーダは、ＲＤ（ｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎ）費用に基づいて前記マージ候補リストを構成するマージ候補のうち最適のマージ候補を選択することができ、前記選択されたマージ候補を指す選択情報（例えば、ｍｅｒｇｅｉｎｄｅｘ）をデコーダにシグナリングすることができる。デコーダは前記マージ候補リスト及び前記選択情報に基づいて前記最適マージ候補を選択する。

前記選択されたマージ候補の動き情報が前記現在ブロックの動き情報として使用されることができ、前記現在ブロックの動き情報に基づいて前記現在ブロックの予測サンプルを導出できることは前述の通りである。エンコーダは、前記予測サンプルに基づいて前記現在ブロックのレジデュアルサンプルを導出し、前記レジデュアルサンプルに関するレジデュアル情報をデコーダにシグナリングすることができる。デコーダは、前記レジデュアル情報に基づいて導出されたレジデュアルサンプル及び前記予測サンプルに基づいて復元サンプルを生成し、これに基づいて復元ピクチャを生成できることは前述の通りである。

スキップモード（ｓｋｉｐｍｏｄｅ）が適用される場合、前述のマージモードが適用される場合と同一の方法で前記現在ブロックの動き情報を導出することができる。ただし、スキップモードが適用される場合、該当ブロックに対するレジデュアル信号が省略され、従って、予測サンプルが直ちに復元サンプルとして利用されることができる。

ＭＶＰモードが適用される場合、復元された空間的周辺ブロックの動きベクトル及び／又は時間的周辺ブロック（又は、Ｃｏｌブロック）に対応する動きベクトルを用いて、動きベクトル予測子（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ、ｍｖｐ）候補リストが生成される。すなわち、復元された空間的周辺ブロックの動きベクトル及び／又は時間的周辺ブロックに対応する動きベクトルは動きベクトル予測子候補として使用されることができる。双予測が適用される場合、Ｌ０動き情報導出のためのｍｖｐ候補リストとＬ１動き情報導出のためのｍｖｐ候補リストが個別に生成されて利用されることができる。前述の予測情報（又は、予測に関する情報）は、前記リストに含まれた動きベクトル予測子候補のうち選択された最適な動きベクトル予測子候補を指示する選択情報（例えば、MVPフラッグ又はＭＶＰインデックス）を含む。ここで、予測部は前記選択情報を利用して、動きベクトル候補リストに含まれた動きベクトル予測子候補のうち、現在ブロックの動きベクトル予測子を選択することができる。エンコード装置の予測部は、現在ブロックの動きベクトルと動きベクトル予測子の間の動きベクトル差分（ＭＶＤ）を求めることができ、これをエンコードしてビットストリーム形態で出力する。すなわち、ＭＶＤは現在ブロックの動きベクトルから前記動きベクトル予測子を引いた値として求められる。ここで、デコード装置の予測部は、前記予測に関する情報に含まれる動きベクトル差分を取得し、前記動きベクトル差分と前記動きベクトル予測子の加算により、現在ブロックの前記動きベクトルを導出することができる。デコード装置の予測部は、参照ピクチャを指示する参照ピクチャインデックスなどを前記予測に関する情報から取得又は誘導することができる。

図７は、動きベクトル予測子候補リストを構成する方法を示す順序図である。

図７に示すように、一実施形態は、まず動きベクトル予測のための空間的候補ブロックを探索して予測候補リストに挿入する（Ｓ７００）。以降、一実施形態は空間的候補ブロックの個数が２より小さいか否かを判断する（Ｓ７１０）。例えば、一実施形態は空間的候補ブロックの個数が２より小さい場合、時間的候補ブロックを探索して予測候補リストに追加挿し（Ｓ７２０）、時間的候補ブロックが使用不可である場合はゼロ動きベクトルを使用する。すなわち、ゼロ動きベクトルを予測候補リストに追加挿入することができる（Ｓ７３０）。以降、一実施形態は予備候補リストの構成を終了する（Ｓ７４０）。または、一実施形態は空間的候補ブロックの個数が２より小さくない場合、予備候補リストの構成を終了する（Ｓ７４０）。ここで、予備候補リストはＭＶＰ候補リストを示す。

一方、ＭＶＰモードが適用される場合、参照ピクチャインデックスが明示的にシグナリングされる。この場合、Ｌ０予測のための参照ピクチャインデックス（ｒｅｆｉｄｘＬ０）とＬ１予測のための参照ピクチャインデックス（ｒｅｆｉｄｘＬ１）に区分されてシグナリングされることができる。例えば、ＭＶＰモードが適用され、双予測（ＢＩｐｒｅｄｉｃｔｉｏｎ）が適用される場合、前記ｒｅｆｉｄｘＬ０に関する情報、及びｒｅｆｉｄｘＬ１に関する情報が両方ともシグナリングされることができる。

ＭＶＰモードが適用される場合、前述のように、エンコード装置から導出されたＭＶＤに関する情報がデコード装置にシグナリングされる。ＭＶＤに関する情報は、例えば、ＭＶＤ絶対値及び符号に対するｘ、ｙ成分を示す情報を含むことができる。この場合、ＭＶＤ絶対値が０より大きいか否か、及び１より大きいか否か、ＭＶＤ残りを示す情報が段階的にシグナリングされることができる。例えば、ＭＶＤ絶対値が１より大きいか否かを示す情報は、ＭＶＤ絶対値が０より大きいか否かを示すｆｌａｇ情報の値が１である場合に限りシグナリングされることができる。

例えば、ＭＶＤに関する情報は、以下の表のようなシンタックスで構成されてエンコード装置においてエンコードされてデコード装置にシグナリングされる。

例えば、表２においてａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ０＿ｆｌａｇシンタックス要素は差分（ＭＶＤ）が０より大きいか否かに関する情報を示し、ａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ１＿ｆｌａｇシンタックス要素は差分（ＭＶＤ）が１より大きいか否かに関する情報を示す。また、ａｂｓ＿ｍｖｄ＿ｍｉｎｕｓ２シンタックス要素は差分（ＭＶＤ）に－２をした値に対する情報を示し、ｍｖｄ＿ｓｉｇｎ＿ｆｌａｇシンタックス要素は差分（ＭＶＤ）の符号に関する情報を示す。また、表２において各シンタックス要素の［０］はＬ０に関する情報であることを示し、［１］はＬ１に関する情報であることを示す。

例えば、ＭＶＤ［ｃｏｍｐＩｄｘ］は、ａｂｓ＿ｍｖｄ＿ｇｒｅａｔｅｒ０＿ｆｌａｇ［ｃｏｍｐＩｄｘ］＊（ａｂｓ＿ｍｖｄ＿ｍｉｎｕｓ２［ｃｏｍｐＩｄｘ］＋２）＊（１－２＊ｍｖｄ＿ｓｉｇｎ＿ｆｌａｇ［ｃｏｍｐＩｄｘ］）に基づいて導出される。ここで、ｃｏｍｐＩｄｘ（又は、ｃｐＩｄｘ）は各成分のインデックスを示し、０または１の値を有することができる。ｃｏｍｐＩｄｘは、０はｘ成分を示し、ｃｏｍｐＩｄｘ１は７成分を示す。ただし、これは例示であり、ｘ、ｙ座標系ではなく、他の座標系を使って各成分別に値を表すこともできる。

一方、Ｌ０予測のためのＭＶＤ（ＭＶＤＬ０）とＬ１予測のためのＭＶＤ（ＭＶＤＬ１）を区分してシグナリングされてもよく、前記ＭＶＤに関する情報は、ＭＶＤＬ０に関する情報及び／又はＭＶＤＬ１に関する情報を含んでもよい。例えば、現在ブロックにＭＶＰモードが適用され、ＢＩ予測が適用される場合、前記ＭＶＤＬ０に関する情報及びＭＶＤＬ１に関する情報が両方ともシグナリングされる。

図８は、ＳＭＶＤ（ｓｙｍｍｅｔｒｉｃｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅｓ）を説明するための図である。

ＢＩ予測が適用される場合、コーディング効率を考慮してＳＭＶＤ（ｓｙｍｍｅｔｒｉｃＭＶＤ）が使用されてもよい。この場合は、動き情報のうち一部のシグナリングが省略されてもよい。例えば、ＳＭＶＤが現在ブロックに適用される場合、ｒｅｆｉｄｘＬ０に関する情報、ｒｅｆｉｄｘＬ１に関する情報、ＭＶＤＬ１に関する情報がエンコード装置からデコード装置にシグナリングされることなく、内部的に導出されることができる。例えば、現在ブロックにＭＶＰモード及びＢＩ予測が適用される場合、ＳＭＶＤの適用可否を指示するフラグ情報（例えば、ＳＭＶＤフラグ情報又はｓｙｍ＿ｍｖｄ＿ｆｌａｇシンタックス要素）がシグナリングされ、前記フラグ情報の値が１である場合、デコード装置は前記現在ブロックにＳＭＶＤが適用されると判断する。

ＳＭＶＤモードが適用される場合（すなわち、ＳＭＶＤフラグ情報の値が１である場合）、ｍｖｐ＿ｌ０＿ｆｌａｇ、ｍｖｐ＿ｌ１＿ｆｌａｇ、及びＭＶＤＬ０（動きベクトル差分Ｌ０）に関する情報が明示的に（ｅｘｐｌｉｃｉｔｌｙ）シグナリングされ、前述のようにｒｅｆｉｄｘＬ０に関する情報、ｒｅｆｉｄｘ１に関する情報、及びＭＶＤＬ１（動きベクトル差分Ｌ１）に関する情報のシグナリングが省略され、内部的に導出されることができる。例えば、ｒｅｆｉｄｘＬ０は参照ピクチャリスト（ｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅｌｉｓｔ）０（ｌｉｓｔ０又はＬ０と呼ばれてもよい）内においてＰＯＣ手順上、現在ピクチャに最も近い以前参照ピクチャを指すインデックスとして導出されることができる。ｒｅｆｉｄｘＬ１は、参照ピクチャリスト（ｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅｌｉｓｔ）１（ｌｉｓｔ１又はＬ１と呼ばれてもよい）内においてＰＯＣ手順上、現在ピクチャに最も近い以後参照ピクチャを指すインデックスとして導出されることができる。または、例えば、ｒｅｆｉｄｘＬ０及びｒｅｆｉｄｘＬ１は、両方ともそれぞれ０として導出されることができる。または、例えば、前記ｒｅｆｉｄｘＬ０及びｒｅｆｉｄｘＬ１は、現在ピクチャとの関係において同一のＰＯＣ差を有する最小インデックスとしてそれぞれ導出されることができる。具体的に、例えば、“［現在ピクチャのＰＯＣ］－［ｒｅｆｉｄｘＬ０が指示する第１参照ピクチャのＰＯＣ]”を第１ＰＯＣ差分といい、”[現在ピクチャのＰＯＣ]－［ｒｅｆｉｄｘＬ１が指示する第２参照ピクチャのＰＯＣ］”を第２ＰＯＣ差分というとき、前記第１ＰＯＣ差分と第２ＰＯＣ差分が同一である場合に限り、前記第１参照ピクチャを指すｒｅｆｉｄｘＬ０の値が前記現在ブロックのｒｅｆｉｄｘＬ０として導出され、前記第２参照ピクチャを指すｒｅｆｉｄｘＬ１の値が前記現在ブロックのｒｅｆｉｄｘＬ１として導出されることもある。また、例えば、前記第１ＰＯＣ差分と第２ＰＯＣ差分が同一である複数のセットがある場合、そのうち差分が最小であるセットのｒｅｆｉｄｘＬ０、ｒｅｆｉｄｘＬ１が現在ブロックのｒｅｆｉｄｘＬ０、ｒｅｆｉｄｘＬ１として導出されることができる。

図８に示すように、参照ピクチャリスト０、参照ピクチャリスト１、及びＭＶＤＬ０、ＭＶＤＬ１が示されている。ここで、ＭＶＤＬ１はＭＶＤＬ０と対称的である。

ＭＶＤＬ１は、マイナス（－）ＭＶＤＬ０と導出されることができる。例えば、現在ブロックに対する最終（改善又は修正された）動き情報（動きベクトル：ＭＶ）は、次の数式に基づいて導出される。

数式１において、ｍｖｘ_０及びｍｖｙ_０は、Ｌ０動き情報又はＬ０予測のための動きベクトルのｘ成分及びｙ成分を示し、ｍｖｘ_１及びｍｖｙ_１は、Ｌ１動き情報又はＬ１予測のための動きベクトルのｘ成分及びｙ成分を示す。また、ｍｖｐｘ_０及びｍｖｐｙ_０は、Ｌ０予測のための動きベクトル予測子のｘ成分及びｙ成分を示し、ｍｖｐｘ_１及びｍｖｐｙ_１は、Ｌ１予測のための動きベクトル予測子のｘ成分及びｙ成分を示す。また、ｍｖｄｘ_０及びｍｖｄｙ_０は、Ｌ０予測のための動きベクトル差分のｘ成分及びｙ成分を示す。

一方、ＭＭＶＤモードは、マージモードにＭＶＤ（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）を適用する方法として、現在ブロック（すなわち、現在ＣＵ）の予測サンプルの生成に直接的に使われる動き情報が内在的に（ｉｍｐｌｉｃｉｔｌｙ）導出されることができる。例えば、現在ブロック（すなわち、現在ＣＵ）にＭＭＶＤを使用するか否かを示すＭＭＶＤフラグ（例：ｍｍｖｄ＿ｆｌａｇ）がシグナリングされ、このＭＭＶＤフラグに基づいてＭＭＶＤが行われることができる。ＭＭＶＤが現在ブロックに適用される場合（例えば、ｍｍｖｄ＿ｆｌａｇが１である場合）、ＭＭＶＤに対する追加情報がシグナリングされることができる。

ここで、ＭＭＶＤに対する追加情報は、マージ候補リスト内の第１候補又は第２候補がＭＶＤと共に使用されるか否かを指示するマージ候補フラグ（例：ｍｍｖｄ＿ｃａｎｄ＿ｆｌａｇ）、動き大きさ（ｍｏｔｉｏｎｍａｇｎｉｔｕｄｅ）を示すための距離インデックス（例：ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）、動き方向（ｍｏｔｉｏｎｄｉｒｅｃｔｉｏｎ）を示すための方向インデックス（ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）を含む。

ＭＭＶＤモードでは、マージ候補リスト内の候補のうち１番目及び２番目のエントリに位置する２つの候補（すなわち、第１候補又は第２候補）を使用することができ、前記２つの候補（すなわち、第１候補又は第２候補）のいずれか１つがベースＭＶとして使用されることができる。例えば、マージ候補フラグ（例：ｍｍｖｄ＿ｃａｎｄ＿ｆｌａｇ）がマージ候補リスト内の２つの候補（すなわち、第１候補又は第２候補）のいずれか１つを示すためにシグナリングされることができる。

また、距離インデックス（例：ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）は、動き大きさ情報を示し、開始ポイントから予め定められたオフセット（ｏｆｆｓｅｔ）を指示することができる。前記オフセットは、開始動きベクトルの水平成分又は垂直成分に加えられてもよい。距離インデックスと予め定められたオフセットの関係は、次の表のように示すことができる。

前記表３を参照すると、距離インデックス（例：ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）の値によってＭＶＤの距離（例：ＭｍｖｄＤｉｓｔａｎｃｅ）が定められており、ＭＶＤの距離（例：ＭｍｖｄＤｉｓｔａｎｃｅ）はｔｉｌｅ＿ｇｒｏｕｐ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値に基づいて整数サンプル単位（ｉｎｔｅｇｅｒｓａｍｐｌｅｐｒｅｃｉｓｉｏｎ）又は分数サンプル単位（ｆｒａｃｔｉｏｎａｌｓａｍｐｌｅｐｒｅｃｉｓｉｏｎ）を使用して導出されることができる。例えば、ｔｉｌｅ＿ｇｒｏｕｐ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１である場合、ＭＶＤの距離は現在タイルグループ（又は、ピクチャヘッダ）において整数サンプル単位を使用して導出されることを示し、ｔｉｌｅ＿ｇｒｏｕｐ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０である場合、ＭＶＤの距離はタイルグループ（又は、ピクチャヘッダ）において分数サンプル単位を使用して導出されることを示す。表１において、タイルグループのための情報（フラグ）はピクチャヘッダのための情報に置き換えられることができ、例えば、ｔｉｌｅ＿ｇｒｏｕｐ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇはｐｈ＿ｆｐｅｌ＿ｍｍｖｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ（又は、ｐｈ＿ｍｍｖｄ＿ｆｕｌｌｐｅｌ＿ｏｎｌｙ＿ｆｌａｇ）に置き換えられることができる。

また、方向インデックス（例：ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）は開始ポイントを基準にＭＶＤの方向を示し、以下の表４に示すように４方向を示す。ここで、ＭＶＤの方向は、ＭＶＤの符号を示すことができる。方向インデックスとＭＶＤ符号の関係は、以下の表のように示す。

前記表４を参照すると、方向インデックス（例：ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）の値によってＭＶＤの符号（例：ＭｍｖｄＳｉｇｎ）が定められており、ＭＶＤの符号（例：ＭｍｖｄＳｉｇｎ）は、Ｌ０参照ピクチャ及びＬ１参照ピクチャに対して導出される。

前述のような距離インデックス（例：ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）及び方向インデックス（例：ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）に基づいて次の数式のようにＭＶＤのオフセットを計算することができる。

数式２及び数式３において、ＭＭＶＤ距離（ＭｍｖｄＤｉｓｔａｎｃｅ［ｘ０］［ｙ０］）及びＭＭＶＤ符号（ＭｍｖｄＳｉｇｎ［ｘ０］［ｙ０］［０］、ＭｍｖｄＳｉｇｎ［ｘ０］［ｙ０］［１］)は、表３及び又は表４に基づいて導出される。まとめると、ＭＭＶＤモードでは、周辺ブロックに基づいて導出されたマージ候補リストのマージ候補子のうちマージ候補フラグ(例：ｍｍｖｄ＿ｃａｎｄ＿ｆｌａｇ)により指示されるマージ候補を選択し、前記選択されたマージ候補をベース(ｂａｓｅ)候補(例えば、ＭＶＰ)として使用することができる。そして、ベース候補に基づいて距離インデックス（例：ｍｍｖｄ＿ｄｉｓｔａｎｃｅ＿ｉｄｘ）及び方向インデックス（例：ｍｍｖｄ＿ｄｉｒｅｃｔｉｏｎ＿ｉｄｘ）を用いて導出されたＭＶＤを加えて現在ブロックの動き情報（すなわち、動きベクトル）を導出することができる。

予測モードによって導出された動き情報に基づいて現在ブロックに対する予測されたブロックを導出することができる。前記予測されたブロックは、前記現在ブロックの予測サンプル（予測サンプルアレイ）を含む。現在のブロックの動きベクトルが分数サンプル単位を指す場合、補間（ｉｎｔｅｒｐｏｌａｔｉｏｎ）手順が行われることができ、これにより参照ピクチャ内において分数サンプル単位の参照サンプルに基づいて前記現在のブロックの予測サンプルが導出されることができる。双予測が適用される場合、Ｌ０予測（すなわち、参照ピクチャリストＬ０内の参照ピクチャとＭＶＬ０を用いた予測）に基づいて導出された予測サンプルとＬ１予測（すなわち、参照ピクチャリストＬ１内の参照ピクチャとＭＶＬ１を用いた予測）に基づいて導出された予測サンプルの（位相に応じた）加重和又は加重平均により導出された予測サンプルが現在のブロックの予測サンプルとして利用できる。双予測が適用される場合、Ｌ０予測に利用された参照ピクチャとＬ１予測に利用された参照ピクチャが現在ピクチャを基準に互いに異なる時間的方向に位置する場合（すなわち、双予測でありながら双方向予測に該当する場合）、これを真（ｔｒｕｅ）双予測と呼んでもよい。

導出された予測サンプルに基づいて復元サンプル及び復元ピクチャが生成され、その後、インループフィルタリングなどの手順が実行できることは前述の通りである。

前述のように本文書によれば、現在ブロックに双予測が適用される場合、加重平均（ｗｅｉｇｈｔｅｄａｖｅｒａｇｅ）に基づいて予測サンプルを導出することができる。既存には、双予測信号（すなわち、双予測サンプル）は、Ｌ０予測信号（Ｌ０予測サンプル）とＬ１予測信号（Ｌ１予測サンプル）の単純平均により導出されていた。すなわち、双予測サンプルは、Ｌ０参照ピクチャ及びＭＶＬ０に基づくＬ０予測サンプルとＬ１参照ピクチャ及びＭＶＬ１に基づくＬ１予測サンプルの平均として導出された。しかしながら、本文書によると、双予測が適用される場合、次のように、Ｌ０予測信号とＬ１予測信号の加重平均により双予測信号（双予測サンプル）を導出することができる。

前述のＭＭＶＤに関連する実施形態において、ＭＭＶＤのＭＶＤ誘導過程においてロングターム参照ピクチャを考慮した方法が提案でき、これにより、様々なアプリケーションにおいて圧縮効率を維持及び増加させることができるようにする。また、本文書の実施形態において提案する方法は、ＭＥＲＧＥにおいて使用されるＭＭＶＤ技術の以外に、インターモード（ＭＶＰモード）において使用される対称的（Ｓｙｍｍｅｔｒｉｃ）ＭＶＤ技術であるＳＭＶＤにおいても同様に適用できる。

図９は、インター予測において動きベクトルを導出する方法を説明するための図である。

本文書の一実施形態において、時間的動き候補（Ｔｅｍｐｏｒａｌｍｏｔｉｏｎｃａｎｄｉｄａｔｅ、ｔｅｍｐｏｒａｌｍｅｒｇｅｃａｎｄｉｄａｔｅ、又はｔｅｍｐｏｒａｌｍｖｐｃａｎｄｉｄａｔｅ）の動きベクトルスケーリング（ＭＶｓｃａｌｉｎｇ）の過程でロングターム参照ピクチャを考慮したＭＶ誘導方法が使われている。時間的動き候補はｍｖＣｏｌ（ｍｖＬＸＣｏｌ）に対応できる。時間的な動き候補は「ＴＭＶＰ」と呼ばれてもよい。

次の表は、ロングターム参照ピクチャの定義を説明する。

前記表５を参照すると、ＬｏｎｇＴｅｒｍＲｅｆＰｉｃ（ａＰｉｃ、ａＰｂ、ｒｅｆＩｄｘ、ＬＸ）が１（真、ｔｒｕｅ）であると、対応する参照ピクチャはロングターム参照のために使われる（ｕｓｅｄｆｏｒｌｏｎｇ－ｔｅｒｍｒｅｆｅｒｅｎｃｅ）ものとマーキングされる。例えば、ロングターム参照のために使われるとマーキングされていない参照ピクチャはショートターム参照のために使われる（ｕｓｅｄｆｏｒｓｈｏｒｔ－ｔｅｒｍｒｅｆｅｒｅｎｃｅ）ものとマーキングされた参照ピクチャであり得る。他の例において、ロングターム参照のために使用されるものとマーキングされず、使用されていないものとマーキングされていない参照ピクチャは、ショートターム参照のために使用されるものとマーキングされた参照ピクチャであり得る。以下、ロングターム参照のために使用されるものとマーキングされた参照ピクチャは、ロングターム参照ピクチャと称されてもよく、ショートターム参照のために使用されるものとマーキングされた参照ピクチャは、ショートターム参照ピクチャと称されてもよい。

次の表はＴＭＶＰ（ｍｖＬＸＣｏｌ）の導出を説明する。

図９及び表６を参照すると、現在ピクチャが指す参照ピクチャタイプ（例えば、ｌｏｎｇ－ｔｅｒｍｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅ（ＬＴＲＰ）又はｓｈｏｒｔ－ｔｅｒｍｒｅｆｒｅｎｃｅｐｉｃｔｕｒｅ（ＳＴＲＰ）であるかを指す）とコロケーテッドピクチャ（ｃｏｌｌｏｃａｔｅｄｐｉｃｔｕｒｅ）が指すコロケーテッド参照ピクチャ（ｃｏｌｌｏｃａｔｅｄｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅ）のタイプが同一であないと、時間的動きベクトル（ｍｖＬＸＣｏｌ）は使用されない。すなわち、全てロングターム参照ピクチャであるか、全てショートターム参照ピクチャである場合はｃｏｌＭＶを誘導し、他のタイプを有する場合はｃｏｌＭＶを誘導しない。また、全てロングターム参照ピクチャである場合と、現在ピクチャと現在ピクチャの参照ピクチャのＰＯＣ差分がコロケーテッドピクチャとコロケーテッドピクチャの参照ピクチャ間のＰＯＣ差分と同一である場合、スケーリングなしにコロケーテッドの動きベクトルをそのまま使用することができる。ショートターム参照ピクチャであり、ＰＯＣ差分が異なる場合、スケーリングされたコロケーテッドブロックの動きベクトルが使用される。

本文書の実施形態において、ＭＥＲＧＥ／ＳＫＩＰモードにおいて使用されるＭＭＶＤは、１つのコーディングブロックに対してベース動きベクトルインデックス（ｂａｓｅＭＶｉｎｄｅｘ）、距離インデックス（ｄｉｓｔａｎｃｅｉｎｄｅｘ）、方向インデックス（ｄｉｒｅｃｔｉｏｎｉｎｄｅｘ）を、ＭＶＤ情報を誘導するための情報として、シグナリングする。単方向予測をする場合、動き情報からＭＶＤを誘導し、双方向予測の場合、ミラーリング（ｍｉｒｒｏｒｉｎｇ）及びスケーリング方法を用いて対称的なＭＶＤ情報を生成する。

双方向予測をする場合、Ｌ０あるいはＬ１のためのＭＶＤ情報はスケーリングされてＬ１あるいはＬ０のＭＶＤを生成するが、ロングターム参照ピクチャを参照する場合、ＭＶＤ誘導過程での変更が必要である。

図１０は、本文書の一実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。図１０に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

図１０を参照すると、Ｌ０参照ピクチャとの距離とＬ１参照ピクチャとの距離が同一であると、誘導されたＭｍｖｄＯｆｆｓｅｔをそのままＭＶＤとして使用することができ、ＰＯＣ差分（Ｌ０参照ピクチャと現在ピクチャ間のＰＯＣ差分及びＬ１参照ピクチャと現在ピクチャ間のＰＯＣ差分）が異なる時、ＰＯＣ差分、及びロングタームあるいはショートターム参照ピクチャであるか否かによってスケーリングするか単純ミラーリング（すなわち、－１を＊ＭｍｖｄＯｆｆｓｅｔ）してＭＶＤを誘導することができる。

一例として、双方向予測が適用されるブロックに対してＭＭＶＤを用いて対称的なＭＶＤを誘導する方法は、ロングターム参照ピクチャを使用するブロックには適合せず、特に、各方向の参照ピクチャタイプが異なる場合、ＭＭＶＤ使用時の性能向上は期待しにくい。従って、次の図及び実施形態においては、Ｌ０とＬ１の参照ピクチャタイプが異なる場合、ＭＭＶＤが適用されないように実現される例が紹介される。

図１１は、本文書の他の実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。図１１に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

図１１を参照すると、現在ピクチャ（又は、現在スライス、現在ブロック）により参照される参照ピクチャがＬＴＲＰ（ｌｏｎｇ－ｔｅｒｍｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅ）又はＳＴＲＰ（ｓｈｏｒｔ－ｔｅｒｍｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅ）であるかによって異なるＭＶＤ誘導方法が適用される。一例において、図１１による実施形態の方法が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

図１２は、本文書の他の実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。図１２に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

図１２を参照すると、現在ピクチャ（又は、現在スライス、現在ブロック）により参照される参照ピクチャがＬＴＲＰ（ｌｏｎｇ－ｔｅｒｍｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅ）又はＳＴＲＰ（ｓｈｏｒｔ－ｔｅｒｍｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅ）であるかによって異なるＭＶＤ誘導方法が適用される。一例において、図１２による実施形態の方法が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

まとめると、各方向の参照ピクチャタイプが異なる場合、ＭＶＤを誘導しないＭＭＶＤのＭＶＤ誘導過程が説明されている。

本文書による一実施形態において、ロングターム参照ピクチャを参照する全ての場合にＭＶＤが誘導されることではない。すなわち、Ｌ０、Ｌ１参照ピクチャが１つでもロングターム参照ピクチャであるときはＭＶＤを０に設定し、ショートターム参照ピクチャを有する場合にのみＭＶＤが誘導されることができる。以下の図面と表で具体的に説明する。

図１３は、本文書の一実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。図１３に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

図１３を参照すると、最優先条件（ＲｅｆＰｉｃＬ０！＝ＬＴＲＰ＆＆ＲｅｆＰｉｃＬ１！＝ＳＴＲＰ）に基づいて現在ピクチャ（又は、現在スライス、現在ブロック）がショートターム参照ピクチャのみを参照する場合にＭＭＶＤのためのＭＶＤが導出されることができる。一例において、図１３による実施形態の方法が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

本文書による一実施形態において、各方向の参照ピクチャタイプが異なる場合、ショートターム参照ピクチャを有する場合はＭＶＤを誘導し、ロングターム参照ピクチャを有する場合はＭＶＤが０に誘導される。以下の図面と表で具体的に説明する。

図１４は、本文書の一実施形態に係るＭＭＶＤのＭＶＤ誘導過程を示す。図１４に示された方法は、双方向予測が適用されるブロックに対するものであることができる。

前記図１４を参照すると、各方向の参照ピクチャタイプが異なる場合、現在ピクチャから距離の近い参照ピクチャ（ショートターム参照ピクチャ）を参照するとき、ＭｍｖｄＯｆｆｓｅｔが適用され、現在ピクチャから距離の遠い参照ピクチャ（ロングターム参照ピクチャ）を参照するとき、ＭＶＤは０値を有する。ここで、現在ピクチャに近いピクチャはショートターム参照ピクチャを有するとみなすことができるが、近いピクチャがロングターム参照ピクチャである場合は、ショートターム参照ピクチャを指すリストの動きベクトルにｍｍｖｄＯｆｆｓｅｔを適用することができる。

例えば、前記表１０に含まれた４つの段落は、前記図１４に含まれた順序図の一番下のブロック（内容）を順次置き換えることができる。

一例において、図１４による実施形態の方法が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

次の表は、本文書に含まれた実施形態間の比較表を示す。

表１２を参照すると、図１０ないし図１４による実施形態において説明されたＭＭＶＤのＭＶＤ導出のために、参照ピクチャタイプを考慮してオフセットを適用する方法間の比較が示される。表１２において、実施形態Ａは既存のＭＭＶＤに関するものであり、実施形態Ｂは図１０ないし図１２による実施形態を示し、実施形態Ｃは図１３による実施形態を示し、実施形態Ｄは図１４による実施形態を示す。

すなわち、図１０、図１１及び図１２による実施形態においては、両方向の参照ピクチャタイプが同一である場合にのみＭＶＤを誘導する方法、図１３による実施形態においては両方向ともショートターム参照ピクチャである場合にのみＭＶＤを誘導する方法について記述した。図１３による実施形態の場合、単方向予測に対してロングターム参照ピクチャであればＭＶＤを０に設定する。また、図１４による実施形態においては、両方向の参照ピクチャタイプが異なる場合、一方向にのみＭＶＤを誘導する方法について記述した。このような実施形態間の相違点は、本文書で説明される技術の様々な特徴を示し、前記特徴に基づいて本文書による実施形態が達成しようとする効果が実現できることが本明細書の属する技術分野の通常の知識を有する者により理解できる。

本文書による実施形態においては、参照ピクチャタイプがロングターム参照ピクチャである場合、別途のプロセスを有する。ロングターム参照ピクチャを含む場合、ＰＯＣ差分（ＰＯＣＤｉｆｆ）ベースのスケーリングあるいはミラーリングは性能向上に影響がないため、ショートターム参照ピクチャを有する方向のＭＶＤはＭｍｖｄＯｆｆｓｅｔ値が割り当てられ、ロングターム参照ピクチャを有する方向のＭＶＤは０値が割り当てられるようにする。一例において、本実施形態が適用される場合、本実施形態による標準文書の一部分は、次の表のように記述される。

他の例において、前記表１３の一部分は、次の表に置き換えることができる。表１４を参照すると、ＰＯＣＤｉｆｆではなく参照ピクチャタイプを基準としてＯｆｆｓｅｔが適用される。

また他の例において、前記表１３の一部分は、次の表に置き換えることができる。表１５を参照すると、参照ピクチャタイプを考慮せずに常にＬ０にＭｍｖｄＯｆｆｓｅｔを、Ｌ１に－ＭｍｖｄＯｆｆｓｅｔを設定することができる。

本文書の一実施形態によると、前述のＭＥＲＧＥモードにおいて使用されるＭＭＶＤに類似してインターモードでのＳＭＶＤが行われることができる。双方向予測をする場合、対称的ＭＶＤ導出の可否がエンコード装置からデコード装置にシグナリングされ、関連フラグ（例えば、ｓｙｍ＿ｍｖｄ＿ｆｌａｇ）が真（又は、その値が１）であるとき、第１方向ＭＶＤ（例えば、ＭＶＤＬ０）のミラーリングにより第２方向ＭＶＤ（例えば、ＭＶＤＬ１）が誘導される。この場合、第１方向ＭＶＤに対するスケーリングは行われない場合がある。

次の表は、デコードユニットのデコードに関連するシンタックスを示す。

前記表１６及び表１７を参照すると、ｉｎｔｅｒ＿ｐｒｅｄ＿ｉｄｃ＝＝ＰＲＥＤ＿ＢＩであり、そして、Ｌ０とＬ１の参照ピクチャが可用（ａｖａｉｌａｂｌｅ）である場合（例えば、ＲｅｆＩｄｘＳｙｍＬ０＞－１＆＆ＲｅｆＩｄｘＳｙｍＬ１＞－１）、ｓｙｍ＿ｍｖｄ＿ｆｌａｇがシグナリングされる。

次の表は、一例によるＭＭＶＤ参照インデックスのためのデコード手順を示す。

表１８を参照すると、Ｌ０とＬ１の参照ピクチャの可用性（ａｖａｉｌａｂｉｌｉｔｙ）導出手順が説明される。すなわち、Ｌ０参照ピクチャのうちフォワード方向（ｆｏｒｗａｒｄｄｉｒｅｃｔｉｏｎ）の参照ピクチャが存在する場合、現在ピクチャに最も近い参照ピクチャインデックスをＲｅｆＩｄｘＳｙｍＬ０に設定し、該当値はＬ０の参照インデックスに設定される。また、Ｌ１参照ピクチャのうちバックワード方向（ｂａｃｋｗａｒｄｄｉｒｅｃｔｉｏｎ）の参照ピクチャが存在する場合、現在ピクチャに最も近い参照ピクチャインデックスをＲｅｆＩｄｘＳｙｍＬ１に設定し、該当値はＬ１の参照インデックスに設定される。

以下の表１９は、他の例によるＭＭＶＤ参照インデックスのためのデコード手順を示す。

表１９を参照すると、図１０、図１１、図１２と共に説明された実施形態のようにＬ０又はＬ１参照ピクチャタイプが異なる場合、すなわち、ロングターム参照ピクチャとショートターム参照ピクチャが使用される場合、ＳＭＶＤを防ぐためにＳＭＶＤのための参照インデックス誘導の以後、Ｌ０とＬ１の参照ピクチャタイプが異なる場合、ＳＭＶＤを使用しないようにする（表１９の一番下の段落参照）。

本文書の一実施形態において、マージモードで使用されるＭＭＶＤに類似してインターモードではＳＭＶＤが適用されることができる。図１３とともに説明された実施形態のように、ロングターム参照ピクチャが使用される場合、ＳＭＶＤを防ぐために以下の表のようにＳＭＶＤのための参照インデックス誘導の過程でロングターム参照ピクチャを除外することができる。

本実施形態の他の例による次の表は、ＳＭＶＤのための参照ピクチャインデックス誘導以後にロングターム参照ピクチャを使用する場合、ＳＭＶＤを適用しないように処理する例を示す。

本文書の一実施形態において、ＴＭＶＰのｃｏｌＭＶ誘導過程で現在ピクチャの参照ピクチャタイプとコロケーテッドピクチャの参照ピクチャタイプが異なる場合、動きベクトルＭＶは０に設定されるが、ＭＭＶＤ、ＳＭＶＤの場合の誘導方法と異なるので、これを統一されるようにする。

現在ピクチャの参照ピクチャタイプがロングターム参照ピクチャであり、コロケーテッドピクチャの参照ピクチャタイプがロングターム参照ピクチャである場合も動きベクトルはコロケーテッド動きベクトル値をそのまま使用しているが、ＭＭＶＤ、ＳＭＶＤにおいて、この場合はＭＶを０に設定する。ここで、ＴＭＶＰも追加誘導なしにＭＶを０に設定する。

また、参照ピクチャタイプが異なっても、現在ピクチャとの距離が近いロングターム参照ピクチャが存在し得るので、これを考慮してＭＶを０に設定する代わりにスケーリングなしにｃｏｌＭＶをＭＶとして使用することができる。

以下の図面は、本明細書の具体的な一例を説明するために作成された。図面に記載された具体的な装置の名称や具体的な信号メッセージフィールドの名称は例示的に提示されたものであるので、本明細書の技術的特徴は、以下の図面に用いられた具体的な名称に制限されない。

図１５及び図１６は、本文書の実施形態（ら）によるビデオ／画像エンコード方法及び関連コンポーネントの一例を概略的に示す。図１５において開示された方法は、図２において開示されたエンコード装置により行われる。具体的には、例えば、図１５のＳ１５００ないしＳ１５５０は前記エンコード装置の予測部２２０により行われ、Ｓ１５６０は前記エンコード装置のレジデュアル処理部２３０により行われる。Ｓ１５７０は、前記エンコード装置のエントロピーエンコード部２４０により行われる。図１５において開示された方法は、本文書で前述した実施形態を含む。

図１５を参照すると、エンコード装置は、現在ブロックのためにインター予測モードを導出する（Ｓ１５００）。ここで、インター予測モードは、前述のマージモード、ＡＭＶＰモード（動きベクトル予測子候補を用いたモード）、ＭＭＶＤ、ＳＭＶＤを含む。

エンコード装置は、前記現在ブロックに対する参照ピクチャリストを導出する（Ｓ１５１０）。一例として、参照ピクチャリストは、参照ピクチャリスト０（または、Ｌ０、参照ピクチャリストＬ０）及び参照ピクチャリスト１（または、Ｌ１、参照ピクチャリストＬ１）を含むことができる。例えば、エンコード装置は、現在ピクチャに含まれたスライスのそれぞれに参照ピクチャリストを構成できる。

エンコード装置は、前記参照ピクチャリスト内に含まれた参照ピクチャの各々と現在ピクチャとの間のＰＯＣ差分を導出する（Ｓ１５２０）。一例として、現在ピクチャと、現在ピクチャからの以前参照ピクチャとの間のＰＯＣ差分は０より大きいことができる。他の例として、現在ピクチャと、現在ピクチャからの次の参照ピクチャとの間のＰＯＣ差分は０より小さいことができる。ただし、これは例示的なものである。

エンコード装置は、前記ＰＯＣ差分に基づいてＳＭＶＤのための参照ピクチャインデックスを含む動き情報を生成する（Ｓ１５３０）。エンコード装置は、ＳＭＶＤのための参照インデックスを導出できる。ＳＭＶＤのための参照インデックスは、ＳＭＶＤ適用のための参照ピクチャを指すことができる。ＳＭＶＤのための参照インデックスは、参照インデックスＬ０（ＲｅｆＩｄｘＳｕｍＬ０）及び参照インデックスＬ１（ＲｅｆＩｄｘＳｕｍＬ１）を含むことができる。

エンコード装置は、動きベクトル予測子候補リストを構成し、そして、前記リストに基づいて動きベクトル予測子を導出できる。エンコード装置は、対称的なＭＶＤと前記動きベクトル予測子とに基づいて動きベクトルを導出できる。動き情報は、前記動きベクトルを含むことができる。

エンコード装置は、前記動き情報に基づいて予測サンプルを生成する（Ｓ１５４０）。エンコード装置は、前記動き情報に含まれた動きベクトルと参照ピクチャインデックスに基づいて前記予測サンプルを生成する。例えば、前記予測サンプルは、前記参照ピクチャインデックスが指す前記参照ピクチャ内のブロック（又は、サンプル）のうち、前記動きベクトルにより指示されるブロック（又は、サンプル）に基づいて生成される。

エンコード装置は、前記インター予測モードを含む予測関連情報を生成する（Ｓ１５５０）。前記予測関連情報は、ＭＭＶＤに関する情報、ＳＭＶＤに関する情報などを含むことができる。

エンコード装置は、前記予測サンプルに基づいてレジデュアル情報を導出する（Ｓ１５６０）。具体的には、エンコード装置は、前記予測サンプルと原本サンプルに基づいてレジデュアルサンプルを導出することができる。エンコード装置は、前記レジデュアルサンプルに基づいてレジデュアル情報を導出することができる。

エンコード装置は、前記予測関連情報及び前記レジデュアル情報を含む画像／ビデオ情報をエンコードする（Ｓ１５７０）。エンコードされた画像／ビデオ情報は、ビットストリーム形態で出力されることができる。前記ビットストリームは、ネットワーク又は（デジタル）格納媒体を介してデコード装置に送信されることができる。

前記画像／ビデオ情報は、本文書の実施形態による様々な情報を含む。例えば、前記画像／ビデオ情報は、前述の表１ないし表２１のいずれか１つに開示された情報を含む。

一実施形態において、前記ＳＭＶＤのための参照ピクチャインデックスは、前記参照ピクチャリスト内に含まれたショートターム参照ピクチャに基づいて導出されることができる。

一実施形態において、前記画像情報は、ＭＶＤ（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅｓ）に関する情報を含むことができる。前記動き情報は、動きベクトルを含むことができる。前記ＭＶＤに関する情報に基づいてＬ０予測のための第１のＭＶＤが導出され得る。前記第１のＭＶＤに基づいてＬ１予測のための第２のＭＶＤが導出され得る。

一実施形態において、前記第２のＭＶＤの大きさは、前記第１のＭＶＤの大きさと同一であることができる。前記第２のＭＶＤの符号は、前記第１のＭＶＤの符号と反対であることができる。

一実施形態において、前記参照ピクチャリストは、Ｌ０予測のための参照ピクチャリストＬ０及びＬ１予測のための参照ピクチャリストＬ１を含むことができる。前記ＰＯＣ差分は、前記参照ピクチャリストＬ０に含まれた第１のショートターム参照ピクチャと前記現在ピクチャとの間の第１のＰＯＣ差分、及び前記参照ピクチャリストＬ１に含まれた第２のショートターム参照ピクチャと前記現在ピクチャとの間の第２のＰＯＣ差分を含むことができる。前記参照ピクチャインデックスは、前記第１のショートターム参照ピクチャを指す第１の参照ピクチャインデックス、及び前記第２のショートターム参照ピクチャを指す第２の参照ピクチャインデックスを含むことができる。前記第１の参照ピクチャインデックスは、前記第１のＰＯＣ差分に基づいて導出されることができる。前記第２の参照ピクチャインデックスは、前記第２のＰＯＣ差分に基づいて導出されることができる。

一実施形態において、前記第１のＰＯＣ差分は、前記第２のＰＯＣ差分と同一であることができる。

一実施形態において、前記参照ピクチャリストは、Ｌ０予測のための参照ピクチャリストＬ０を含むことができる。前記参照ピクチャリストＬ０は、第３のショートターム参照ピクチャ及び第４のショートターム参照ピクチャを含むことができる。前記ＰＯＣ差分は、前記第３のショートターム参照ピクチャと前記現在ピクチャとの間の第３のＰＯＣ差分、及び前記第４のショートターム参照ピクチャと前記現在ピクチャとの間の第４のＰＯＣ差分を含むことができる。前記第３及び第４のＰＯＣ差分の間の比較に基づいて前記第３のショートターム参照ピクチャが前記ＳＭＶＤのための参照ピクチャインデックスのうち１つで導出されることができる。

一実施形態において、前記第３のＰＯＣ差分が前記第４のＰＯＣ差分より小さい場合、前記第３のショートターム参照ピクチャが前記ＳＭＶＤのための参照ピクチャインデックスのうち１つで導出されることができる。

図１７及び図１８は、本文書の実施形態による画像／ビデオデコード方法及び関連コンポーネントの一例を概略的に示す。図１７において開示された方法は、図３において開示されたデコード装置により行われる。具体的に、例えば、図１７のＳ１７００は前記デコード装置のエントロピーデコード部３１０により行われ、Ｓ１７１０ないしＳ１７５０は前記デコード装置の予測部３３０により行われる。図１７において開示された方法は、本文書で前述した実施形態を含む。

図１７に示すように、デコード装置は画像／ビデオ情報を受信／取得する（Ｓ１７００）。デコード装置は、ビットストリームを介して前記画像／ビデオ情報を受信／取得することができる。前記画像／ビデオ情報は、予測関連情報（予測モード情報を含む）及びレジデュアル情報を含む。前記予測関連情報は、ｍＭＶＤに関する情報、ＳＭＶＤに関する情報などを含む。また、前記画像／ビデオ情報は、本文書の実施形態による様々な情報を含む。例えば、前記画像／ビデオ情報は、前述の表１ないし表２１の少なくとも１つに開示された情報を含む。

デコード装置は、前記予測関連情報に基づいて現在ブロックに対するインター予測モードを導出する（Ｓ１７１０）。ここで、インター予測モードは前述のマージモード、ＡＭＶＰモード（動きベクトル予測子候補を用いたモード）、ＭＭＶＤ、ＳＭＶＤを含む。

デコード装置は、前記現在ブロックに対する参照ピクチャリストを導出する（Ｓ１７２０）。一例として、参照ピクチャリストは、参照ピクチャリスト０（または、Ｌ０、参照ピクチャリストＬ０）及び参照ピクチャリスト１（または、Ｌ１、参照ピクチャリストＬ１）を含むことができる。例えば、デコード装置は、現在ピクチャに含まれたスライスのそれぞれに参照ピクチャリストを構成できる。

デコード装置は、前記参照ピクチャリスト内に含まれた参照ピクチャの各々と現在ピクチャとの間のＰＯＣ差分を導出する（Ｓ１７３０）。一例として、現在ピクチャと、現在ピクチャからの以前参照ピクチャとの間のＰＯＣ差分は０より大きいことができる。他の例として、現在ピクチャと、現在ピクチャからの次の参照ピクチャとの間のＰＯＣ差分は０より小さいことができる。ただし、これは例示的なものである。

デコード装置は、前記ＰＯＣ差分に基づいてＳＭＶＤのための参照ピクチャインデックスを含む動き情報を導出する（Ｓ１７４０）。デコード装置は、ＳＭＶＤのための参照インデックスを導出できる。ＳＭＶＤのための参照インデックスは、ＳＭＶＤ適用のための参照ピクチャを指すことができる。ＳＭＶＤのための参照インデックスは、参照インデックスＬ０（ＲｅｆＩｄｘＳｕｍＬ０）及び参照インデックスＬ１（ＲｅｆＩｄｘＳｕｍＬ１）を含むことができる。

デコード装置は、動きベクトル予測子候補リストを構成し、そして、前記リストに基づいて動きベクトル予測子を導出できる。デコード装置は、対称的なＭＶＤと前記動きベクトル予測子とに基づいて動きベクトルを導出できる。動き情報は、前記動きベクトルを含むことができる。

デコード装置は、前記動き情報に基づいて予測サンプルを生成する（Ｓ１７５０）。デコード装置は、前記動き情報に含まれた動きベクトルと参照ピクチャインデックスに基づいて前記予測サンプルを生成することができる。例えば、前記予測サンプルは、前記参照ピクチャインデックスが指す前記参照ピクチャ内のブロック（又は、サンプル）のうち前記動きベクトルにより指示されるブロック（又は、サンプル）に基づいて生成されることができる。

一実施形態において、前記画像情報は、ＭＶＤに関する情報を含むことができる。前記動き情報は、動きベクトルを含むことができる。前記ＭＶＤに関する情報に基づいてＬ０予測のための第１のＭＶＤが導出され得る。前記第１のＭＶＤに基づいてＬ１予測のための第２のＭＶＤが導出され得る。前記動きベクトルは、前記第１及び第２のＭＶＤに基づいて導出されることができる。

前述した実施形態において、方法は、一連のステップ又はブロックとしてフローチャートに基づいて説明されているが、該当実施形態は、ステップの順序に限定されるわけではなく、あるステップは、前述したところと異なるステップと異なる順序で、又は同時に発生し得る。また、当業者であれば、フローチャートに示されているステップが排他的ではなく、異なるステップが含まれるか、フローチャートの１つ又はそれ以上のステップが本文書の実施形態の範囲に影響を与えずに削除され得ることを理解することができる。

前述した本文書の実施形態に係る方法は、ソフトウェアの形態で具現されることができ、本文書に係るエンコード装置及び／又はデコード装置は、例えば、ＴＶ、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置等の画像処理を行う装置に含まれ得る。

本文書で、実施形態がソフトウェアで具現される際、前述した方法は、前述した機能を行うモジュール（過程、機能等）で具現されることができる。モジュールはメモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部又は外部にあってもよく、よく知られている様々な手段でプロセッサと連結されてもよい。プロセッサは、ＡＳＩＣ（ａｐｐｌｉｃａｔｉｏｎ－ｓｐｅｃｉｆｉｃｉｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）、他のチップセット、論理回路及び／又はデータ処理装置を含むことができる。メモリは、ＲＯＭ（ｒｅａｄ－ｏｎｌｙｍｅｍｏｒｙ）、ＲＡＭ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、フラッシュメモリ、メモリカード、格納媒体及び／又は他の格納装置を含むことができる。即ち、本文書で説明した実施形態は、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で具現されて行われ得る。例えば、各図面で示している機能ユニットは、コンピュータ、プロセッサ、マイクロプロセッサ、コントローラ又はチップ上で具現されて行われ得る。この場合、具現のための情報（ｅｘ．ｉｎｆｏｒｍａｔｉｏｎｏｎｉｎｓｔｒｕｃｔｉｏｎｓ）又はアルゴリズムがデジタル格納媒体に格納されることができる。

また、本文書の実施形態が適用されるデコード装置及びエンコード装置は、マルチメディア放送送受信装置、モバイル通信端末、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視用カメラ、ビデオ対話装置、ビデオ通信のようなリアルタイム通信装置、モバイルストリーミング装置、格納媒体、カムコーダ、オーダーメイド型ビデオ（ＶｏＤ）サービス提供装置、ＯＴＴビデオ（Ｏｖｅｒｔｈｅｔｏｐｖｉｄｅｏ）装置、インターネットストリーミングサービス提供装置、３次元（３Ｄ）ビデオ装置、ＶＲ（ｖｉｒｔｕａｌｒｅａｌｉｔｙ）装置、ＡＲ（ａｒｇｕｍｅｎｔｅｒｅａｌｉｔｙ）装置、画像電話ビデオ装置、運送手段端末（ｅｘ．車両（自律走行車両含む）端末、飛行機端末、船舶端末など）及び医療用ビデオ装置等に含まれ得、ビデオ信号又はデータ信号を処理するために使用され得る。例えば、ＯＴＴビデオ（Ｏｖｅｒｔｈｅｔｏｐｖｉｄｅｏ）装置としては、ゲームコンソール、ブルーレイプレーヤー、インターネットアクセスＴＶ、ホームシアターシステム、スマートフォン、タブレットＰＣ、ＤＶＲ（ＤｉｇｉｔａｌＶｉｄｅｏＲｅｃｏｄｅｒ）等を含み得る。

また、本文書の実施形態が適用される処理方法は、コンピュータで実行されるプログラムの形態で生産されることができ、コンピュータが読み取ることができる記録媒体に格納されることができる。本文書の実施形態に係るデータ構造を有するマルチメディアデータもまた、コンピュータが読み取ることができる記録媒体に格納されることができる。前記コンピュータが読み取ることができる記録媒体は、コンピュータで読み取られるデータが格納される全ての種類の格納装置及び分散格納装置を含む。前記コンピュータが読み取ることができる記録媒体は、例えば、ブルーレイディスク（ＢＤ）、汎用直列バス（ＵＳＢ）、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＲＡＭ、ＣＤ－ＲＯＭ、磁気テープ、フロッピディスク、及び光学的データ格納装置を含み得る。また、前記コンピュータが読み取ることができる記録媒体は、搬送波（例えば、インターネットを介した送信）の形態で具現されたメディアを含む。また、エンコード方法で生成されたビットストリームが、コンピュータが読み取られる記録媒体に格納されるか、有無線通信ネットワークを介して送信されることができる。

また、本文書の実施形態は、プログラムコードによるコンピュータプログラム製品で具現されることができ、前記プログラムコードは、本文書の実施形態によってコンピュータで実行されることができる。前記プログラムコードは、コンピュータによって読み取り可能なキャリア上に格納されることができる。

図１９は、本文書に開示された実施形態が適用されることができるコンテンツストリーミングシステムの例を示す。

図１９を参照すると、本文書の実施形態が適用されるコンテンツストリーミングシステムは、大きくエンコードサーバ、ストリーミングサーバ、ウェブサーバ、メディアストレージ、ユーザ装置、及びマルチメディア入力装置を含むことができる。

前記エンコードサーバは、スマートフォン、カメラ、カムコーダ等のようなマルチメディア入力装置から入力されたコンテンツをデジタルデータに圧縮してビットストリームを生成し、これを前記ストリーミングサーバに送信する役割をする。別の例として、スマートフォン、カメラ、カムコーダなどのようなマルチメディア入力装置がビットストリームを直接生成する場合、前記エンコードサーバは省略され得る。

前記ビットストリームは、本文書の実施形態が適用されるエンコード方法又はビットストリームの生成方法により生成されることができ、前記ストリーミングサーバは、前記ビットストリームを送信又は受信する過程で、一時的に前記ビットストリームを格納することができる。

前記ストリーミングサーバは、ウェブサーバを介してのユーザ要請に基づいてマルチメディアデータをユーザ装置に送信し、前記ウェブサーバは、ユーザにどのようなサービスがあるかを知らせる媒介体役割をする。ユーザが前記ウェブサーバに所望のサービスを要請すれば、前記ウェブサーバは、これをストリーミングサーバに伝達し、前記ストリーミングサーバは、ユーザにマルチメディアデータを送信する。このとき、前記コンテンツストリーミングシステムは、別の制御サーバを含むことができ、この場合、前記制御サーバは、前記コンテンツストリーミングシステム内の各装置間の命令／応答を制御する役割をする。

前記ストリーミングサーバは、メディア格納所及び／又はエンコードサーバからコンテンツを受信することができる。例えば、前記エンコードサーバからコンテンツを受信するようになる場合、前記コンテンツをリアルタイムに受信することができる。この場合、円滑なストリーミングサービスを提供するために、前記ストリーミングサーバは、前記ビットストリームを一定時間の間、格納することができる。

前記ユーザ装置の例では、携帯電話、スマートフォン（ｓｍａｒｔｐｈｏｎｅ）、ノートブックコンピュータ（ｌａｐｔｏｐｃｏｍｐｕｔｅｒ）、デジタル放送用端末機、ＰＤＡ（ｐｅｒｓｏｎａｌｄｉｇｉｔａｌａｓｓｉｓｔａｎｔｓ）、ＰＭＰ（ｐｏｒｔａｂｌｅｍｕｌｔｉｍｅｄｉａｐｌａｙｅｒ）、ナビゲーション、スレートＰＣ（ｓｌａｔｅＰＣ）、タブレットＰＣ（ｔａｂｌｅｔＰＣ）、ウルトラブック（ｕｌｔｒａｂｏｏｋ）、ウェアラブルデバイス（ｗｅａｒａｂｌｅｄｅｖｉｃｅ、例えば、ウォッチ型端末機（ｓｍａｒｔｗａｔｃｈ）、グラス型端末機（ｓｍａｒｔｇｌａｓｓ）、ＨＭＤ（ｈｅａｄｍｏｕｎｔｅｄｄｉｓｐｌａｙ））、デジタルＴＶ、デスクトップコンピュータ、デジタルサイニジなどがありうる。

前記コンテンツストリーミングシステム内の各サーバは、分散サーバとして運営されることができ、この場合、各サーバで受信するデータは、分散処理されることができる。

本明細書に記載された請求項は、多様な方式で組み合わせることができる。例えば、本明細書の方法請求項の技術的特徴が組み合わせられて装置として具現されることができ、本明細書の装置請求項の技術的特徴が組み合わせられて方法として具現されることができる。また、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて装置として具現されることができ、本明細書の方法請求項の技術的特徴と装置請求項の技術的特徴とが組み合わせられて方法として具現されることができる。

Claims

デコード装置によって行われる画像デコード方法において、
ビットストリームから予測関連情報を含む画像情報を取得するステップと、
前記予測関連情報に基づいて現在ブロックに対するインター予測モードを導出するステップと、
前記現在ブロックに対する参照ピクチャリストを導出するステップと、
前記参照ピクチャリスト内に含まれた参照ピクチャの各々と現在ピクチャとの間のＰＯＣ（ｐｉｃｔｕｒｅｏｒｄｅｒｃｏｕｎｔ）差分を導出するステップと、
前記ＰＯＣ差分に基づいてＳＭＶＤ（ｓｙｍｍｅｔｒｉｃｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅｓ）のための参照ピクチャインデックスを含む動き情報を導出するステップと、
前記動き情報に基づいて予測サンプルを生成するステップと、
を含み、
前記ＳＭＶＤのための参照ピクチャインデックスは、前記参照ピクチャリスト内に含まれたショートターム（ｓｈｏｒｔ－ｔｅｒｍ）参照ピクチャに基づいて導出されることを特徴とする画像デコード方法。
前記画像情報は、ＭＶＤ（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅｓ）に関する情報を含み、
前記動き情報は、動きベクトルを含み、
前記ＭＶＤに関する情報に基づいてＬ０予測のための第１のＭＶＤが導出され、
前記第１のＭＶＤに基づいてＬ１予測のための第２のＭＶＤが導出され、
前記動きベクトルは、前記第１及び第２のＭＶＤに基づいて導出されることを特徴とする請求項１に記載の画像デコード方法。
前記第２のＭＶＤの大きさは、前記第１のＭＶＤの大きさと同一であり、
前記第２のＭＶＤの符号は、前記第１のＭＶＤの符号と反対であることを特徴とする請求項２に記載の画像デコード方法。
前記参照ピクチャリストは、Ｌ０予測のための参照ピクチャリストＬ０及びＬ１予測のための参照ピクチャリストＬ１を含み、
前記ＰＯＣ差分は、前記参照ピクチャリストＬ０に含まれた第１のショートターム参照ピクチャと前記現在ピクチャとの間の第１のＰＯＣ差分、及び前記参照ピクチャリストＬ１に含まれた第２のショートターム参照ピクチャと前記現在ピクチャとの間の第２のＰＯＣ差分を含み、
前記参照ピクチャインデックスは、前記第１のショートターム参照ピクチャを指す第１の参照ピクチャインデックス、及び前記第２のショートターム参照ピクチャを指す第２の参照ピクチャインデックスを含み、
前記第１の参照ピクチャインデックスは、前記第１のＰＯＣ差分に基づいて導出され、
前記第２の参照ピクチャインデックスは、前記第２のＰＯＣ差分に基づいて導出されることを特徴とする請求項１に記載の画像デコード方法。
前記第１のＰＯＣ差分は、前記第２のＰＯＣ差分と同一であることを特徴とする請求項４に記載の画像デコード方法。
前記参照ピクチャリストは、Ｌ０予測のための参照ピクチャリストＬ０を含み、
前記参照ピクチャリストＬ０は、第３のショートターム参照ピクチャ及び第４のショートターム参照ピクチャを含み、
前記ＰＯＣ差分は、前記第３のショートターム参照ピクチャと前記現在ピクチャとの間の第３のＰＯＣ差分、及び前記第４のショートターム参照ピクチャと前記現在ピクチャとの間の第４のＰＯＣ差分を含み、
前記第３及び第４のＰＯＣ差分の間の比較に基づいて前記第３のショートターム参照ピクチャが前記ＳＭＶＤのための参照ピクチャインデックスのうち１つで導出されることを特徴とする請求項１に記載の画像デコード方法。
前記第３のＰＯＣ差分が前記第４のＰＯＣ差分より小さい場合、前記第３のショートターム参照ピクチャが前記ＳＭＶＤのための参照ピクチャインデックスのうち１つで導出されることを特徴とする請求項６に記載の画像デコード方法。
エンコード装置によって行われる画像エンコード方法において、
現在ブロックのためにインター予測モードを導出するステップと、
参照ピクチャを含む参照ピクチャリストを導出するステップと、
前記参照ピクチャリストに含まれる前記参照ピクチャと現在ピクチャとの間のＰＯＣ（ｐｉｃｔｕｒｅｏｒｄｅｒｃｏｕｎｔ）差分を導出するステップと、
前記ＰＯＣ差分に基づいてＳＭＶＤ（ｓｙｍｍｅｔｒｉｃｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅｓ）のための参照ピクチャインデックスを含む動き情報を導出するステップと、
前記動き情報に基づいて予測サンプルを生成するステップと、
前記インター予測モードを含む予測関連情報を生成するステップと、
前記予測サンプルに基づいてレジデュアル情報を導出するステップと、
前記予測関連情報及び前記レジデュアル情報を含む画像情報をエンコードするステップと、
を含み、
前記ＳＭＶＤのための参照ピクチャインデックスは、前記参照ピクチャリスト内に含まれたショートターム（ｓｈｏｒｔ－ｔｅｒｍ）参照ピクチャに基づいて導出されることを特徴とする画像エンコード方法。
前記画像情報は、ＭＶＤ（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅｓ）に関する情報を含み、
前記動き情報は、動きベクトルを含み、
前記ＭＶＤに関する情報は、Ｌ０予測のための第１のＭＶＤを表し、
前記第１のＭＶＤに基づいてＬ１予測のための第２のＭＶＤが導出されることを特徴とする請求項８に記載の画像エンコード方法。
前記第２のＭＶＤの大きさは、前記第１のＭＶＤの大きさと同一であり、
前記第２のＭＶＤの符号は、前記第１のＭＶＤの符号と反対であることを特徴とする請求項９に記載の画像エンコード方法。
前記参照ピクチャリストは、Ｌ０予測のための参照ピクチャリストＬ０及びＬ１予測のための参照ピクチャリストＬ１を含み、
前記ＰＯＣ差分は、前記参照ピクチャリストＬ０に含まれた第１のショートターム参照ピクチャと前記現在ピクチャとの間の第１のＰＯＣ差分、及び前記参照ピクチャリストＬ１に含まれた第２のショートターム参照ピクチャと前記現在ピクチャとの間の第２のＰＯＣ差分を含み、
前記参照ピクチャインデックスは、前記第１のショートターム参照ピクチャを指す第１の参照ピクチャインデックス、及び前記第２のショートターム参照ピクチャを指す第２の参照ピクチャインデックスを含み、
前記第１の参照ピクチャインデックスは、前記第１のＰＯＣ差分に基づいて導出され、
前記第２の参照ピクチャインデックスは、前記第２のＰＯＣ差分に基づいて導出されることを特徴とする請求項８に記載の画像エンコード方法。
前記第１のＰＯＣ差分は、前記第２のＰＯＣ差分と同一であることを特徴とする請求項１１に記載の画像エンコード方法。
前記参照ピクチャリストは、Ｌ０予測のための参照ピクチャリストＬ０を含み、
前記参照ピクチャリストＬ０は、第３のショートターム参照ピクチャ及び第４のショートターム参照ピクチャを含み、
前記ＰＯＣ差分は、前記第３のショートターム参照ピクチャと前記現在ピクチャとの間の第３のＰＯＣ差分、及び前記第４のショートターム参照ピクチャと前記現在ピクチャとの間の第４のＰＯＣ差分を含み、
前記第３及び第４のＰＯＣ差分の間の比較に基づいて前記第３のショートターム参照ピクチャが前記ＳＭＶＤのための参照ピクチャインデックスのうち１つで導出されることを特徴とする請求項８に記載の画像エンコード方法。
前記第３のＰＯＣ差分が前記第４のＰＯＣ差分より小さい場合、前記第３のショートターム参照ピクチャが前記ＳＭＶＤのための参照ピクチャインデックスのうち１つで導出されることを特徴とする請求項１２に記載の画像エンコード方法。
画像デコード装置が画像デコード方法を行うように引き起こすエンコードされた情報を格納するコンピュータ読み取り可能な格納媒体において、前記画像デコード方法は、
ビットストリームから予測関連情報を含む画像情報を取得するステップと、
前記予測関連情報に基づいて現在ブロックに対するインター予測モードを導出するステップと、
前記現在ブロックに対する参照ピクチャリストを導出するステップと、
前記参照ピクチャリスト内に含まれた参照ピクチャの各々と現在ピクチャとの間のＰＯＣ（ｐｉｃｔｕｒｅｏｒｄｅｒｃｏｕｎｔ）差分を導出するステップと、
前記ＰＯＣ差分に基づいてＳＭＶＤ（ｓｙｍｍｅｔｒｉｃｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅｓ）のための参照ピクチャインデックスを含む動き情報を導出するステップと、
前記動き情報に基づいて予測サンプルを生成するステップと、
を含み、
前記ＳＭＶＤのための参照ピクチャインデックスは、前記参照ピクチャリスト内に含まれたショートターム（ｓｈｏｒｔ－ｔｅｒｍ）参照ピクチャに基づいて導出されることを特徴とするコンピュータ読み取り可能な格納媒体。