JP7395771B2

JP7395771B2 - テンプレートマッチングベースのイントラ予測

Info

Publication number: JP7395771B2
Application number: JP2022565834A
Authority: JP
Inventors: リー，リン; リー，シャン; リウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2021-04-26
Filing date: 2022-04-26
Publication date: 2023-12-11
Anticipated expiration: 2042-04-26
Also published as: CN115529852A; EP4107949A1; KR20230003005A; JP2023527666A; US20220345692A1; US12015765B2; WO2022232784A1; EP4107949A4

Description

参照による組み込み
本願は、２０２２年４月２２日に出願された米国特許出願第１７／７２７，５７０号「ＴＥＭＰＬＡＴＥＭＡＴＣＨＩＮＧＩＮＴＲＡＰＲＥＤＩＣＴＩＯＮ」に対する優先権の利益を主張し、同出願は、２０２１年４月２６日に出願された米国仮出願第６３／１７９，８９１号「ＴｅｍｐｌａｔｅＭａｔｃｈｉｎｇＢａｓｅｄＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ」に対する優先権の利益を主張する。これらの出願の開示は、その全体が参照により本明細書に組み込まれる。

本開示は、ビデオコーディングに一般的に関連する実施形態を記載する。

本明細書で提供される背景の説明は、本開示の文脈を一般的に提示するためのものである。本発明者の仕事であって、それがこの背景セクションに記載されているという範囲において、さもなければ出願時に先行技術に当たらないかもしれない記載の側面は、本開示に対する先行技術として明示的にも暗示的にも認めない。

ビデオコーディング及びデコーディングは、モーション補正を伴うインター画像予測を用いて行うことができる。非圧縮デジタルビデオは、一連の画像を含むことができ、各画像は、例えば、１９２０×１０８０の輝度サンプル及び関連する色サンプルの空間寸法を有する。一連の画像は、例えば、６０画像／秒または６０Ｈｚの固定または可変の画像速度（非公式にはフレームレートとも知られる）を有することができ、非圧縮ビデオは、特定のビットレート要件を有する。例えば、サンプル当たり８ビットの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚのフレームレートでの１９２０ｘ１０８０の輝度サンプル解像度）は、１．５Ｇｂｉｔ／ｓに近い帯域幅を必要とする。このようなビデオの１時間は、６００Ｇバイトを超える記憶領域を必要とする。

ビデオコーディング及びデコーディングの１つの目的は、圧縮による入力ビデオ信号の冗長性の低減である。圧縮は、場合によっては、前述の帯域幅および／または記憶領域の要件を２桁以上低減する助けとなり得る。可逆圧縮および不可逆圧縮の両方、ならびにそれらの組み合わせを採用することができる。可逆圧縮とは、元の信号の正確なコピーを圧縮された元の信号から再構成することができる技法をいう。不可逆圧縮を使用する場合、再構成された信号は、元の信号と同一ではないかもしれないが、元の信号と再構成された信号との間の歪みは、再構成された信号を意図された用途に有用にするのに十分小さい。ビデオの場合、非可逆圧縮が広く用いられている。許容される歪みの量は、用途に依存し、例えば、特定の消費者ストリーミングアプリケーションのユーザは、テレビ配信アプリケーションのユーザよりも高い歪みを許容し得る。達成可能な圧縮比は、より高い許可できる／許容される歪みがより高い圧縮比をもたらすことができることを反映し得る。

ビデオエンコーダおよびデコーダは、例えば、モーション補償、変換、量子化、およびエントロピーコーディングを含むいくつかの広範なカテゴリからの技法を利用することができる。

ビデオコーデック技術は、イントラコーディングとして知られる技法を含むことができる。イントラコーディングでは、サンプル値は、以前に再構成された参照画像からのサンプルまたは他のデータを参照することなく表現される。いくつかのビデオコーデックでは、画像は空間的にサンプルのブロックに分割される。サンプルのブロックすべてがイントラモードでコーディングされる場合、その画像はイントラ画像であり得る。イントラ画像及び独立デコーダリフレッシュ画像のようなそれらの派生物は、デコーダ状態をリセットするために使用することができ、従って、コーディングされたビデオビットストリームおよびビデオセッションにおける最初の画像として、または静止画像として使用することができる。イントラブロックのサンプルにある変換を施すことができ、変換係数をエントロピーコーディングの前に量子化することができる。イントラ予測は、変換前の領域におけるサンプル値を最小化する技法であり得る。場合によっては、変換後のＤＣ値が小さく、ＡＣ係数が小さいほど、所与の量子化ステップにおいてエントロピーコーディング後のブロックを表すのに必要なサイズであるビット数が少なくなる。

例えばＭＰＥＧ－２世代コーディング技術から知られているような伝統的なイントラコーディングは、イントラ予測を使用しない。しかしながら、いくつかのより新しいビデオ圧縮技術は、例えば、空間的に隣接し、かつデコーディングの順番で先行するデータブロックのエンコーディングおよび／またはデコーディングの間に得られた、周囲のサンプルデータおよび／またはメタデータから試みる技法を含む。このような技法は、以下では「イントラ予測」技法と呼ばれる。少なくともいくつかのケースでは、イントラ予測は再構成中の現行画像からの参照データのみを使用し、参照画像からの参照データは使用しないことに留意されたい。

さまざまな形式のイントラ予測があり得る。所与のビデオコーディング技術において、２つ以上のそのような技法が使用され得る場合、使用中の技法は、イントラ予測モードでコーディングされ得る。場合によっては、モードは、サブモードおよび／またはパラメータを有することができ、それらは、個別にコーディングされ得るか、またはモードコードワードに含まれ得る。所与のモード、サブモード、および／またはパラメータの組み合わせに対してどのコードワードを使用するかは、イントラ予測によるコーディング効率利得に影響を及ぼし得るし、コードワードをビットストリームに変換するために使用されるエントロピーコーディング技術も同様である。

あるモードのイントラ予測は、Ｈ．２６４において導入され、Ｈ．２６５において改良され、共同探査モデル（ＪＥＭ）、汎用ビデオコーディング（ＶＶＣ）、およびベンチマークセット（ＢＭＳ）のようなより新しいコーディング技術においてさらに改良された。予測子ブロックは、既に利用可能なサンプルに属する隣接するサンプル値を使用して形成され得る。隣接するサンプルのサンプル値は、ある方向に従って予測子ブロックにコピーされる。使用中の方向への参照は、ビットストリームにコーディングされ得るし、またはそれ自体が予測されてもよい。

図１を参照すると、右下に示されているのは、Ｈ．２６５の３３個の可能な予測子方向（３５個のイントラモードの３３個の角度モードに対応する）から知られている９個の予測子方向のサブセットである。矢印が収束する点（１０１）は、予測されるサンプルを表す。矢印は、サンプルが予測される方向を表す。例えば、矢印（１０２）は、サンプル（１０１）が、水平から４５度の角度で、サンプルから右上に向かって予測されることを示す。同様に、矢印（１０３）は、サンプル（１０１）が、水平から２２．５度の角度で、サンプルから左下に向かって予測されることを示す。

依然として図１を参照すると、左上には、４×４サンプルの正方形ブロック（１０４）（破線の太線で示されている）が示されている。正方形ブロック（１０４）は、１６個のサンプルを含み、各サンプルは「Ｓ」、Ｙ次元におけるその位置（例えば、行インデックス）、およびＸ次元におけるその位置（例えば、列インデックス）でラベル付けされる。例えば、サンプルＳ２１は、Ｙ次元の（上から）２番目のサンプルおよびＸ次元の（左から）1番目のサンプルである。同様に、サンプルＳ４４は、ＹおよびＸ次元の両方においてブロック（１０４）の4番目のサンプルである。ブロックのサイズが４×４サンプルであるので、Ｓ４４は一番右下にある。さらに、同様の番号付けスキームに従った参照サンプルを示す。参照サンプルは、Ｒ、ブロック（１０４）に対するそのＹ位置（例えば、行インデックス）およびＸ位置（列インデックス）でラベル付けされる。Ｈ．２６４とＨ．２６５の両方で、予測サンプルは再構成中のブロックに隣接しているため、負の値を使用する必要はない。

イントラ画像予測は、シグナル伝達された予測方向に応じて、隣接するサンプルから参照サンプル値をコピーすることによって機能する。例えば、コーディングされたビデオビットストリームは、このブロックについて、矢印（１０２）と一致する予測方向を示す信号を含むと仮定する。すなわち、サンプルは、予測サンプルから右上へ、水平方向から４５度の角度で予測される。その場合、サンプルＳ４１、Ｓ３２、Ｓ２３、及びＳ１４は、同じ参照サンプルＲ０５から予測される。次いで、サンプルＳ４４は、参照サンプルＲ０８から予測される。

場合によっては、特に方向が４５度で均一に割り切れない場合には、参照サンプルを計算するために、複数の参照サンプルの値を、例えば内挿によって組み合わせることができる。

ビデオコーディング技術の発達に伴い、可能な方向の数が増加している。Ｈ．２６４（２００３年）では、９個の異なる方向を表すことができた。これは、Ｈ．２６５（２０１３年）で３３個に増加し、開示時のＪＥＭ／ＶＶＣ／ＢＭＳでは、最大６５個の方向をサポートできる。最も可能性の高い方向を同定するために実験が行われ、エントロピーコーディングにおけるある技術が、より可能性の低い方向に対するあるペナルティを受け入れて、少数のビットでそれらの可能性のある方向を表現するために使用される。さらに、方向それ自体が、時には、隣接する、すでにデコーディングされたブロックで使用された隣接する方向から予測することができる。

図２は、経時的に増加する予測方向の数を示すために、ＪＥＭによる６５個のイントラ予測方向を示す概略図（２０１）を示す。

方向を表すコーディングされたビデオビットストリーム中のイントラ予測方向ビットのマッピングは、ビデオコーディング技術によって異なることができ、例えば、予測方向の単純な直接マッピングからイントラ予測モード、コードワード、最も可能性の高いモードを含む複雑な適応スキーム、および類似の技法まで及ぶことができる。しかし、すべての場合で、ビデオコンテンツにおいて、他の特定の方向よりも統計的に起こりにくい特定の方向が存在し得る。ビデオ圧縮の目標は冗長性の低減であるので、良好に動作するビデオコーディング技術においては、より可能性の低い方向は、より可能性の高い方向よりも多くのビット数によって表されるだろう。

本開示の態様は、ビデオエンコーディング／デコーディングのための方法および装置を提供する。いくつかの例では、ビデオデコーディング装置は、受信回路および処理回路を含む。

本開示の一態様によれば、デコーダ内で実行されるデコーディング方法が提供される。この方法では、コーディング単位（ＣＵ）、テンプレート領域、および複数の参照領域のコーディングされた情報を、コーディングされたビデオビットストリームから受信することができる。コーディングされた情報は、テンプレートマッチングベースの多重参照線（ＭＲＬ）イントラ予測モードに基づいてＣＵが予測されるかどうかを示す第１の構文要素を含むことができる。テンプレート領域は、ＣＵに隣接することができ、複数の参照領域は、テンプレート領域に隣接することができる。ＣＵがテンプレートマッチングベースのＭＲＬイントラ予測モードに基づいて予測されることを示す第１の構文要素に応答して、複数のコスト値が、（ｉ）複数の参照領域の各々におけるサンプルに基づいてテンプレート領域のそれぞれの予測サンプルと、（ｉｉ）それぞれの予測サンプルに対応するテンプレート領域の再構成サンプルとの間で決定され得る。参照領域は、複数のコスト値に基づいて複数の参照領域から決定することができる。ＣＵのサンプルは、決定された参照領域のサンプルに基づいて再構成することができる。

いくつかの実施形態では、複数のコスト値の各々は、（ｉ）複数の参照領域のそれぞれの１つのサンプルに基づいて決定されるテンプレート領域のそれぞれの予測サンプルと、（ｉｉ）それぞれの予測サンプルに対応するテンプレート領域の再構成サンプルとの間の差に従って決定され得る。

いくつかの実施形態では、テンプレート領域は、（ｉ）ＣＵの上部の上の行内の上部サンプル、および（ｉｉ）ＣＵの左側部に隣接する列内の側部サンプルのうちの１つまたはそれらの組み合わせをさらに含むことができる。

いくつかの実施形態では、テンプレート領域は、側部サンプルの上に位置し、かつ上部サンプルに隣接するインターフェースサンプルをさらに含むことができる。

いくつかの実施形態では、複数の参照領域は、（ｉ）テンプレート領域の上部の上に位置する行部分と、テンプレート領域の左側部に隣接する列部分とを含む第１の参照領域と、（ｉｉ）第１の参照領域の行部分の上の行部分と、第１の参照領域の列部分に隣接する列部分とを含む第２の参照領域と、（ｉｉｉ）第２の参照領域の行部分の上の行部分と、第２の参照領域の列部分に隣接する列部分とを含む第３の参照領域とを含むことができる。

いくつかの実施形態では、テンプレート領域は、（ｉ）ＣＵの上部の上の第１行内の上部サンプル、および（ｉｉ）ＣＵの左側部に隣接する第１列内の側部サンプルのうちのまたはそれらの組み合わせをさらに含むことができる。テンプレート領域はまた、（ｉ）第１行の上の第２行内の上部サンプル、および（ｉｉ）第１列に沿った第２列内の側面サンプルのうちの１つまたはそれらの組み合わせを含むことができる。

いくつかの実施形態では、テンプレート領域は、第１列および第２列の側部サンプルの上に位置し、かつ第１行および第２行の上部サンプルの左のインターフェースサンプルをさらに含むことができる。

いくつかの実施形態では、複数の参照領域は、テンプレート領域の上部の上に位置する行部分とテンプレート領域の左側に隣接する列部分とを含む第１の参照領域と、第１の参照領域の行部分の上の行部分と第１の参照領域の列部分に隣接する列部分とを含む第２の参照領域とを含むことができる。

この方法では、第２の構文要素はコーディングされた情報からさらにデコーディングすることができ、ここで、第２の構文要素はＣＵがテンプレートベースのイントラモード導出（ＴＩＭＤ）モードに基づいてイントラ予測されるかどうかを示すことができる。ＴＩＭＤモードは、候補イントラ予測モードのセットを含むことができる。ＣＵがテンプレートマッチングベースのＭＲＬイントラ予測モードに基づいて予測されることを示す第１の構文要素、およびＣＵがＴＩＭＤモードに基づいてイントラ予測されることを示す第２の構文要素に応答して、テンプレート領域のそれぞれの予測サンプルは、（ｉ）複数の参照領域のそれぞれの１つの中に位置するサンプル、および（ｉｉ）候補イントラ予測モードのセット内のそれぞれの候補イントラ予測モードに基づいて決定され得る。複数のコスト値を決定することができる。複数のコスト値の各々は、テンプレート領域のそれぞれの予測サンプルと、それぞれの予測サンプルに対応するテンプレート領域の再構成サンプルとの間の絶対値変換された差の合計に従って決定され得る。複数のコスト値の中で最低のコスト値と関連する、複数の参照領域からの参照領域および候補イントラ予測モードのセットからのイントラ予測モードのペアを決定することができる。ＣＵのサンプルは、参照領域およびイントラ予測モードの決定されたペア内のサンプルに基づいて再構成することができる。

いくつかの実施形態では、ＣＵがＴＩＭＤモードに基づいてイントラ予測されないことを示す第２の構文要素に応答して、別のイントラコーディングモードに関連する構文要素をデコーディングすることができ、ここで、他のイントラコーディングモードは、行列ベースのイントラ予測（ＭＩＰ）および最確モード（ＭＰＭ）のうちの１つを含むことができる。

本開示の別の態様によれば、装置が提供される。装置は、処理回路を有する。処理回路は、ビデオコーディングのために開示された方法を実行するように構成される。

また、本開示の態様は、ビデオデコーディングのためにコンピュータによって実行されたときに、コンピュータにビデオデコーディングのための方法を実行させる命令を記憶する非一時的コンピュータ可読媒体を提供する。

開示された主題のさらなる特徴、性質、および種々の利点は、以下の詳細な説明および添付の図面からより明らかになるであろう：

イントラ予測モードの例示的サブセットの概略図である。例示的なイントラ予測方向の説明図である。一実施形態による通信システム（３００）の簡略ブロック図の概略図である。一実施形態による通信システム（４００）の簡略ブロック図の概略図である。一実施形態によるデコーダの簡略ブロック図の概略図である。一実施形態によるエンコーダの簡略ブロック図の概略図である。別の実施形態によるエンコーダのブロック図を示す。別の実施形態によるデコーダのブロック図を示す。一実施形態による多重参照線（ＭＲＬ）イントラ予測の概略図である。一実施形態によるテンプレートベースのイントラモード導出（ＴＩＭＤ）の概略図である。一実施形態による、テンプレートマッチングベースのＭＲＬの第１の例示的テンプレートを示す。一実施形態による、テンプレートマッチングベースのＭＲＬの第２の例示的テンプレートを示す。一実施形態による、テンプレートマッチングベースのＭＲＬの第３の例示的テンプレートを示す。一実施形態による、テンプレートマッチングベースのＭＲＬの第４の例示的テンプレートを示す。本開示のいくつかの実施形態に従う、例示的なデコーディングプロセスの概要を示すフローチャートを示す。本開示のいくつかの実施形態に従う、例示的なエンコーディングプロセスの概要を示すフローチャートを示す。一実施形態によるコンピュータシステムの概略図である。

図３は、本開示の一実施形態による通信システム（３００）の簡略化されたブロック図を示す。通信システム（３００）は、例えばネットワーク（３５０）を介して互いに通信することができる複数の端末デバイスを含む。例えば、通信システム（３００）は、ネットワーク（３５０）を介して相互接続された第１の対の端末デバイス（３１０）および（３２０）を含む。図３の例では、第１の対の端末デバイス（３１０）および（３２０）は、データの一方向送信を行う。例えば、端末デバイス（３１０）は、ネットワーク（３５０）を介して他方の端末デバイス（３２０）に送信するために、ビデオデータ（例えば、端末デバイス（３１０）によってキャプチャされたビデオ画像ストリーム）をコーディングすることができる。エンコーディングされたビデオデータは、１つ以上のコーディングされたビデオビットストリームの形態で送信することができる。端末デバイス（３２０）は、ネットワーク（３５０）からコーディングされたビデオデータを受信し、コーディングされたビデオデータをデコーディングして、ビデオ画像を復元し、復元されたビデオデータに従ってビデオ画像を表示することができる。一方向データ伝送は、媒体提供用途等において一般的である。

別の例では、通信システム（３００）は、例えば、ビデオ会議中に発生し得るコーディングされたビデオデータの双方向送信を行う第２の対の端末デバイス（３３０）および（３４０）を含む。データの双方向送信のために、例えば、端末デバイス（３３０）及び（３４０）の各端末デバイスは、ネットワーク（３５０）を介して端末デバイス（３３０）及び（３４０）の他方の端末デバイスに送信するために、ビデオデータ（例えば、端末デバイスによってキャプチャされるビデオ画像ストリーム）をコーディングすることができる。端末デバイス（３３０）及び（３４０）の各端末デバイスは、端末デバイス（３３０）及び（３４０）のうちの他方の端末デバイスによって送信されたコーディングされたビデオデータを受信し、コーディングされたビデオデータをデコーディングして、ビデオ画像を復元し、復元されたビデオデータに従って、アクセス可能なディスプレイデバイスにビデオ画像を表示することができる。

図３の例では、端末デバイス（３１０）、（３２０）、（３３０）および（３４０）は、サーバ、パーソナルコンピュータおよびスマートフォンとして図示することができるが、本開示の原理は、それに限定されない。本開示の実施形態は、ラップトップ・コンピュータ、タブレット・コンピュータ、メディア・プレーヤ、および／または専用のビデオ会議機器への適用を見出す。ネットワーク（３５０）は、例えば、有線および／または無線通信ネットワークを含む、端末デバイス（３１０）、（３２０）、（３３０）および（３４０）の間でコーディングされたビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク（３５０）は、回線交換および／またはパケット交換チャネル内のデータを交換することができる。代表的なネットワークには、通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび／またはインターネットが含まれる。本説明の目的のために、ネットワーク（３５０）のアーキテクチャおよびトポロジーは、以下に説明しない限り、本開示の動作には重要ではない。

図４は、開示された主題の適用例として、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置を示す。開示された主題は、例えば、ビデオ会議、デジタルＴＶ、圧縮ビデオのＣＤ、ＤＶＤ、メモリスティックなどを含むデジタル媒体上への記憶などを含む、ビデオが可能とする他の用途にも同様に適用可能である。

ストリーミングシステムは、キャプチャサブシステム（４１３）を含んでもよく、キャプチャサブシステム（４１３）は、ビデオソース（４０１）、例えば、デジタルカメラを含むことができ、例えば、非圧縮のビデオ画像のストリーム（４０２）を生成する。一例では、ビデオ画像のストリーム（４０２）は、デジタルカメラによって撮影されるサンプルを含む。エンコーディングされたビデオデータ（４０４）（またはコーディングされたビデオビットストリーム）と比較した場合の高データ量を強調するために太線として描かれたビデオ画像のストリーム（４０２）は、ビデオソース（４０１）に結合されたビデオエンコーダ（４０３）を含む電子デバイス（４２０）によって処理することができる。ビデオエンコーダ（４０３）は、ハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができ、以下により詳細に説明されるように、開示された主題の態様を可能にし、または実現する。エンコーディングされたビデオデータ（４０４）（またはエンコーディングされたビデオビットストリーム（４０４））は、ビデオ画像（４０２）のストリームと比較して、より低いデータ量を強調するために細線として描かれており、将来の使用のためにストリーミング・サーバ（４０５）に記憶することができる。図４のクライアント・サブシステム（４０６）および（４０８）のような１つ以上のストリーミング・クライアント・サブシステムは、ストリーミング・サーバ（４０５）にアクセスして、エンコーディングされたビデオデータ（４０４）のコピー（４０７）および（４０９）を取り出すことができる。クライアント・サブシステム（４０６）は、例えば、電子デバイス（４３０）内にビデオデコーダ（４１０）を含むことができる。ビデオデコーダ（４１０）は、エンコーディングされたビデオデータの入ってくるコピー（４０７）をデコーディングし、ディスプレイ（４１２）（例えば、ディスプレイスクリーン）または他のレンダリングデバイス（図示せず）上にレンダリングすることができるビデオ画像の出ていくストリーム（４１１）を生成する。いくつかのストリーミングシステムでは、エンコーディングされるビデオデータ（４０４）、（４０７）、および（４０９）（例えば、ビデオビットストリーム）は、特定のビデオコーディング／圧縮標準に従ってエンコーディングすることができる。これらの標準の例には、ＩＴＵ－Ｔ勧告Ｈ．２６５が含まれる。一例では、開発中のビデオコーディング標準は、汎用ビデオコーディング（ＶＶＣ）として非公式に知られている。開示された主題事項は、ＶＶＣの文脈で使用することができる。

電子デバイス（４２０）および（４３０）は、他の構成要素（図示せず）を含むことができることに留意されたい。例えば、電子デバイス（４２０）は、ビデオデコーダ（図示せず）も含むことができ、電子デバイス（４３０）は、ビデオエンコーダ（図示せず）も含むことができる。

図５は、本開示の一実施形態によるビデオデコーダ（５１０）のブロック図を示す。ビデオデコーダ（５１０）は、電子デバイス（５３０）に含まれ得る。電子デバイス（５３０）は、受信器（５３１）（例えば、受信回路）を含むことができる。ビデオデコーダ（５１０）は、図４の例におけるビデオデコーダ（４１０）に代わって使用することができる。

受信器（５３１）は、ビデオデコーダ（５１０）によってデコーディングされるべき１つ以上のコーディングされたビデオシーケンスを受信することができ、同一または別の実施形態では、一度に１つのコーディングされたビデオシーケンスを受信することができ、ここで、コーディングされたビデオシーケンスの各々のデコーディングは、他のコーディングされたビデオシーケンスから独立している。コーディングされたビデオシーケンスは、チャネル（５０１）から受信することができ、このチャネルは、エンコーディングされたビデオデータを記憶する記憶デバイスへのハードウェア／ソフトウェアリンクであってもよい。受信器（５３１）は、エンコーディングされたビデオデータを、他のデータ、例えば、コーディングされたオーディオデータおよび／または補助的なデータストリームと共に受信することができ、これらのデータは、それぞれの使用するエンティティ（図示せず）に転送することができる。受信器（５３１）は、コーディングされたビデオシーケンスを他のデータから分離することができる。ネットワークジッタに対抗するために、バッファメモリ（５１５）は、受信器（５３１）とエントロピーデコーダ／パーサ（５２０）（以下、「パーサ（５２０）」）との間に結合されてもよい。特定の用途では、バッファメモリ（５１５）は、ビデオデコーダ（５１０）の一部である。別の用途では、それは、ビデオデコーダ（５１０）の外側にあることができる（図示せず）。さらに別の用途では、例えばネットワークジッタに対抗するために、ビデオデコーダ（５１０）の外側にバッファメモリ（図示せず）があり、加えて、例えば再生タイミングを処理するために、ビデオデコーダ（５１０）の内側に別のバッファメモリ（５１５）があり得る。受信器（５３１）が、十分な帯域幅および制御可能性を有する記憶／転送デバイスから、または同期ネットワークからデータを受信している場合、バッファメモリ（５１５）は不要であるか、または小さくてもよい。インターネットのようなベストエフォート型パケットネットワークでの使用のために、バッファメモリ（５１５）は、必要とされ得るし、比較的大きく、有利に適応サイズであり得、ビデオデコーダ（５１０）の外側のオペレーティングシステムまたは類似の要素（図示せず）に少なくとも部分的に実装され得る。

ビデオデコーダ（５１０）は、コーディングされたビデオシーケンスからシンボル（５２１）を再構成するためのパーサ（５２０）を含んでもよい。これらのシンボルのカテゴリは、ビデオデコーダ（５１０）の動作を管理するために使用される情報、および、潜在的に、レンダリングデバイス（５１２）（例えば、ディスプレイスクリーン）のような、電子デバイス（５３０）に統合された部分ではないが、図５に示されたように、電子デバイス（５３０）に結合され得るレンダリングデバイスを制御する情報を含む。レンダリングデバイスの制御情報は、補足拡張情報（ＳＥＩメッセージ）またはビデオユーザビリティ情報（ＶＵＩ）パラメータセットフラグメント（図示せず）の形式であってもよい。パーサ（５２０）は、受信するコーディングされたビデオシーケンスを構文解析／エントロピーデコーディングすることができる。コーディングされたビデオシーケンスのコーディングは、ビデオコーディング技術または標準に従うことができ、可変長コーディング、ハフマンコーディング、コンテキスト感度を伴うまたは伴わない算術コーディングなどを含む種々の原理に従うことができる。パーサ（５２０）は、グループに対応する少なくとも１つのパラメータに基づいて、ビデオデコーダ内の画素のサブグループのうちの少なくとも１つについてのサブグループパラメータのセットを、コーディングされたビデオシーケンスから抽出することができる。サブグループは、画像のグループ（ＧＯＰ）、画像、タイル、スライス、マクロブロック、コーディング単位（ＣＵ）、ブロック、変換単位（ＴＵ）、予測単位（ＰＵ）などを含むことができる。パーサ（５２０）はまた、変換係数、量子化パラメータ値、モーションベクトルなどの情報もコーディングされたビデオシーケンスから抽出することができる。

パーサ（５２０）は、シンボル（５２１）を生成するように、バッファメモリ（５１５）から受信したビデオシーケンスに対してエントロピーデコーディング／構文解析動作を実行することができる。

シンボル（５２１）の再構成には、コーディングされたビデオ画像またはその部分(インター画像及びイントラ画像、インターブロック及びイントラブロックなど)の種類および他の要因に応じて、複数の異なるユニットが関与し得る。どのユニットがどのように関与するかは、コーディングされたビデオシーケンスからパーサ（５２０）によって構文解析されたサブグループ制御情報によって制御される。パーサ（５２０）と以下の複数のユニットとの間のこのようなサブグループ制御情報の流れは、明確性のために図示されていない。

すでに述べた機能ブロックを越えて、ビデオデコーダ（５１０）は、概念的に、以下に説明するように、いくつかの機能ユニットに細分化することができる。商業的制約の下で動作する実用的な実装では、これらのユニットの多くは互いに密接に相互作用し、少なくとも部分的に互いに統合することができる。しかしながら、開示された主題事項を説明するためには、以下の機能ユニットに概念的に細分化することが適切である。

第１のユニットは、スケーラ／逆変換ユニット（５５１）である。スケーラ／逆変換ユニット（５５１）は、量子化された変換係数、及び使用する変換、ブロックサイズ、量子化因数、量子化スケーリング行列などを含む制御情報をシンボル（５２１）としてパーサ（５２０）から受信する。スケーラ／逆変換ユニット（５５１）は、サンプル値を含むブロックを出力することができ、それらは集約装置（５５５）に入力され得る。

場合によっては、スケーラ／逆変換（５５１）の出力サンプルは、イントラコーディングされたブロック、すなわち、以前に再構成された画像からの予測情報を使用していないが、現行画像の以前に再構成された部分からの予測情報を使用することができるブロックに関連付けることができる。このような予測情報は、イントラ画像予測ユニット（５５２）によって提供され得る。場合によっては、イントラ画像予測ユニット（５５２）は、現行画像バッファ（５５８）から取り出された既に再構成された周囲の情報を使用して、再構成中のブロックの同じサイズおよび形状のブロックを生成する。現行画像バッファ（５５８）は、例えば、部分的に再構成された現行画像および／または完全に再構成された現行画像をバッファする。集約装置（５５５）は、場合によっては、サンプル毎に、イントラ予測ユニット（５５２）が生成した予測情報を、スケーラ／逆変換ユニット（５５１）によって提供されるような出力サンプル情報に追加する。

他の場合には、スケーラ／逆変換ユニット（５５１）の出力サンプルは、インターコーディングされ、潜在的にモーション補償されたブロックに関係することができる。このような場合、モーション補償予測ユニット（５５３）は、予測に使用されるサンプルを取り出すための参照画像メモリ（５５７）にアクセスすることができる。ブロックに関連するシンボル（５２１）に従って取り出されたサンプルをモーション補償した後、これらのサンプルは、出力サンプル情報を生成するために、集約装置（５５５）によって、スケーラ／逆変換ユニット（５５１）の出力（この場合は、残留サンプルまたは残留信号と呼ばれる）に追加され得る。モーション補償予測ユニット（５５３）が予測サンプルを取り出す参照画像メモリ（５５７）内のアドレスは、例えば、Ｘ、Ｙ、および参照画像コンポーネントを有することができるシンボル（５２１）の形態でモーション補償予測ユニット（５５３）に利用可能なモーションベクトルによって制御することができる。また、モーション補償は、サブサンプルの正確なモーションベクトルが使用されている場合の参照画像メモリ（５５７）から取り出されるサンプル値の補間、モーションベクトル予測メカニズムなども含むことができる。

集約装置（５５５）の出力サンプルは、ループフィルタユニット（５５６）内で種々のループフィルタ技術を受けることができる。ビデオ圧縮技術は、パーサ（５２０）からのシンボル（５２１）としてコーディングされたビデオシーケンス（コーディングされたビデオビットストリームとも呼ばれる）に含まれ、ループフィルタユニット（５５６）に利用可能になるパラメータによって制御されるループ内フィルタ技術を含み得るが、コーディングされた画像またはコーディングされたビデオシーケンスの（デコーディングの順番で）以前の部分のデコーディングの間に得られたメタ情報に敏感であると共に、以前に再構成されループフィルタされたサンプル値に敏感でもあり得る。

ループフィルタユニット（５５６）の出力は、レンダリングデバイス（５１２）に出力され、また将来のインター画像予測に使用するために参照画像メモリ（５５７）に記憶され得るサンプルストリームであり得る。

特定のコーディングされた画像は、いったん完全に再構成されると、将来の予測のための参照画像として使用することができる。例えば、いったん現行画像に対応するコーディングされた画像が完全に再構成され、コーディングされた画像が（例えば、パーサ（５２０）によって）参照画像として識別された場合、現行画像バッファ（５５８）は参照画像メモリ（５５７）の一部となり得、新しい現行画像バッファは、次のコーディングされた画像の再構成を開始する前に再割当てされ得る。

ビデオデコーダ（５１０）は、ＩＴＵ－ＴＲｅｃＨ．２６５．等の標準における所定のビデオ圧縮技術に従ってデコーディング動作を実行することができる。コーディングされたビデオシーケンスは、コーディングされたビデオシーケンスが、ビデオ圧縮技術または標準の構文およびビデオ圧縮技術または標準に文書化されているプロファイルの両方に従うという意味で、使用されているビデオ圧縮技術または標準によって指定された構文に適合し得る。具体的には、プロファイルは、特定のツールを、そのプロファイルの下で使用可能な唯一のツールとして、ビデオ圧縮技術または標準で使用可能なすべてのツールから選択することができる。また、コンプライアンスのために必要なことは、コーディングされたビデオシーケンスの複雑さが、ビデオ圧縮技術または標準のレベルによって定義される範囲内にあり得ることである。場合によっては、レベルは、最大画像サイズ、最大フレームレート、最大再構成サンプルレート（例えば、毎秒メガサンプルの単位で測定される）、最大参照画像サイズなどを制限する。レベルによって設定された制限値は、場合によっては、コーディングされたビデオシーケンス中に信号化された仮設参照デコーダ（ＨＲＤ）バッファ管理のためのＨＲＤの仕様とメタデータによってさらに制限され得る。

一実施形態では、受信器（５３１）は、エンコーディングされたビデオと共に追加の（冗長な）データを受信することができる。追加のデータは、コーディングされたビデオシーケンスの一部として含まれることがある。追加のデータは、データを適切にデコーディングするため、および／または元のビデオデータをより正確に再構成するために、ビデオデコーダ（５１０）によって使用されてもよい。追加のデータは、例えば、時間的、空間的、または信号雑音比（ＳＮＲ）エンハンスメント層、冗長スライス、冗長画像、前方誤り訂正コードなどの形態であり得る。

図６は、本開示の一実施形態によるビデオエンコーダ（６０３）のブロック図を示す。ビデオエンコーダ（６０３）は、電子デバイス（６２０）に含まれる。電子デバイス（６２０）は、送信器（６４０）（例えば、送信回路）を含む。ビデオエンコーダ（６０３）は、図４の例におけるビデオエンコーダ（４０３）に代わって使用することができる。

ビデオエンコーダ（６０３）は、ビデオエンコーダ（６０３）によってコーディングされるべきビデオサンプルをキャプチャすることができるビデオソース（６０１）（図６の例では電子デバイス（６２０）の一部ではない）からビデオサンプルを受け取ることができる。別の例では、ビデオソース（６０１）は、電子デバイス（６２０）の一部である。

ビデオソース（６０１）は、任意の適切なビット深さ（例えば、８ビット、１０ビット、１２ビット、．．．）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢ、．．．）、および任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であり得るデジタルビデオサンプルストリームの形態で、ビデオエンコーダ（６０３）によってコーディングされるべきソースビデオシーケンスを提供することができる。メディア配信システムにおいて、ビデオソース（６０１）は、事前に準備されたビデオを記憶する記憶デバイスであってもよい。ビデオ会議システムでは、ビデオソース（６０１）は、局所的な画像情報をビデオシーケンスとしてキャプチャするカメラであってもよい。ビデオデータは、順番に見たときにモーションを伝える複数の個々の画像として提供されてもよい。画像自体は、画素の空間アレイとして構成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて、１つ以上のサンプルを含むことができる。当業者は、画素とサンプルとの関係を容易に理解することができる。以下の説明は、サンプルに焦点を当てている。

一実施形態によれば、ビデオエンコーダ（６０３）は、ソースビデオシーケンスの画像を、リアルタイムで、またはアプリケーションによって要求される任意の他の時間制約下で、コーディングされたビデオシーケンス（６４３）にコーディングおよび圧縮することができる。適切なコーディング速度を実現することは、制御器（６５０）の一つの機能である。いくつかの実施形態において、制御器（６５０）は、以下に記載されるように他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。結合は、明確性のために描かれていない。制御器（６５０）によって設定されるパラメータは、レート制御関連パラメータ（画像スキップ、量子化器、レート歪み最適化技術のラムダ値、．．．）、画像サイズ、画像のグループ（ＧＯＰ）レイアウト、最大モーションベクトル探索範囲などを含むことができる。制御器（６５０）は、特定のシステム設計のために最適化されたビデオエンコーダ（６０３）に関連する他の適切な機能を有するように構成することができる。

いくつかの実施形態では、ビデオエンコーダ（６０３）は、コーディングループで動作するように構成される。過剰に単純化された説明として、一例において、コーディングループは、ソースコーダ（６３０）（例えば、コーディングされるべき入力画像に基づくシンボルストリームなどのシンボルおよび参照画像を生成する責任を負う）と、ビデオエンコーダ（６０３）に埋め込まれた（局所）デコーダ（６３３）とを含むことができる。デコーダ（６３３）は、シンボルを再構成して、（シンボルとコーディングされたビデオビットストリームとの間の任意の圧縮が、開示された主題において考慮されたビデオ圧縮技術において可逆であるように）（遠隔）デコーダも生成するであろう方法と同様の方法でサンプルデータを生成する。再構成されたサンプルストリーム（サンプルデータ）は、参照画像メモリ（６３４）に入力される。シンボルストリームのデコーディングが、デコーダ位置（局所または遠隔）に依存しないビットごとに正確な結果をもたらすので、参照画像メモリ（６３４）中の内容も、局所エンコーダと遠隔エンコーダとの間でビットごとに正確である。言い換えると、エンコーダの予測部分は、デコーダがデコーディング中に予測を使用するときに「見る」のとまったく同じサンプル値を参照画像サンプルとして「見る」。参照画像同期性のこの基本原理（および、例えば、チャネルエラーのために同期性を維持できないならば結果として生じるドリフト）は、いくつかの関連技術においても同様に使用される。

「局所」デコーダ（６３３）の動作は、ビデオデコーダ（５１０）のような「遠隔」デコーダの動作と同じであり得、これは、すでに図５に関連して上述されている。しかし、図５も簡単に参照すると、シンボルが利用可能であり、エントロピーコーダ（６４５）およびパーサ（５２０）によるコーディングされたビデオシーケンスへのシンボルのエンコーディング／デコーディングが可逆であり得るので、バッファメモリ（５１５）およびパーサ（５２０）を含むビデオデコーダ（５１０）のエントロピーデコーディング部分は、局所デコーダ（６３３）では完全には実装されない場合がある。

この時点で可能な観察からわかることは、デコーダ内に存在する構文解析／エントロピーデコーディングを除く任意のデコーダ技術も、対応するエンコーダ内に実質的に同一の機能的形態で存在する必要があることである。この理由のために、開示された主題はデコーダ動作に焦点を当てる。エンコーダ技術の記述は、包括的に記述されたデコーダ技術の逆であるため、省略することができる。特定の分野においてのみ、より詳細な記述が必要であり、以下に提供される。

動作中に、いくつかの例において、ソースコーダ（６３０）は、モーション補償された予測コーディングを実行することができ、それは、「参照画像」として指定されたビデオシーケンスからの１つ以上の以前にコーディングされた画像に関して入力画像を予測的にコーディングする。このようにして、コーディングエンジン（６３２）は、入力画像の画素ブロックと、入力画像に対する予測参照として選択され得る参照画像の画素ブロックとの間の差分をコーディングする。

局所ビデオデコーダ（６３３）は、ソースコーダ（６３０）によって生成されたシンボルに基づいて、参照画像として指定することができる画像のコーディングされたビデオデータをデコーディングすることができる。コーディングエンジン（６３２）の動作は、有利には、不可逆プロセスであり得る。コーディングされたビデオデータがビデオデコーダ（図６には示されない）でデコーディングされ得る場合、再構成されたビデオシーケンスは、典型的には、いくつかのエラーを伴うソースビデオシーケンスのレプリカであり得る。局所ビデオデコーダ（６３３）は、参照画像上でビデオデコーダによって実行され得るデコーディング過程を複製し、再構成された参照画像を参照画像キャッシュ（６３４）に記憶させることができる。このようにして、ビデオエンコーダ（６０３）は、遠端のビデオデコーダによって得られるであろう（伝送エラーのない）再構成された参照画像として、共通のコンテンツを有する局所的に再構成された参照画像のコピーを記憶することができる。

予測子（６３５）は、コーディングエンジン（６３２）について予測探索を実行することができる。すなわち、コーディングされるべき新しい画像に対して、予測子（６３５）は、参照画像メモリ（６３４）からサンプルデータ（候補参照画素ブロックとして）、または参照画像モーションベクトル、ブロック形状などのような特定のメタデータを検索することができ、これらは、新しい画像に対して適切な予測参照として役立つことができる。予測子（６３５）は、適切な予測参照を見出すために、サンプルブロック‐画素ブロック毎に動作し得る。場合によっては、予測子（６３５）によって得られた検索結果によって決定されるように、入力画像は、参照画像メモリ（６３４）に記憶された複数の参照画像から引き出された予測参照を有することができる。

制御器（６５０）は、例えば、ビデオデータをエンコーディングするために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ（６３０）のコーディング動作を管理してもよい。

前述のすべての機能ユニットの出力は、エントロピーコーダ（６４５）におけるエントロピーコーディングを受けることができる。エントロピーコーダ（６４５）は、ハフマンコーディング、可変長コーディング、算術コーディングなどの技術に従って可逆圧縮することによって、種々の機能ユニットによって生成されたシンボルをコーディングされたビデオシーケンスに変換する。

送信器（６４０）は、エントロピーコーダ（６４５）によって生成されるようにコーディングされたビデオシーケンスをバッファし、通信チャネル（６６０）を介した送信の準備を行うことができ、通信チャネル（６６０）は、エンコーディングされたビデオデータを記憶する記憶デバイスへのハードウェア／ソフトウェアリンクであってもよい。送信器（６４０）は、ビデオコーダ（６０３）からのコーディングされたビデオデータを、例えばコーディングされたオーディオデータおよび／または補助的なデータストリーム（ソースは図示せず）など、送信されるべき他のデータとマージすることができる。

制御器（６５０）は、ビデオエンコーダ（６０３）の動作を管理することができる。コーディングの間、制御器（６５０）は、コーディングされた画像の各々に、特定のコーディングされた画像タイプを割り当てることができ、これは、各画像に適用され得るコーディング技術に影響を及ぼし得る。例えば、画像は、しばしば、以下の画像タイプの１つとして割り当てられ得る：

イントラ画像（Ｉ画像）は、予測のソースとしてシーケンス内の他の画像を使用せずにコーディングおよびデコーディングされ得るものであり得る。いくつかのビデオコーデックは、例えば、独立デコーダリフレッシュ（「ＩＤＲ」）画像を含む、異なるタイプのイントラ画像を許容する。当業者は、Ｉ画像のこれらの変形例、並びにそれらのそれぞれの用途及び特徴を知っている。

予測画像（Ｐ画像）は、各ブロックのサンプル値を予測するために、最大で１つのモーションベクトルと参照インデックスを使用するイントラ予測またはインター予測を用いて、コーディングおよびデコーディングされ得るものであり得る。

双方向予測画像（Ｂ画像）は、各ブロックのサンプル値を予測するために、最大で２つのモーションベクトルと参照インデックスを使用するイントラ予測またはインター予測を用いて、コーディングおよびデコーディングされ得るものであり得る。同様に、多重予測画像は、１つのブロックの再構成のために、３つ以上の参照画像および関連するメタデータを使用することができる。

ソース画像は、通常、空間的に複数のサンプルブロック（例えば、各々４×４、８×８、４×８、または１６×１６サンプルのブロック）に分割され、ブロック毎にコーディングされる。ブロックは、ブロックのそれぞれの画像に適用されるコーディング割り当てによって決定されるように、他の（既にコーディングされた）ブロックを参照して予測的にコーディングされ得る。例えば、Ｉ画像のブロックは、非予測的にコーディングされてもよく、または、それらは、同じ画像の既にコーディングされたブロックを参照して予測的にコーディングされてもよい（空間的予測またはイントラ予測）。Ｐ画像の画素ブロックは、以前にコーディングされた一つの参照画像を参照して、空間的予測または時間的予測を介して予測的にコーディングされ得る。Ｂ画像のブロックは、１つまたは２つの以前にコーディングされた参照画像を参照して、空間的予測または時間的予測を介して予測的にコーディングされ得る。

ビデオエンコーダ（６０３）は、ＩＴＵ－ＴＲｅｃＨ．２６５などの所定のビデオコーディング技術または標準に従ってコーディング動作を実行することができる。その動作において、ビデオエンコーダ（６０３）は、入力ビデオシーケンスにおける時間的および空間的冗長性を利用する予測コーディング動作を含む、種々の圧縮動作を実行することができる。従って、コーディングされたビデオデータは、使用されているビデオコーディング技術または標準によって指定された構文に適合し得る。

一実施形態では、送信器（６４０）は、エンコーディングされたビデオと共に追加のデータを送信してもよい。ソースコーダ（６３０）は、コーディングされたビデオシーケンスの一部としてそのようなデータを含むことができる。追加のデータは、時間的／空間的／ＳＮＲ強調層、冗長画像およびスライス、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメントなどのような他の形式の冗長データを含んでもよい。

ビデオは、時間シーケンスにおいて複数のソース画像（ビデオ画像）としてキャプチャされ得る。イントラ画像予測（しばしば、イントラ予測と略される）は、与えられた画像における空間的相関を利用し、インター画像予測は、画像間の（時間的または他の）相関を利用する。一例では、現行画像と呼ばれるエンコーディング／デコーディング下の特定の画像は、ブロックに分割される。現行画像内のブロックが、ビデオ内の以前にコーディングされ、かつ、まだバッファに入れられた参照画像内の参照ブロックに類似する場合、現行画像内のブロックは、モーションベクトルと呼ばれるベクトルによってコーディングされ得る。モーションベクトルは、参照画像内の参照ブロックを指し、複数の参照画像が使用されている場合には、参照画像を識別する第３の寸法を有することができる。

いくつかの実施形態において、バイ予測技術は、インター画像予測において使用され得る。バイ予測技術によれば、ビデオ内の現行画像へのデコーディング順序で両方とも先行する（ただし、表示順序では、それぞれ過去および将来である可能性がある）第一参照画像および第二参照画像のような二つの参照画像が使用される。現行画像内のブロックは、第１の参照画像内の第１の参照ブロックを指す第１のモーションベクトルと、第２の参照画像内の第２の参照ブロックを指す第２のモーションベクトルとによってコーディングすることができる。ブロックは、第１の参照ブロックと第２の参照ブロックの組み合わせによって予測することができる。

さらに、コーディング効率を改善するために、インター画像予測にマージモード技法を使用することができる。

本開示のいくつかの実施形態によれば、インター画像予測およびイントラ画像予測などの予測は、ブロックの単位で実行される。例えば、ＨＥＶＣ標準によれば、ビデオ画像のシーケンス中の画像は、圧縮のためにコーディングツリー単位（ＣＴＵ）に分割され、画像中のＣＴＵは、６４×６４画素、３２×３２画素、または１６×１６画素のように、同じサイズを有する。一般に、ＣＴＵは、１つのルミナンスＣＴＢと２つのクロミナンスＣＴＢである３つのコーディングツリーブロック（ＣＴＢ）を含む。各ＣＴＵは、１つまたは複数のコーディング単位（ＣＵ）に再帰的に４木分割することができる。例えば、６４×６４画素のＣＴＵは、６４×６４画素の１ＣＵ、３２×３２画素の４ＣＵ、または１６×１６画素の１６ＣＵに分割することができる。例では、各ＣＵは、インター予測タイプまたはイントラ予測タイプのような、ＣＵの予測タイプを決定するために分析される。ＣＵは時間的および／または空間的予測可能性に依存して１つ以上の予測単位（ＰＵ）に分割される。一般に、各ＰＵはルミナンス予測ブロック（ＰＢ）と２つのクロミナンスＰＢを含む。一実施形態では、コーディング（エンコーディング／デコーディング）における予測操作は、予測ブロックのユニットにおいて実行される。予測ブロックの一例としてルミナンス予測ブロックを用いると、予測ブロックは、８×８画素、１６×１６画素、８×１６画素、１６×８画素など、画素に対する値（例えば、ルミナンス値）の行列を含む。

図７は、本開示の別の実施形態によるビデオエンコーダ（７０３）の図を示す。ビデオエンコーダ（７０３）は、ビデオ画像のシーケンス内の現行ビデオ画像内のサンプル値の処理ブロック（例えば、予測ブロック）を受信し、処理ブロックをコーディングされたビデオシーケンスの一部であるコーディングされた画像にエンコーディングするように構成される。一実施形態では、ビデオエンコーダ（７０３）は、図４の例のビデオエンコーダ（４０３）の代わりに使用される。

ＨＥＶＣの例では、ビデオエンコーダ（７０３）は、８×８サンプルの予測ブロックなどの処理ブロックに対するサンプル値の行列を受信する。ビデオエンコーダ（７０３）は、処理ブロックが、例えば、レート歪み最適化を使用して、イントラモード、インターモード、またはバイ予測モードを使用して、最良にコーディングされるかどうかを決定する。処理ブロックがイントラモードでコーディングされる場合、ビデオエンコーダ７０３は、処理ブロックをコーディングされた画像にエンコーディングするためにイントラ予測技術を使用してもよく、処理ブロックがインターモードまたはバイ予測モードでコーディングされる場合、ビデオエンコーダ７０３は、処理ブロックをコーディングされた画像にエンコーディングするために、それぞれ、インター予測技術またはバイ予測技術を使用してもよい。ある種のビデオコーディング技術では、マージモードは、予測子の外側のコーディングされたモーションベクトル成分の利益なしに、モーションベクトルが１つ以上のモーションベクトル予測子から導出されるインター画像予測サブモードであり得る。特定の他のビデオコーディング技術では、対象ブロックに適用可能なモーションベクトル成分が存在してもよい。一実施形態では、ビデオエンコーダ（７０３）は、処理ブロックのモードを決定するためのモード決定モジュール（図示せず）などの他の構成要素を含む。

図７の例では、ビデオエンコーダ（７０３）は、インターエンコーダ（７３０）、イントラエンコーダ（７２２）、残留演算器（７２３）、スイッチ（７２６）、残留エンコーダ（７２４）、一般制御器（７２１）、および図７に示すように一緒に結合されたエントロピーエンコーダ（７２５）を含む。

インターエンコーダ（７３０）は、現行ブロック（例えば、処理ブロック）のサンプルを受信し、ブロックを参照画像内の１つ以上の参照ブロックと比較し（例えば、前の画像および後の画像内のブロック）、インター予測情報（例えば、インターエンコーディング技術による冗長情報の記述、モーションベクトル、マージモード情報）を生成し、任意の適切な技術を使用して、インター予測情報に基づいてインター予測結果（例えば、予測されたブロック）を計算するように構成される。いくつかの例では、参照画像は、エンコーディングされたビデオ情報に基づいてデコーディングされたデコーディングされた参照画像である。

イントラエンコーダ（７２２）は、現行ブロック（例えば、処理ブロック）のサンプルを受信するように構成され、ある場合には、ブロックを、同じ画像で既にコーディングされているブロックと比較し、変換後に量子化された係数を生成し、また、ある場合には、イントラ予測情報（例えば、１つ以上のイントラコーディング技術に従ったイントラ予測方向情報）も生成する。一例では、イントラエンコーダ（７２２）は、また、同じ画像内のイントラ予測情報および参照ブロックに基づいてイントラ予測結果（例えば、予測されたブロック）を計算する。

一般制御器（７２１）は、一般制御データを決定し、一般制御データに基づいてビデオエンコーダ（７０３）の他の構成要素を制御するように構成される。一例では、一般制御器（７２１）は、ブロックのモードを決定し、そのモードに基づいてスイッチ（７２６）に制御信号を供給する。例えば、モードがイントラモードの場合、一般制御器（７２１）は、スイッチ（７２６）を制御して、残留演算器（７２３）が使用するイントラモードの結果を選択し、エントロピーエンコーダ（７２５）を制御して、イントラ予測情報を選択し、ビットストリームにイントラ予測情報を含めるように制御し、モードがインターモードの場合、一般制御器（７２１）は、スイッチ（７２６）を制御して、残留演算器（７２３）が使用するインター予測結果を選択し、エントロピーエンコーダ（７２５）を制御して、インター予測情報を選択し、ビットストリームにインター予測情報を含めるように制御する。

残留演算器（７２３）は、受信されたブロックと、イントラエンコーダ（７２２）またはインターエンコーダ（７３０）から選択された予測結果との間の差（残留データ）を計算するように構成される。残留エンコーダ（７２４）は、残留データに基づいて動作し、残留データをエンコーディングして変換係数を生成するように構成される。一例では、残留エンコーダ（７２４）は、残留データを空間ドメインから周波数ドメインに変換し、変換係数を生成するように構成される。次いで、変換係数は、量子化処理にかけられ、量子化された変換係数を得る。様々な実施形態では、ビデオエンコーダ（７０３）は、残留デコーダ（７２８）も含む。残留デコーダ（７２８）は、逆変換を実行し、デコーディングされた残留データを生成するように構成される。デコーディングされた残留データは、イントラエンコーダ（７２２）及びインターエンコーダ（７３０）によって適切に使用することができる。例えば、インターエンコーダ（７３０）は、デコーディングされた残留データおよびインター予測情報に基づいてデコーディングされたブロックを生成することができ、イントラエンコーダ（７２２）は、デコーディングされた残留データおよびイントラ予測情報に基づいてデコーディングされたブロックを生成することができる。デコーディングされたブロックは、デコーディングされた画像を生成するために適切に処理され、デコーディングされた画像は、メモリ回路（図示せず）内でバッファリングされ、いくつかの例では参照画像として使用され得る。

エントロピーエンコーダ（７２５）は、エンコーディングされたブロックを含むようにビットストリームをフォーマットするように構成される。エントロピーエンコーダ（７２５）は、ＨＥＶＣ標準などの適切な標準に従った種々の情報を含むように構成される。一例では、エントロピーエンコーダ（７２５）は、一般的な制御データ、選択された予測情報（例えば、イントラ予測情報またはインター予測情報）、残留情報、およびビットストリーム内の他の適切な情報を含むように構成される。開示された主題に従って、インターモードまたはバイ予測モードのいずれかのマージサブモードにおけるブロックをコーディングする場合、残留情報は存在しないことに留意されたい。

図８は、本開示の別の実施形態によるビデオデコーダ（８１０）の図を示す。ビデオデコーダ（８１０）は、コーディングされたビデオシーケンスの一部であるコーディングされた画像を受信し、コーディングされた画像をデコーディングして再構成された画像を生成するように構成される。一例では、ビデオデコーダ（８１０）は、図４の例のビデオデコーダ（４１０）の代わりに使用される。

図８の例では、ビデオデコーダ（８１０）は、エントロピーデコーダ（８７１）、インターデコーダ（８８０）、残留デコーダ（８７３）、再構成モジュール（８７４）、および図８に示すように一緒に結合されたイントラデコーダ（８７２）を含む。

エントロピーデコーダ（８７１）は、コーディングされた画像から、そのコーディングされた画像が構成される構文要素を表す特定のシンボルを再構成するように構成することができる。このようなシンボルは、例えば、ブロックがコーディングされるモード（例えば、イントラモード、インターモード、バイ予測モード、マージサブモードまたは別のサブモードにおける後者の２つ）、イントラデコーダ（８７２）またはインターデコーダ（８８０）によってそれぞれ予測のために使用される特定のサンプルまたはメタデータを識別することができる予測情報（例えば、イントラ予測情報またはインター予測情報）、例えば量子化された変換係数の形態の残留情報などを含むことができる。一例として、予測モードがインターまたはバイ予測モードである場合には、インター予測情報がインターデコーダ（８８０）に提供され、予測タイプがイントラ予測タイプである場合には、イントラ予測情報がイントラデコーダ（８７２）に提供される。残留情報は、逆量子化を受けることができ、残留デコーダ（８７３）に提供される。

インターデコーダ（８８０）は、インター予測情報を受信し、インター予測情報に基づいてインター予測結果を生成するように構成される。

イントラデコーダ（８７２）は、イントラ予測情報を受信し、イントラ予測情報に基づいて予測結果を生成するように構成される。

残留デコーダ（８７３）は、逆量子化された変換係数を抽出するために逆量子化を実行し、逆量子化された変換係数を処理して残留を周波数領域から空間領域に変換するように構成される。残留デコーダ（８７３）はまた、特定の制御情報（量子化パラメータ（ＱＰ）を含む）を必要とする場合があり、その情報は、エントロピーデコーダ（８７１）によって提供されてもよい（これは、低ボリューム制御情報のみであり得るので、図示されていないデータ経路）。

再構成モジュール（８７４）は、空間領域において、残留デコーダ（８７３）による出力としての残留と、（場合によっては、インターまたはイントラ予測モジュールによる出力としての）予測結果とを組み合わせて、再構成されたブロックを形成するように構成され、これは、再構成された画像の一部であってもよく、次に、再構成されたビデオの一部であってもよい。脱保護操作等の他の適切な操作を行って、視覚品質を改善することができることに留意されたい。

なお、ビデオエンコーダ（４０３）、（６０３）および（７０３）、ならびにビデオデコーダ（４１０）、（５１０）および（８１０）は、任意の適切な技術を用いて実現することができる。一実施形態では、ビデオエンコーダ（４０３）、（６０３）、および（７０３）、ならびにビデオデコーダ（４１０）、（５１０）、および（８１０）は、１つ以上の集積回路を使用して実現され得る。別の実施形態では、ビデオエンコーダ（４０３）、（６０３）、および（６０３）、ならびにビデオデコーダ（４１０）、（５１０）、および（８１０）は、ソフトウェア命令を実行する１つ以上のプロセッサを使用して実現することができる。

本開示は、テンプレートマッチングベースのイントラ予測に対する改良を含む。

ＩＴＵ－ＴＶＣＥＧ（Ｑ６／１６）及びＩＳＯ／ＩＥＣＭＰＥＧ（ＪＴＣ１／ＳＣ２９／ＷＧ１１）は、２０１３年（バージョン１）、２０１４年（バージョン２）、２０１５年（バージョン３）、２０１６年（バージョン４）にＨ．２６５／ＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）標準を公表した。２０１５年には、これら２つの標準組織が共同でＪＶＥＴ（ＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ）を結成し、ＨＥＶＣを越えた次のビデオコーディング標準の開発の可能性を探った。２０１８年４月、ＪＶＥＴはＨＥＶＣを超えた次世代ビデオコーディングの標準化プロセスを正式に開始した。この新しい標準はＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（ＶＶＣ）と命名され、ＪＶＥＴはＪｏｉｎｔＶｉｄｅｏＥｘｐｅｒｔＴｅａｍに改名された。２０２０年７月、Ｈ．２６６／ＶＶＣバージョン１が完成した。２０２１年１月に、ＶＶＣ能力を超えた圧縮の増大を調査するためにアドホックグループが設立された。

デコーダ側のイントラモード導出において、イントラモードは、ビットストリーム内でシグナル伝達される関連する構文要素を用いて導出することができ、又は、イントラモードは、ビットストリーム内でシグナル伝達される関連する構文要素を用いることなく、デコーダ側で導出することができる。デコーダ側でイントラモードを導出するための多くの方法があり、「デコーダ側イントラモード導出」という表現は、本開示に記載された例示的な方法に限定されない。

多重参照線（ＭＲＬ）イントラ予測は、イントラ予測のためにより多くの参照線（または参照領域）を用いることができる。図９に示されているように、４つの参照線の例が示されており、ここで、セグメントＡおよびＦのサンプルは、再構成された隣接するサンプルからフェッチされるのではなく、セグメントＢおよびＥからそれぞれ最も近いサンプルでパディング（または充填）される。ＨＥＶＣイントラ画像予測は、最も近い参照線（例えば、参照線０）を使用する。ＭＲＬでは、２つの追加ライン（例えば、参照ライン１および参照ライン３）を使用することができる。従って、これらの２つの追加ラインのサンプルをブロック単位（９０２）のイントラ予測に適用することができる。

選択された参照線のインデックス（例えば、ｍｒｌ＿ｉｄｘ）は、シグナル伝達され、ブロック単位（９０２）のためのイントラ予測子を生成するために使用され得る。０より大きい参照線インデックスについては、最確数モード（ＭＰＭ）リストに追加の参照線モードのみを含めることができ、残りのモード（例えば、ＭＰＭリストに含まれないイントラ予測モード）を含まないＭＰＭインデックスのみをシグナル伝達することができる。参照線インデックスは、イントラ予測モードの前にシグナル伝達することができ、平面及びＤＣモードは、ゼロでない参照線インデックスがシグナル伝達される場合には、イントラ予測モードから除外することができる。

テンプレートベースのイントラモード導出（ＴＩＭＤ）は、テンプレートとして現行ＣＵの参照サンプルを使用し、ＴＩＭＤに関連する候補イントラ予測モードのセットの中から最良のイントラモードを選択することができる。図１０に示されるように、現行ＣＵ（１００２）の隣接する再構成されたサンプルは、テンプレート（１００４）として使用され得る。テンプレート（１００４）内の再構成されたサンプルは、テンプレート（１００４）の予測サンプルと比較され得る。予測サンプルは、テンプレート（１００４）の参照サンプル（１００６）を使用して生成され得る。参照サンプル（１００６）は、テンプレート（１００４）の周囲の隣接する再構成サンプルであり得る。コスト関数を使用して、候補となるイントラ予測モードのそれぞれのセットに基づいて、テンプレート（１００４）内の予測サンプルと再構成されたサンプルとの間のコスト（または歪み）を計算することができる。最良のイントラ予測モードとして、最小コスト（または歪み）のイントラ予測モードを選択して、現行ＣＵ（１００２）をインター予測することができる。

表１は、ＴＩＭＤに関連する例示的なコーディング・プロセスを示す。表１に示されるように、ＤＩＭＤフラグ（例えばＤＩＭＤ＿ｆｌａｇ）が１でない（または真でない）時、ＴＩＭＤフラグ（例えばＴＩＭＤ＿ｆｌａｇ）はシグナル伝達可能である。ＤＩＭＤ＿ｆｌａｇが１の時、現行ＣＵ／ＰＵはＤＩＭＤを使用しており、ＩＳＰフラグ（例えば、ＩＳＰ＿ｆｌａｇ）は現行ＣＵ／ＰＵにＩＳＰが使用されているかどうかを見るために構文解析されることができる。ＤＩＭＤ＿ｆｌａｇが１でない場合、ＴＩＭＤ＿ｆｌａｇは構文解析される。ＴＩＭＤ＿ｆｌａｇが１の時、ＴＩＭＤは他のイントラコーディングツールを適用せずに現行ＣＵ／ＰＵに適用することができる（例えば、ＴＩＭＤが使用される時はＩＳＰは許可されない）。ＴＩＭＤ＿ｆｌａｇが１でない時、（ＭＩＰ、ＭＲＬ、ＭＰＭなど）関連の構文要素のような他のイントラコーディングツールがデコーダで構文解析できる。

本開示では、デコーダ側テンプレートマッチングベースのＭＲＬを適用することができる。テンプレートマッチングベースのＭＲＬは、テンプレートを使用して、現行ＣＵ／ＰＵの候補参照線の中から参照線（例えば、最良の参照線）を見つけることができ、参照線は、現行ＣＵ／ＰＵのイントラ予測のために使用することができる。現行ＣＵの参照インデックスは、ビットストリームでシグナル伝達される代わりに、テンプレートマッチングベースの方法で導出することができる。テンプレートの例は与えられ得るが、図１１Ａ～１１Ｄに限定されない。

一実施形態において、テンプレートは、図１１Ａおよび１１Ｂに示すように、１つの列および／または１つの行のみを含むことができる。従って、候補参照線は参照線１、２、及び３を含むことができる。例えば、図１１Ａにおいて、現行ＣＵ（１１０２）は、（ｉ）現行ＣＵ（１１０２）の上側の上の行における上部サンプル（１１０４Ａ）および（ｉｉ）現行ＣＵ（１１０２）の左側に隣接する列における側部サンプル（１１０４Ｂ）の１つまたは組み合わせを含むことができるテンプレートを有することができる。参照線１、２、および３内のサンプル（１１０６）を適用して、テンプレートの予測サンプルを生成することができる。図１１Ｂでは、現行ＣＵ（１１０２）のテンプレートはまた、側部サンプル１１０４Ｂの上方且つ上部サンプル１１０４Ａに隣接するインターフェースサンプル（１１０４Ｃ）も含むことができる。

図１１Ｃでは、現行ＣＵ（１１０２）のテンプレートは、複数の行における上部サンプルおよび複数の列における側部サンプルの１つまたは組み合わせ、例えば、（ｉ）現行ＣＵ（１１０２）の上側の上の第１の行における上部サンプル（１１０４Ａ）および第１の行の上の第２の行における上部サンプル（１１０４Ｄ）、ならびに（ｉｉ）現行ＣＵ（１１０２）の左側に隣接する第１の列における側部サンプル（１１０４Ｂ）および第１の列に沿った第２の列における側部サンプル（１１０４Ｅ）の１つまたは組み合わせを含んでもよい。従って、候補参照線は参照線２および３であり得る。参照線２および３内のサンプル（１１０６）を適用して、テンプレートの予測サンプルを生成することができる。図１１Ｄにおいて、テンプレートはまた、第１および第２の列の側部サンプル（１１０４Ｂ）および（１１０４Ｅ）の上方且つ第１および第２の行の上部サンプル（１１０４Ａ）および（１１０４Ｄ）の左方に配置されたインターフェースサンプル（１１０４Ｃ）も含むことができる。

各候補参照線に対して、テンプレートの予測サンプルを生成することができる。コスト関数を使用して、テンプレートの予測サンプルとテンプレートの予測サンプルに対応するテンプレートの再構成されたサンプルとの間のコストを計算することができる。例えば、絶対差の和（ＳＡＤ）または絶対変換差の和（ＳＡＴＤ）を、テンプレートの予測サンプルとテンプレートの予測サンプルに対応するテンプレートの再構成されたサンプルとの間で計算することができる。最小コスト（例えば、最小ＳＡＤ値または最小ＳＡＴＤ値）の参照線を、現行ＣＵ／ＰＵの参照線または最良参照線として選択することができる。従って、参照線内のサンプルは、現行ＣＵ／ＰＵをイントラ予測するために適用することができる。

テンプレートマッチングベースのＭＲＬの適用は、テンプレートマッチングベースのＭＲＬフラグ（例えば、ＭＲＬ＿ｆｌａｇ）のような、テンプレートマッチングベースのＭＲＬ情報によって示され得る。例えば、テンプレートマッチングベースのＭＲＬフラグの値が１の場合、現行ＣＵ／ＰＵがテンプレートマッチングベースのＭＲＬを使用することを示す。それ以外の、ＭＲＬ＿ｆｌａｇの値が１と異なる場合、テンプレートマッチングベースのＭＲＬは使用されない。

本開示において、テンプレートマッチングベースのＭＲＬは、別のテンプレートベースのモードと組み合わせることができる。例えば、図１０に記載したテンプレートマッチングベースのＭＲＬとＴＩＭＤの組み合わせを適用することができる。テンプレートマッチングベースのＭＲＬおよびＴＩＭＤの組み合わせについての例示的な擬似コードを表２に示すことができる。

表２に示すように、ＴＩＭＤフラグ（例えば、ＴＩＭＤ＿ｆｌａｇ）は、シグナル伝達され得る。ＴＩＭＤ＿ｆｌａｇが１の場合、現行ＣＵ／ＰＵがＴＩＭＤを使用していることを示す。さらに、テンプレートマッチングベースのＭＲＬフラグ（例えば、ＭＲＬ＿ｆｌａｇ）を解析して、テンプレートマッチングベースのＭＲＬが現行ＣＵ／ＰＵに使用されているかどうかを判定することができる。ＴＩＭＤ＿ｆｌａｇが１でない時、他の関連構文要素（例えば、ＭＩＰ、ＭＰＭなど）をデコーダで構文解析できる。

ＴＩＭＤ＿ｆｌａｇとＭＲＬ＿ｆｌａｇの両方が１に等しい場合、同じテンプレート（例えば、図１１Ａ～１１Ｄに示されているテンプレートのいずれか）を使用して、選択されたイントラモード（例えば、最良のイントラモード）と選択された参照線（例えば、最良の参照線）を決定することができる。したがって、ｓｅｌｅｃｔｅｄＩｎｔｒａＭｏｄｅ（例えば、ｂｅｓｔＩｎｔｒａＭｏｄｅ）とｓｅｌｅｃｔｅｄＲｅｆｅｒｅｎｅＬｉｎｅ（例えば、ｂｅｓｔＲｅｆｅｒｅｎｃｅＬｉｎｅ）のペアを得ることができる。使用されるイントラモードおよび参照線を決定するために、ＴＩＭＤに関連する候補イントラモードのセットおよび候補参照線（例えば、図１１Ａ～１１Ｄの参照線１～３）を通じて探索プロセスを行うことができる。ＳＡＴＤまたはＳＡＤを、候補イントラモードのセットの各々および候補参照線の各々について、テンプレートの予測サンプルとテンプレートの再構成されたサンプルとの間で計算することができる。従って、イントラモードと参照線のいくつかのペアを得ることができる。コストが最小のイントラモードと参照線のペアが現行ＣＵ／ＰＵについてのイントラモードと参照線のペアとして選択できる。その後、選択されたイントラモードと選択された参照線を使ってイントラ予測を行うことができる。

図１２は、本開示のいくつかの実施形態に従う例示的なデコーディングプロセス（１２００）の概要を示すフローチャートを示す。図１３は、本開示のいくつかの実施形態に従う例示的エンコーディングプロセス（１３００）の概要を示すフローチャートを示す。提案された方法は、別々に、または任意の順序で組み合わせて使用することができる。さらに、方法（または実施形態）、エンコーダ、およびデコーダの各々は、処理回路（例えば、１つ以上のプロセッサ、または１つ以上の集積回路）によって実現されてもよい。一例では、１つ以上のプロセッサは、一時的でないコンピュータ読取り可能媒体に記憶されたプログラムを実行する。

実施形態において、プロセス（例えば、（１２００）および（１３００））の任意の動作は、必要に応じて、任意の数または順序で結合または配置されてもよい。実施形態において、プロセス（例えば、（１２００）および（１３００））の動作のうちの２つ以上は、並行して実行されてもよい。

プロセス（例えば、（１２００）および（１３００））は、再構成中のブロックに対する予測ブロックを生成するために、ブロックの再構成および／またはエンコーディング中に使用することができる。様々な実施形態では、プロセス（例えば、（１２００）および（１３００）は、端末デバイス（２１０）、（２２０）、（２３０）および（２４０）中の処理回路、ビデオエンコーダ（３０３）の機能を実行する処理回路、ビデオデコーダ（３１０）の機能を実行する処理回路、ビデオデコーダ（４１０）の機能を実行する処理回路、ビデオエンコーダ（５０３）の機能を実行する処理回路などの処理回路によって実行される。いくつかの実施形態では、プロセス（例えば、（１２００）および（１３００））は、ソフトウェア命令で実現され、従って、処理回路がソフトウェア命令を実行すると、処理回路は、プロセス（例えば、（１２００）および（１３００））を実行する。

図１２に示すように、プロセス（１２００）は、（Ｓ１２０１）から開始し、次いで（Ｓ１２１０）に進むことができる。（Ｓ１２１０）において、コーディング単位（ＣＵ）、テンプレート領域、および複数の参照領域のコーディングされた情報を、コーディングされたビデオビットストリームから受信することができる。コーディングされた情報は、テンプレートマッチングベースの多重参照線（ＭＲＬ）イントラ予測モードに基づいてＣＵが予測されるかどうかを示す第１の構文要素を含むことができる。テンプレート領域は、ＣＵに隣接することができ、複数の参照領域は、テンプレート領域に隣接することができる。

（Ｓ１２２０）において、ＣＵがテンプレートマッチングベースのＭＲＬイントラ予測モードに基づいて予測されることを示す第１の構文要素に応答して、複数のコスト値が、（ｉ）複数の参照領域の各々におけるサンプルに基づくテンプレート領域の各々の予測サンプルと、（ｉｉ）各予測サンプルに対応するテンプレート領域の再構成されたサンプルとの間で決定され得る。

（Ｓ１２３０）において、参照領域は、複数のコスト値に基づいて複数の参照領域から決定され得る。

（Ｓ１２４０）において、ＣＵのサンプルは、決定された参照領域のサンプルに基づいて再構成され得る。

いくつかの実施形態では、複数のコスト値のそれぞれは、（ｉ）複数の参照領域のそれぞれの１つのサンプルに基づいて決定されるテンプレート領域のそれぞれの予測サンプルと、（ｉｉ）それぞれの予測サンプルに対応するテンプレート領域の再構成されたサンプルとの間の差に従って決定され得る。

いくつかの実施形態において、テンプレート領域は、（ｉ）ＣＵの上側の上の行における上部サンプル、および（ｉｉ）ＣＵの左側に隣接する列における側部サンプルの１つまたは組み合わせをさらに含むことができる。

いくつかの実施形態において、テンプレート領域は、側部サンプルの上方且つ上部サンプルに隣接して位置するインターフェースサンプルをさらに含むことができる。

いくつかの実施形態では、複数の参照領域は、（ｉ）テンプレート領域の上側の上に位置する行部分と、テンプレート領域の左側に隣接する列部分とを含む第１の参照領域と、（ｉｉ）第１の参照領域の行部分の上に位置する行部分と、第１の参照領域の列部分に隣接する列部分とを含む第２の参照領域と、（ｉｉｉ）第２の参照領域の行部分の上に位置する行部分と、第２の参照領域の列部分に隣接する列部分とを含む第３の参照領域とを含むことができる。

いくつかの実施形態において、テンプレート領域は、（ｉ）ＣＵの上側の上の第１の行における上部サンプル、および（ｉｉ）ＣＵの左側に隣接する第１の列における側部サンプルの１つまたは組み合わせをさらに含むことができる。テンプレート領域はまた、（ｉ）第１の行の上の第２の行における上部サンプル、および（ｉｉ）第１の列に沿った第２の列における側部サンプルの１つまたは組み合わせも含むことができる。

いくつかの実施形態において、テンプレート領域は、第１の列および第２の列の側部サンプルの上に、且つ第１の行および第２の行の上部サンプルの左に配置されたインターフェースサンプルをさらに含むことができる。

いくつかの実施形態では、複数の参照領域は、テンプレート領域の上側の上に位置する行部分と、テンプレート領域の左側に隣接する列部分とを含む第１の参照領域と、第１の参照領域の行部分の上に位置する行部分と、第１の参照領域の列部分に隣接する列部分とを含む第２の参照領域とを含むことができる。

プロセス（１２００）において、第２の構文要素は、さらに、コーディングされた情報からデコーディングされ得、ここで、第２の構文要素は、ＣＵがテンプレートベースのイントラモード導出（ＴＩＭＤ）モードに基づいてイントラ予測されるかどうかを示すことができる。ＴＩＭＤモードは、候補イントラ予測モードのセットを含むことができる。ＣＵがテンプレートマッチングベースのＭＲＬイントラ予測モードに基づいて予測されることを示す第１の構文要素、およびＣＵがＴＩＭＤモードに基づいてイントラ予測されることを示す第２の構文要素に応答して、テンプレート領域のそれぞれの予測サンプルは、（ｉ）複数の参照領域のそれぞれの１つに位置するサンプル、および（ｉｉ）候補イントラ予測モードのセットにおけるそれぞれの候補イントラ予測モードに基づいて決定され得る。複数のコスト値を決定することができる。複数のコスト値のそれぞれは、テンプレート領域のそれぞれの予測サンプルと、それぞれの予測サンプルに対応するテンプレート領域の再構成されたサンプルとの間の絶対変換された差の合計に従って決定され得る。複数の参照領域からの参照領域のペアと、候補のイントラ予測モードのセットからのイントラ予測モードとを決定することができ、それは、複数のコスト値の中で最低のコスト値と関連する。ＣＵのサンプルは、決定された参照領域のペア中のサンプルおよびイントラ予測モードに基づいて再構成することができる。

いくつかの実施形態において、ＣＵがＴＩＭＤモードに基づいてイントラ予測されていないことを示す第２の構文要素に応答して、他のイントラコーディングモードに関連する構文要素をデコーディングすることができ、他のイントラコーディングモードは行列ベースのイントラ予測（ＭＩＰ）およびＭＰＭの１つを含むことができる。

図１３に示すように、プロセス（１３００）は、（Ｓ１３０１）から開始して、次いで（Ｓ１３１０）に進むことができる。（Ｓ１３１０）において、複数のコスト値は、（ｉ）コーディングユニット（ＣＵ）の複数の参照領域の各々におけるサンプルに基づいた画像中のＣＵのテンプレート領域のそれぞれの予測サンプルと、（ｉｉ）それぞれの予測サンプルに対応するテンプレート領域の再構成されたサンプルとの間で決定され得る。テンプレート領域は、ＣＵに隣接することができ、複数の参照領域は、テンプレート領域に隣接することができる。

例えば、複数のコスト値のそれぞれは、複数の参照領域のそれぞれの１つにおけるサンプルに基づいて決定されたテンプレート領域のそれぞれの予測サンプルと、それぞれの予測サンプルに対応するテンプレート領域の再構成されたサンプルとの間の差に従って決定され得る。

（Ｓ１３２０）において、参照領域は、複数のコスト値に基づいて複数の参照領域から決定され得る。例えば、決定された参照領域は、複数のコスト値の中で最も低いコスト値と関連付けることができる。

（Ｓ１３３０）において、決定された参照領域およびテンプレート領域に基づいてテンプレートマッチングベースの多重参照線（ＭＲＬ）イントラ予測モードによってＣＵについての予測を行うことができる。

（Ｓ１３４０）では、ＣＵがテンプレートマッチングベースのＭＲＬイントラ予測モードに基づいてイントラ予測されているかどうかを示す第１の構文要素を生成することができる。

上述の技術は、コンピュータ読取可能な命令を用い、１つ以上のコンピュータ読取可能な媒体に物理的に記憶されるコンピュータソフトウェアとして実現することができる。例えば、図１４は、開示された主題の特定の実施形態を実施するのに適したコンピュータシステム（１４００）を示す。

コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、または類似のメカニズムの対象となり得る任意の適切な機械コードまたはコンピュータ言語を使用してコーディングされて、１つまたは複数のコンピュータ中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）などによって、直接的に、またはインタープリテーション、マイクロコード実行などを通して実行され得る命令を含むコードを作成することができる。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイス等を含む種々のタイプのコンピュータまたはその構成要素上で実行することができる。

コンピュータシステム（１４００）について図１４に示す構成要素は、本質的に例示的なものであり、本開示の実施形態を実現するコンピュータソフトウェアの使用範囲または機能性に関する制限を示唆することを意図するものではない。また、構成要素の構成は、コンピュータシステム（１４００）の例示的な実施形態に示される構成要素の任意の１つまたは組み合わせに関するいかなる従属性または要件も有するものとして解釈されてはならない。

コンピュータシステム（１４００）は、特定のヒューマンインターフェース入力デバイスを含んでもよい。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（例えば、キーストローク、スワイプ、データグローブ運動）、音声入力（例えば、音声、拍手）、視覚入力（例えば、ジェスチャ）、嗅覚入力（図示せず）を介して、一人または複数の人間ユーザによる入力に応答することができる。また、ヒューマンインターフェイスデバイスは、オーディオ（例えば、音声、音楽、周囲音）、画像（例えば、走査画像、静止画像カメラから得られる写真画像）、ビデオ（例えば、２次元ビデオ、立体ビデオを含む３次元ビデオ）のような、人間による意識的入力に必ずしも直接関係しない特定の媒体をキャプチャするために使用することができる。

入力ヒューマンインターフェースデバイスは、キーボード（１４０１）、マウス（１４０２）、トラックパッド（１４０３）、タッチスクリーン（１４１０）、データグローブ（図示せず）、ジョイスティック（１４０５）、マイクロホン（１４０６）、スキャナ（１４０７）、カメラ（１４０８）の１つ以上（それぞれの１つのみ図示）を含んでもよい。

コンピュータシステム（１４００）はまた、特定のヒューマンインターフェース出力デバイスを含んでもよい。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、および嗅覚／味覚を通して、１人または複数の人間ユーザの感覚を刺激することができる。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（１４１０）、データグローブ（図示せず）、またはジョイスティック（１４０５）による触覚フィードバックがあるが、入力デバイスとして働かない触覚フィードバックデバイスもある）、オーディオ出力デバイス（例えば、スピーカー（１４０９）、ヘッドフォン（図示せず））、視覚出力デバイス（例えば、ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含むスクリーン（１４１０）などであって、各々がタッチスクリーン入力能力を有する、または有さない、各々が触覚フィードバック能力を有する、または有さない、各々のうちの一部は、２次元視覚出力、または立体画像出力、仮想現実メガネ（図示せず）、ホログラフィックディスプレイおよびスモークタンク（図示せず）などの手段を通じて４次元以上の出力を出力することができるものもある）、およびプリンタ（図示せず）を含み得る。

コンピュータシステム（１４００）はまた、人間がアクセス可能な記憶デバイス、及び、ＣＤ／ＤＶＤまたは類似の媒体（１４２１）を有するＣＤ／ＤＶＤＲＯＭ／ＲＷを含む光媒体（１４２０）、サムドライブ（１４２２）、取り外し可能なハードドライブ又はソリッドステートドライブ（１４２３）、テープ及びフロッピーディスク（図示せず）のようなレガシー磁気媒体、セキュリティドングル（図示せず）のような特殊化されたＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイス等の関連媒体を含むこともできる。

当業者はまた、現在開示されている主題に関連して使用される用語「コンピュータ可読媒体」は、伝送媒体、搬送波、または他の過渡信号を包含しないことを理解すべきである。

コンピュータシステム（１４００）はまた、１つ以上の通信ネットワーク（１４５５）へのインターフェース（１４５４）を含むこともできる。ネットワークは、例えば、無線、有線、光であり得る。ネットワークは、さらに、局所、広域、大都市、車両および工業、リアルタイム、遅延耐性などであり得る。ネットワークの例としては、イーサネット、無線ＬＡＮ、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、および地上放送ＴＶを含む有線または無線の広域デジタルネットワーク、ＣＡＮＢｕｓを含む車両および産業などが挙げられる。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス（１４４９）に接続される外部ネットワークインターフェースアダプタ（例えば、コンピュータシステム（１４００）のＵＳＢポート）を必要とし、他のネットワークインターフェースアダプタは、一般に、以下に説明するシステムバスに接続されることによって、コンピュータシステム（１４００）のコアに統合される（例えば、ＰＣコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）。これらのネットワークのいずれかを使用して、コンピュータシステム（１４００）は、他のエンティティと通信することができる。このような通信は、単指向性、受信のみ（例えば、放送テレビ）、単指向性送信専用（例えば、特定のＣＡＮバスデバイスへのＣＡＮバス）、または、例えば、局所または広域デジタルネットワークを使用する他のコンピュータシステムへの双指向性であってもよい。特定のプロトコルおよびプロトコルスタックは、上述のように、それらのネットワークおよびネットワークインタフェースの各々で使用することができる。

前述のヒューマンインタフェースデバイス、人がアクセス可能な記憶デバイス、およびネットワークインタフェースは、コンピュータシステム（１４００）のコア（１４４０）に取り付けることができる。

コア（１４４０）は、１つ以上の中央処理ユニット（ＣＰＵ）（１４４１）、グラフィックス処理ユニット（ＧＰＵ）（１４４２）、フィールドプログラマブルゲートエリア（ＦＰＧＡ）（１４４３）の形式の特殊プログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ（１４４４）、グラフィックスアダプタ（１４５０）などを含むことができる。これらのデバイスは、読出し専用メモリ（ＲＯＭ）（１４４５）、ランダムアクセスメモリ（１４４６）、内部大容量記憶デバイス、例えば内部ユーザアクセス不可ハードドライブ、ＳＳＤ等（１４４７）と共に、システムバス（１４４８）を介して接続されてもよい。いくつかのコンピュータシステムでは、システムバス（１４４８）は、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にするために、１つまたは複数の物理プラグの形態でアクセス可能である。周辺デバイスは、コアのシステムバス（１４４８）に直接接続することも、周辺バス（１４４９）を介して接続することもできる。一例では、スクリーン（１４１０）は、グラフィックスアダプタ（１４５０）に接続され得る。周辺バスのアーキテクチャは、ＰＣＩ、ＵＳＢなどを含む。

ＣＰＵ（１４４１）、ＧＰＵ（１４４２）、ＦＰＧＡ（１４４３）、およびアクセラレータ（１４４４）は、組み合わせて、上述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（１４４５）またはＲＡＭ（１４４６）に記憶することができる。過渡的なデータは、ＲＡＭ（１４４６）に記憶することもでき、永久データは、例えば、内部大容量記憶デバイス（１４４７）に記憶することができる。１つ以上のＣＰＵ（１４４１）、ＧＰＵ（１４４２）、大容量記憶デバイス（１４４７）、ＲＯＭ（１４４５）、ＲＡＭ（１４４６）などと密接に関連付けることができるキャッシュメモリを使用することによって、メモリデバイスのいずれかへの高速記憶および検索を可能にすることができる。

コンピュータ読取可能媒体は、種々のコンピュータ実装された動作を実行するためのコンピュータコードをその上に有することができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであってもよく、またはそれらは、コンピュータソフトウェア技術に熟練した者に周知でかつ入手可能な種類のものであってもよい。

一例として、限定するものではなく、アーキテクチャ（１４００）を有するコンピュータシステム、具体的にはコア（１４４０）は、１つ以上の有形のコンピュータ可読媒体に具現化されたソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ等を含む）の結果としての機能性を提供することができる。そのようなコンピュータ読取可能媒体は、上述のようなユーザがアクセス可能な大容量記憶デバイスに関連する媒体であってもよいし、コア内部大容量記憶デバイス（１４４７）またはＲＯＭ（１４４５）のような非一時的な性質のコア（１４４０）の特定の記憶デバイスであってもよい。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア（１４４０）によって実行され得る。コンピュータ読取可能媒体は、特定のニーズに応じて、１つまたは複数のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア（１４４０）およびその中の具体的にプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、ＲＡＭ（１４４６）に記憶されたデータ構造を定義し、ソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を修正することを含む、本明細書に記載された特定のプロセスまたは特定の部分を実行させることができる。さらに、または代替として、コンピュータシステムは、回路（例えば、アクセラレータ（１４４４））内に配線された、または他の方法で具体化された論理の結果としての機能性を提供することができ、これは、本明細書に記載される特定のプロセスまたは特定のプロセスの特定の部分を実行するためのソフトウェアの代わりに、またはそれと共に動作することができる。ソフトウェアへの参照は、論理を含み、また、適切な場合には、その逆も可能である。コンピュータ読取り可能媒体への参照は、実行のためのソフトウェアを記憶する回路（集積回路（ＩＣ）のような）、実行のためのロジックを具体化する回路、または適切な場合にはその両方を含むことができる。本開示は、ハードウェアおよびソフトウェアの任意の適切な組み合わせを包含する。

付録Ａ：頭字語
ＪＥＭ：共同探査モデル
ＶＶＣ：汎用ビデオコーディング
ＢＭＳ：ベンチマークセット
ＭＶ：モーションベクトル
ＨＥＶＣ：高効率ビデオコーディング
ＳＥＩ：補足拡張情報
ＶＵＩ：ビデオ操作性情報
ＧＯＰ：画像のグループ
ＴＵ：変換単位、
ＰＵ：予測単位
ＣＴＵ：コーディングツリー単位
ＣＴＢ：コーディングツリーブロック
ＰＢ：予測ブロック
ＨＲＤ：仮設参照デコーダ
ＳＮＲ：信号雑音比
ＣＰＵ：中央処理ユニット
ＧＰＵ：グラフィックス処理ユニット
ＣＲＴ：ブラウン管
ＬＣＤ：液晶ディスプレイ
ＯＬＥＤ：有機発光ダイオード
ＣＤ：コンパクトディスク
ＤＶＤ：デジタルビデオディスク
ＲＯＭ：読み出し専用メモリ
ＲＡＭ：ランダムアクセスメモリ
ＡＳＩＣ：特定用途向け集積回路
ＰＬＤ：プログラマブルロジックデバイス
ＬＡＮ：局所エリアネットワーク
ＧＳＭ：移動通信のためのグローバルシステム
ＬＴＥ：長期的発展
ＣＡＮＢｕｓ：コントローラエリアネットワークバス
ＵＳＢ：ユニバーサルシリアルバス
ＰＣＩ：ペリフェラルコンポーネント相互接続
ＦＰＧＡ：フィールドプログラマブルゲートエリア
ＳＳＤ：ソリッドステートドライブ
ＩＣ：集積回路
ＣＵ：コーディング単位

本開示は、いくつかの例示的な実施形態を記載してきたが、本開示の範囲内にある変更、置換、および種々の代替等価物がある。したがって、当業者は、本明細書に明示的に示されていないか、または記載されていないが、本開示の原理を具体化し、従って、本開示の精神および範囲内にある多くのシステムおよび方法を考案することができることが理解されるであろう。

Claims

デコーダ内で実行されるデコーディングの方法であって、
コーディング単位（ＣＵ）、テンプレート領域、および複数の参照領域のコーディングされた情報をコーディングされたビデオビットストリームから受信するステップであって、前記コーディングされた情報は、テンプレートマッチングベースの多重参照線（ＭＲＬ）イントラ予測モードに基づいて前記ＣＵが予測されるかどうかを示す第１の構文要素を含み、前記テンプレート領域は、前記ＣＵに隣接し、前記複数の参照領域は、前記テンプレート領域に隣接する、ステップと、
前記テンプレートマッチングベースのＭＲＬイントラ予測モードに基づいて前記ＣＵが予測されることを示す第１の構文要素に応答して、（ｉ）前記複数の参照領域の各々の中のサンプルに基づく前記テンプレート領域のそれぞれの予測サンプルと、（ｉｉ）前記それぞれの予測サンプルに対応する前記テンプレート領域の再構成されたサンプルとの間の複数のコスト値を決定するステップと、
前記複数のコスト値に基づいて前記複数の参照領域から参照領域を決定するステップと、
前記決定された参照領域のサンプルに基づいて前記ＣＵのサンプルを再構成するステップと、を含む、方法。
前記複数のコスト値の各々は、（ｉ）前記複数の参照領域のそれぞれの１つの中の前記サンプルに基づいて決定される前記テンプレート領域の前記それぞれの予測サンプルと、（ｉｉ）前記それぞれの予測サンプルに対応する前記テンプレート領域の前記再構成されたサンプルとの間の差に従って決定される、請求項１に記載の方法。
前記テンプレート領域は、（ｉ）前記ＣＵの上側の上方の行内の上部サンプル、および（ｉｉ）前記ＣＵの左側に隣接する列内の側部サンプルのうちの１つまたはそれらの組み合わせをさらに含む、請求項１に記載の方法。
前記テンプレート領域は、前記側部サンプルの上方に位置し、且つ前記上部サンプルに隣接するインターフェースサンプルをさらに含む、請求項３に記載の方法。
前記複数の参照領域は、
前記テンプレート領域の上側の上方に位置する行部分と、前記テンプレート領域の左側に隣接する列部分とを含む第１の参照領域と、
前記第１の参照領域の前記行部分の上方の行部分と、前記第１の参照領域の前記列部分に隣接する列部分とを含む第２の参照領域と、
前記第２の参照領域の前記行部分の上方の行部分と、前記第２の参照領域の前記列部分に隣接する列部分とを含む第３の参照領域と、を含む、請求項４に記載の方法。
前記テンプレート領域は、（ｉ）前記ＣＵの上側の上方の第１の行内の上部サンプルおよび前記第１の行の上方の第２の行内の上部サンプルと、（ｉｉ）前記ＣＵの左側に隣接する第１の列内の側部サンプルおよび前記第１の列に沿った第２の列内の側部サンプルとのうちの１つまたはそれらの組み合わせをさらに含む、請求項１に記載の方法。
前記テンプレート領域は、前記第１および第２の列の前記側部サンプルの上方かつ前記第１および第２の行の前記上部サンプルの左方に位置するインターフェースサンプルをさらに含む、請求項６に記載の方法。
前記複数の参照領域は、
前記テンプレート領域の上側の上方に位置する行部分および前記テンプレート領域の左側に隣接する列部分を含む第１の参照領域と、
前記第１の参照領域の前記行部分の上方の行部分および前記第１の参照領域の前記列部分に隣接する列部分を含む第２の参照領域と、を含む、請求項７に記載の方法。
前記コーディングされた情報から第２の構文要素をデコーディングするステップであって、前記第２の構文要素は、前記ＣＵがテンプレートベースのイントラモード導出（ＴＩＭＤ）モードに基づいてイントラ予測されるかどうかを示し、前記ＴＩＭＤモードは、候補イントラ予測モードのセットを含む、ステップと、
前記ＣＵが前記テンプレートマッチングベースのＭＲＬイントラ予測モードに基づいて予測されることを示す前記第１の構文要素、および前記ＣＵが前記ＴＩＭＤモードに基づいてイントラ予測されることを示す第２の構文要素に応答して、（ｉ）前記複数の参照領域のそれぞれの１つの中に位置する前記サンプル、および（ｉｉ）前記候補イントラ予測モードのセット内のそれぞれの候補イントラ予測モードに基づいて前記テンプレート領域の前記それぞれの予測サンプルを決定するステップと、
前記複数のコスト値を決定するステップであって、前記複数のコスト値の各々は、前記テンプレート領域の前記それぞれの予測サンプルと、前記それぞれの予測サンプルに対応する前記テンプレート領域の前記再構成されたサンプルとの間の絶対値変換された差の合計に従って決定される、ステップと、
前記複数のコスト値の中で最低のコスト値と関連する、前記複数の参照領域からの参照領域および前記候補イントラ予測モードのセットからのイントラ予測モードのペアを決定するステップと、
前記参照領域および前記イントラ予測モードの前記決定されたペア内のサンプルに基づいて前記ＣＵの前記サンプルを再構成するステップと、をさらに含む、請求項１に記載の方法。
前記ＣＵが前記ＴＩＭＤモードに基づいてイントラ予測されないことを示す前記第２の構文要素に応答して、別のイントラコーディングモードに関連する構文要素をデコーディングするステップであって、前記別のイントラコーディングモードは、行列ベースのイントラ予測（ＭＩＰ）および最確モード（ＭＰＭ）のうちの１つを含む、ステップをさらに含む、請求項９に記載の方法。
ビデオデコーディングのための装置であって、請求項１～１０のいずれか１項に記載の方法を実行するように構成された処理回路を含む、装置。
少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサに請求項１～１０のいずれか１項に記載の方法を行わせる命令を含むコンピュータプログラム。
エンコーダ内で実行されるエンコーディングの方法であって、
（ｉ）コーディングユニット（ＣＵ）の複数の参照領域の各々におけるサンプルに基づいた画像中のＣＵのテンプレート領域のそれぞれの予測サンプルと、（ｉｉ）前記それぞれの予測サンプルに対応する前記テンプレート領域の再構成されたサンプルとの間の複数のコスト値を決定するステップであって、前記テンプレート領域は、前記ＣＵに隣接し、前記複数の参照領域は、前記テンプレート領域に隣接する、ステップと、
前記複数のコスト値に基づいて前記複数の参照領域から参照領域を決定するステップと、
前記決定された参照領域および前記テンプレート領域に基づいてテンプレートマッチングベースの多重参照線（ＭＲＬ）イントラ予測モードによって前記ＣＵについての予測を行うステップと、
前記ＣＵが前記テンプレートマッチングベースのＭＲＬイントラ予測モードに基づいてイントラ予測されているかどうかを示す第１の構文要素を生成するステップと、を含む、方法。