JP2023515175A

JP2023515175A - シグナリングスライスヘッダシンタックス要素を簡略化するためのエンコーダ、デコーダおよび対応する方法

Info

Publication number: JP2023515175A
Application number: JP2022551419A
Authority: JP
Inventors: エセンリク、セミ; ワン、ビャオ; メハーコトラ、アナンド; アレクサンドロヴナアルシナ、エレナ
Original assignee: ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date: 2020-02-28
Filing date: 2021-03-01
Publication date: 2023-04-12
Also published as: EP4101168A1; MX2022010698A; BR112022016900A2; EP4101168A4; US11729391B2; US20220210422A1; CN115152218A; WO2021170132A1; KR20220143943A; CA3173266A1; US20230291904A1; AU2021226551A1

Abstract

デコーディングデバイスによって実装される、ビデオビットストリームから画像をデコードする方法であって、前記ビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記方法は、条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータを取得する段階であって、前記条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、段階と、前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築する段階とを備える、方法。

Description

本願（開示）の実施形態は、概して、画像処理分野、より具体的には、シグナリングスライスヘッダシンタックス要素を簡略化することに関する。

ビデオコーディング（ビデオエンコーディングおよびデコーディング）は、例えば、放送デジタルＴＶ、インターネットおよびモバイルネットワークを介したビデオ送信、またはビデオチャット、ビデオ会議、ＤＶＤおよびブルーレイディスク、ビデオコンテンツの取得および編集システム、セキュリティアプリケーションのカムコーダー等のリアルタイムの会話型アプリケーションといった、広範なデジタルビデオアプリケーションで使用される。

比較的短いビデオを示すのであっても、必要とされるビデオデータの量は、かなりのものであり得、その結果、限定的な帯域幅容量を有する通信ネットワークを介してデータがストリームされるかまたは別様に通信されることになる場合に困難が生じる場合がある。したがって、ビデオデータは一般に、現代の遠隔通信ネットワークを介して通信される前に圧縮される。ビデオのサイズは、メモリリソースが限定的である場合があるので、ビデオがストレージデバイス上に格納される場合にも問題となり得る。ビデオ圧縮デバイスは、しばしば、ソースにおけるソフトウェアおよび／またはハードウェアを使用して、送信または格納の前にビデオデータをコードし、それによりデジタルビデオイメージを表現するのに必要なデータの量を低減させる。その後、圧縮データは、デスティネーションにおいて、ビデオデータをデコードするビデオ圧縮解除デバイスによって受信される。ネットワークリソースが限られており、より高いビデオ品質への要求がますます高まっているため、画質をほとんどまたはまったく犠牲にすることなく圧縮率を改善する改善された圧縮および圧縮解除技術が望ましい。

本開示の実施形態は、独立請求項に記載のエンコードおよびデコードのための装置および方法を提供する。

本発明は、以下を提供する。

デコーディングデバイスによって実装される、ビデオビットストリームから画像をデコードする方法であって、ビットストリームは現在のスライスのスライスヘッダと現在のスライスを表すデータとを含み、当該方法は、条件が満たされた場合にスライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータ（例えば、ｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１）を取得する段階であって、条件は、現在のスライスのスライスアドレス（例えば、ｓｌｉｃｅ＿ａｄｄｒｅｓｓ）が、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、段階と、現在のスライス内のタイルの数と現在のスライスを表すデータとを使用して現在のスライスを再構築する段階とを含む。

当該方法では、上述のように、現在のスライスのスライスアドレスが画像内の最後のタイルのアドレスであることは、画像内のタイルの数から現在のスライスのスライスアドレスを引いた値が１に等しいと決定することを含み得る。

当該方法では、上述のように、現在のスライスのスライスアドレスが画像内の最後のタイルのアドレスでないことは、画像（例えば、ＮｕｍＴｉｌｅｓＩｎＰｉｃ）内のタイルの数から現在のスライスのスライスアドレスを引いた値が１より大きいと決定することを含み得る。

したがって、本発明によると、スライスヘッダにおける画像ヘッダ構造の存在は、スライスアドレスとスライスインジケーション内のタイルの数との存在を制御するのに使用され得る。ある画像内に単一のスライスが存在する場合、スライスアドレスは、当該画像内の第１のタイルに等しくなければならず、スライス内のタイルの数は当該画像内のタイルの数に等しくなければならない。したがって、これは、圧縮効率を高め得る。

上述のような方法では、現在のスライスのパラメータの値は、条件が満たされていない場合のデフォルト値に等しいと推論され得る。

上述のような方法では、デフォルト値は０に等しくてよい。

上述のような方法では、スライスアドレスはタイル単位であってよい。

上述のような方法では、条件はさらに、現在のスライスがラスタースキャンモードにあると決定する段階を含み得る。

上述のような方法では、現在のスライス内のタイルの数を使用して現在のスライスを再構築する段階は、現在のスライス内のタイルの数を使用して現在のスライス内のコーディングツリーユニットのスキャン順序を決定する段階と、スキャン順序を使用して現在のスライス内のコーディングツリーユニットを再構築する段階とを含み得る。

本発明はさらに、エンコーディングデバイスによって実装される、ビデオビットストリームをエンコードする方法であって、ビットストリームは現在のスライスのスライスヘッダと現在のスライスを表すデータとを含む方法を提供しており、当該方法は、条件が満たされた場合にスライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータをエンコードする段階であって、条件は、現在のスライスのスライスアドレスが、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、段階と、現在のスライス内のタイルの数と現在のスライスを表すデータとを使用して現在のスライスを再構築する段階とを含む。

本発明はさらに、ビデオビットストリームから画像をデコードする装置であって、ビットストリームは現在のスライスのスライスヘッダと現在のスライスを表すデータとを含む装置を提供しており、当該装置は、条件が満たされた場合にスライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータを取得するように構成された取得ユニットであって、条件は、現在のスライスのスライスアドレスが、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、取得ユニットと、現在のスライス内のタイルの数と現在のスライスを表すデータとを使用して現在のスライスを再構築するように構成された再構築ユニットとを含む。本発明はさらに、コーディング済みのビデオビットストリームから画像をエンコードする装置であって、ビットストリームは現在のスライスのスライスヘッダと現在のスライスを表すデータとを含む装置を提供しており、当該装置は、条件が満たされた場合にスライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータをエンコードするように構成されたエンコードユニットであって、条件は、現在のスライスのスライスアドレスが、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、エンコードユニットと、現在のスライス内のタイルの数と現在のスライスを表すデータとを使用して現在のスライスを再構築するように構成された再構築ユニットとを含む。

本発明はさらに、上述のようなビデオビットストリームのエンコード方法を実行するための処理回路を含むエンコーダを提供する。

本発明はさらに、上述のようなビデオビットストリームのデコード方法を実行するための処理回路を含むデコーダを提供する。

本発明はさらに、コンピュータまたはプロセッサ上でそれぞれ実行された場合、上述のようなビデオビットストリームのエンコード方法または上述のようなビデオビットストリームのデコード方法を実行するためのプログラムコードを含むコンピュータプログラム製品を提供する。

本発明はさらに、１または複数のプロセッサと、プロセッサに結合され且つプロセッサによる実行のためのプログラミングを格納した非一時的コンピュータ可読記憶媒体であって、プログラミングは、プロセッサによって実行された場合、上述のようにビデオビットストリームをデコードするための方法を実行するようにデコーダを構成する、非一時的コンピュータ可読記憶媒体とを含むデコーダを提供する。

本発明はさらに、１または複数のプロセッサと、プロセッサに結合され且つプロセッサによる実行のためのプログラミングを格納した非一時的コンピュータ可読記憶媒体であって、プログラミングは、プロセッサによって実行された場合、上述のようにビデオビットストリームをエンコードするための方法を実行するようにエンコーダを構成する、非一時的コンピュータ可読記憶媒体とを含むエンコーダを提供する。

本発明はさらに、コンピュータデバイスによって実行された場合、当該コンピュータデバイスに、上述のようなビデオビットストリームのエンコード方法または上述のようなビデオビットストリームのデコード方法を実行させるプログラムコードを保持した非一時的コンピュータ可読媒体を提供する。

本発明はさらに、ビデオビットストリームを含む非一時的記憶媒体であって、ビットストリームは、現在のスライスのスライスヘッダと現在のスライスを表すデータとを含む、非一時的記憶媒体を提供しており、ここで、スライスヘッダは、現在のスライスのスライスアドレスを含み、ここで、条件が満たされた場合、スライスヘッダはさらに、スライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータを含み、条件は、現在のスライスのスライスアドレスが、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む。

１または複数の実施形態の詳細は、添付図面および以下の説明に記載されている。他の特徴、目的、および利点は、明細書、図面、および特許請求の範囲から明らかになるであろう。

以下において、本発明の実施形態は、添付の図および図面を参照してより詳細に説明される。
本発明の実施形態を実装するように構成されたビデオコーディングシステムの例を示すブロック図である。本発明の実施形態を実装するように構成されたビデオコーディングシステムの別の例を示すブロック図である。本発明の実施形態を実装するように構成されたビデオエンコーダの例を示すブロック図である。本発明の実施形態を実装するように構成されたビデオデコーダの例示的な構造を示すブロック図である。エンコーディング装置またはデコーディング装置の例を示すブロック図である。エンコーディング装置またはデコーディング装置の別の例を示すブロック図である。ＣＴＵに分割された画像の例を示す図である。ラスタースキャン順序の例を示す図である。タイル、スライスおよびサブ画像の例を示す図である。例として、ＣＴＵの画像におけるラスタースキャン順序と、画像内の１つのスライスとを示す図である。１２個のタイルと３個のスライスに区分化された画像を例示する図である。ＬＭＣＳアーキテクチャの例を示すブロック図である。コンテンツ配信サービスを実現するコンテンツ供給システム３１００の例示的な構造を示すブロック図である。端末デバイスの例の構造を示すブロック図である。本開示の実施形態に係るビデオビットストリームのデコード方法のフローチャートを示す図である。本開示の実施形態に係るビデオビットストリームのデコード方法のフローチャートを示す図である。本開示の実施形態に係るビデオビットストリームのデコードのためのデコーダを示す図である。本開示の実施形態に係るビデオビットストリームのエンコードのためのエンコーダを示す図である。以下において、同一の参照符号は、別様に明記しない限り、同一のまたは少なくとも機能的に同等の特徴を指す。

以下の説明では、本開示の一部を形成し、本発明の実施形態の特定の態様または本発明の実施形態を使用することができる特定の態様を例示として示す添付の図面を参照する。本発明の実施形態は他の態様で使用されてもよく、図に示されない構造的または論理的変更を含んでもよいことが理解される。したがって、以下の詳細な説明は、限定する意味で解釈されず、本発明の範囲は、添付の特許請求の範囲によって規定される。

例えば、説明された方法に関連する開示は、方法を実行するように構成された対応するデバイスまたはシステムにも当てはまり得、逆もまた同様であることが理解される。例えば、特定の方法の段階のうちの１または複数が説明される場合、対応するデバイスは、説明された１または複数の方法の段階（例えば、上記１または複数の段階を実行する１つのユニット、または、それぞれ複数の段階のうちの１または複数を実行する複数のユニット）を実行するために、１または複数のユニットが明示的に説明もまたは図面に示しもされていない場合であっても、そのような１または複数のユニット、例えば、機能ユニットを含んでよい。その一方、例えば、特定の装置が１または複数のユニット、例えば機能ユニットに基づいて説明される場合、対応する方法は、上記１または複数のユニットの機能を実行するために、１または複数の段階が明示的に説明もまたは図面に示しもされていない場合であっても、そのような１つの段階（例えば、１または複数のユニットの機能を実行する１つの段階、またはそれぞれ複数のユニットのうちの１または複数の機能を実行する複数の段階）を含んでよい。さらに、別様に具体的に注記されない限り、本明細書で説明する様々な例示的な実施形態および／または態様の特徴が互いに組み合わされ得ることが理解される。

ビデオコーディングは典型的には、ビデオまたはビデオシーケンスを形成する一連の画像の処理を指す。ビデオコーディングの分野では、「画像」という用語の代わりに、「フレーム」または「イメージ」という用語が同義語として使用されることがある。ビデオコーディング（または一般にコーディング）は、ビデオエンコーディングおよびビデオデコーディングの２つの部分を含む。ビデオエンコーディングは、ソース側で実行され、典型的には、（より効率的な格納および／または送信のために）ビデオ画像を表現するために要求されるデータ量を低減させるように、元のビデオ画像を処理（例えば、圧縮による）することを含む。ビデオデコーディングは、デスティネーション側で実行され、典型的には、ビデオ画像を再構築するように、エンコーダと比較して逆の処理を含む。ビデオ画像（または一般に画像）の「コーディング」に言及する実施形態は、ビデオ画像またはそれぞれのビデオシーケンスの「エンコーディング」または「デコーディング」に関すると理解されるものとする。エンコーディング部分とデコーディング部分との組み合わせは、コーデック（コーディングおよびデコーディング）とも称される。

無損失ビデオコーディングの場合、元のビデオ画像を再構築でき、すなわち、再構築済みのビデオ画像は元のビデオ画像と同じ品質である（格納中または送信中に送信損失またはその他のデータ損失がないと仮定して）。不可逆ビデオコーディングの場合、ビデオ画像を表現するデータ量を低減するために、例えば量子化による更なる圧縮が実行されるが、これはデコーダにおいて完全には再構築できない、すなわち、再構築済みのビデオ画像の品質は、元のビデオ画像の品質に比較して低下または劣化する。

いくつかのビデオコーディング規格は、「不可逆ハイブリッドビデオコーデック」のグループに属する（すなわち、サンプル領域における空間的および時間的予測と、変換領域における量子化を適用するための２Ｄ変換コーディングとを組み合わせる）。ビデオシーケンスの各画像は、典型的には、非重複ブロックのセットへと区分化され、コーディングは、典型的には、ブロックレベルで実行される。換言すれば、エンコーダにおいて、ビデオは、例えば、空間的（イントラ画像）予測および／または時間的（インター画像）予測を使用して予測ブロックを生成し、現在のブロック（現在処理されている／処理されることになるブロック）から予測ブロックを減算して残差ブロックを取得し、残差ブロックを変換するとともに変換領域における残差ブロックを量子化して、送信されることになるデータ量を低減（圧縮）することによって、典型的にはブロック（ビデオブロック）レベルで処理され、すなわちエンコードされ、一方で、デコーダにおいて、現在のブロックを表現のために再構築するために、エンコーダと比較して逆の処理がエンコードまたは圧縮されたブロックに適用される。さらに、エンコーダがデコーダ処理ループを繰り返し、その結果、後続のブロックの処理のために、すなわちコーディングのために、両方が同一の予測（例えば、イントラおよびインター予測）および／または再構築物を生成することになる。

以下、ビデオコーディングシステム１０、ビデオエンコーダ２０、およびビデオデコーダ３０の実施形態が、図１Ａ～図３に基づいて説明される。

図１Ａは、例示的なコーディングシステム１０、例えば、本開示の技術を使用し得るビデオコーディングシステム１０（または略してコーディングシステム１０）を示す概略ブロック図である。ビデオコーディングシステム１０のビデオエンコーダ２０（または略してエンコーダ２０）およびビデオデコーダ３０（または略してデコーダ３０）は、本開示に説明された様々な例に従って技術を実行するように構成され得るデバイスの例を表す。

図１Ａに示すように、コーディングシステム１０は、エンコード済みの画像データ２１を、例えば、このエンコード済みの画像データ２１をデコードするためにデスティネーションデバイス１４に提供するように構成されているソースデバイス１２を含む。

ソースデバイス１２は、エンコーダ２０を含み、加えて、すなわち任意選択的に、画像ソース１６と、プリプロセッサ（または前処理ユニット）１８、例えば画像プリプロセッサ１８と、通信インタフェースまたは通信ユニット２２とを含んでよい。

画像ソース１６は、任意の種類の画像キャプチャデバイス、例えば、現実世界の画像をキャプチャするカメラ、および／または、任意の種類の画像生成デバイス、例えば、コンピュータアニメーション化画像を生成するコンピュータグラフィックプロセッサ、または、現実世界の画像、コンピュータ生成画像（例えば、スクリーンコンテンツ、仮想現実（ＶＲ）画像）、および／またはそれらの任意の組み合わせ（例えば、拡張現実（ＡＲ）画像）を取得および／または提供する任意の種類の他のデバイスを含むかまたはそれらのデバイスであってよい。画像ソースは、前述の画像の任意のものを格納する任意の種類のメモリまたはストレージであってよい。

プリプロセッサ１８および前処理ユニット１８によって実行される処理と区別するように、画像または画像データ１７は、生画像または生画像データ１７とも称され得る。

プリプロセッサ１８は、（生）の画像データ１７を受信するとともに、画像データ１７に対して前処理を実行して、前処理済みの画像１９または前処理済みの画像データ１９を取得するように構成されている。プリプロセッサ１８によって実行される前処理は、例えば、トリミング、カラーフォーマット変換（例えば、ＲＧＢからＹＣｂＣｒ）、色補正、またはノイズ除去を含んでよい。前処理ユニット１８は任意選択的なコンポーネントであり得ると理解できる。

ビデオエンコーダ２０は、前処理済みの画像データ１９を受信するとともに、エンコード済みの画像データ２１を提供するように構成されている（更なる詳細は、例えば図２に基づいて下記に説明される）。

ソースデバイス１２の通信インタフェース２２は、通信チャネル１３を介して、エンコード済みの画像データ２１を受信するとともに、エンコード済みの画像データ２１（またはその任意のさらなる処理バージョン）を、格納または直接の再構築のために、別のデバイス、例えばデスティネーションデバイス１４または任意の他のデバイスに送信するように構成されてよい。

デスティネーションデバイス１４は、デコーダ３０（例えばビデオデコーダ３０）を含み、加えて、すなわち任意選択的に、通信インタフェースまたは通信ユニット２８と、ポストプロセッサ３２（または後処理ユニット３２）と、ディスプレイデバイス３４とを含んでよい。

デスティネーションデバイス１４の通信インタフェース２８は、エンコード済みの画像データ２１（またはその任意のさらなる処理バージョン）を、例えばソースデバイス１２から直接または任意の他のソース、例えばストレージデバイス、例えばエンコード済みの画像データストレージデバイスから受信するとともに、エンコード済みの画像データ２１をデコーダ３０に提供するように構成されている。

通信インタフェース２２および通信インタフェース２８は、ソースデバイス１２とデスティネーションデバイス１４との間で、直接通信リンク、例えば、直接的な有線もしくは無線接続を介して、または、任意の種類のネットワーク、例えば、有線もしくは無線ネットワークもしくはそれらの任意の組み合わせ、もしくは、任意の種類のプライベートおよびパブリックネットワークもしくはそれらの任意の種類の組み合わせを介して、エンコード済みの画像データ２１またはエンコード済みのデータ１３を送信または受信するように構成されてよい。

通信インタフェース２２は、例えば、エンコード済みの画像データ２１を適切なフォーマットに、例えばパケットにパッケージ化する、および／または、通信リンクまたは通信ネットワークを介した送信のための任意の種類の送信エンコーディングまたは処理を使用して、エンコード済みの画像データを処理するように構成されてよい。

通信インタフェース２２のカウンターパートを形成する通信インタフェース２８は、例えば、送信されたデータを受信するとともに、任意の種類の対応する送信デコーディングまたは処理および／またはデパッケージングを使用して送信データを処理して、エンコード済みの画像データ２１を取得するように構成されてよい。

通信インタフェース２２および通信インタフェース２８は両方とも、図１Ａにおいてソースデバイス１２からデスティネーションデバイス１４に向く通信チャネル１３の矢印で示すように単方向通信インタフェースとして、または、双方向通信インタフェースとして構成されてよく、例えば、メッセージを送信および受信する、例えば、接続を設定し、通信リンクおよび／またはデータ送信、例えばエンコード済みの画像データ送信に関連する任意の他の情報を確認およびやりとりするように構成されてよい。

デコーダ３０は、エンコード済みの画像データ２１を受信するとともに、デコード済みの画像データ３１またはデコード済みの画像３１を提供するように構成されている（更なる詳細は、例えば図３または図５に基づいて下記で説明される）。

デスティネーションデバイス１４のポストプロセッサ３２は、デコード済みの画像データ３１（再構築済みの画像データとも呼ばれる）、例えばデコード済みの画像３１を後処理して、後処理済みの画像データ３３、例えば後処理済みの画像３３を取得するように構成されている。後処理ユニット３２により行われる後処理は、例えば、デコード済みの画像データ３１を、例えば、ディスプレイデバイス３４による表示のために準備する目的で、例えば、カラーフォーマット変換（例えば、ＹＣｂＣｒからＲＧＢへ）、色補正、トリミング、もしくは再サンプリング、または任意の他の処理を含んでよい。

デスティネーションデバイス１４のディスプレイデバイス３４は、画像を例えばユーザまたは視聴者に表示するために、後処理済みの画像データ３３を受信するように構成されている。ディスプレイデバイス３４は、再構築済みの画像を表現するための任意の種類のディスプレイ、例えば、一体型または外付けのディスプレイまたはモニタであってもよく、または、これを含んでもよい。ディスプレイは、例えば、液晶ディスプレイ（ＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、プラズマディスプレイ、プロジェクタ、マイクロＬＥＤディスプレイ、液晶オンシリコン（ＬＣｏＳ）、デジタル光プロセッサ（ＤＬＰ）、または任意の種類の他のディスプレイを含んでよい。

図１Ａはソースデバイス１２とデスティネーションデバイス１４とを別個のデバイスとして示しているが、デバイスの実施形態は、それらの両方または両方の機能、すなわち、ソースデバイス１２または対応する機能と、デスティネーションデバイス１４または対応する機能とを含んでもよい。そのような実施形態では、ソースデバイス１２または対応する機能およびデスティネーションデバイス１４または対応する機能は、同じハードウェアおよび／またはソフトウェアを使用して、または別個のハードウェアおよび／またはソフトウェアまたはそれらの任意の組み合わせによって実装され得る。

本説明に基づいて当業者には明らかであるように、図１Ａに示すような、異なるユニットの機能またはソースデバイス１２および／またはデスティネーションデバイス１４内の機能の存在および（正確な）分割は、実際のデバイスおよびアプリケーションに応じて変わり得る。

エンコーダ２０（例えば、ビデオエンコーダ２０）またはデコーダ３０（例えば、ビデオデコーダ３０）またはエンコーダ２０およびデコーダ３０の両方は、１または複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリートロジック、ハードウェア、ビデオコーディング専用またはそれらの任意の組み合わせ等の、図１Ｂに示すような処理回路を介して実装されてよい。エンコーダ２０は、図２のエンコーダ２０および／または本明細書に記載の任意の他のエンコーダシステムまたはサブシステムに関連して説明される様々なモジュールを具現するために処理回路４６を介して実装されてよい。デコーダ３０は、図３のデコーダ３０および／または本明細書に記載の任意の他のデコーダシステムまたはサブシステムに関連して説明される様々なモジュールを具現するために処理回路４６を介して実装されてよい。処理回路は、後で説明されるように様々な操作を実行するように構成されてよい。図５に示すように、本技術がソフトウェアにおいて部分的に実装される場合、デバイスは、好適な非一時的コンピュータ可読記憶媒体にソフトウェアのための命令を格納してよく、ハードウェア内で１または複数のプロセッサを使用して命令を実行して、本開示の技術を実行してよい。ビデオエンコーダ２０およびビデオデコーダ３０のいずれかは、図１Ｂに示すように、例えば、単一のデバイス内の組み合わされたエンコーダ／デコーダ（コーデック）の一部として統合されてよい。

ソースデバイス１２およびデスティネーションデバイス１４は、任意の種類のハンドヘルドまたはステーショナリデバイス、例えば、ノートブックまたはラップトップコンピュータ、携帯電話、スマートフォン、タブレットまたはタブレットコンピュータ、カメラ、デスクトップコンピュータ、セットトップボックス、テレビ、ディスプレイデバイス、デジタルメディアプレイヤ、ビデオゲーミングコンソール、ビデオストリーミングデバイス（コンテンツサービスサーバまたはコンテンツ配信サーバ等）、ブロードキャスト受信機デバイス、ブロードキャスト送信機デバイス等を含む、広範なデバイスのいずれかを含んでよく、オペレーティングシステムを使用しないまたは任意の種類のオペレーティングシステムを使用してよい。場合によっては、ソースデバイス１２およびデスティネーションデバイス１４は、無線通信に対応してよい。したがって、ソースデバイス１２およびデスティネーションデバイス１４は、無線通信デバイスとしてよい。

場合によっては、図１Ａに示すビデオコーディングシステム１０は単なる例であり、本開示の技術は、エンコーディングデバイスとデコーディングデバイスとの間のいずれかのデータ通信を必ずしも含まないビデオコーディング設定（例えば、ビデオエンコーディングまたはビデオデコーディング）に適用することができる。他の例において、データは、ローカルメモリから取得され、ネットワークを介してストリーム等される。ビデオエンコーディングデバイスは、データをメモリにエンコードして格納してよく、および／または、ビデオデコーディングデバイスは、データをメモリからデコードして取得してよい。いくつかの例において、エンコーディングおよびデコーディングは、互いに通信しないが単にデータをメモリにエンコードするおよび／またはデータをメモリから取得するとともにデコードするデバイスによって実行される。

説明の便宜上、本発明の実施形態は、例えば、高効率ビデオコーディング（ＨＥＶＣ）または多用途ビデオコーディング（ＶＶＣ）の参照ソフトウェア、ＩＴＵ－Ｔビデオコーディング・エキスパート・グループ（ＶＣＥＧ）およびＩＳＯ／ＩＥＣモーション・ピクチャ・エキスパート・グループ（ＭＰＥＧ）のビデオコーディングに関するジョイント・コラボレーション・チーム（ＪＣＴ－ＶＣ）によって開発された次世代ビデオコーディング規格を参照することによって、本明細書に記載される。当業者であれば、本発明の実施形態がＨＥＶＣまたはＶＶＣに限定されないことを理解するであろう。

［エンコーダおよびエンコーディング方法］
図２は、本開示の技術を実装するように構成された例示的なビデオエンコーダ２０の概略ブロック図を示す。図２の例において、ビデオエンコーダ２０は、入力２０１（または入力インタフェース２０１）と、残差計算ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、ループフィルタユニット２２０と、デコード済みの画像バッファ（ＤＰＢ）２３０と、モード選択ユニット２６０と、エントロピーエンコーディングユニット２７０と、出力２７２（または出力インタフェース２７２）とを含む。モード選択ユニット２６０は、インター予測ユニット２４４、イントラ予測ユニット２５４、および区分化ユニット２６２を含み得る。インター予測ユニット２４４は、動き推定ユニットおよび動き補償ユニットを含んでよい（図示せず）。図２に示されたビデオエンコーダ２０は、ハイブリッドビデオエンコーダ、またはハイブリッドビデオコーデックによるビデオエンコーダとも称され得る。

残差計算ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、モード選択ユニット２６０とは、エンコーダ２０の順方向信号経路を形成するものとして言及されてよく、一方、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、バッファ２１６と、ループフィルタ２２０と、デコード済みの画像バッファ（ＤＰＢ）２３０と、インター予測ユニット２４４と、イントラ予測ユニット２５４とは、ビデオエンコーダ２０の逆方向信号経路を形成するものとして言及されてよい。ビデオエンコーダ２０の逆方向信号経路は、デコーダの信号経路に対応する（図３のビデオデコーダ３０を参照）。逆量子化ユニット２１０、逆変換処理ユニット２１２、再構築ユニット２１４、ループフィルタ２２０、デコード済みの画像バッファ（ＤＰＢ）２３０、インター予測ユニット２４４、およびイントラ予測ユニット２５４はまた、ビデオエンコーダ２０の「内蔵デコーダ」を形成していると言及される。

［画像および画像区分化（画像およびブロック）］
エンコーダ２０は、例えば、入力２０１を介して、画像１７（または画像データ１７）、例えば、ビデオまたはビデオシーケンスを形成する一連の画像のうちの画像を受信するように構成されてよい。受信された画像または画像データは、前処理済みの画像１９（または前処理済みの画像データ１９）であってもよい。簡潔さのために、以下の説明では画像１７を参照する。画像１７は、現在の画像またはコードされる画像とも称され得る（特に、ビデオコーディングにおいて、現在の画像を他の画像、例えば、同じビデオシーケンス、すなわち現在の画像も含むビデオシーケンスの、以前にエンコードされたおよび／またはデコードされた画像から区別するために）。
（デジタル）画像は、強度値を持つサンプルの２次元アレイまたはマトリックスであるか、または、それとみなされ得る。アレイ内のサンプルは、画素（画像要素の略称）またはペルとも称され得る。アレイまたは画像の水平および垂直方向（または軸）のサンプル数は、画像のサイズおよび／または解像度を定義する。色を表現するために、典型的には３つの色成分が利用され、すなわち、画像は、３つのサンプルアレイで表されてもまたはこれを含んでもよい。ＲＧＢフォーマットまたは色空間では、画像は対応する赤、緑、および青のサンプルアレイを含む。しかしながら、ビデオコーディングでは、各画素は、典型的には輝度およびクロミナンス形式または色空間、例えばＹＣｂＣｒで表され、これには、Ｙ（代わりにＬが使用される場合もある）で示される輝度成分と、ＣｂおよびＣｒで示される２つのクロミナンス成分とが含まれる。輝度（または略してルマ（ｌｕｍａ））成分Ｙは、明るさまたは（例えば、グレースケール画像でのような）グレーレベルの強度を表し、２つのクロミナンス（または略してクロマ（ｃｈｒｏｍａ））成分であるＣｂおよびＣｒは、色度または色情報成分を表す。したがって、ＹＣｂＣｒ形式の画像は、輝度サンプル値（Ｙ）の輝度サンプルアレイと、クロミナンス値（ＣｂおよびＣｒ）の２つのクロミナンスサンプルアレイとを含む。ＲＧＢ形式の画像は、ＹＣｂＣｒ形式に転換または変換することができ、逆もまた同様であり、このプロセスは、色変換または転換とも知られている。画像がモノクロの場合、画像は輝度サンプルアレイのみを含んでよい。したがって、画像は、例えば、モノクロ形式におけるルマサンプルのアレイ、または、４：２：０、４：２：２、および４：４：４のカラー形式におけるルマサンプルのアレイおよびクロマサンプルの２つの対応するアレイであってよい。

ビデオエンコーダ２０の実施形態は、画像１７を複数の（典型的には重複しない）画像ブロック２０３に区分化するように構成されている画像区分化ユニット（図２には示されない）を含み得る。これらのブロックは、ルートブロック、マクロブロック（Ｈ．２６４／ＡＶＣ）またはコーディングツリーブロック（ＣＴＢ）またはコーディングツリーユニット（ＣＴＵ）（Ｈ．２６５／ＨＥＶＣおよびＶＶＣ）とも称され得る。画像区分化ユニットは、ビデオシーケンスの全ての画像およびブロックサイズを定義する対応するグリッドに同じブロックサイズを使用するか、または、画像または画像のサブセットもしくはグループ間でブロックサイズを変化させて、各画像を対応するブロックに区分化するように構成されてよい。

更なる実施形態において、ビデオエンコーダは、画像１７のブロック２０３、例えば、画像１７を形成する１つ、いくつか、または全てのブロックを直接受信するように構成されてよい。画像ブロック２０３は、現在の画像ブロックまたはコードされる画像ブロックとも称され得る。

画像１７と同様にここでも、画像ブロック２０３は、画像１７より寸法が小さいが、強度値（サンプル値）を持つサンプルの２次元アレイまたはマトリックスであるか、または、それとみなすことができる。換言すれば、ブロック２０３は、例えば、１つのサンプルアレイ（例えば、モノクロ画像１７の場合はルマアレイ、または、カラー画像の場合はルマもしくはクロマアレイ）、または３つのサンプルアレイ（例えば、カラー画像１７の場合はルマおよび２つのクロマアレイ）、または、適用されるカラーフォーマットに応じた任意の他の数および／または種類のアレイを含んでよい。ブロック２０３の水平および垂直方向（または軸）のサンプル数は、ブロック２０３のサイズを定義する。したがって、ブロックは、例えば、サンプルのＭ×Ｎ（Ｍ列×Ｎ行）アレイ、または変換係数のＭ×Ｎアレイであってよい。

図２に示すようなビデオエンコーダ２０の実施形態は、画像１７をブロック毎にエンコードするように構成され得、例えば、エンコードおよび予測は、ブロック２０３毎に実行される。

図２に示されたビデオエンコーダ２０の実施形態は、スライス（ビデオスライスとも称される）を使用することによって画像を区分化および／またはエンコードするようにさらに構成され得、ここで画像は、１または複数のスライスを使用して区分化またはエンコードされ得（通常は重複しない）、各スライスは、１または複数のブロック（例えば、ＣＴＵ）を含み得る。

図２に示すようなビデオエンコーダ２０の実施形態は、タイルグループ（ビデオタイルグループとも称される）および／またはタイル（ビデオタイルとも称される）を使用することによって画像を区分化および／またはエンコードするようにさらに構成され得、画像は、１または複数のタイルグループ（通常は重複しない）を使用して区分化またはエンコードされ得、各タイルグループは、例えば１または複数のブロック（例えばＣＴＵ）または１または複数のタイルを含み得、各タイルは、例えば長方形の形状であり得、１または複数のブロック（例えばＣＴＵ）、例えば完全なブロックまたは部分的なブロックを含み得る。

［残差計算］
残差計算ユニット２０４は、例えば、サンプル毎（画素毎）に画像ブロック２０３のサンプル値から予測ブロック２６５のサンプル値を減算し、サンプル領域における残差ブロック２０５を取得することによって、画像ブロック２０３および予測ブロック２６５に基づいて（予測ブロック２６５に関する更なる詳細は後で提供される）、残差ブロック２０５（残差２０５とも称される）を計算するように構成されてよい。

［変換］
変換処理ユニット２０６は、残差ブロック２０５のサンプル値に対して変換、例えば、離散コサイン変換（ＤＣＴ）または離散サイン変換（ＤＳＴ）を適用し、変換領域における変換係数２０７を取得するように構成されてよい。変換係数２０７は、変換残差係数とも称されてよく、変換領域における残差ブロック２０５を表す。

変換処理ユニット２０６は、Ｈ．２６５／ＨＥＶＣに指定された変換等のＤＣＴ／ＤＳＴの整数近似を適用するように構成されてよい。直交ＤＣＴ変換に比較して、そのような整数近似は、典型的には特定の係数によってスケーリングされる。順変換および逆変換によって処理される残差ブロックのノルムを保存するべく、変換プロセスの一部として追加のスケーリング係数が適用される。スケーリング係数は、典型的には、シフト演算に関して２のべき乗であるスケーリング係数、変換係数のビット深度、確度と実装コストとの間のトレードオフ等のような特定の制約に基づいて選択される。例えば、特定のスケーリング係数が、例えば、逆変換処理ユニット２１２による逆変換（および、例えばビデオデコーダ３０における逆変換処理ユニット３１２による対応する逆変換）に指定され、例えば、エンコーダ２０における変換処理ユニット２０６による順方向変換のための対応するスケーリング係数が、相応に指定されてよい。

ビデオエンコーダ２０の実施形態は（それぞれ変換処理ユニット２０６）は、変換パラメータ、例えば単数または複数の変換のタイプを、例えば、直接またはエントロピーエンコーディングユニット２７０を介してエンコードもしくは圧縮してから出力するように構成されてよく、それにより、例えば、ビデオデコーダ３０は、デコーディングのための変換パラメータを受信して使用してよい。

［量子化］
量子化ユニット２０８は、例えば、スカラ量子化またはベクトル量子化を適用することによって、変換係数２０７を量子化して、量子化係数２０９を取得するように構成されてよい。量子化係数２０９は、量子化変換係数２０９または量子化残差係数２０９とも称され得る。

量子化プロセスは、変換係数２０７のいくつかまたは全てに関連付けられたビット深度を減少させ得る。例えば、ｎビット変換係数は、量子化中にｍビット変換係数に丸められてよく、ここでｎはｍより大きい。量子化の程度は、量子化パラメータ（ＱＰ）を調整することによって変更されてよい。例えば、スカラ量子化の場合、より細かいまたはより粗い量子化を達成するために、異なるスケーリングが適用されてもよい。量子化ステップサイズが小さいほど細かい量子化に対応し、一方で、量子化ステップサイズが大きいほど粗い量子化に対応する。適用可能な量子化ステップサイズは、量子化パラメータ（ＱＰ）によって示され得る。量子化パラメータは、例えば、適用可能な量子化ステップサイズの予め定義されたセットへのインデックスであり得る。例えば、小さな量子化パラメータは細かい量子化（小さな量子化ステップサイズ）に対応し得、大きな量子化パラメータは粗い量子化（大きな量子化ステップサイズ）に対応し得るか、または逆もまた同様である。量子化は、量子化ステップサイズによる除算を含んでよく、例えば逆量子化ユニット２１０による対応する逆量子化および／または量子化解除は、量子化ステップサイズによる乗算を含んでよい。いくつかの規格、例えばＨＥＶＣに従った実施形態は、量子化ステップサイズを決定するのに量子化パラメータを使用するように構成されてよい。概して、量子化ステップサイズは、除算を含む方程式の固定小数点近似を使用する量子化パラメータに基づいて計算され得る。量子化ステップサイズおよび量子化パラメータの方程式の固定小数点近似で使用されるスケーリングに起因して変更される可能性がある残差ブロックのノルムを復元するために、量子化および量子化解除に追加のスケーリング係数を導入することができる。一例の実装では、逆変換および量子化解除のスケーリングは組み合わされ得る。代替的には、カスタマイズされた量子化テーブルが使用され、例えばビットストリームにおいてエンコーダからデコーダにシグナリングされてよい。量子化は不可逆演算であり、損失は量子化ステップサイズの増加に伴って増加する。

ビデオエンコーダ２０の実施形態（それぞれ量子化ユニット２０８）は、量子化パラメータ（ＱＰ）、例えば直接かまたはエントロピーエンコーディングユニット２７０を介してエンコードしてから出力するように構成されてよく、それにより、例えば、ビデオデコーダ３０は、デコーディングのための量子化パラメータを受信して適用してよい。

［逆量子化］
逆量子化ユニット２１０は、例えば、量子化ユニット２０８と同じ量子化ステップサイズに基づいてまたはそれを使用して量子化ユニット２０８によって適用された量子化スキームの逆を適用することによって、量子化係数に対して量子化ユニット２０８の逆量子化を適用し、量子化解除係数２１１を取得するように構成されている。量子化解除係数２１１は、量子化解除残差係数２１１とも称され得、典型的には量子化による損失に起因して変換係数とは同一でないが、変換係数２０７に対応する。

［逆変換］

逆変換処理ユニット２１２は、変換処理ユニット２０６によって適用された変換の逆変換、例えば、逆離散コサイン変換（ＤＣＴ）または逆離散サイン変換（ＤＳＴ）または他の逆変換を適用し、サンプル領域における再構築済みの残差ブロック２１３（または対応する量子化解除係数２１３）を取得するように構成されている。再構築済みの残差ブロック２１３は、変換ブロック２１３とも称され得る。

［再構築］
再構築ユニット２１４（例えば、加算器または合算器２１４）は、例えば、サンプル毎に、再構築済みの残差ブロック２１３のサンプル値と予測ブロック２６５のサンプル値とを加算することによって、変換ブロック２１３（すなわち、再構築済みの残差ブロック２１３）を予測ブロック２６５に加算し、サンプル領域における再構築済みのブロック２１５を取得するように構成されている。

［フィルタリング］
ループフィルタユニット２２０（または、略して「ループフィルタ」２２０）は、再構築済みのブロック２１５をフィルタして、フィルタリング済みのブロック２２１を取得する、または、一般に、再構築済みのサンプルをフィルタして、フィルタリング済みのサンプルを取得するように構成されている。ループフィルタユニットは例えば、画素遷移を滑らかにするように、またはそうでなければ、ビデオ品質を改善するように構成される。ループフィルタユニット２２０は、デブロッキングフィルタ、サンプル適応型オフセット（ＳＡＯ）フィルタ、または、１または複数の他のフィルタ、例えば、バイラテラルフィルタ、適応型ループフィルタ（ＡＬＦ）、鮮明化、平滑化フィルタもしくは協調フィルタ、または、それらの任意の組み合わせなどの１または複数のループフィルタを含み得る。ループフィルタユニット２２０が、ループフィルタ内にあるものとして図２に示されているが、他の構成では、ループフィルタユニット２２０はポストループフィルタとして実装されてもよい。フィルタリング済みのブロック２２１は、フィルタリング済みの再構築済みのブロック２２１とも称され得る。

ビデオエンコーダ２０の実施形態（それぞれループフィルタユニット２２０）は、ループフィルタパラメータを（サンプル適応オフセット情報等）、例えば、直接またはエントロピーエンコーディングユニット２７０を介してエンコードしてから出力するように構成されてよく、それにより、例えば、デコーダ３０は、デコーディングのために同じループフィルタパラメータまたはそれぞれのループフィルタを受信して適用してよい。

［デコード済みの画像バッファ］
デコード済みの画像バッファ（ＤＰＢ）２３０は、ビデオエンコーダ２０によってビデオデータをエンコードするための参照画像、または一般に参照画像データを格納するメモリであってよい。ＤＰＢ２３０は、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗ＲＡＭ（ＲＲＡＭ（登録商標））、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）等の様々なメモリデバイスのうちの任意のものによって形成されてよい。デコード済みの画像バッファ（ＤＰＢ）２３０は、１または複数のフィルタリング済みのブロック２２１を格納するように構成されてよい。デコード済みの画像バッファ２３０は、同じ現在の画像または異なる画像の、例えば、以前に再構築された画像の、他の以前にフィルタリングされたブロック、例えば、以前に再構築およびフィルタリングされたブロック２２１を格納するようにさらに構成され得、例えば、インター予測のために、完全に以前に再構築された、すなわち、デコードされた、画像（および対応する参照ブロックおよびサンプル）および／または部分的に再構築された現在の画像（および対応する参照ブロックおよびサンプル）を提供し得る。デコード済みの画像バッファ（ＤＰＢ）２３０は、例えば、再構築済みのブロック２１５がループフィルタユニット２２０によってフィルタリングされていない場合、１または複数のフィルタリングされていない再構築済みのブロック２１５、または一般に、フィルタリングされていない再構築サンプル、または、再構築済みのブロックもしくはサンプルの任意の他のさらに処理されたバージョンを格納するように構成されてもよい。

［モード選択（区分化および予測）］
モード選択ユニット２６０は、区分化ユニット２６２と、インター予測ユニット２４４と、イントラ予測ユニット２５４とを含み、元の画像データ、例えば元のブロック２０３（現在の画像１７の現在のブロック２０３）、および再構築済みの画像データ、例えば、同じ（現在の）画像のおよび／または１または複数の以前にデコードされた画像からの、例えばデコード済みの画像バッファ２３０もしくは他のバッファ（例えば、図示しないラインバッファ）からのフィルタリング済みおよび／またはフィルタリングされていない再構築サンプルもしくはブロックを受信または取得するように構成されている。再構築済みの画像データは、予測ブロック２６５または予測因子２６５を取得するために、予測、例えばインター予測またはイントラ予測のための参照画像データとして使用される。

モード選択ユニット２６０は、現在のブロック予測モード（区分化を含まない）のための区分化および予測モード（例えば、イントラまたはインター予測モード）を決定または選択し、対応する予測ブロック２６５を生成するように構成されてよく、予測ブロック２６５は、残差ブロック２０５の計算のためおよび再構築済みのブロック２１５の再構築のために使用される。

モード選択ユニット２６０の実施形態は、区分化および予測モード（例えば、モード選択ユニット２６０によってサポートされているものまたはモード選択ユニット２６０に利用可能なものから）選択するように構成されてよく、これにより、最良のマッチ、または換言すれば、最小残差（最小残差は、送信または格納のための圧縮率がより良好であることを意味する）、または、最小シグナリングオーバヘッド（最小シグナリングオーバヘッドは、送信または格納のための圧縮率がより良好であることを意味する）、またはこれらの両方を考慮したもしくはバランスを取ったものを提供する。モード選択ユニット２６０は、レート歪み最適化（ＲＤＯ）に基づいて区分化および予測モードを決定する、すなわち、最小レート歪みを提供する予測モードを選択するように構成されてよい。この文脈において「最良」、「最小」、「最適」等のような用語は、全般的な「最良」、「最小」、「最適」等を必ずしも指さず、値が閾値または他の制約を超過または下回り、潜在的に「準最適選択」につながるが複雑性および処理時間を低減するような、終了または選択基準の達成を指してもよい。

換言すれば、区分化ユニット２６２は、例えば、四分木区分化（ＱＴ）、二分木区分化（ＢＴ）、もしくは三分木区分化（ＴＴ）、またはそれらの任意の組み合わせを繰り返し使用して、ブロック２０３をより小さいブロック区分またはサブブロック（ここでもブロックを形成する）に区分化するように、また、例えば、ブロック区分またはサブブロック毎に予測を実行するように構成されてよく、モード選択は、区分化されたブロック２０３の木構造の選択を含み、予測モードは、ブロック区分またはサブブロックの各々に適用される。

以下では、例示のビデオエンコーダ２０によって実行される、区分化（例えば、区分化ユニット２６０による）および予測処理（インター予測ユニット２４４およびイントラ予測ユニット２５４による）をより詳細に説明する。

［区分化］
区分化ユニット２６２は、現在のブロック２０３をより小さい区分、例えば、正方形または長方形サイズのより小さいブロックに区分化（または分割）してよい。これらのより小さいブロック（サブブロックとも称され得る）は、さらにより小さい区分にさらに区分化されてよい。これは、ツリー区分化もしくは階層的ツリー区分化とも称され、ここで、例えばルートツリーレベル０（階層レベル０、深度０）にあるルートブロックは、再帰的に区分化、例えば、次に低いツリーレベル、例えばツリーレベル１（階層レベル１、深度１）にあるノードの２または２より多いブロックに区分化されてよく、これらのブロックは、例えば終了基準が達成されたことで、例えば最大ツリー深度または最小ブロックサイズに達したことで、区分化が終了するまで、次に低いレベル、例えばツリーレベル２（階層レベル２、深度２）の２または２より多いブロックに再度区分化される等してよい。さらに区分化されないブロックは、ツリーのリーフブロックまたはリーフノードとも称される。２つの区分への区分化を使用するツリーは、二分木（ＢＴ）と称され、３つの区分への区分化を使用するツリーは、三分木（ＴＴ）と称され、４つの区分への区分化を使用するツリーは、四分木（ＱＴ）と称される。

前で言及したように、本明細書で使用される「ブロック」という用語は、画像の部分、特に正方形または長方形部分であってよい。例えば、ＨＥＶＣおよびＶＶＣを参照すると、ブロックは、コーディングツリーユニット（ＣＴＵ）、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）、および変換ユニット（ＴＵ）であり得る、または、それに対応し得る、および／または、対応するブロック、例えば、コーディングツリーブロック（ＣＴＢ）、コーディングブロック（ＣＢ）、変換ブロック（ＴＢ）、または、予測ブロック（ＰＢ）に対応し得る。

例えば、コーディングツリーユニット（ＣＴＵ）は、３つのサンプルアレイを有する画像のルマサンプルのＣＴＢ、クロマサンプルの２つの対応するＣＴＢ、または、モノクロ画像のもしくはサンプルをコードするために使用された３つの別個の色平面およびシンタックス構造を使用してコードされた画像のサンプルのＣＴＢであるか、またはそれらを含んでよい。それに対応して、コーディングツリーブロック（ＣＴＢ）は、コンポーネントのＣＴＢへの分割が区分化であるように、何らかの値ＮについてのＮ×Ｎブロックのサンプルであり得る。コーディングユニット（ＣＵ）は、ルマサンプルのコーディングブロック、３つのサンプルアレイを有する画像のクロマサンプルの２つの対応するコーディングブロック、または、モノクロ画像のもしくはサンプルをコードするために使用された３つの別個の色平面およびシンタックス構造を使用してコードされた画像のサンプルのコーディングブロックであるか、またはそれらを含んでよい。これに対応して、コーディングブロック（ＣＢ）は、ＣＴＢのコーディングブロックへの分割が区分化であるように、ＭおよびＮの何らかの値に対するサンプルのＭ×Ｎブロックであり得る。

例えばＨＥＶＣに従う実施形態において、コーディングツリーユニット（ＣＴＵ）は、コーディングツリーとして示される四分木構造を使用することによってＣＵに分割されてよい。インター画像（時間的）予測またはイントラ画像（空間的）予測のどちらを使用して画像エリアをコードするかの決定は、ＣＵレベルで行われる。各ＣＵは、ＰＵ分割タイプに従って、１つ、２つまたは４つのＰＵへさらに分割され得る。１つのＰＵの内部では、同じ予測処理が適用され、関連情報はＰＵベースでデコーダに送信される。ＰＵ分割タイプに基づいて予測処理を適用することによって残差ブロックを取得した後に、ＣＵは、ＣＵについてのコーディングツリーと同様の別の四分木構造に従って、変換ユニット（ＴＵ）に区分化できる。

例えば、多用途ビデオコーディング（ＶＶＣ）と称される、現在開発中の最新のビデオコーディング規格に従う実施形態において、組み合された四分木および二分木（ＱＴＢＴ）区分化は、例えば、コーディングブロックを区分化するのに使用される。ＱＴＢＴブロック構造では、ＣＵは、正方形または長方形のいずれかの形状とすることができる。例えば、コーディングツリーユニット（ＣＴＵ）はまず、四分木構造によって区分化される。四分木リーフノードはさらに、二分木または三分（ｔｅｒｎａｒｙ（ｏｒｔｒｉｐｌｅ）木構造によって区分化される。区分化ツリーのリーフノードは、コーディングユニット（ＣＵ）と称され、そのセグメンテーションは、任意のさらなる区分化を伴うことなく、予測および変換処理に使用される。これは、ＣＵ、ＰＵおよびＴＵがＱＴＢＴコーディングブロック構造内で同じブロックサイズを有することを意味する。並行して、複数の区分化、例えば、三分木区分化が、ＱＴＢＴブロック構造と一緒に使用され得る。

一例において、ビデオエンコーダ２０のモード選択ユニット２６０は、本明細書に記載の区分化技術の任意の組み合わせを実行するように構成されてよい。

上述のように、ビデオエンコーダ２０は、（例えば予め決定された）予測モードのセットから、最良または最適な予測モードを決定または選択するように構成されている。予測モードのセットは、例えば、イントラ予測モードおよび／またはインター予測モードを含んでよい。

［イントラ予測］
イントラ予測モードのセットは、３５の異なるイントラ予測モード、例えば、ＤＣ（またはミーン）モードおよび平面モードのような無方向性モード、もしくは、例えばＨＥＶＣにおいて定義されているような、方向性モードを含んでよく、または、６７の異なるイントラ予測モード、例えば、ＤＣ（またはミーン）モードおよび平面モードのような無方向性モード、もしくは、例えばＶＶＣに定義されている、方向性モードを含んでよい。

イントラ予測ユニット２５４は、同じ現在の画像の隣接ブロックの再構築済みのサンプルを使用して、イントラ予測モードのセットのうちのイントラ予測モードに従って、イントラ予測ブロック２６５を生成するように構成されている。

イントラ予測ユニット２５４（または一般にモード選択ユニット２６０）は、イントラ予測パラメータ（または一般に、ブロックのために選択されたイントラ予測モードを示す情報）を、エンコード済みの画像データ２１に含まれるようにシンタックス要素２６６の形態でエントロピーエンコーディングユニット２７０に出力するようにさらに構成され、それにより、例えば、ビデオデコーダ３０は、デコーディングのための予測パラメータを受信して使用してよい。

［インター予測］
インター予測モードのセット（または可能なインター予測モード）は、利用可能な参照画像（すなわち、例えばＤＰＢ２３０に格納された、以前の少なくとも部分的にデコード済みの画像）および他のインター予測パラメータ、例えば、最良にマッチする参照ブロックの検索に使用されたのは、参照画像の全体なのかもしくは参照画像の一部のみ、例えば、現在のブロックのエリアの周りの検索窓エリアなのか、および／または、例えば、画素補間、例えばハーフ／セミペルおよび／またはクオータペル補間が適用されたか否かに依拠する。

上記の予測モードに加えて、スキップモードおよび／または直接モードが適用されてもよい。

インター予測ユニット２４４は、動き推定（ＭＥ）ユニットおよび動き補償（ＭＣ）ユニット（両方とも図２には図示せず）を含んでよい。動き推定ユニットは、動きの推定のために、画像ブロック２０３（現在の画像１７の現在の画像ブロック２０３）およびデコード済みの画像２３１、または少なくとも１または複数の以前に再構築されたブロック、例えば、１または複数の他の／異なる以前にデコードされた画像２３１の再構築済みのブロックを受信または取得するように構成され得る。例えば、ビデオシーケンスは、現在の画像および以前にデコードされた画像２３１を含むことができ、または言い換えれば、現在の画像および以前にデコードされた画像２３１は、ビデオシーケンスを形成する一連の画像の一部であるか、またはそのシーケンスを形成することができる。

エンコーダ２０は、例えば、複数の他の画像のうちの同じまたは異なる画像の複数の参照ブロックから参照ブロックを選択し、インター予測パラメータとして参照画像（または参照画像インデックス）および／または参照ブロックの位置（ｘ、ｙ座標）と現在のブロックの位置との間のオフセット（空間的オフセット）を動き推定ユニットに提供するように構成してよい。このオフセットは、動きベクトル（ＭＶ）とも呼ばれる。

動き補償ユニットは、インター予測パラメータを取得、例えば受信するとともに、そのインター予測パラメータに基づいてまたはそれを使用してインター予測を実行して、インター予測ブロック２６５を取得するように構成されている。動き補償ユニットによって実行される動き補償は、動き推定によって決定された動き／ブロックベクトルに基づいて予測ブロックをフェッチまたは生成し、場合によってサブ画素精度までの補間を実行することを伴ってよい。補間フィルタリングは、既知の画素サンプルから追加の画素サンプルを生成してよく、したがって、画像ブロックをコードするのに使用され得る候補予測ブロックの数を潜在的に増加させる。現在の画像ブロックのＰＵのための動きベクトルを受信すると、動き補償ユニットは、参照画像リストのうちの１つにおいて動きベクトルが指し示す予測ブロックを位置特定してよい。

動き補償ユニットはまた、ビデオスライスの画像ブロックをデコードする際にビデオデコーダ３０によって使用されるブロックおよびビデオスライスに関連付けられたシンタックス要素を生成することができる。スライスおよびそれぞれのシンタックス要素に追加的に、または代替的に、タイルグループおよび／またはタイル、ならびに、それぞれのシンタックス要素が生成または使用され得る。

［エントロピーコーディング］
エントロピーエンコーディングユニット２７０は、例えば、エントロピーエンコーディングアルゴリズムまたはスキーム（例えば、可変長コーディング（ＶＬＣ）スキーム、コンテキスト適応型ＶＬＣスキーム（ＣＡＶＬＣ）、算術コーディングスキーム、バイナリゼーション、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースのコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率インターバル区分化エントロピー（ＰＩＰＥ）コーディング、または、別のエントロピーエンコーディング方法もしくは技術）、またはバイパス（無圧縮）を、量子化係数２０９、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、および／または他のシンタックス要素に適用し、例えばエンコード済みのビットストリーム２１の形態で出力２７２を介して出力できるエンコード済みの画像データ２１を取得するように構成され、それにより、例えば、ビデオデコーダ３０は、デコーディングのためのパラメータを受信して使用してよい。エンコード済みのビットストリーム２１は、ビデオデコーダ３０に送信、または、後でビデオデコーダ３０によって送信または取得するためにメモリに格納されてよい。

ビデオエンコーダ２０の他の構造上の変形を、ビデオストリームをエンコードするのに使用することができる。例えば、非変換ベースのエンコーダ２０は、特定のブロックまたはフレームのための変換処理ユニット２０６なしで直接的に残差信号を量子化できる。別の実装において、エンコーダ２０は、単一のユニットに組み合わされた量子化ユニット２０８および逆量子化ユニット２１０を有することができる。

［デコーダおよびデコーディング方法］
図３は、本開示の技術を実装するように構成されたビデオデコーダ３０の例を示す。ビデオデコーダ３０は、例えばエンコーダ２０によってエンコードされた、エンコード済みの画像データ２１（例えば、エンコード済みのビットストリーム２１）を受信して、デコード済みの画像３３１を取得するように構成されている。エンコード済みの画像データまたはビットストリームは、エンコード済みの画像データをデコードするための情報、例えば、エンコード済みのビデオスライス（および／またはタイルグループまたはタイル）の画像ブロックおよび関連付けられたシンタックス要素を表すデータを含む。

図３の例では、デコーダ３０は、エントロピーデコーディングユニット３０４、逆量子化ユニット３１０、逆変換処理ユニット３１２、再構築ユニット３１４（例えば、合算器３１４）、ループフィルタ３２０、デコード済みの画像バッファ（ＤＰＢ）３３０、モード適用ユニット３６０、インター予測ユニット３４４、およびイントラ予測ユニット３５４を含む。インター予測ユニット３４４は、動き補償ユニットであるかまたはこれを含んでよい。ビデオデコーダ３０は、いくつかの例では、図２からのビデオエンコーダ１００に関連して説明されたエンコーディングパスに対して一般に逆のデコーディングコーディングパスを実行してよい。

エンコーダ２０に関して説明したように、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構築ユニット２１４、ループフィルタ２２０、デコード済みの画像バッファ（ＤＰＢ）２３０、インター予測ユニット３４４、およびイントラ予測ユニット３５４も、ビデオエンコーダ２０の「内蔵デコーダ」を形成するものとして言及される。したがって、逆量子化ユニット３１０は、逆量子化ユニット１１０と機能が同一であり得、逆変換処理ユニット３１２は、逆変換処理ユニット２１２と機能が同一であり得、再構築ユニット３１４は、再構築ユニット２１４と機能が同一であり得、ループフィルタ３２０は、ループフィルタ２２０と機能が同一であり得、デコード済みの画像バッファ３３０は、デコード済みの画像バッファ２３０と機能が同一であり得る。したがって、ビデオ２０エンコーダのそれぞれのユニットおよび機能について提供される説明は、ビデオデコーダ３０のそれぞれのユニットおよび機能に対応して適用される。

［エントロピーデコーディング］
エントロピーデコーディングユニット３０４は、ビットストリーム２１（または一般にエンコード済みの画像データ２１）をパースし、例えば、エンコード済みの画像データ２１にエントロピーデコーディングを実行して、例えば量子化係数３０９および／またはデコードされたコーディングパラメータ（図３には図示せず）、例えば、インター予測パラメータ（例えば、参照画像インデックスおよび動きベクトル）、イントラ予測パラメータ（例えば、イントラ予測モードまたはインデックス）、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、および／または他のシンタックス要素のいずれかまたは全てを取得するように構成されている。エントロピーデコーディングユニット３０４は、エンコーダ２０のエントロピーエンコーディングユニット２７０に関して記載されたエンコーディングスキームに対応するデコーディングアルゴリズムまたはスキームを適用するように構成されてよい。エントロピーデコーディングユニット３０４は、インター予測パラメータ、イントラ予測パラメータ、および／または他のシンタックス要素をモード適用ユニット３６０に、また他のパラメータをデコーダ３０の他のユニットに提供するようにさらに構成されてよい。ビデオデコーダ３０は、ビデオスライスレベルでおよび／またはビデオブロックレベルで、シンタックス要素を受信してよい。スライスおよびそれぞれのシンタックス要素に追加的に、または代替的に、タイルグループおよび／またはタイル、ならびに、それぞれのシンタックス要素が受信および／または使用され得る。

［逆量子化］
逆量子化ユニット３１０は、エンコード済みの画像データ２１から量子化パラメータ（ＱＰ）（または一般に逆量子化に関連する情報）および量子化係数を受信する（例えばエントロピーデコーディングユニット３０４によって、例えばパースおよび／またはデコードすることによって）とともに、量子化パラメータに基づいて、デコード済みの量子化係数３０９に逆量子化を適用し、変換係数３１１とも称され得る量子化解除係数３１１を取得するように構成されてよい。逆量子化プロセスは、量子化の程度、また同様に適用されるべき逆量子化の程度を決定するために、ビデオスライス（またはタイルもしくはタイルグループ）内のビデオブロック毎にビデオエンコーダ２０によって決定される量子化パラメータの使用を含んでよい。

［逆変換］
逆変換処理ユニット３１２は、変換係数３１１とも称される量子化解除係数３１１を受信するとともに、サンプル領域における再構築済みの残差ブロック２１３を取得するべく、量子化解除係数３１１に変換を適用するように構成されてよい。再構築済みの残差ブロック２１３は、変換ブロック３１３とも称され得る。変換は、逆変換、例えば、逆ＤＣＴ、逆ＤＳＴ、逆整数変換、または概念的に同様の逆変換プロセスであってよい。逆変換処理ユニット３１２は、エンコード済みの画像データ２１から変換パラメータまたは対応する情報を受信し（例えばエントロピーデコーディングユニット３０４によって、例えばパースおよび／またはデコードすることによって）、量子化解除係数３１１に適用されるべき変換を決定するようにさらに構成されてよい。

［再構築］
再構築ユニット３１４（例えば、加算器または合算器３１４）は、再構築済みの残差ブロック３１３を予測ブロック３６５に加算し、例えば、再構築済みの残差ブロック３１３のサンプル値と予測ブロック３６５のサンプル値とを加算することによって、サンプル領域における再構築済みのブロック３１５を取得するように構成されてよい。

［フィルタリング］
ループフィルタユニット３２０（コーディングループ内またはコーディングループの後のいずれかにある）は、例えば、画素遷移を滑らかにするようにまたはビデオ品質を別様に改善するように、再構築済みのブロック３１５をフィルタして、フィルタリング済みのブロック３２１を取得するように構成されている。ループフィルタユニット３２０は、デブロッキングフィルタ、サンプル適応型オフセット（ＳＡＯ）フィルタ、または、１または複数の他のフィルタ、例えば、バイラテラルフィルタ、適応型ループフィルタ（ＡＬＦ）、鮮明化、平滑化フィルタ、または協調フィルタ、またはそれらの任意の組み合わせなど、１または複数のループフィルタを含み得る。ループフィルタユニット３２０が、ループフィルタ内にあるものとして図３に示されているが、他の構成では、ループフィルタユニット３２０はポストループフィルタとして実装されてもよい。

［デコード済みの画像バッファ］
画像のデコード済みのビデオブロック３２１は、その後、デコード済みの画像バッファ３３０に格納され、デコード済みの画像バッファ３３０は、デコード済みの画像３３１を他の画像の後続の動き補償のためのおよび／またはそれぞれ表示を出力するための参照画像として格納する。

デコーダ３０は、例えば出力３３２を介して、ユーザに提示または閲覧させるために、デコード済みの画像３３１を出力するように構成されている。

［予測］
インター予測ユニット３４４は、インター予測ユニット２４４（特に、動き補償ユニット）と同一であってよく、イントラ予測ユニット３５４は、イントラ予測ユニット２５４と機能的に同一であってよく、エンコード済みの画像データ２１から受信（例えば、エントロピーデコーディングユニット３０４によって、例えば、パースおよび／またはデコードすることによって）された区分化および／または予測パラメータまたはそれぞれの情報に基づいて分割または区分化の決定および予測を実行する。モード適用ユニット３６０は、再構築済みの画像、ブロック、またはそれぞれのサンプル（フィルタリング済みまたはフィルタリングされていない）に基づいてブロック毎に予測（イントラまたはインター予測）を実行し、予測ブロック３６５を取得するように構成されてよい。

ビデオスライスがイントラコーディング（Ｉ）スライスとしてコードされる場合、モード適用ユニット３６０のイントラ予測ユニット３５４は、シグナリングされたイントラ予測モードおよび現在の画像の以前にデコードされたブロックからのデータに基づいて、現在のビデオスライスの画像ブロックに対する予測ブロック３６５を生成するように構成される。ビデオ画像がインターコード済みの（すなわち、ＢまたはＰ）スライスとしてコードされている場合、モード適用ユニット３６０のインター予測ユニット３４４（例えば、動き補償ユニット）は、動きベクトルおよびエントロピーデコーディングユニット３０４から受信された他のシンタックス要素に基づいて、現在のビデオスライスのビデオブロックのための予測ブロック３６５を生成するように構成されている。インター予測では、予測ブロックは、複数の参照画像リストのうちの１つの内部に含まれる複数の参照画像のうちの１つから生成されてよい。ビデオデコーダ３０は、リスト０およびリスト１という参照フレームリストを、デフォルトの構築技術を使用して、ＤＰＢ３３０に格納された参照画像に基づいて構築してよい。同じまたは同様のことが、スライス（例えばビデオスライス）に追加的または代替的にタイルグループ（例えばビデオタイルグループ）および／またはタイル（例えばビデオタイル）を使用する実施形態について、または、それによって適用され得る。例えば、ビデオは、Ｉ、Ｐ、またはＢタイルグループおよび／またはタイルを使用してコードされ得る。

モード適用ユニット３６０は、動きベクトルまたは関連情報および他のシンタックス要素をパースすることによって、現在のビデオスライスのビデオブロックのための予測情報を決定するように構成され、デコードされている現在のビデオブロックのための予測ブロックを生成するために上記予測情報を使用する。例えば、モード適用ユニット３６０は、受信されたシンタックス要素のいくつかを使用して、ビデオスライスのビデオブロックをコードするのに使用された予測モード（例えば、イントラまたはインター予測）、インター予測スライスタイプ（例えば、Ｂスライス、Ｐスライス、またはＧＰＢスライス）、スライスのための参照画像リストのうちの１または複数に関する構築情報、スライスのインターエンコード済みのビデオブロック毎の動きベクトル、スライスのインターコード済みのビデオブロック毎のインター予測ステータス、および現在のビデオスライス内のビデオブロックをデコードするための他の情報を決定する。同じまたは同様のことが、スライス（例えばビデオスライス）に追加的または代替的にタイルグループ（例えばビデオタイルグループ）および／またはタイル（例えばビデオタイル）を使用する実施形態について、または、それによって適用され得る。例えば、ビデオは、Ｉ、Ｐ、またはＢタイルグループおよび／またはタイルを使用してコードされ得る。

図３に示されたビデオデコーダ３０の実施形態は、スライス（ビデオスライスとも称される）を使用することによって画像を区分化および／またはデコードするように構成され得、ここで画像は、１または複数のスライスを使用して区分化またはデコードされ得（通常は重複しない）、各スライスは、１または複数のブロック（例えば、ＣＴＵ）を含み得る。

図３に示されたビデオデコーダ３０の実施形態は、タイルグループ（ビデオタイルグループとも称される）および／またはタイル（ビデオタイルとも称される）を使用することによって画像を区分化および／またはデコードするように構成され得、画像は、１または複数のタイルグループ（通常は重複しない）を使用して区分化またはデコードされ得、各タイルグループは、例えば１または複数のブロック（例えばＣＴＵ）または１または複数のタイルを含み得、各タイルは、例えば長方形の形状であり得、１または複数のブロック（例えばＣＴＵ）、例えば完全なブロックまたは部分的なブロックを含み得る。

ビデオデコーダ３０の他の変形を、エンコード済みの画像データ２１をデコードするのに使用することができる。例えば、デコーダ３０は、ループフィルタリングユニット３２０なしに、出力ビデオストリームを生成することができる。例えば、非変換ベースのデコーダ３０は、特定のブロックまたはフレームのための逆変換処理ユニット３１２なしに、残差信号を直接的に逆量子化することができる。別の実装において、ビデオデコーダ３０は、単一のユニットに組み合わされた逆量子化ユニット３１０および逆変換処理ユニット３１２を有することができる。

エンコーダ２０およびデコーダ３０において、現在の段階の処理結果は、さらに処理されて、その後、次の段階に出力されてよいことが理解されるべきである。例えば、補間フィルタリング、動きベクトル導出またはループフィルタリングの後に、クリップまたはシフト等の更なる操作を、補間フィルタリング、動きベクトル導出またはループフィルタリングの処理結果に対して実行してよい。

更なる操作を、現在のブロックの導出された動きベクトル（限定しないが、アフィンモードの制御点動きベクトル、アフィン、平面、ＡＴＭＶＰモードにおけるサブブロック動きベクトル、時間的な動きベクトル等を含む）に適用してよいことに留意すべきである。例えば、動きベクトルの値は、その表現ビットに従って予め定義された範囲に制限される。動きベクトルの表現ビットがｂｉｔＤｅｐｔｈである場合、その範囲は、－２＾（ｂｉｔＤｅｐｔｈ－１）～２＾（ｂｉｔＤｅｐｔｈ－１）－１であり、ここで、「＾」はべき乗を意味する。例えば、ｂｉｔＤｅｐｔｈが１６に等しく設定されている場合、その範囲は－３２７６８～３２７６７であり、ｂｉｔＤｅｐｔｈが１８に等しく設定されている場合、その範囲は－１３１０７２～１３１０７１である。例えば、導出された動きベクトル（例えば、１つの８×８ブロック内の４つの４×４サブブロックのＭＶ）の値は、４つの４×４サブブロックＭＶの整数部分の間の最大差が、１画素以下など、Ｎ画素以下であるように制限される。以下、ｂｉｔＤｅｐｔｈに従って動きベクトルを制限する２つの方法を提供する。

方法１：以下の操作により、オーバフローＭＳＢ（最上位ビット）を除去する。

ここで、ｍｖｘは、イメージブロックまたはサブブロックの動きベクトルの水平成分であり、ｍｖｙはイメージブロックまたはサブブロックの動きベクトルの垂直成分であり、ｕｘおよびｕｙは中間値を示している。

例えば、式（１）および（２）の適用後、ｍｖｘの値が－３２７６９である場合、結果として得られる値は３２７６７である。コンピュータシステムにおいて、十進数は、２の補数として格納される。

－３２７６９の２の補数は、１，０１１１，１１１１，１１１１，１１１１（１７ビット）であり、その後、ＭＳＢは破棄されるので、結果として得られる２の補数は、０１１１，１１１１，１１１１，１１１１（十進数は３２７６７）である。これは、式（１）および（２）を適用することによる出力と同じである。

操作は、式（５）～（８）に示すように、ｍｖｐおよびｍｖｄの合計中に適用されてよい。

方法２：値をクリッピングすることによって、オーバフローＭＳＢを除去する。

ここで、ｖｘはイメージブロックまたはサブブロックの動きベクトルの水平成分であり、ｖｙはイメージブロックまたはサブブロックの動きベクトルの垂直成分であり、ｘ、ｙおよびｚはそれぞれ、ＭＶクリッピングプロセスの３つの入力値に対応しており、関数Ｃｌｉｐ３の定義は、以下の通りである。

図４は、本開示の実施形態に係るビデオコーディングデバイス４００の概略図である。ビデオコーディングデバイス４００は、本明細書に記載の開示される実施形態を実装するのに好適なものである。実施形態において、ビデオコーディングデバイス４００は、図１Ａのビデオデコーダ３０などのデコーダ、または、図１Ａのビデオエンコーダ２０などのエンコーダであり得る。

ビデオコーディングデバイス４００は、データを受信するための入口ポート４１０（または、入力ポート４１０）および受信機ユニット（Ｒｘ）４２０と、データを処理するためのプロセッサ、論理ユニット、または中央演算処理装置（ＣＰＵ）４３０と、データを送信するための送信機ユニット（Ｔｘ）４４０および出口ポート４５０（または出力ポート４５０）と、データを格納するためのメモリ４６０とを含む。ビデオコーディングデバイス４００は、光信号または電気信号の出口または入口のために、入口ポート４１０、受信機ユニット４２０、送信機ユニット４４０および出口ポート４５０に連結された光／電気（ＯＥ）コンポーネントおよび電気／光（ＥＯ）コンポーネントも含み得る。

プロセッサ４３０は、ハードウェアおよびソフトウェアによって実装される。プロセッサ４３０は、１または複数のＣＰＵチップ、コア（例えば、マルチコアプロセッサ）、ＦＰＧＡ、ＡＳＩＣ、およびＤＳＰとして実装され得る。プロセッサ４３０は、入口ポート４１０、受信機ユニット４２０、送信機ユニット４４０、出口ポート４５０、およびメモリ４６０と通信する。プロセッサ４３０は、コーディングモジュール４７０を含む。コーディングモジュール４７０は、上述の開示される実施形態を実装する。例えば、コーディングモジュール４７０は、様々なコーディング操作を実装、処理、準備または提供する。したがって、コーディングモジュール４７０を含むことで、ビデオコーディングデバイス４００の機能に対する実質的な改善が提供され、ビデオコーディングデバイス４００の異なる状態への変換をもたらす。代替的に、コーディングモジュール４７０は、メモリ４６０に格納されプロセッサ４３０によって実行される命令として実装される。

メモリ４６０は、１または複数のディスク、テープドライブ、およびソリッドステートドライブを含んでよく、プログラムが実行のために選択された場合に係るプログラムを格納するとともに、プログラムの実行中に読み取られる命令およびデータを格納するために、オーバーフローデータストレージデバイスとして使用されてよい。メモリ４６０は例えば、揮発性および／または不揮発性であり得、リードオンリメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、三値連想メモリ（ＴＣＡＭ）、および／または、スタティックランダムアクセスメモリ（ＳＲＡＭ）であり得る。

図５は、例示的な実施形態に従って、図１からのソースデバイス１２およびデスティネーションデバイス１４のいずれかまたは両方として使用され得る装置５００の簡略的なブロック図である。

装置５００におけるプロセッサ５０２は、中央演算処理装置とすることができる。代替的に、プロセッサ５０２は、現在既存のまたは今後開発される情報の操作または処理が可能な任意の他のタイプのデバイスまたは複数のデバイスとすることができる。開示される実装は、示されているような単一のプロセッサ、例えばプロセッサ５０２を使用して実施され得るが、速度および効率上の利点は、１つより多くのプロセッサを使用して実現され得る。

装置５００におけるメモリ５０４は、一実装において、リードオンリメモリ（ＲＯＭ）デバイスまたはランダムアクセスメモリ（ＲＡＭ）デバイスとすることができる。任意の他の好適なタイプのストレージデバイスが、メモリ５０４として使用され得る。メモリ５０４は、バス５１２を使用してプロセッサ５０２によってアクセスされるコードおよびデータ５０６を含むことができる。メモリ５０４は、オペレーティングシステム５０８およびアプリケーションプログラム５１０をさらに含むことができ、アプリケーションプログラム５１０は、プロセッサ５０２が本明細書に記載の方法を実行することを可能にする少なくとも１つのプログラムを含む。例えば、アプリケーションプログラム５１０は、アプリケーション１～Ｎを含むことができ、アプリケーション１～Ｎは、本明細書に記載の方法を実行するビデオコーディングアプリケーションをさらに含む。

装置５００は、ディスプレイ５１８等の、１または複数の出力デバイスも含むことができる。ディスプレイ５１８は、一例において、ディスプレイと、タッチ入力を検知するように動作可能なタッチセンサ素子とを組み合わせたタッチセンサ式ディスプレイであってよい。ディスプレイ５１８は、バス５１２を介してプロセッサ５０２に連結され得る。

単一のバスとして本明細書に示したが、装置５００のバス５１２は、複数のバスから構成することができる。さらに、二次ストレージ５１４は、装置５００の他のコンポーネントに直接的に連結され得る、または、ネットワークを介してアクセスされ得、メモリカードなどの単一の統合ユニット、または、複数のメモリカードなどの複数のユニットを含み得る。したがって、装置５００は、多種多様な構成で実装することができる。

［パラメータセット］
パラメータセットは、基本的に同様で、同じ基本的な設計目標（すなわち、ビットレート効率、エラー耐性、およびシステム層インタフェースの提供）を共有している。ＨＥＶＣ（Ｈ．２６５）には、ビデオパラメータセット（ＶＰＳ）、シーケンスパラメータセット（ＳＰＳ）、および画像パラメータセット（ＰＰＳ）を含むパラメータセットの階層が存在し、それらはＡＶＣおよびＶＶＣにおいて自らのカウンターパートと同様である。各スライスは、スライスをデコードするのに使用される情報にアクセスするために、単一のアクティブＰＰＳ、ＳＰＳおよびＶＰＳを参照する。ＰＰＳは、画像内の全てのスライスに適用される情報を含むので、画像内の全てのスライスは同じＰＰＳを参照しなければならない。異なる画像内のスライスも、同じＰＰＳを参照することが可能である。同様に、ＳＰＳは、同じコーディング済みのビデオシーケンスで全ての画像に適用される情報を含む。

ＰＰＳは個別の画像ごとに異なり得るが、コーディング済みのビデオシーケンスにおける多くのまたは全ての画像が同じＰＰＳを参照することは一般的である。パラメータセットを再利用することは、共有された情報を複数回送信する必要性を回避するので、ビットレートが効率的にさせる。それはまた、パラメータセットのコンテンツを、それが損失されないことを確実にするべく、いくつかのより信頼できる外部の通信リンクによって搬送されるまたはビットストリーム内で頻繁に繰り返されることを可能にするので、損失に強い。

［シーケンスパラメータセット（ＳＰＳ）］
ＳＰＳは、コーディング済みのビデオシーケンスの１または複数の層に適用されるパラメータを含み、コーディング済みのビデオシーケンス内で画像毎に変更することはない。具体的に、ＳＰＳはサブ画像のシグナリング情報を含む。

以下の表のいくつかの部分は、ＩＴＵＪＶＥＴ－Ｑ２００１－ｖ１１におけるＳＰＳのサブ画像シグナリングの一部のスナップショットを示しており、そのダウンロードリンクは以下の通りである。
ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ－ｓｕｄｐａｒｉｓ．ｅｕ／ｊｖｅｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１７＿Ｂｒｕｓｓｅｌｓ／ｗｇ１１／ＪＶＥＴ－Ｑ２００１－ｖ１１．ｚｉｐ。本出願の残りの部分では、この先行技術文献は、簡潔さのためにＶＶＣＤｒａｆｔ８と称される。

ＳＰＳ信号におけるいくつかのシンタックス要素は、各サブ画像の位置情報および制御フラグをシグナリングする。ｉ番目のサブ画像の位置情報は、
・画像内のサブ画像ｉの左上の座標の水平成分を示すｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｉ］、または
・画像内のサブ画像ｉの左上の座標の垂直成分を示すｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｉ］、または
・画像内のサブ画像ｉの幅を示すｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］、または
・画像内のサブ画像ｉの高さを示すｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｉ］
を含む。

いくつかのシンタックス要素は、画像内部のサブ画像の数、例えば、ｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１を示す。

画像は、１または複数のタイルの行および１または複数のタイルの列に分割される。タイルは、画像の長方形領域をカバーする一連のＣＴＵである。タイル内のＣＴＵは、そのタイル内のラスタースキャン順序でスキャンされる。

スライスは、整数個の完全なタイル、または、画像のタイル内の整数個の連続した完全なＣＴＵ行で構成されている。従って、各垂直スライス境界は常に垂直タイル境界でもある。スライスの水平境界が、タイル境界でないがタイル内の水平ＣＴＵ境界で構成されることも可能である：これは、タイルが、その各々がタイル内の整数個の連続した完全なＣＴＵ行で構成された複数の長方形スライスに分割された場合に生じる。

スライスの２つのモード、すなわち、ラスタースキャンスライスモードおよび長方形スライスモードがサポートされている。ラスタースキャンスライスモードにおいて、スライスは、画像のタイルラスタースキャンにおいて一連の完全なタイルを含む。長方形スライスモードにおいて、スライスは、画像の長方形領域を集合的に形成する多数の完全なタイル、または、画像の長方形領域を集合的に形成する１つのタイルの多数の連続した完全なＣＴＵ行、のうちいずれかを含む。長方形スライス内のタイルは、そのスライスに対応する長方形領域内においてタイルラスタースキャン順序でスキャンされる。

サブ画像は、画像の長方形領域を集合的にカバーする１または複数のスライスを含む。従って、各サブ画像境界は常にスライス境界でもあり、各垂直サブ画像境界は常に垂直タイル境界でもある。

以下の条件のうち１つまたは両方が、サブ画像およびタイル毎に達成されるものとする。
‐サブ画像内の全てのＣＴＵは同じタイルに属している。
‐タイル内の全てのＣＴＵは同じサブ画像に属している。

［画像をＣＴＵ、スライス、タイルおよびサブ画像に区分化すること］

［画像をＣＴＵに区分化すること］
画像は、一連のコーディングツリーユニット（ＣＴＵ）に分割される。用語ＣＴＢ（コーディングツリーブロック）は、場合によっては互換的に使用される。ＣＴＵの概念は、ＨＥＶＣのそれと同じである。３つのサンプルアレイを有する画像の場合、ＣＴＵは、クロマサンプルの２つの対応するブロックと一緒に、ルマサンプルのＮ×Ｎブロックで構成されている。図６は、ＣＴＵに分割された画像の例を示す。フレームの内部のＣＴＵのサイズは、画像境界（不完全なＣＴＵが存在できる）におけるそれを除いて、同じでなければならない。

［画像をタイルに区分化すること］
タイルが有効になった場合、画像は、垂直および／または水平境界によって分離されたＣＴＵの長方形の形状のグループに分割される。垂直および水平のタイル境界はそれぞれ、底部から且つ底部に、および、左の画像境界から右の画像境界に、画像を交差する。ビットストリームには、当該水平および垂直のタイル境界の位置に関するインジケーションが含まれる。

図７は、画像を９個のタイルに区分化することを例示する。例において、タイル境界は太い破線で示されている。換言すれば、図７は、画像内に異なるサイズの９個のタイルを有するＣＴＵのタイルベースのラスタースキャン順序を示す。タイル境界は太い破線で示されていることに留意されたい。

１つより多いタイルが画像の内部に存在する場合、ＣＴＵのスキャン順序は変更される。ＣＴＵは、以下のルールに従ってスキャンされる。
１．タイルは、本開示ではタイルスキャン順序と呼ばれるラスタースキャン順序で、左から右に、上部から底部にスキャンされる。これは、左上のタイルから開始し、まず同じタイル行にある全てのタイルが左から右にスキャンされることを意味する。その後、第２のタイル行（１つ下のタイル行）内の第１のタイルから開始し、全てのタイルが第２のタイル行において左から右にスキャンされる。当該プロセスは、全てのタイルがスキャンされるまで繰り返される。
２．タイルの内部において、ＣＴＵはラスタースキャン順序でスキャンされる。ＣＴＵ行の内部において、ＣＴＵは左から右にスキャンされ、ＣＴＵ行は上部から底部にスキャンされる。図７は、タイルが存在する場合のＣＴＵのスキャニング順序を例示しており、ＣＴＵの内部の数はスキャニング順序を示している。

タイルの概念は、各タイルが同じ画像の他のタイルから独立してデコード可能であるような方法で画像を区分化することを提供しており、ここでデコードは、エントロピー、残差および予測的デコードを指す。さらに、タイルを使用して、画像を同様のサイズを有する領域に区分化することが可能となる。したがって、画像のタイルを互いに並行して処理する可能性が生じることが可能であり、これは、各処理コアが互いに同一であるマルチコア処理環境には好ましい。

処理順序およびスキャニング順序といった用語は、本開示において以下の通りに使用されている。

処理は、エンコーダまたはデコーダ内で行われるＣＴＵのエンコードまたはデコードを指す。スキャニング順序は、画像の内部の特定の区分のインデックス化を示す。タイルにおけるＣＴＵスキャン順序は、タイルの内部のＣＴＵがどのようにインデックス化されるかを意味しており、これは、ＣＴＵが処理される順序と同じ順序でない場合がある。

［画像をスライスに区分化すること］
スライスの概念は、各スライスが同じ画像の他のスライスから独立したデコード可能であるような方法で画像の区分化を提供し、ここでデコードは、エントロピー、残差および予測的デコードを指す。タイルとの差は、スライスはより任意の形状（区分化の可能性においてよりフレキシブルである）を有することができ、スライス区分化の目的は並列処理ではなく、送信環境におけるパケットサイズのマッチングと、エラー耐性とである。

スライスは、完全な画像、ならびにその部分で構成され得る。ＨＥＶＣにおいて、スライスは、画像の複数の連続したＣＴＵを処理順序で含む。スライスは、それ自身がスライスヘッダまたは画像パラメータセットまたはいくつかの他のユニットにおいてシグナリングされるＣＴＵアドレスを開始することによって識別される。

ＶＶＣのドラフト８において、スライスは、整数個の完全なタイル、または、画像のタイル内の整数個の連続したＣＴＵ行を含む。従って、各垂直スライス境界は常に垂直タイル境界でもある。スライスの水平境界が、タイル境界でないがタイル内の水平ＣＴＵ境界を含むことも可能である：これは、タイルが、その各々のスライスがタイル内の整数個の連続した完全なＣＴＵ行を含む複数の長方形スライスに分割された場合に生じる。

いくつかの例において、ラスタースキャンスライスモードおよび長方形スライスモードといった２つのスライスモードが存在する。ラスタースキャンスライスモードにおいて、スライスは、画像のタイルラスタースキャンにおいて一連のタイルを含む。長方形スライスモードにおいて、スライスは、画像の長方形領域を集合的に形成する多数のタイルを含むか、または、スライスは、画像の長方形領域を集合的に形成する１つのタイルの多数の連続したＣＴＵ行を含む。長方形スライス内のタイルは、そのスライスに対応する長方形領域内においてタイルラスタースキャン順序でスキャンされる。

画像の全てのスライスは、画像全体を集合的に形成する、すなわち、画像の全てのＣＴＵは画像の複数のスライスのうち１つに含まれなければならない。同様のルールがタイルおよびサブ画像に適用される。

［画像をサブ画像に区分化すること］
サブ画像は、画像の長方形の区分である。サブ画像は、画像全体または画像の一部であり得る。サブ画像は、各サブ画像がビデオシーケンス全体の他のサブ画像から独立してデコード可能であるような画像の区分である。ＶＶＣＤｒａｆｔ８において、これは、サブ画像がビットストリームに示された場合、真である。すなわち、ｓｕｂｐｉｃ＿ｔｒｅａｔｅｄ＿ａｓ＿ｐｉｃ＿ｆｌａｇ［ｉ］のインジケーションがサブ画像ｉに対して真である場合、そのサブ画像ｉはビデオシーケンス全体の他のサブ画像から独立してデコード可能である。

サブ画像とタイルまたはスライスとの間の差は、サブ画像はビデオシーケンスの内部に独立してデコード可能なビデオシーケンスを作成することである。一方、タイルおよびスライスの場合は、独立したデコードは、ビデオシーケンスの単一の画像の内部においてのみ保証される。

ＶＶＣＤｒａｆｔ８において、サブ画像は、画像の長方形領域を集合的にカバーする１または複数のスライスを含む。従って、各サブ画像境界は常にスライス境界であり、各垂直サブ画像境界は常に垂直タイル境界である。

図８は、タイル、スライスおよびサブ画像の例を提供する。換言すれば、図８は、４つのタイル、すなわち、２つのタイル列と２つのタイル行とを含み、４つの長方形スライス、および３つのサブ画像を含む画像の例を示す。サブ画像１は、２つのスライスを含む。

図８に示された例において、画像は２１６個のＣＴＵ、４つのタイル、４つのスライスおよび３つのサブ画像に区分化される。ｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１の値は２であり、位置に関連したシンタックス要素は以下の値を有する。

サブ画像０の場合、
・ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［０］は、シグナリングされていないが、０と推論される。
・ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［０］は、シグナリングされていないが、０と推論される。
・ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［０］の値は、８である。
・ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［０］の値は、１１である。

サブ画像１の場合、
・ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［１］の値は９である。
・ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［１］の値は０である。
・ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［１］の値は８である。
・ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［１］の値は５である。

サブ画像２の場合、
・ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［２］の値は９である。
・ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［２］の値は６である。
・ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［２］はシグナリングされていないが、８と推論される。
・ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［２］は、シグナリングされていないが、５と推論される。

［タイルのシグナリング］
以下の表は、タイルのサイズのシグナリング、および画像の内部のタイルの座標（ＶＶＣＤｒａｆｔ８の画像パラメータセットＲＢＳＰシンタックス表から）を例示している。

タイルの区分化情報（各タイルのアドレスおよび寸法）は、通常、パラメータセットに含まれている。上記の例において、まず、インジケーションはビットストリームに含まれている（ｎｏ＿ｐｉｃ＿ｐａｒｔｉｔｉｏｎ＿ｆｌａｇ）であり、画像がスライスおよびタイルに区分化されているか否かを示す。このインジケーションが、真である（画像がスライスまたはタイルに区分化されていないことを意味する）場合、画像が１つのみのスライスと１つのみのタイルに区分化されたと推論され、その境界は画像境界と整合されている。そうでなければ（ｎｏ＿ｐｉｃ＿ｐａｒｔｉｔｉｏｎ＿ｆｌａｇが偽である場合）、タイルの区分化情報はビットストリームに含まれている。

シンタックス要素ｔｉｌｅ＿ｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］は、ｉ'番目のタイル列の幅を示す。シンタックス要素ｔｉｌｅ＿ｒｏｗ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｉ］は、ｉ'番目のタイル行の高さを示す。

タイル行の高さおよびタイル列の幅は、いずれもビットストリーム内で明示的にシグナリングされることができるまたは推論することができる。シンタックス要素ｎｕｍ＿ｅｘｐ＿ｔｉｌｅ＿ｃｏｌｕｍｎｓ＿ｍｉｎｕｓ１およびｎｕｍ＿ｅｘｐ＿ｔｉｌｅ＿ｒｏｗｓ＿ｍｉｎｕｓ１は、それぞれ、その幅および高さが明示的にシグナリングされたタイル列およびタイル行の数を示している。残りのタイル列および行の幅および高さは、関数に従って推論される。

タイルのインデックス化は、「画像におけるタイルスキャン順序」に従う。画像内のタイルはラスタースキャン順序に従って順序付けられ（スキャンされ）、画像の左上隅にある第１のタイルは０番目のタイルであり、インデックスは、各タイル行において左から右へと増加しており、タイル行における最後のタイルがスキャンされた後、次のタイル行（現在のタイル行より１つ下）の左端のタイルに続く。

［スライスのシグナリング］
以下の表は、タイルのサイズのシグナリング、および画像の内部の長方形の形状のスライスの座標（ＶＶＣＤｒａｆｔ８の画像パラメータセットＲＢＳＰシンタックス表から）を例示している。

ＶＶＣＤｒａｆｔ８において、スライスとタイルとの間には以下の関係が存在する。スライスが１または複数の完全なタイルを含むか、または、タイルが１または複数の完全なスライスを含むかのいずれかである。したがって、スライスの座標およびサイズは、ｗ．ｒ．ｔタイル区分化で示される。ＶＶＣＤｒａｆｔ８において、まず、タイル区分化が画像パラメータセット内でシグナリングされる。スライス区分化情報はその後、タイルマッピング情報を使用してシグナリングされる。

上記の表において、シンタックス要素ｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１は、画像の内部のスライスの数を示す。Ｔｉｌｅ＿ｉｄｘ＿ｄｅｌｔａ［ｉ］は、（ｉ＋１）番目とｉ番目のスライスの第１のタイルのタイルインデックス間の差を示す。例えば、画像内の第１のスライスの第１のタイルのインデックスは０である。画像の内部の第２のスライスの第１のタイルのタイルインデックスが５である場合、Ｔｉｌｅ＿ｉｄｘ＿ｄｅｌｔａ［０］は５に等しくなる。この文脈において、タイルインデックスは、スライスのアドレスとして使用されており、すなわち、スライスの第１のタイルのインデックスはスライスの開始アドレスである。

ｓｌｉｃｅ＿ｗｉｄｔｈ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］およびｓｌｉｃｅ＿ｈｅｉｇｈｔ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］は、画像の内部のｉ番目のスライスの幅および高さをタイルの数で示す。

上記の表において、ｓｌｉｃｅ＿ｗｉｄｔｈ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］およびｓｌｉｃｅ＿ｈｅｉｇｈｔ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］の両方が０（ｉ番目のスライスの最大寸法が高さにおいて１つのタイル、幅において１つのタイルであることを示す）に等しい場合、シンタックス要素ｎｕｍ＿ｅｘｐ＿ｓｌｉｃｅｓ＿ｉｎ＿ｔｉｌｅ［ｉ］がビットストリームに含まれることができる。このシンタックス要素は、タイルの内部のスライスの数を示す。

先に説明されたように、ＶＶＣＤｒａｆｔ８によると、スライスは、複数の完全なタイルを含み得、または、タイルは、複数の完全なスライスを含み得、他の代替物は禁止される。上記のシンタックス表によると、まず、スライスの内部のタイルの数が（ｓｌｉｃｅ＿ｗｉｄｔｈ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］およびｓｌｉｃｅ＿ｈｅｉｇｈｔ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］を含むことによって）示される。加えて、スライスの内部のタイルの数がインジケーションに従って１に等しい場合、当該タイルの内部のスライスの数が（ｎｕｍ＿ｅｘｐ＿ｓｌｉｃｅｓ＿ｉｎ＿ｔｉｌｅ［ｉ］で）示される。そのため、ｓｌｉｃｅ＿ｗｉｄｔｈ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］およびｓｌｉｃｅ＿ｈｅｉｇｈｔ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］の両方が１に等しい場合、スライスの実際のサイズは１つのタイルに等しいまたはそれより小さい場合がある。

シンタックス要素ｓｉｎｇｌｅ＿ｓｌｉｃｅ＿ｐｅｒ＿ｓｕｂｐｉｃ＿ｆｌａｇは、真である場合、スライスが存在することと、スライスの全てのサブ画像に対してサブ画像毎に１つのみのスライスが存在する（すなわち、あるサブ画像は１つより多くのスライスに分割することができない）こととを示す。

１つの代替的なシグナリング方法によると、スライスマップ（スライス開始アドレスおよびスライスのサイズ）は、以下の段階に従ってＶＶＣＤｒａｆｔ８に示される。
１．まず、タイル区分化マップがビットストリーム内に示され、ここで、（ｔｉｌｅＩｄｘと呼ばれ得る）インデックスが使用され、（画像におけるタイルスキャン順序に従って）画像内の全てのタイルをインデックス化する。この段階の後、各タイルのインデックス、座標およびサイズが知られる。
２．画像内のスライスの数がシグナリングされる。一例において、スライスの数は、ｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１シンタックス要素によって示すことができる。
３．画像内の第１のスライスについては、スライスの幅および高さのみがタイルの数で示される。第１のスライスの開始アドレスは明示的にシグナリングされていないが、むしろ、ｔｉｌｅＩｄｘ０（画像内の第１のタイルが画像の第１のスライス内の第１のタイルである）と推論される。
４．第１のスライスのサイズが幅において１つのタイルおよび高さにおいて１つのタイルに等しい場合、ならびに、第１のスライス内に含まれたタイルの内部に１つより多くのＣＴＵ行が存在する場合、ｎｕｍ＿ｅｘｐ＿ｓｌｉｃｅｓ＿ｉｎ＿ｔｉｌｅ［０］シンタックス要素がシグナリングされ、それは、当該タイル内に含まれたスライスがいくつあるかを示す（ｎｕｍＳｌｉｃｅｓＩｎＴｉｌｅ［０］と呼ばれる）。
５．画像内の第２のスライスから最後のスライスまでの各々（第２のスライスを含むが、最後のスライスは除く）について、スライスの幅および高さがタイルの数で明示的に示される。スライスの開始アドレスは、ｔｉｌｅ＿ｉｄｘ＿ｄｅｌｔａ［ｉ］シンタックス要素によって明示的に示され得、ここでｉはスライスのインデックスである。開始アドレスが明示的にシグナリングされていない場合（例えば、スライスが、開始位置と、現在のスライスの幅および高さとを使用して次のスライスの開始位置を推論することを可能とさせる順序でシグナリングされた場合）、その後、スライスの開始アドレスは関数を介して推論される。
６．ｎ番目のスライス（ｎは２と、画像内のスライスの数から１を引いた数との間の数である）のサイズが幅において１つのタイルおよび高さにおいて１つのタイルに等しい場合、且つ、第１のスライス内に含まれたタイル内のＣＴＵ行が１つより多い場合、ｎｕｍ＿ｅｘｐ＿ｓｌｉｃｅｓ＿ｉｎ＿ｔｉｌｅ［ｎ］シンタックス要素がシグナリングされ、それは、当該タイル内に含まれたスライスがいくつあるかを示す。
７．画像内の最後のスライスの場合、スライスの幅および高さは明示的にシグナリングされていないが、画像の幅におけるタイルの数、画像の高さにおけるタイルの数、および最後のスライスの開始アドレスに従って推論される。最後のスライスの開始アドレスは、明示的に示されるまたは推論されることができる。画像内の最後のスライスの幅および高さの推論は、以下の２つの方程式に従って実行でき、これらの式は、ＶＶＣＤｒａｆｔ８のセクション６．５．１からのものである。

上記で説明された段階からわかり得るように、最後のスライスの幅および高さはシグナリングされない。スライスの開始アドレスが知られている場合に容易に推論できるので、ビットストリーム内には最後のスライスの幅および高さを含まないことが望ましい。結果として、ビットストリームに冗長な情報を含まないことによって、効率的圧縮が達成される。

上記方程式における変数ｔｉｌｅＸ、ｔｉｌｅＹ、ＮｕｍＴｉｌｅＣｏｌｕｍｎｓ、ＮｕｍＴｉｌｅＲｏｗｓは、後ほど説明される。

［ＶＶＣＤｒａｆｔ８のセクション６．５．１］
［６．５．１ＣＴＢラスタースキャン、タイルスキャンおよびサブ画像スキャンのプロセス］
長方形スライスの場合、０からｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１の範囲内の（両端を含む）ｉに対する、ｉ番目のスライスにおけるＣＴＵの数を指定するリストＮｕｍＣｔｕｓＩｎＳｌｉｃｅ［ｉ］、０からｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１の範囲内の（両端を含む）ｉに対する、スライスの左上のタイルのインデックスを指定するリストＳｌｉｃｅＴｏｐＬｅｆｔＴｉｌｅＩｄｘ［ｉ］、および、０からｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１の範囲内の（両端を含む）ｉと０からＮｕｍＣｔｕｓＩｎＳｌｉｃｅ［ｉ］－１の範囲内の（両端を含む）ｊとに対する、ｉ番目のスライス内のｊ番目のＣＴＢの画像ラスタースキャンアドレスを指定するマトリックスＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［ｉ］［ｊ］は、以下の通りに導出される。

ここで、関数ＡｄｄＣｔｂｓＴｏＳｌｉｃｅ（ｓｌｉｃｅＩｄｘ，ｓｔａｒｔＸ，ｓｔｏｐＸ，ｓｔａｒｔＹ，ｓｔｏｐＹ）は、以下の通り指定されている。

再び、完全性のために、２０２０年８月２９日のｈｔｔｐ：／／ｈａｎｄｌｅ．ｉｔｕ．ｉｎｔ／１１．１００２／１０００／１４３３６を介して引用されたＲｅｃｏｍｍｅｎｄａｔｉｏｎＩＴＵ－ＴＨ．２６６（ＩＳＯ／ＩＥＣ２３０９０‐３：２０２０）による多用途ビデオコーディングもほぼ同じことを引用しており、その内容は以下の通りである。

ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇが１に等しい場合、０からｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１の範囲内の（両端を含む）ｉに対する、ｉ番目のスライスにおけるＣＴＵの数を指定するリストＮｕｍＣｔｕｓＩｎＳｌｉｃｅ［ｉ］、０からｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１の範囲内の（両端を含む）ｉに対する、スライス内の第１のＣＴＵを含むタイルのタイルインデックスを指定するリストＳｌｉｃｅＴｏｐＬｅｆｔＴｉｌｅＩｄｘ［ｉ］、０からｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１の範囲内の（両端を含む）ｉと０からＮｕｍＣｔｕｓＩｎＳｌｉｃｅ［ｉ］－１の範囲内の（両端を含む）ｊとに対する、ｉ番目のスライス内のｊ番目のＣＴＢの画像ラスタースキャンアドレスを指定するマトリックスＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［ｉ］［ｊ］、および、ｉ番目のスライスを含むタイルにおけるスライスの数を指定する変数ＮｕｍＳｌｉｃｅｓＩｎＴｉｌｅ［ｉ］，は、以下の通りに導出される。

ここでは、ＶＶＣＤｒａｆｔ８の上記に示されたテキストを参照する。

画像の内部のスライスマップのシグナリングについての上記の段階的説明は、ＶＶＣＤｒａｆｔ８におけるシグナリングの一例である。より具体的には、当該説明は、長方形の形状のスライスが使用され、サブ画像毎のスライスの数が１に等しく示されておらず、画像には１つのタイルより多くが存在しており、タイルの内部のＣＴＵ行の数が１より大きい場合を説明している。当該パラメータのうちいくつかが変更された場合、スライスマップのシグナリングの他のモードを使用できる。例えば、サブ画像毎に１つのみのスライスが存在すると示される場合、スライスの幅および高さはビットストリーム内で明示的にシグナリングされないが、むしろ、対応するサブ画像の幅および高さに等しいと推論される。

ＶＶＣＤｒａｆｔ８の副項６．５．１は、スライスｉの内部のＣＴＵのスキャン順序を指定しており、ここでｉはスライスインデックスである。この副項の出力であるマトリックスＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［ｉ］［ｎ］は、スライスｉの内部のＣＴＵスキャン順序を指定しており、ここでｎはスライスｉの０とＣＴＵの数との間のＣＴＵインデックスである。ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［ｉ］［ｎ］の値は、スライスｉにおけるｎ番目のＣＴＵのアドレスを（画像におけるラスタースキャン順序で）指定する。

図９は、ＣＴＵの画像におけるラスタースキャン順序（「画像におけるＣＴＵラスタースキャン順序」）と、画像内の１つのスライス（スライス５、すなわち、画像内の５番目のスライス）とを例として示す。換言すれば、図９は、画像の内部のＣＴＵのラスタースキャン順序を示しており、ここで画像は１つのタイルと１つのサブ画像とで構成されている。

この例によると、ＣｔｂＡｄｄｒＩｎＳｌｉｃｅの値は、以下の通りである。
ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［４］［０］＝２７
ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［４］［１］＝２８
ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［４］［２］＝２９
ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［４］［３］＝３０
ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［４］［４］＝３７
ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［４］［５］＝３８
ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［４］［６］＝３９
ＣｔｂＡｄｄｒＩｎＳｌｉｃｅ［４］［７］＝４０

［本開示において使用されている用語］
・本開示で説明された「画像におけるタイルスキャン順序」
・本開示で説明された「タイルの内部のＣＴＵスキャン順序」
・本開示で説明された「スライスの内部のＣＴＵスキャン順序」
・本開示で説明された「画像におけるＣＴＵラスタースキャン順序」
・「画像の内部のＣＴＵのタイルベースのスキャン順序」
・「スキャニング順序」は、インデックスが増加する順序に従った、ＸのＹでのインデックス化を指す。
・「処理」は、エンコーダまたはデコーダにおけるデコードまたはエンコードを意味する。したがって、処理順序は、Ｘ（例えば、ＣＴＵ）がエンコーダまたはデコーダにおいて処理される順序を意味する。

ＶＶＣＤｒａｆｔ８において、画像毎に１つより多くのタイルが存在する場合、スライスのシグナリングは以下の通りである。

１．明示的な指示または推論を使用して、スライスの開始タイルアドレスをタイルの数で決定する。
２．最後のスライスを除いて、スライス毎に、スライスがタイルをいくつ含むかをシグナリングする。
ａ．スライスが１つのタイルのみを含むと決定した場合、タイル内にスライスがいくつ含まれているかを示す。
３．画像における最後のスライスについて、スライスが少なくとも１つの完全なタイルを含むと決定された場合のスライス内のタイルの数を推論する。

換言すれば、ＶＶＣＤｒａｆｔ８において、画像内の最後のスライスのサイズが幅および高さの両方の寸法において１つのタイルより大きいまたはそれに等しい場合、最後のスライスのサイズは推論され、また、シグナリングされることはない。

これは表１からわかり得、ここで、ｓｌｉｃｅ＿ｗｉｄｔｈ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］およびｓｌｉｃｅ＿ｈｅｉｇｈｔ＿ｉｎ＿ｔｉｌｅｓ＿ｍｉｎｕｓ１［ｉ］（ｉ番目のスライスの幅および高さをそれぞれタイルの数で示す）は、ｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１（ｆｏｒ－ｌｏｏｐ「ｆｏｒ（ｉ＝０；ｉ＜ｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１；ｉ＋＋）」に起因する）より小さい場合、ビットストリーム内に含まれる。したがって、スライスの幅および高さは、ｉがｎｕｍ＿ｓｌｉｃｅｓ＿ｉｎ＿ｐｉｃ＿ｍｉｎｕｓ１に等しい場合、すなわち、最後のスライスに対して、シグナリングされない。

［クロマスケーリングを使用したルママッピング（ＬＭＣＳ）］
ＶＶＣにおいて、クロマスケーリングを使用したルママッピング（ＬＭＣＳ）と呼ばれるコーディングツールが、新たな処理ブロックとしてループフィルタの前に追加される。ＬＭＣＳは、２つの主な成分を有する：１）適応型の区分的線形モデルに基づくルマ成分のインループ（ｉｎ－ｌｏｏｐ）マッピング、２）クロマ成分については、ルマ依存クロマ残差スケーリングが適用される。図１１は、デコーダの観点からＬＭＣＳアーキテクチャを示す。図１１における水色の陰影ブロックは、マッピングされたドメインに処理が適用された場所を示しており、これらは、逆量子化、逆変換、ルマイントラ予測、および、ルマ予測をルマ残差と一緒に追加することを含む。図１１における陰影のないブロックは、元の（すなわち、マッピングされていない）ドメインに処理が適用された場所を示しており、これらは、非ブロック化、ＡＬＦおよびＳＡＯ等のループフィルタ、動き補償予測、クロマイントラ（ｃｈｒｏｍａｉｎｔｒａ）予測、クロマ予測をクロマ残差と一緒に追加すること、およびデコード済みの画像を参照画像として格納することを含む。図１１における淡黄色の陰影ブロックは、新たなＬＭＣＳ機能ブロックであり、ルマ信号の順方向と逆方向のマッピングと、ルマ依存クロマスケーリングプロセスを含む。ＶＶＣのほとんどの他のツールと同様に、ＬＭＣＳは、ＳＰＳフラグを使用してシーケンスレベルで有効化／無効化できる。

スライスヘッダ：タイル内の全てのタイルまたはＣＴＵ行に関連したデータ要素を含むコーディング済みのスライスの一部がスライスに表されている。

［スライスヘッダ］

［表３］

表３は、ＶＶＣＤｒａｆｔ８のスライスヘッダシンタックス構造の一部を例示する。「…」を含む行は、表における行のうちいくつかが省略されていることを示す。

スライスヘッダにおいて、シンタックス要素は、以下を示す：
ｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇは、画像ヘッダシンタックス構造がスライスヘッダに存在するか否かを示す。画像ヘッダシンタックス構造がスライスヘッダに存在しない場合、それは、ビットストリーム内に含まれなければならない画像ヘッダに含まれていなければならない。
ｓｌｉｃｅ＿ａｄｄｒｅｓｓは、スライスの第１のタイルのタイルインデックスを示す。
ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１は、スライスに含まれたタイルの数を示す。

図１０は、１２個のタイルと３個のスライスに区分化された画像を例示する。または、換言すれば、図１０は、１２個のタイルと３個のラスタースキャンスライスに区分化された１８×１２のルマＣＴＵを有する画像を示す。

図１０に示されたこの例において、スライスアドレスおよびｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１シンタックス要素は、画像のスライス毎に以下の値を仮定する：
・スライス１
・ｓｌｉｃｅ＿ａｄｄｒｅｓｓ=０であり、スライス開始アドレスはタイルインデックス０である。
・ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１＝１であり、スライスは２個のタイルで構成されている。
・スライス２
・ｓｌｉｃｅ＿ａｄｄｒｅｓｓ=２であり、スライス開始アドレスはタイルインデックス２である。
・ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１＝５であり、スライスは５個のタイルで構成されている。
・スライス３
・ｓｌｉｃｅ＿ａｄｄｒｅｓｓ=７であり、スライス開始アドレスはタイルインデックス７である。
・ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１＝４であり、スライスは４個のタイルで構成されている。

１に等しいｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、クロマスケーリングを使用したルママッピングが現在のスライスに対して有効になることを指定する。０に等しいｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、クロマスケーリングを使用したルママッピングが現在のスライスに対して有効にならないことを指定する。ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇが存在しない場合は、０に等しいと推論される。

スライスの開始タイル（画像内のスライスのアドレス）および画像の内部のタイルの数は、２つの方法を使用して示され得る。ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇが１に等しい（画像のスライスが長方形の形状を有することを示す）場合、表１におけるシグナリングメカニズムが使用される。表１は、画像パラメータセットの一部を表す。このメカニズムにおいて、画像の全てのスライスのアドレスおよびサイズは、ビットストリーム内の画像の第１のスライスの前に、画像パラメータセット内でシグナリングされる。なお、ビットストリームは、情報（画像パラメータセット、画像のスライス、および、シンタックス構造等の内部のシンタックス要素）がビットストリーム内に含まれた（またはビットストリームからパースされた）順序を有する。

そうでなければ、ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇが０に等しい（画像のスライスが長方形の形状である必要がないことを示す）場合、スライスヘッダにおけるｓｌｉｃｅ＿ａｄｄｒｅｓｓおよびｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１シンタックス要素は、スライスのアドレスおよびサイズを示す。

［画像ヘッダ］
［７．３．２．６画像ヘッダのＲＢＳＰシンタックス］

上記の表は、ＶＶＣＤｒａｆｔ８に係る画像ヘッダシンタックスを提示する。それは、画像ヘッダ構造、およびｒｂｓｐ＿ｔｒａｉｌｉｎｇ＿ｂｉｔｓ（）を含み、これらは、画像ヘッダ内のビットの数を８の倍数に等しくさせるフィラービットである。

［画像ヘッダ構造］
［７．３．２．７画像ヘッダ構造のシンタックス］

画像ヘッダ構造は、画像の全てのスライスに適用可能なシンタックス要素を含む。シンタックス要素のうちいくつかは、上記の表に提示された画像ヘッダ構造に含まれる。例として、ｐｈ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、ＬＭＣＳ（クロマスケーリングを使用したルママッピング）コーディングツールが、画像のスライスに対して有効になったか否かを示す。１に等しいｐｈ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、クロマスケーリングを使用したルママッピングがＰＨと関連付けられた全てのスライスに対して有効になることを指定する。０に等しいｐｈ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、クロマスケーリングを使用したルママッピングが、ＰＨに関連付けられた１つのまたはより多くのまたは全てのスライスに対して無効になり得ることを指定する。存在しない場合、ｐｈ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は０に等しいと推論される。

上記からわかり得るように、画像ヘッダ構造は、スライスヘッダまたは画像ヘッダのいずれかにおいて存在することができる。ＶＶＣＤｒａｆｔ８によると、画像ヘッダ構造は、画像のスライスヘッダまたは画像ヘッダのいずれかにおいて存在しなければならない。画像ヘッダ構造が画像ヘッダにおいて存在する場合、当該画像ヘッダを参照する画像の全てのスライスは画像ヘッダ構造を含んではならない。その逆も真であり、画像ヘッダ構造が画像ヘッダに存在しない、したがって、画像ヘッダが特定の画像のビットストリームに含まれていない場合、画像ヘッダ構造は、当該画像のスライスのスライスヘッダに存在しなければならない。

さらに、ＶＶＣＤｒａｆｔ８には別の制約があり、ここで、画像ヘッダ構造がスライスヘッダに存在する場合、画像は、１つのスライスのみで構成されなければならない（すなわち、画像は複数のスライスに分割できない）。

現在のＶＶＣＤｒａｆｔ８は、ｓｌｉｃｅ＿ａｄｄｒｅｓｓおよびｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１が特定の場合にビットストリーム内に冗長的に含まれているので、効率的ではない。ｓｌｉｃｅ＿ａｄｄｒｅｓｓおよびｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１のビットストリーム内での冗長的な包含により、画像のあらゆるスライスヘッダがこのシンタックス要素を含み得、故に圧縮効率が低減するので、ビットレートが増加する。

［実施形態１］
実施形態によると、スライスヘッダにおけるｓｌｉｃｅ＿ａｄｄｒｅｓｓおよびｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１シンタックス要素の存在は、スライスヘッダにおける画像ヘッダ構造の存在に基づいて制御されている。

本発明は、上記の表に示されたように実装できる。本発明によると、ｓｌｉｃｅ＿ａｄｄｒｅｓｓは、６行目の条件が真になった場合に、スライスヘッダに含まれる。換言すれば、ｓｌｉｃｅ＿ａｄｄｒｅｓｓは、以下の場合、スライスヘッダに含まれる。
・画像内のタイルの数が１より多く且つ長方形でないスライスが許容され（ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ=０）且つ画像ヘッダ構造がスライスヘッダ内に存在しない。
または、
・（ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ=１）であり且つ現在のサブ画像内のスライスの数が１より多い。

そうでなければ、ｓｌｉｃｅ＿ａｄｄｒｅｓｓはスライスヘッダに含まれておらず、その値は０に等しいと推論することができる。

加えてまたは代替的に、スライスヘッダにおけるｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１シンタックス要素の存在は、スライスヘッダにおける画像ヘッダ構造の存在によって制御することができる。例えば、ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１は、スライスヘッダに画像ヘッダ構造がある場合は、スライスヘッダに含まれていない。

上記の表の行１０は、
・Ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇが０に等しく、画像内のタイルの数が１より多く、ｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇが０に等しい
場合に、ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１がスライスヘッダに含まれる本発明の実装を示す。

そうでなければ、ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１はスライスヘッダに含まれておらず、その値は、画像内のタイルの数から１を引いた数に等しいと推論できる。

先に説明されたように、ＶＶＣＤｒａｆｔ８における、スライスヘッダの画像ヘッダ構造の包含を制限するビットストリーム適合性要件が存在する。ＶＶＣＤｒａｆｔ８によると、画像ヘッダ構造は、画像毎に１つのスライスが存在する場合に、スライスヘッダに含まれることができる。

本発明によると、スライスヘッダにおける画像ヘッダ構造の存在は、スライスインジケーションにおけるｓｌｉｃｅ＿ａｄｄｒｅｓｓおよびタイルの数の存在を制御するために使用されており、これは、画像内に単一のスライスが存在する場合に、スライスアドレスは画像内の第１のタイルに等しくなければならず、スライス内のタイルの数は画像内のタイルの数に等しくなければならないからである。

［実施形態２］

加えてまたは代替的に、スライスヘッダにおけるｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１の存在は、画像内のタイルの数（例えば、上記の表のＮｕｍＴｉｌｅｓＩｎＰｉｃ）とｓｌｉｃｅ＿ａｄｄｒｅｓｓとの間の差によって制御される。

より具体的には、画像内のタイルの数とｓｌｉｃｅ＿ａｄｄｒｅｓｓとの間の差が閾値より小さい場合、ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１はスライスヘッダに含まれておらず、その値は、予め定義された数に等しいと推論される。例えば、ＮｕｍＴｉｌｅｓＩｎＰｉｃとｓｌｉｃｅ＿ａｄｄｒｅｓｓとの間の差が１より小さいまたはそれに等しい場合、ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１はビットストリームに含まれておらず、その値は、０に等しい（現在のスライス内に１つのタイルが存在することを示す）と推論される。

ｓｌｉｃｅ＿ａｄｄｒｅｓｓは、スライスのスライスアドレスを指定する。

存在しない場合、ｓｌｉｃｅ＿ａｄｄｒｅｓｓの値は０に等しいと推論される。

ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇが０に等しい場合、以下が適用される。

スライスアドレスは、スライス内の第１のタイルのラスタースキャンタイルインデックスである。

ｓｌｉｃｅ＿ａｄｄｒｅｓｓの長さは、Ｃｅｉｌ（Ｌｏｇ２（ＮｕｍＴｉｌｅｓＩｎＰｉｃ））ビットである。

ｓｌｉｃｅ＿ａｄｄｒｅｓｓの値は、０からＮｕｍＴｉｌｅｓＩｎＰｉｃ－１の範囲（両端を含む）内のものとする。

そうでなければ（ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇが１に等しい）、以下が適用される。

スライスアドレスは、現在のスライスのサブ画像レベルのスライスインデックス、すなわちＳｕｂｐｉｃＬｅｖｅｌＳｌｉｃｅＩｄｘ［ｊ］であり、ｊは、現在のスライスの画像レベルのスライスインデックスである。
ｓｌｉｃｅ＿ａｄｄｒｅｓｓの長さは、Ｃｅｉｌ（Ｌｏｇ２（ＮｕｍＳｌｉｃｅｓＩｎＳｕｂｐｉｃ［ＣｕｒｒＳｕｂｐｉｃＩｄｘ］））ビットである。
ｓｌｉｃｅ＿ａｄｄｒｅｓｓの値は、０からＮｕｍＳｌｉｃｅｓＩｎＳｕｂｐｉｃ［ＣｕｒｒＳｕｂｐｉｃＩｄｘ］－１の範囲（両端を含む）内のものとする。

それは、以下の制約が適用されるビットストリーム適合性要件である。

ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇが０に等しいまたはｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０に等しい場合、ｓｌｉｃｅ＿ａｄｄｒｅｓｓの値は、同じコーディング済みの画像の任意の他のコーディング済みのスライスＮＡＬユニットのｓｌｉｃｅ＿ａｄｄｒｅｓｓの値に等しくないものとする。

そうでなければ、ｓｕｂｐｉｃ＿ｉｄおよびｓｌｉｃｅ＿ａｄｄｒｅｓｓの値のペアは、同じコーディング済みの画像の任意の他のコーディング済みのスライスＮＡＬユニットのｓｕｂｐｉｃ＿ｉｄおよびｓｌｉｃｅ＿ａｄｄｒｅｓｓの値のペアに等しくないものとする。

画像のスライスの形状は、各ＣＴＵが、デコードされる場合に、その左の境界全体と上部境界全体とが画像境界で構成されるまたは以前にデコードされたＣＴＵの境界で構成されるものとするようなものとする。

ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１＋１は、存在する場合、スライス内のタイルの数を指定する。ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１の値は、０からＮｕｍＴｉｌｅｓＩｎＰｉｃ－１の範囲（両端を含む）内のものとする。存在しない場合、ｎｕｍ＿ｔｉｌｅｓ＿ｉｎ＿ｓｌｉｃｅ＿ｍｉｎｕｓ１の値は、０に等しいと推論されるものとする。

現在のスライス内のＣＴＵの数を指定する変数ＮｕｍＣｔｕｓＩｎＣｕｒｒＳｌｉｃｅ、および、０からＮｕｍＣｔｕｓＩｎＣｕｒｒＳｌｉｃｅ－１の範囲内の（両端を含む）ｉに対する、スライス内のｉ番目のＣＴＢの画像ラスタースキャンアドレスを指定するリストＣｔｂＡｄｄｒＩｎＣｕｒｒＳｌｉｃｅ［ｉ］は、以下の通りに導出される。

変数ＳｕｂｐｉｃＬｅｆｔＢｏｕｎｄａｒｙＰｏｓ、ＳｕｂｐｉｃＴｏｐＢｏｕｎｄａｒｙＰｏｓ、ＳｕｂｐｉｃＲｉｇｈｔＢｏｕｎｄａｒｙＰｏｓおよびＳｕｂｐｉｃＢｏｔＢｏｕｎｄａｒｙＰｏｓは、以下の通りに導出される。

［実施形態３］

加えてまたは代替的に、スライスヘッダにおけるｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの存在は、スライスヘッダにおける画像ヘッダ構造の存在に基づいて制御される。例示的な実装態様が上記の表において行１５に含まれている。

より具体的には、画像ヘッダ構造がスライスヘッダに含まれている場合、ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇはスライスヘッダに含まれていない。加えて、スライスヘッダに含まれていない場合、ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は、以下のルールに従って推論できる。
・ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は、ｐｈ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇに等しいと推論される。

代替的にまたは加えて、ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は、スライスヘッダに存在しない場合、以下のルールに従って推論できる。
・ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は、ｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇが１に等しい（画像ヘッダ構造がスライスヘッダに含まれている）場合、ｐｈ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇに等しいと推論される。

代替的にまたは加えて、ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は、スライスヘッダに存在しない場合、以下のルールに従って推論できる。
・ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は、ｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇが０に等しい場合、０に等しいと推論される。

上記の実施形態は、行６および１０の条件「！ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ＆＆ＮｕｍＴｉｌｅｓＩｎＰｉｃ＞１」を「！ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ」に置換することによって実装できる。いくつかの例示的な実装態様において、ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇの値が０に等しい（画像内のスライスが必ずしも長方形である必要はないことを示す）場合、ＮｕｍＴｉｌｅｓＩｎＰｉｃシンタックス要素の値は、０より大きくなければならない（例えば、スライス内のタイルの数は１より大きくなければならない）。換言すれば、ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇの値は、画像内のタイルの数が１より大きい場合に、０に等しくなる他ならない。そのような実装において、条件「！ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ＆＆ＮｕｍＴｉｌｅｓＩｎＰｉｃ＞１」および「！ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ」は、同一の結果を有するであろう。したがって、条件の一部である「！ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ＆＆ＮｕｍＴｉｌｅｓＩｎＰｉｃ＞１」を含む条件である（上記の実施形態の全てにおける行６および１０の）条件は、「！ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ」に置換できる。

上記の実施形態は、行６および１０の条件「！ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ＆＆ＮｕｍＴｉｌｅｓＩｎＰｉｃ＞１」を「！ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇ」に置換することによって実装できる。いくつかの例示的な実装態様において、ｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇの値が０に等しい（画像内の各スライスが１または複数のタイルを含んでいることを示す）場合と、ｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇが０に等しい（画像内のスライスの数が１より大きいことを示す）場合とにおいて、ＮｕｍＴｉｌｅｓＩｎＰｉｃは、ｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇが０に等しく且つｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇが０に等しい場合、１より大きくなければならない。

以下は、上述の実施形態に示されたようなエンコーディング方法およびデコーディング方法の適用、ならびにそれらを使用するシステムの説明である。

図１４は、本開示の実施形態に係るビデオビットストリームのデコード方法のフローチャートを示す図である。図１４に示された方法は、デコーディングデバイスによって実装される、ビデオビットストリームから画像をデコードする方法であって、ビットストリームは現在のスライスのスライスヘッダと現在のスライスを表すデータとを含み、当該方法は、条件が満たされた場合にスライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータを取得する段階であって、条件は、現在のスライスのスライスアドレスが、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、段階（段階１６０１）と、現在のスライス内のタイルの数と現在のスライスを表すデータとを使用して現在のスライスを再構築する段階（段階１６０３）とを含む、方法である。

図１５は、本開示の実施形態に係るビデオビットストリームの別のエンコード方法のフローチャートを示す図である。図１５に示された方法は、エンコーディングデバイスによって実装される、ビデオビットストリームをエンコードする方法であって、ビットストリームは現在のスライスのスライスヘッダと現在のスライスを表すデータとを含み、当該方法は、条件が満たされた場合にスライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータをエンコードする段階であって、条件は、現在のスライスのスライスアドレスが、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、段階（段階１７０１）と、現在のスライス内のタイルの数と現在のスライスを表すデータとを使用して現在のスライスを再構築する段階（段階１７０３）とを含む、方法である。

図１６は、本開示の実施形態に係るビデオビットストリームのデコードのための装置、すなわち、デコーダ（３０）を示す図である。図１６に示された装置は、ビデオビットストリームから画像をデコードする装置であって、ビットストリームは現在のスライスのスライスヘッダと現在のスライスを表すデータとを含み、当該装置は、条件が満たされた場合にスライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータを取得するように構成された取得ユニットであって、条件は、現在のスライスのスライスアドレスが、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、取得ユニット（３００１）と、現在のスライス内のタイルの数と現在のスライスを表すデータとを使用して現在のスライスを再構築するように構成された再構築ユニット（３００３）とを含む、装置（３０）である。

図１７は、本開示の実施形態に係るビデオビットストリームのエンコードのための装置、すなわち、エンコーダ（２０）を示す図である。図１７に示された装置は、コーディング済みのビデオビットストリームをエンコードする装置であって、ビットストリームは現在のスライスのスライスヘッダと現在のスライスを表すデータとを含み、当該装置は、条件が満たされた場合にスライスヘッダから現在のスライス内のタイルの数を導出するのに使用されるパラメータをエンコードするように構成されたエンコードユニットであって、条件は、現在のスライスのスライスアドレスが、現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、エンコードユニット（２００１）と、現在のスライス内のタイルの数と現在のスライスを表すデータとを使用して現在のスライスを再構築するように構成された再構築ユニット（２００３）とを含む、装置（２０）である。

図１６に示されたビデオデコーディング装置は、図１Ａ、１Ｂおよび３に示されたデコーダ３０と、図１３に示されたビデオデコーダ３２０６とであってもよく、または、それらによって構成されてもよい。さらに、デコーディング装置は、図４に示されたビデオコーディングデバイス４００、図５に示された装置５００および図１２に示された端末デバイス３１０６によって構成されてよい。図１７に示されたエンコーディング装置は、図１Ａ、１Ｂおよび３に示されたエンコーダ２０であってもよく、または、それによって構成されてもよい。さらに、エンコーディング装置は、図４に示されたビデオコーディングデバイス４００、図５に示された装置５００および図１２に示されたキャプチャデバイス３１０２によって構成されてよい。

本開示は、以下のさらなる図を開示する。図１２は、コンテンツ配信サービスを実現するためのコンテンツ供給システム３１００を示すブロック図である。このコンテンツ供給システム３１００は、キャプチャデバイス３１０２、端末デバイス３１０６を含み、任意選択的に、ディスプレイ３１２６を含む。キャプチャデバイス３１０２は、通信リンク３１０４を介して端末デバイス３１０６と通信する。通信リンクは、上述した通信チャネル１３を含んでよい。通信リンク３１０４は、限定されるものではないが、ＷＩＦＩ（登録商標）、イーサネット（登録商標）、ケーブル、無線（３Ｇ／４Ｇ／５Ｇ）、ＵＳＢまたはそれらの任意の種類の組み合わせなどを含む。

キャプチャデバイス３１０２は、データを生成し、上記の実施形態に示されたようなエンコーディング方法によってデータをエンコードすることができる。代替的に、キャプチャデバイス３１０２は、データをストリーミングサーバ（図示せず）に配信してよく、サーバは、データをエンコードして、エンコード済みのデータを端末デバイス３１０６に送信する。キャプチャデバイス３１０２は、限定されるものではないが、カメラ、スマートフォンまたはパッド、コンピュータまたはラップトップ、ビデオ会議システム、ＰＤＡ、車載デバイスまたはそれらのいずれかの組み合わせなどを含む。例えば、上述のように、キャプチャデバイス３１０２はソースデバイス１２を含んでよい。データがビデオを含む場合、キャプチャデバイス３１０２に含まれるビデオエンコーダ２０は、ビデオエンコーディング処理を実際に実行してよい。データがオーディオ（すなわち、音声）を含む場合、キャプチャデバイス３１０２に含まれるオーディオエンコーダは、オーディオエンコーディング処理を実際に実行してよい。いくつかの実際のシナリオについて、キャプチャデバイス３１０２は、それらを一緒に多重化することにより、エンコード済みのビデオおよびオーディオデータを配信する。他の実際のシナリオについて、例えば、ビデオ会議システムにおいて、エンコード済みのオーディオデータおよびエンコード済みのビデオデータは多重化されない。キャプチャデバイス３１０２は、エンコード済みのオーディオデータおよびエンコード済みのビデオデータを別個に端末デバイス３１０６に配信する。

コンテンツ供給システム３１００では、端末デバイス３１０がエンコード済みのデータを受信して再現する。端末デバイス３１０６は、データ受信および復元機能を有するデバイス、例えば、上述したエンコード済みのデータをデコードすることが可能なスマートフォンまたはパッド３１０８、コンピュータまたはラップトップ３１１０、ネットワークビデオレコーダ（ＮＶＲ）／デジタルビデオレコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、セットトップボックス（ＳＴＢ）３１１６、ビデオ会議システム３１１８、ビデオ監視システム３１２０、パーソナルデジタルアシスタント（ＰＤＡ）３１２２、車載デバイス３１２４またはそれらのいずれかの組み合わせなどであってよい。例えば、上述のように、端末デバイス３１０６はデスティネーションデバイス１４を含んでよい。エンコード済みのデータがビデオを含む場合、端末デバイスに含まれるビデオデコーダ３０は、ビデオデコーディングを実行することを優先させる。エンコード済みのデータがオーディオを含む場合、端末デバイスに含まれるオーディオデコーダは、オーディオデコーディング処理を実行することを優先させる。

そのディスプレイを有する端末デバイス、例えば、スマートフォンまたはＰａｄ３１０８、コンピュータまたはラップトップ３１１０、ネットワークビデオレコーダ（ＮＶＲ）／デジタルビデオレコーダ（ＤＶＲ）３１１２、ＴＶ３１１４、パーソナルデジタルアシスタント（ＰＤＡ）３１２２、または車載デバイス３１２４の場合、端末デバイスは、デコード済みのデータをそのディスプレイに供給することができる。ディスプレイを搭載していない端末デバイス、例えば、ＳＴＢ３１１６、ビデオ会議システム３１１８またはビデオ監視システム３１２０について、外部ディスプレイ３１２６は、デコード済みのデータを受信および示すために、内部で接触される。

本システムにおける各デバイスがエンコードまたはデコードを実行する場合、上述の実施形態で示したような画像エンコーディングデバイスまたは画像デコーディングデバイスを使用することができる。

図１３は、端末デバイス３１０６の例の構造を示す図である。端末デバイス３１０６がキャプチャデバイス３１０２からストリームを受信した後に、プロトコル進行ユニット３２０２は、ストリームの送信プロトコルを解析する。プロトコルは、限定されるものではないが、リアルタイムストリーミングプロトコル（ＲＴＳＰ）、ハイパーテキストトランスファープロトコル（ＨＴＴＰ）、ＨＴＴＰライブストリーミングプロトコル（ＨＬＳ）、ＭＰＥＧ－ＤＡＳＨ、リアルタイムトランスポートプロトコル（ＲＴＰ）、リアルタイムメッセージングプロトコル（ＲＴＭＰ）、または、それらの任意の種類の組み合わせなどを含む。

プロトコル進行ユニット３２０２がストリームを処理した後、ストリームファイルが生成される。当該ファイルは、逆多重化ユニット３２０４に出力される。逆多重化ユニット３２０４は、多重化されたデータをエンコード済みのオーディオデータおよびエンコード済みのビデオデータに分離できる。上述のように、いくつかの実際のシナリオについて、例えば、ビデオ会議システムでは、エンコード済みのオーディオデータおよびエンコード済みのビデオデータは多重化されていない。この状況において、エンコード済みのデータは、逆多重化ユニット３２０４を通すことなく、ビデオデコーダ３２０６およびオーディオデコーダ３２０８に送信される。

この逆多重化処理により、ビデオエレメンタリストリーム（ＥＳ）と、オーディオＥＳと、任意選択的に字幕が生成される。ビデオデコーダ３２０６は、上述の実施形態で説明したようなビデオデコーダ３０を含み、上述の実施形態で示したようなデコーディング方法でビデオＥＳをデコードしてビデオフレームを生成し、このデータを同期ユニット３２１２に供給する。オーディオデコーダ３２０８は、オーディオＥＳをデコードしてオーディオフレームを生成し、このデータを同期ユニット３２１２に供給する。代替的に、ビデオフレームは、同期ユニット３２１２に供給する前に、バッファ（図１３には図示せず）に格納され得る。同様に、オーディオフレームは、同期ユニット３２１２に供給する前に、バッファ（図１３には図示せず）に格納され得る。

同期ユニット３２１２は、ビデオフレームとオーディオフレームを同期させ、ビデオ／オーディオをビデオ／オーディオディスプレイ３２１４に供給する。例えば、同期ユニット３２１２は、ビデオおよびオーディオ情報の提示を同期させる。情報は、コーディング済みのオーディオおよびビジュアルデータの提示に関するタイムスタンプ、および、データストリームそのものの配信に関するタイムスタンプを使用してシンタックスでコードしてよい。

字幕デコーダ３２１０は、ストリームに字幕が含まれている場合、字幕をデコードしてビデオフレームおよびオーディオフレームに同期させ、ビデオ／オーディオ／字幕をビデオ／オーディオ／字幕ディスプレイ３２１６に供給する。

本発明は、上述のシステムに限定されるものではなく、上述の実施形態における画像エンコーディングデバイスまたは画像デコーディングデバイスのいずれかを、他のシステム、例えば、カーシステムに組み込むことも可能である。

［数学演算子］
本開示に使用される数学演算子は、Ｃプログラミング言語で使用されるものと同様である。しかしながら、整数除算および算術シフト演算の結果はより厳密に定義され、べき乗および実数値除算などの追加の演算が定義される。番号およびカウントの規定は概して０から始まり、例えば「第１」は０番目と同等であり、「第２」は１番目と同等であり、以降も同様である。

［算術演算子］
以下の算術演算子を以下の通りに定める。

［論理演算子］
以下の論理演算子は、以下の通りに定義される。
ｘ＆＆ｙｘおよびｙのブール論理上の「ａｎｄ」
ｘ｜｜ｙｘおよびｙのブール論理上の「ｏｒ」
！ブール論理上の「ｎｏｔ」
ｘ？ｙ：ｚｘがＴＲＵＥであるかまたは０に等しくない場合、ｙの値になり、そうでなければ、ｚの値になる。

［関係演算子］
以下の関係演算子は、以下の通りに定義される。
＞より大きい
＞＝以上
＜より小さい
＜＝以下
＝＝に等しい
！＝に等しくない

関係演算子が、値「ｎａ」（非該当）をアサインされているシンタックス要素または変数に適用される場合、値「ｎａ」は、そのシンタックス要素または変数の区別的な値として扱われる。値「ｎａ」は、任意の他の値に等しくないとみなされる。

［ビット単位演算子］
以下のビット毎の演算子は以下の通りに定められる。
＆ビット単位の「ａｎｄ」。整数項に対して演算を行う場合、整数値の２の補数表現に対して演算を行う。別の項より少ないビットを含む二進項に対して演算を行う場合、そのより短い項は、０に等しいより上位のビットを追加することによって拡張される。
｜ビット単位の「ｏｒ」。整数項に対して演算を行う場合、整数値の２の補数表現に対して演算を行う。別の項より少ないビットを含む二進項に対して演算を行う場合、そのより短い項は、０に等しいより上位のビットを追加することによって拡張される。
＾ビット単位の「排他的ｏｒ」。整数項に対して演算を行う場合、整数値の２の補数表現に対して演算を行う。別の項より少ないビットを含む二進項に対して演算を行う場合、そのより短い項は、０に等しいより上位のビットを追加することによって拡張される。
ｘ＞＞ｙｙの二進数だけの、ｘの２の補数整数表現の算術右シフト。この関数は、ｙの非負の整数値に関してのみ定義される。右シフトの結果として最上位ビット（ＭＳＢ）にシフトされたビットは、シフト演算前のｘのＭＳＢに等しい値を有する。
ｘ＜＜ｙｙの二進数だけの、ｘの２の補数整数表現の算術左シフト。この関数は、ｙの非負の整数値に関してのみ定義される。左シフトの結果として最下位ビット（ＬＳＢ）にシフトされたビットは、０に等しい値を有する。

［代入演算子］
以下の算術演算子は、以下の通りに定義される。
＝代入演算子
＋＋インクリメント、すなわち、ｘ＋＋はｘ＝ｘ＋１に相当する。配列インデックスに使用される場合、インクリメント演算の前の変数の値になる。
－－デクリメント、すなわち、ｘ－－はｘ＝ｘ－１に相当する。配列インデックスに使用される場合、デクリメント演算の前の変数の値になる。
＋＝指定された量だけのインクリメント、すなわち、ｘ＋＝３はｘ＝ｘ＋３に相当し、ｘ＋＝（－３）はｘ＝ｘ＋（－３）に相当する。
－＝指定された量だけのデクリメント、すなわち、ｘ－＝３はｘ＝ｘ－３に相当し、ｘ－＝（－３）はｘ＝ｘ－（－３）に相当する。

［範囲表記］
以下の表記は、値の範囲を指定するのに使用される。
ｘ＝ｙ．．ｚｘはｙからｚまでの整数値（両端を含む）をとり、ｘ、ｙおよびｚは整数でありｚはｙより大きい。

［数学関数］
以下の数学関数が定義される。

Ａｓｉｎ（ｘ）逆三角サイン関数であり、
－１．０から１．０までの範囲内（両端を含む）にある引数ｘに対して演算を行い、
出力値は、ラジアンの単位で、－π÷２からπ÷２までの範囲内（両端を含む）にある。
Ａｔａｎ（ｘ）逆三角タンジェント関数であり、
引数ｘに対して演算を行い、出力値は、ラジアンの単位で、－π÷２からπ÷２までの範囲内（両端を含む）にある。

Ｃｅｉｌ（ｘ）ｘ以上の最小の整数
Ｃｌｉｐ１Ｙ（ｘ）＝Ｃｌｉｐ３（０，（１＜＜ＢｉｔＤｅｐｔｈＹ）－１，ｘ）
Ｃｌｉｐ１Ｃ（ｘ）＝Ｃｌｉｐ３（０，（１＜＜ＢｉｔＤｅｐｔｈＣ）－１，ｘ）

Ｃｏｓ（ｘ）ラジアンの単位である引数ｘに対して操作する三角コサイン関数
Ｆｌｏｏｒ（ｘ）ｘ以下の最大の整数

Ｌｎ（ｘ）ｘの自然対数（底ｅ対数であり、ｅは自然対数の底２．７１８２８１８２８...である）
Ｌｏｇ２（ｘ）底を２とするｘの対数
Ｌｏｇ１０（ｘ）底を１０とするｘの対数

Ｒｏｕｎｄ（ｘ）＝Ｓｉｇｎ（ｘ）＊Ｆｌｏｏｒ（Ａｂｓ（ｘ）＋０．５）

Ｓｉｎ（ｘ）ラジアンの単位である引数ｘを操作する三角サイン関数

Ｓｗａｐ（ｘ，ｙ）＝（ｙ，ｘ）
Ｔａｎ（ｘ）ラジアンの単位である引数ｘを操作する三角タンジェント関数

［演算の優先順位の順序］
式の優先順位の順序が括弧を使用して明示的に指示されていない場合、以下のルールが適用される。
－より高い優先順位の演算は、より低い優先順位の任意の演算の前に評価される。
－同じ優先順位の演算は、左から右に順次評価される。

以下の表は、演算の優先順位を最高から最低まで指定する。表でのより高い位置は、より高い優先順位を示す。

Ｃプログラミング言語でも使用される演算子の場合、本明細書で使用される優先順位の順序は、Ｃプログラミング言語で使用されるものと同じである。
表：最高（表の最上部）から最低（表の最下部）までの操作の優先順位

［論理演算のテキストの説明］
テキストでは、論理演算のステートメント（ｓｔａｔｅｍｅｎｔ）は、以下の形式で数学的に説明される。

は、以下の方式で説明することができる。

各「Ｉｆ...Ｏｔｈｅｒｗｉｓｅ，ｉｆ...Ｏｔｈｅｒｗｉｓｅ，...」というテキストでのステートメントには、「...ａｓｆｏｌｌｏｗｓ」または「ｔｈｅｆｏｌｌｏｗｉｎｇａｐｐｌｉｅｓ」は、直後に「Ｉｆ...」が導入される。「Ｉｆ...Ｏｔｈｅｒｗｉｓｅ，ｉｆ...Ｏｔｈｅｒｗｉｓｅ」の最後の条件は常に、「Ｏｔｈｅｒｗｉｓｅ，...」である。インターリーブされた「Ｉｆ...Ｏｔｈｅｒｗｉｓｅ，ｉｆ...Ｏｔｈｅｒｗｉｓｅ，...」ステートメントは、「Ｏｔｈｅｒｗｉｓｅ，...」で終わる「...ａｓｆｏｌｌｏｗｓ」または「...ｔｈｅｆｏｌｌｏｗｉｎｇａｐｐｌｉｅｓ」をマッチングすることによって識別され得る。

テキストでは、論理演算のステートメントは、以下の形式で数学的に説明される。

は、以下の方式で説明することができる。

は、以下の方式で説明することができる。
条件０である場合、ステートメント０
条件１である場合、ステートメント１

本発明の実施形態は主にビデオコーディングに基づいて説明されてきたが、コーディングシステム１０、エンコーダ２０、およびデコーダ３０（およびそれに対応してシステム１０）の実施形態ならびに本明細書に記載の他の実施形態はまた、静止画像処理またはコーディング、すなわち、ビデオコーディングのようにいずれかの先行するまたは連続する画像から独立した個々の画像の処理またはコーディングのために構成され得ることに留意されたい。一般に、画像処理コーディングが単一の画像１７に限定される場合、インター予測ユニット２４４（エンコーダ）および３４４（デコーダ）のみが利用可能ではないことがある。ビデオエンコーダ２０およびビデオデコーダ３０の全ての他の機能（ツールまたは技術とも称される）は、静止画像処理、例えば、残差計算２０４／３０４、変換２０６、量子化２０８、逆量子化２１０／３１０、（逆）変換２１２／３１２、区分化２６２／３６２、イントラ予測２５４／３５４．および／または、ループフィルタリング２２０、３２０、ならびに、エントロピーコーディング２７０およびエントロピーデコーディング３０４のために等しく使用され得る。

例えばエンコーダ２０およびデコーダ３０の実施形態、ならびに、例えばエンコーダ２０およびデコーダ３０を参照して本明細書に記載された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせで実装されてよい。ソフトウェアにおいて実装される場合、機能は、コンピュータ可読媒体上に格納されるか、または、通信媒体を介して１または複数の命令もしくはコードとして送信され、ハードウェアベースの処理ユニットによって実行されてよい。コンピュータ可読媒体は、データ記憶媒体等の有形の媒体に対応するコンピュータ可読記憶媒体、または、例えば通信プロトコルに従った、コンピュータプログラムの１つの場所から別の場所への移動を容易にする任意の媒体を含む通信媒体を含んでよい。このように、コンピュータ可読媒体は、一般に、（１）非一時的な有形コンピュータ可読記憶媒体、または、（２）信号もしくは搬送波等の通信媒体に対応してよい。データ記憶媒体は、本開示において説明された技術の実装のための命令、コードおよび／またはデータ構造を取得するために１または複数のコンピュータまたは１または複数のプロセッサによりアクセスされ得る任意の利用可能な媒体であってよい。コンピュータプログラム製品はコンピュータ可読媒体を含んでよい。

限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭもしくは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、または命令もしくはデータ構造の形態で所望のプログラムコードを格納するために使用することができ、コンピュータによってアクセスすることができる任意の他の媒体を含むことができる。加えて、あらゆる接続がコンピュータ可読媒体と呼ぶのに適切である。例えば、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者線（ＤＳＬ）、または、赤外線、無線、およびマイクロ波等の無線技術を使用して、ウェブサイト、サーバ、または他のリモートソースから命令が送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、または、赤外線、無線、およびマイクロ波等の無線技術が媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まず、その代わりに、非一時的な有形記憶媒体に関するものと理解されるべきである。本明細書で使用されるディスク（Ｄｉｓｋａｎｄｄｉｓｃ）は、コンパクトディスク（ＣＤ）、レーザディスク、光ディスク、デジタル多用途ディスク（ＤＶＤ）、フロッピディスク、およびブルーレイディスクを含み、ここで、通常、ディスク（ｄｉｓｋ）はデータを磁気的に再現するものであり、ディスク（ｄｉｓｃ）はデータをレーザによって光学的に再現するものである。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれるべきである。

命令は、１または複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルロジックアレイ（ＦＰＧＡ）、または他の同等な集積もしくはディスクリート論理回路等の、１または複数のプロセッサによって実行されてよい。したがって、本明細書で使用される「プロセッサ」という用語は、前述の構造のいずれか、または、本明細書に記載の技術の実装に好適な任意の他の構造を指してよい。加えて、いくつかの態様では、本明細書に記載の機能は、エンコーディングおよびデコーディングのために構成されている専用ハードウェアおよび／またはソフトウェアモジュール内に提供されるか、または、組み合わされたコーデックに組み込まれてよい。加えて、これらの技術は、１または複数の回路または論理素子に完全に実装することができる。

本開示の技術は、無線ハンドセット、集積回路（ＩＣ）またはＩＣのセット（例えば、チップセット）を含む、多種多様なデバイスまたは装置において実装してよい。様々なコンポーネント、モジュール、またはユニットが、開示された技術を実行するように構成されているデバイスの機能的態様を強調するように本開示において記載されているが、異なるハードウェアユニットによる実現は必ずしも要求されない。むしろ、上述のように、好適なソフトウェアおよび／またはファームウェアと連動して、様々なユニットがコーデックハードウェアユニットにして組み合わされるか、または、上述のように、１または複数のプロセッサを含む相互運用ハードウェアユニットの集合によって提供されてよい。

本開示は、以下の２１個のさらなる態様を開示する。

（項目１）
デコーディングデバイスによって実装される、ビデオまたは画像ビットストリームのデコード方法の態様であって、前記ビットストリームは現在のスライスを表すデータを含み、前記方法は、存在条件が満たされることを条件として、前記ビットストリームのスライスヘッダから前記現在のスライスの前記スライスアドレスを取得する段階であって、前記存在条件は、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことを含む、段階と、前記現在のスライスの前記スライスアドレスに基づいて前記現在のスライスを再構築する段階とを備える、態様。

（項目２）
前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことは、シンタックス要素が偽に等しいことを含み、偽に等しい前記シンタックス要素は、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことを指定する、態様１に記載の方法の態様。

（項目３）
前記現在のスライスの前記スライスアドレスの値は、前記存在条件が満たされていない場合、ゼロに等しいと推論される、態様１または２に記載の方法の態様。

（項目４）
デコーディングデバイスによって実装されるビデオまたは画像ビットストリームのデコード方法の態様であって、前記ビットストリームは現在のスライスを表すデータを含み、前記方法は、存在条件が満たされることを条件として、前記ビットストリームのスライスヘッダから前記現在のスライスのタイルの数を導出するのに使用されるパラメータを取得する段階であって、前記存在条件は、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことを含む、段階と、前記現在のスライス内の前記タイルの数に基づいて前記現在のスライスを再構築する段階とを備える、態様。

（項目５）
前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことは、シンタックス要素が偽に等しいことを含み、偽に等しい前記シンタックス要素は、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことを指定する、態様４に記載の方法の態様。

（項目６）
前記現在のスライスの前記パラメータの値は、前記存在条件が満たされていない場合、前記現在のスライスから１を引いた値である前記画像内の合計のタイルの数に等しいと推論される、態様４または５に記載の方法の態様。

（項目７）
デコーディングデバイスによって実装されるビデオまたは画像ビットストリームのデコード方法の態様であって、前記ビットストリームは現在のスライスを表すデータを含み、前記方法は、存在条件が満たされることを条件として、前記ビットストリームのスライスヘッダから前記現在のスライスのタイルの数を導出するのに使用されるパラメータを取得する段階であって、前記存在条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、段階と、前記現在のスライス内の前記タイルの数に基づいて前記現在のスライスを再構築する段階とを備える、態様。

（項目８）
前記現在のスライスの前記スライスアドレスが、前記画像内の前記最後のタイルの前記アドレスであることは、前記画像内の前記タイルの数から前記現在のスライスの前記スライスアドレスを引いた値が１に等しいことを含む、態様７に記載の方法の態様。

（項目９）
前記現在のスライスの前記パラメータの値は、前記存在条件が満たされていない場合、デフォルト値に等しいと推論される、態様７または８に記載の方法の態様。

（項目１０）
前記デフォルト値は０に等しい、態様９に記載の方法の態様。

（項目１１）
デコーディングデバイスによって実装されるビデオまたは画像ビットストリームのデコード方法の態様であって、前記ビットストリームは現在のスライスを表すデータを含み、前記方法は、存在条件が満たされることを条件として、前記ビットストリームのスライスヘッダから前記現在のスライスのタイルの数を導出するのに使用されるパラメータを取得する段階であって、前記存在条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことと、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないこととを含む、段階と、前記現在のスライス内の前記タイルの数に基づいて前記現在のスライスを再構築する段階とを備える、態様。

（項目１２）
前記パラメータの値は、前記現在のスライスの前記スライスアドレスが前記画像内の前記最後のタイルの前記アドレスである場合には第１デフォルト値に等しいと推論され、または、第２のデフォルト値であり、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しない、態様１１に記載の方法の態様。

（項目１３）
デコーディングデバイスによって実装されるビデオまたは画像ビットストリームのデコード方法の態様であって、前記ビットストリームは現在のスライスを表すデータを含み、前記方法は、存在条件が満たされることを条件として、前記ビットストリームのスライスヘッダから前記現在のスライスに対してクロマスケーリングを使用したルママッピングが有効になったかどうかを指定するのに使用されるパラメータ（ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ等）を取得する段階であって、前記存在条件は、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことを含む、段階と、前記パラメータ内のタイルの数に基づいて前記現在のスライスを再構築する段階とを備える、態様。

（項目１４）
前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことは、シンタックス要素が偽に等しいことを含み、偽に等しい前記シンタックス要素は、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことを指定する、態様１３に記載の方法の態様。

（項目１５）
エンコーディングデバイスによって実装される、ビデオまたは画像をビットストリームにエンコードする方法の態様であって、前記ビットストリームは現在のスライスを表すデータを含み、前記方法は、存在条件が満たされることを条件として、前記ビットストリームのスライスヘッダから前記現在のスライスの前記スライスアドレスを前記ビットストリームに含める段階であって、前記存在条件は、前記画像ヘッダシンタックス構造が前記スライスヘッダに存在しないことを含む、段階と、前記現在のスライスの前記スライスアドレスに基づいて前記現在のスライスを再構築する段階とを備える、態様。

（項目１６）
態様１から１５のいずれか１つに記載の方法を実行するための処理回路を備えるデコーダ（３０）の態様。

（項目１７）
コンピュータ上またはプロセッサ上で実行される場合、先行する態様のいずれか１つに記載の方法を実行するためのプログラムコードを含むコンピュータプログラム製品の態様。

（項目１８）
デコーダの態様であって、前記デコーダは、
１または複数のプロセッサと、前記プロセッサに結合され且つ前記プロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体であって、前記プログラミングは、前記プロセッサによって実行される場合、前記デコーダを、先行する態様１から１５のいずれか１つに記載の方法を実行するように構成する、非一時的コンピュータ可読記憶媒体とを備える、態様。

（項目１９）
コンピュータデバイスによって実行される場合、前記コンピュータデバイスに先行する態様１から１５のいずれか１つに記載の方法を実行させるプログラムコードを保持する、非一時的コンピュータ可読媒体の態様。

（項目２０）

複数のシンタックス要素を含むことによる、前記ビデオ信号に対するエンコード済みのビットストリームの態様であって、前記複数のシンタックス要素はｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇを含み、フラグ（ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ等）は、ｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇの値に少なくとも基づいて、前記スライスヘッダ内で条件付きでシグナリングされている、態様。

（項目２１）
イメージデコーディングデバイスによってデコードされたエンコード済みのビットストリームを含み、前記ビットストリームは、ビデオ信号またはイメージ信号のフレームを複数のブロックに分割することによって生成され、複数のシンタックス要素を含む、非一時的記録媒体の態様であって、前記複数のシンタックス要素はｒｅｃｔ＿ｓｌｉｃｅ＿ｆｌａｇまたはｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１を含み、フラグ（ｓｌｉｃｅ＿ｌｍｃｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇ等）は、ｐｉｃｔｕｒｅ＿ｈｅａｄｅｒ＿ｉｎ＿ｓｌｉｃｅ＿ｈｅａｄｅｒ＿ｆｌａｇの値に少なくとも基づいて、前記スライスヘッダ内で条件付きでシグナリングされている、態様。
［他の可能な項目］
［項目１］
デコーディングデバイスによって実装される、ビデオビットストリームから画像をデコードする方法であって、前記ビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記方法は、
条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータを取得する段階であって、前記条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、段階と、
前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築する段階と
を備える、方法。
［項目２］
前記現在のスライスの前記スライスアドレスが前記画像内の前記最後のタイルの前記アドレスであることは、前記画像内の前記タイルの数から前記現在のスライスの前記スライスアドレスを引いた値が１に等しいと決定することを含む、項目１に記載の方法。
［項目３］
前記現在のスライスの前記スライスアドレスが前記画像内の前記最後のタイルの前記アドレスでないことは、前記画像内の前記タイルの数から前記現在のスライスの前記スライスアドレスを引いた値が１より大きいと決定することを含む、項目１に記載の方法。
［項目４］
前記現在のスライスの前記パラメータの値は、条件が満たされていない場合のデフォルト値に等しいと推論される、項目１から３のいずれか一項に記載の方法。
［項目５］
前記デフォルト値は０に等しい、項目４に記載の方法。
［項目６］
前記スライスアドレスはタイル単位である、項目１から５のいずれか一項に記載の方法。
［項目７］
前記条件はさらに、前記現在のスライスはラスタースキャンモードにあると決定される段階を含む、項目１から６のいずれか一項に記載の方法。
［項目８］
前記現在のスライス内の前記タイルの数を使用して前記現在のスライスを再構築する段階は、前記現在のスライス内の前記タイルの数を使用して前記現在のスライス内の前記コーディングツリーユニットのスキャン順序を決定する段階と、前記スキャン順序を使用して前記現在のスライス内の前記コーディングツリーユニットを再構築する段階とを有する、項目１から７のいずれか一項に記載の方法。
［項目９］
エンコーディングデバイスによって実装される、ビデオビットストリームをエンコードする方法であって、前記ビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記方法は、
条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータをエンコードする段階であって、前記条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、段階と、
前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築する段階と
を備える、方法。
［項目１０］
ビデオビットストリームから画像をデコードする装置であって、前記ビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記装置は、
条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータを取得するように構成された取得ユニットであって、前記条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、取得ユニットと、
前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築するように構成された再構築ユニットと
を備える、装置。
［項目１１］
コーディング済みのビデオビットストリームをエンコードする装置であって、前記ビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記装置は、
条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータをエンコードするように構成されたエンコードユニットであって、前記条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、エンコードユニットと、
前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築するように構成された再構築ユニットと
を備える、装置。
［項目１２］
項目９に記載の方法を実行するための処理回路を備える、エンコーダ（２０）。
［項目１３］
項目１から８のいずれか一項に記載の方法を実行するための処理回路を備える、デコーダ（３０）。
［項目１４］
コンピュータ上またはプロセッサ上で実行される場合、項目１から９のいずれか一項に記載の方法を実行するためのプログラムコードを含むコンピュータプログラム製品。
［項目１５］
デコーダであって、
１または複数のプロセッサと、
前記プロセッサに結合され且つ前記プロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体であって、前記プログラミングは、前記プロセッサによって実行される場合、前記デコーダを、項目１から８のいずれか一項に記載の方法を実行するように構成する、非一時的コンピュータ可読記憶媒体と
を備える、デコーダ。
［項目１６］
エンコーダであって、
１または複数のプロセッサと、
前記プロセッサに結合され且つ前記プロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体であって、前記プログラミングは、前記プロセッサによって実行される場合、前記エンコーダを、項目９に記載の方法を実行するように構成する、非一時的コンピュータ可読記憶媒体と
を備える、エンコーダ。
［項目１７］
コンピュータデバイスによって実行される場合、前記コンピュータデバイスに項目１から９のいずれか一項に記載の方法を実行させるプログラムコードを保持する、非一時的コンピュータ可読媒体。
［項目１８］
ビデオビットストリームを含む非一時的記憶媒体であって、前記ビットストリームは、現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記スライスヘッダは、前記現在のスライスのスライスアドレスを含み、
条件が満たされた場合、前記スライスヘッダはさらに、前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータを含み、前記条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、非一時的記憶媒体。

Claims

デコーディングデバイスによって実装される、ビデオビットストリームから画像をデコードする方法であって、前記ビデオビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記方法は、
条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータを取得する段階であって、前記条件は、前記現在のスライスのスライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、段階と、
前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築する段階と
を備える、方法。
前記現在のスライスの前記スライスアドレスが前記画像内の前記最後のタイルの前記アドレスであることは、前記画像内の前記タイルの数から前記現在のスライスの前記スライスアドレスを引いた値が１に等しいと決定することを含む、請求項１に記載の方法。
前記現在のスライスの前記スライスアドレスが前記画像内の前記最後のタイルの前記アドレスでないことは、前記画像内の前記タイルの数から前記現在のスライスの前記スライスアドレスを引いた値が１より大きいと決定することを含む、請求項１に記載の方法。
前記現在のスライスの前記パラメータの値は、条件が満たされていない場合のデフォルト値に等しいと推論される、請求項１から３のいずれか一項に記載の方法。
前記デフォルト値は０に等しい、請求項４に記載の方法。
前記スライスアドレスはタイル単位である、請求項１から５のいずれか一項に記載の方法。
前記条件はさらに、前記現在のスライスはラスタースキャンモードにあると決定される段階を含む、請求項１から６のいずれか一項に記載の方法。
前記現在のスライス内の前記タイルの数を使用して前記現在のスライスを再構築する段階は、前記現在のスライス内の前記タイルの数を使用して前記現在のスライス内のコーディングツリーユニットのスキャン順序を決定する段階と、前記スキャン順序を使用して前記現在のスライス内の前記コーディングツリーユニットを再構築する段階とを有する、請求項１から７のいずれか一項に記載の方法。
エンコーディングデバイスによって実装される、ビデオビットストリームをエンコードする方法であって、前記ビデオビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記方法は、
条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータをエンコードする段階であって、前記条件は、前記現在のスライスのスライスアドレスが、前記現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、段階と、
前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築する段階と
を備える、方法。
ビデオビットストリームから画像をデコードする装置であって、前記ビデオビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記装置は、
条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータを取得するように構成された取得ユニットであって、前記条件は、前記現在のスライスのスライスアドレスが、前記現在のスライスが位置付けられた前記画像内の最後のタイルのアドレスではないことを含む、取得ユニットと、
前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築するように構成された再構築ユニットと
を備える、装置。
コーディング済みのビデオビットストリームをエンコードする装置であって、前記コーディング済みのビットストリームは現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記装置は、
条件が満たされた場合に前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータをエンコードするように構成されたエンコードユニットであって、前記条件は、前記現在のスライスのスライスアドレスが、前記現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、エンコードユニットと、
前記現在のスライス内の前記タイルの数と前記現在のスライスを表す前記データとを使用して前記現在のスライスを再構築するように構成された再構築ユニットと
を備える、装置。
請求項９に記載の方法を実行するための処理回路を備える、エンコーダ。
請求項１から８のいずれか一項に記載の方法を実行するための処理回路を備える、デコーダ。
コンピュータに、請求項１から９のいずれか一項に記載の方法を実行させるためのコンピュータプログラム。
デコーダであって、
１または複数のプロセッサと、
前記１または複数のプロセッサに結合され且つ前記１または複数のプロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体であって、前記プログラミングは、前記１または複数のプロセッサによって実行される場合、前記デコーダを、請求項１から８のいずれか一項に記載の方法を実行するように構成する、非一時的コンピュータ可読記憶媒体と
を備える、デコーダ。
エンコーダであって、
１または複数のプロセッサと、
前記１または複数のプロセッサに結合され且つ前記１または複数のプロセッサによる実行のためのプログラミングを格納する非一時的コンピュータ可読記憶媒体であって、前記プログラミングは、前記１または複数のプロセッサによって実行される場合、前記エンコーダを、請求項９に記載の方法を実行するように構成する、非一時的コンピュータ可読記憶媒体と
を備える、エンコーダ。
コンピュータデバイスによって実行される場合、前記コンピュータデバイスに請求項１から９のいずれか一項に記載の方法を実行させるプログラムコードを保持する、非一時的コンピュータ可読記憶媒体。
ビデオビットストリームを含む非一時的記憶媒体であって、前記ビデオビットストリームは、現在のスライスのスライスヘッダと前記現在のスライスを表すデータとを含み、前記スライスヘッダは、前記現在のスライスのスライスアドレスを含み、
条件が満たされた場合、前記スライスヘッダはさらに、前記スライスヘッダから前記現在のスライス内のタイルの数を導出するのに使用されるパラメータを含み、前記条件は、前記現在のスライスの前記スライスアドレスが、前記現在のスライスが位置付けられた画像内の最後のタイルのアドレスではないことを含む、非一時的記憶媒体。