JP2023184565A

JP2023184565A - ビデオエンコーダ、ビデオデコーダ、及び対応する方法

Info

Publication number: JP2023184565A
Application number: JP2023177002A
Authority: JP
Inventors: ヘンドリー，フヌ; Hendry Fnu; ワン，イエクォイ; Ye-Kui Wang
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2018-12-27
Filing date: 2023-10-12
Publication date: 2023-12-28
Also published as: WO2020142175A8; PT3903492T; KR20210105980A; US11729401B2; WO2020142175A1; KR102660599B1; EP4376414A2; JP2022533497A; KR20240063987A; ES2992052T3; EP4376414A3; CN113273196A; MX2021007872A; PL3903492T3; EP3903492B1; JP7368477B2; US12126817B2; US20220174290A1; EP3903492A4; HUE066902T2

Abstract

【課題】ビデオビットストリームを復号する方法を提供する。【解決手段】ビットストリームは、少なくとも１つのピクチャのコーディングデータを含み、各ピクチャは、少なくとも１つのタイルグループを含む。方法は、コーディングピクチャのタイル情報がパラメータセット内に又はタイルグループヘッダ内に存在するかを指定するフラグをパースするステップを含む。タイル情報は、ピクチャのどのタイルがタイルグループに含まれるかを示す。方法は、フラグに基づき、パラメータセット又はタイルグループヘッダからタイル情報をパースする。方法は、タイル情報に基づき、コーディングピクチャの復号データを取得する。【選択図】図８

Description

本開示は、概して、ビデオコーディングに関し、具体的には、ビデオコーディングにおけるタイルグループシグナリングに関する。

比較的短いビデオでも描写するために必要なビデオデータの量は相当なものになり得る。これは、データが限られた帯域幅能力を有する通信ネットワークに渡りストリーミングされる又はその他の場合に通信されるとき、困難をもたらすことがある。したがって、ビデオデータは、通常、今日の電気通信ネットワークに渡り通信される前に、圧縮される。ビデオが記憶装置に格納されるとき、メモリリソースが限られていることがあるので、ビデオのサイズも問題になり得る。ビデオ圧縮装置は、送信又は記憶の前に、ソースにおいてビデオデータをコーディングするためにソフトウェア及び／又はハードウェアを度々使用し、それによりデジタルビデオ画像を表現するために必要なデータの量を削減する。圧縮されたデータは、次に、ビデオデータを復号するビデオ伸長装置により宛先において受信される。限られたネットワークリソース及びより高いビデオ品質の増え続ける要求に伴い、画像品質を僅かしか又は全く犠牲にせずに圧縮率を向上する改良された圧縮及び伸長技術が望ましい。

本開示の第１の態様は、エンコーダにおいて実施される方法であって、前記方法は、
前記エンコーダのプロセッサにより、コーディングピクチャのタイル情報がパラメータセット内に存在するか又はタイルグループヘッダ内に存在するかを指定するフラグを符号化するステップであって、前記タイル情報は、前記ピクチャのどのタイルがタイルグループに含まれるかを示す、ステップと、
前記プロセッサにより、前記フラグが、コーディングピクチャの前記タイル情報は前記パラメータセット内に符号化されることを指定するという決定に応答して、前記タイル情報を前記パラメータセット内にのみ符号化するステップと、
前記プロセッサにより、前記フラグが、コーディングピクチャの前記タイル情報は前記タイルグループヘッダ内に符号化されることを指定するという決定に応答して、前記タイル情報を前記タイルグループヘッダ内にのみ符号化するステップと、
前記プロセッサにより、前記タイル情報に基づき、前記ビデオビットストリーム内に前記ピクチャを符号化するステップと、
ネットワークに沿ってデコーダへ向けて前記ビデオビットストリームを送信するステップと、
を含む方法を含む。本態様は、タイルグループ構造シグナリングを向上し及び冗長な情報を削減するメカニズムを提供する。

任意的に、第１の態様では、前記プロセッサにより、前記タイル情報を前記パラメータセット内にのみ符号化するステップは、前記プロセッサにより、前記ピクチャ内の各タイルグループの最初のタイルのタイル識別子（ＩＤ）を符号化するステップを含む。

任意的に、第１の態様では、前記プロセッサにより、前記タイル情報を前記パラメータセット内にのみ符号化するステップは、
前記プロセッサにより、前記パラメータセットを参照する現在タイルグループが１より多くのタイルを含むかどうかを指定する第２フラグをパースするステップと、
前記プロセッサにより、前記第２フラグが、前記パラメータセットを参照する前記現在タイルグループが１より多くのタイルを含むことを指定するという決定に応答して、前記ピクチャ内の前記現在タイルグループの最後のタイルのタイルＩＤを符号化するステップと、
を更に含む。

任意的に、第１の態様では、前記プロセッサにより、前記タイル情報を前記パラメータセット内にのみ符号化するステップは、
前記プロセッサにより、前記パラメータセットを参照する現在タイルグループが１より多くのタイルを含むかどうかを指定する第２フラグをパースするステップと、
前記プロセッサにより、前記第２フラグが、前記パラメータセットを参照する前記現在タイルグループが１より多くのタイルを含むことを指定するという決定に応答して、前記ピクチャ内の前記現在タイルグループ内のタイルの数を符号化するステップと、
を更に含む。

任意的に、第１の態様では、前記プロセッサにより、前記タイル情報を前記タイルグループヘッダ内にのみ符号化するステップは、
前記プロセッサにより、前記ピクチャ内のタイルグループの最初のタイルのタイルＩＤをタイルグループヘッダ内に符号化するステップと、
前記プロセッサにより、前記フラグが、前記コーディングピクチャの前記タイル情報は前記タイルグループヘッダ内に符号化されることを指定するかどうか、及び前記第２フラグが、前記パラメータセットを参照する現在タイルグループは１より多くのタイルを含むことを指定するかどうか、を決定するステップと、
前記フラグが、前記コーディングピクチャの前記タイル情報は前記タイルグループヘッダ内に符号化されることを指定する、及び前記第２フラグが、前記パラメータセットを参照する前記現在タイルグループは１より多くのタイルを含むことを指定する、という決定に応答して、前記ピクチャ内の前記タイルグループの最後のタイルのタイルＩＤを前記タイルグループヘッダピクチャ内に符号化するステップと、
を含む。

本開示の第２の態様は、ビデオビットストリームを復号するデコーダにおいて実施される方法であって、前記ビットストリームは、少なくとも１つのピクチャのためのコーディングデータを含み、各ピクチャは少なくとも１つのタイルグループを含み、前記方法は、
前記復号のプロセッサにより、コーディングピクチャのタイル情報がパラメータセット内又はタイルグループヘッダ内に存在するかを指定するフラグをパースするステップであって、前記タイル情報は、前記ピクチャのどのタイルがタイルグループに含まれるかを示す、ステップと、
前記プロセッサにより、前記フラグが、コーディングピクチャの前記タイル情報は前記パラメータセット内に符号化されることを指定するという決定に応答して、前記タイル情報を前記パラメータセットからパースするステップと、
前記プロセッサにより、前記フラグが、コーディングピクチャの前記タイル情報は前記タイルグループヘッダ内に符号化されることを指定するという決定に応答して、前記タイル情報を前記タイルグループヘッダからパースするステップと、
前記タイル情報に基づき、前記符号化ピクチャの前記復号データを取得するステップと、
を含む方法を含む。

任意的に、第２態様では、前記プロセッサにより、前記パラメータセット内の前記タイル情報をパースするステップは、前記ピクチャ内の各タイルグループの最初のタイルのタイル識別子（ＩＤ）を復号するステップを含む。

任意的に、第２態様では、前記プロセッサにより、前記パラメータセット内の前記タイル情報をパースするステップは、
前記プロセッサにより、前記パラメータセットを参照する現在タイルグループが１より多くのタイルを含むかどうかを指定する第２フラグをパースするステップと、
前記第２フラグが、前記パラメータセットを参照する前記現在タイルグループが１より多くのタイルを含むことを指定するという決定に応答して、前記ピクチャ内の前記現在タイルグループの最後のタイルのタイルＩＤを復号するステップと、
を更に含む。

任意的に、第２態様では、前記プロセッサにより、前記パラメータセット内の前記タイル情報をパースするステップは、
前記プロセッサにより、前記パラメータセットを参照する現在タイルグループが１より多くのタイルを含むかどうかを指定する第２フラグをパースするステップと、
前記第２フラグが、前記パラメータセットを参照する前記現在タイルグループが１より多くのタイルを含むことを指定するという決定に応答して、前記ピクチャ内の前記現在タイルグループ内のタイルの数を復号するステップと、
を更に含む。

任意的に、第２態様では、前記プロセッサにより、前記タイルグループヘッダ内の前記タイル情報をパースするステップは、
タイルグループヘッダ内の、前記ピクチャ内のタイルグループの最初のタイルのタイルＩＤを復号するステップと、
前記フラグが、前記コーディングピクチャの前記タイル情報は前記タイルグループヘッダ内に符号化されることを指定するかどうか、及び前記第２フラグが、前記パラメータセットを参照する現在タイルグループは１より多くのタイルを含むことを指定するかどうか、を決定するステップと、
前記フラグが、前記コーディングピクチャの前記タイル情報は前記タイルグループヘッダ内に符号化されることを指定する、及び前記第２フラグが、前記パラメータセットを参照する前記現在タイルグループは１より多くのタイルを含むことを指定する、という決定に応答して、前記タイルグループヘッダピクチャ内の、前記ピクチャ内の前記タイルグループの最後のタイルのタイルＩＤを復号するステップと、
を含む。

任意的に、第２態様では、前記プロセッサにより、コーディングピクチャのタイル情報がパラメータセット内に又はタイルグループヘッダ内に存在するかどうかを指定する前記フラグをパースするステップは、前記フラグが前記パラメータセット内に存在しないという決定に応答して、前記フラグが、前記コーディングピクチャの前記タイル情報は前記タイルグループヘッダ内にのみ存在することを指定すると推定するステップを含む。

任意的に、前述の態様のいずれかにおいて、前記フラグはtile_group_info_in_pps_flagと呼ばれる。

任意的に、前述の態様のいずれかにおいて、前記第２フラグはsingle_tile_per_tile_group_flagと呼ばれる。

任意的に、前述の態様のいずれかにおいて、前記パラメータセットはピクチャパラメータセットである。

任意的に、前述の態様のいずれかにおいて、前記パラメータセットはシーケンスパラメータセットである。

任意的に、前述の態様のいずれかにおいて、前記パラメータセットはビデオパラメータセットである。

本開示の第３の態様は、ビデオコーディング装置であって、
プロセッサと、前記プロセッサに接続された受信機と、前記プロセッサに接続された送信機と、を含み、前記プロセッサ及び送信機は、上述の態様のいずれかの方法を実行するよう構成される、ビデオコーディング装置を含む。

本開示の第４の態様は、ビデオコーディング装置による使用のためのコンピュータプログラムプロダクトを含む非一時的コンピュータ可読媒体であって、前記コンピュータプログラムプロダクトは、プロセッサにより実行されると前記ビデオコーディング装置に前述の態様のいずれかの方法を実行させる、前記非一時的コンピュータ可読媒体に記憶されたコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体を含む。

明確さを目的として、前述の実施形態のうちのいずれか１つは、他の前述の実施形態のうちの任意の１つ以上と結合されて、本開示の範囲内にある新しい実施形態を生成してよい。

上述及び他の特徴は、添付の図面及び請求の範囲と関連して取り入れられる以下の詳細な説明から一層明確に理解されるだろう。

本開示のより完全な理解のために、ここで、添付の図面及び詳細な説明と関連して以下の簡単な説明を参照する。ここで同様の参照符号は同様の部分を表す。

ビデオ信号をコーディングする例示的な方法のフローチャートである。

ビデオコーディングのための例示的なコーディング及び復号（コーデック）システムの概略図である。

例示的なビデオエンコーダを示す概略図である。

例示的なビデオデコーダを示す概略図である。

符号化ビデオシーケンスを含む例示的なビットストリームを示す概略図である。

例示的なタイルグループにパーティションされたピクチャを示す概略図である。

例示的なビデオコーディング装置の概略図である。

タイルグループ情報の位置を示すフラグと共に画像をビットストリームに符号化する例示的な方法のフローチャートである。

タイルグループ情報の位置を示すフラグと共に画像をビットストリームから復号する例示的な方法のフローチャートである。

ビットストリーム内の画像のビデオシーケンスをコーディングする例示的なシステムの概略図である。

初めに理解されるべきことに、１つ以上の実施形態の説明的実装が以下に適用されるが、開示のシステム及び／又は方法は、現在知られているか又は既存かに関わらず、任意の数の技術を用いて実装されてよい。本開示は、ここに図示され説明される例示的な設計及び実装を含む以下に説明する説明的実装、図面、及び技術に決して限定されるべきではないが、添付の請求の範囲の範囲内で、それらの均等物の全範囲と共に、変更されてよい。

多くのビデオ圧縮技術が、最小限のデータ損失によりビデオファイルのサイズを削減するために利用され得る。例えば、ビデオ圧縮技術は、ビデオシーケンスの中のデータ冗長性を低減又は除去するために、空間（例えば、イントラピクチャ）予測及び／又は時間（例えば、インターピクチャ）予測を実行することを含み得る。ブロックに基づくビデオコーディングでは、ビデオスライス（例えば、ビデオピクチャ又はビデオピクチャの部分）は、木ブロック、コーディングブロック（coding block (CB)）、コーディング木ブロック（coding tree block (CTB)）、コーディング木単位（coding tree unit (CTU)）、コーディング単位（coding unit (CU)）、及び／又はコーディングノードとも呼ばれてよいビデオブロックにパーティションされてよい。コーディングブロック（coding block (CB)）は、何らかの値のＭ及びＮについてサンプルのＭ×Ｎブロックであってよい。その結果、コーディングブロックへのＣＴＢの分割はパーティションである。相応して、コーディング木ブロック（coding tree block (CTB)）は、何らかの値のＮについてサンプルのＮ×Ｎブロックであってよい。その結果、ＣＴＢへの成分の分割はパーティションである。コーディング木単位（coding tree unit (CTU)）は、ルマサンプルのＣＴＢ、３個のサンプル配列を有するピクチャのクロマサンプルの２個の対応するＣＴＢ、又は単色ピクチャ又は３個の別個の色平面及びサンプルをコーディングするために使用されるシンタックス構造を用いてコーディングされるピクチャのサンプルのＣＴＢである。コーディング単位（coding unit (CU)）は、ルマサンプルのコーディングブロック、３個のサンプル配列を有するピクチャのクロマサンプルの２個の対応するコーディングブロック、又は単色ピクチャ又は３個の別個の色平面及びサンプルをコーディングするために使用されるシンタックス構造を用いてコーディングされるピクチャのサンプルのコーディングブロックである。

ピクチャのイントラコーディング（Ｉ）スライス内のビデオブロックは、同じピクチャ内の近隣ブロックの中の参照サンプルに対して空間予測を用いてコーディングされる。ピクチャのインターコーディング片方向予測（Ｐ）又は双方向予測（Ｂ）スライス内のビデオブロックは、同じピクチャ内の近隣ブロックの中の参照サンプルに対する空間予測、又は他の参照ピクチャ内の参照サンプルに対する時間予測を利用してコーディングされてよい。ピクチャは、フレーム及び／又は画像と呼ばれてよく、参照ピクチャは、参照フレーム及び／又は参照画像と呼ばれてよい。空間又は時間予測は、画像ブロックを表す予測ブロックを生じる。残差データは、元の画像ブロックと予測ブロックとの間のピクセル差を表す。従って、インターコーディングブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、及びコーディングブロックと予測ブロックとの間の差を示す残差データに従い符号化される。イントラコーディングブロックは、イントラコーディングモード及び残差データに従い符号化される。更なる圧縮のために、残差データは、ピクセルドメインから変換ドメインへと変換されてよい。これらは、量子化されてよい残差変換係数を生じる。量子化済み変換係数は、最初に、２次元アレイに構成されてよい。量子化済み変換係数は、１次元ベクトルの変換係数を生成するためにスキャンされてよい。エントロピーコーディングは、更に多くの圧縮を達成するために適用されてよい。このようなビデオ圧縮技術は、以下に更に詳細に議論される。

符号化ビデオが正確に復号されることを保証するために、ビデオは、対応するビデオコーディング標準に従い符号化及び復号される。ビデオコーディング標準は、国際電気通信連合（International Telecommunication Union (ITU)）標準化部門（ITU－T）Ｈ．２６１、国際標準化機構／国際電気標準会議（International Organization for Standardization/International Electrotechnical Commission (ISO/IEC)）動画専門家グループ（Motion Picture Experts Group (MPEG)）－１Ｐａｒｔ２、ＩＴＵ－ＴＨ．２６２、又はＩＳＯ／ＩＥＣＭＰＥＧ－２Ｐａｒｔ２、ＩＴＵ－ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ－４Ｐａｒｔ２、ＩＴＵ－ＴＨ．２６４又はＩＳＯ／ＩＥＣＭＰＥＧ－４Ｐａｒｔ１０としても知られている高度ビデオコーディング（Advanced Video Coding (AVC)）、及びＩＴＵ－ＴＨ．２６５又はＭＰＥＧ－ＨＰａｒｔ２としても知られている高効率ビデオコーディング（High Efficiency Video Coding (HEVC)）を含む。ＡＶＣは、スケーラブル映像コーディング（Scalable Video Coding (SVC)）、多視点映像コーディング（Multiview Video Coding (MVC)）、及び多視点映像コーディング及び奥行き（Multiview Video Coding plus Depth (MVC+D)）、並びに３次元（three dimensional (３D)）ＡＶＣ（３D－AVC）のような拡張を含む。ＨＥＶＣは、スケーラブルＨＥＶＣ（Scalable HEVC (SHVC)）、多視点ＨＥＶＣ（Multiview HEVC (MV－HEVC)）、及び３ＤＨＥＶＣ（３D－HEVC）のような拡張を含む。ＩＴＵ－Ｔ及びＩＳＯ／ＩＥＣの共同ビデオ専門家チーム（joint video experts team (JVET)）は、バーサタイルビデオコーディング（Versatile Video Coding (VVC)）と呼ばれるビデオコーディング標準を開発し始めている。ＶＶＣは、ＪＶＥＴ－Ｌ１００１－v９を含むワーキングドラフト（Working Draft (WD)）に含まれる。

ビデオ画像をコーディングするために、画像は先ずパーティションされ、パーティションはビットストリームにコーディングされる。種々のピクチャパーティション方式が利用可能である。例えば、画像は、通常スライス、依存スライス、タイルに、及び／又は波面並列処理（Wavefront Parallel Processing (WPP)）に従い、パーティションできる。簡単のために、ＨＥＶＣは、ビデオコーディングのためにスライスをＣＴＢのグループにパーティションするとき、通常スライス、依存スライス、タイル、ＷＰＰ、及びそれらの組合せのみが使用できるように、エンコーダを制約する。このようなパーティションは、最大転送単位（Maximum Transfer Unit (MTU)）サイズ適合、並列処理、及び削減されたエンドツーエンド遅延をサポートするために適用できる。ＭＴＵは、単一パケットの中で送信できる最大データ量を示す。パケットペイロードがＭＴＵを超える場合、該ペイロードは、フラグメント化と呼ばれる処理を通じて２個のパケットに分割される。

単にスライスとも呼ばれる通常スライスは、ループフィルタリング動作による何からの相互依存性にも拘わらず、同じピクチャ内の他の通常スライスと独立に再構成可能な画像のパーティションされた部分である。スライスは、ラスタスキャンで連続して順序付けられた整数個のＣＴＵを含む。各スライスは、送信のために、それ自体のネットワーク抽象化層（Network Abstraction Layer (NAL)）単位の中にカプセル化される。更に、ピクチャ内予測（イントラサンプル予測、動き情報予測、コーディングモード予測）、及びスライス境界に跨がるエントロピーコーディング依存性は、独立した再構成をサポートするために無効にされてよい。このような独立した再構成は、並列化をサポートする。例えば、通常スライスに基づく並列化は、最小限のインタープロセッサ又はインターコア通信を利用する。しかしながら、各々の通常スライスは独立なので、各スライスは、個別のスライスヘッダに関連付けられる。通常スライスの使用は、スライス毎のスライスヘッダのビットコストにより、及びスライス境界に跨がる予測の欠如により、相当なコーディングオーバヘッドを生じ得る。更に、通常スライスは、ＭＴＵサイズ要件の適合をサポートするために利用されてよい。具体的に、通常スライスは別個のＮＡＬ単位にカプセル化され、独立にコーディングされ得るので、スライスを複数のパケットに分解することを防ぐために、各々の通常スライスは、ＭＴＵ方式におけるＭＴＵよりも小さいべきである。このように、並列化の目的と、ＭＴＵサイズ適合の目的とは、ピクチャ内のスライスレイアウトに対して矛盾する要求を課すことがある。

依存スライスは、通常スライスと同様であるが、短縮されたスライスヘッダを有し、ピクチャ内予測を壊すことなく、画像木ブロック境界のパーティションを可能にする。従って、依存スライスは、通常スライスが複数のＮＡＬ単位にフラグメント化されることを可能にし、これは、通常スライス全体の符号化が完了する前に、通常スライスの部分を送出可能にすることにより、削減されたエンドツーエンド遅延をもたらす。

タイルは、タイルの列及び行を生成する水平及び垂直境界により生成される画像／ピクチャのパーティションされた部分である。タイルは、ピクチャ内の特定のタイル列及び特定のタイル行の中で長方形領域のＣＴＵを含む。タイルはラスタスキャン順序（右から左へ、及び上から下へ）でコーディングされてよい。ＣＴＢのスキャン順序はタイル内でローカルである。従って、第１タイル内のＣＴＢは、次のタイル内のＣＴＢに進む前に、ラスタスキャン順序でコーディングされる。通常スライスと同様に、タイルは、ピクチャ内予測依存性、並びにエントロピー復号依存性を壊す。しかしながら、タイルは、個々のＮＡＬ単位に含まれなくてよく、従って、タイルはＭＴＵサイズ適合のために使用されなくてよい。各タイルは１つのプロセッサ／コアにより処理でき、近隣タイルを復号する処理ユニットの間でインターピクチャ予測のために利用されるインタープロセッサ／インターコア通信は、（隣接タイルが同じスライス内にあるとき）共有スライスヘッダを運ぶこと、及びループフィルタリングに関連する再構成サンプル及びメタデータの共有を実行することに限定され得る。１つより多くのタイルがスライスに含まれるとき、スライス内の最初のエントリポイントオフセット以外の各タイルのエントリポイントバイトオフセットは、スライスヘッダの中でシグナリングされてよい。

所与のコーディングビデオシーケンスは、ＨＥＶＣで指定されたプロファイルの大部分について、タイル及び波面の両方を含むことができない。スライス及びタイル毎に、以下の条件のうちのいずれか又は両方が満たされるべきである。１）スライス内の全部のコーディング木ブロックが同じタイルに属する、及び、２）タイル内の全部のコーディング木ブロックが同じスライスに属する。波面セグメントは、正確に１個のＣＴＢ行を含み、ＷＰＰが使用されるとき、スライスがＣＴＢ行内で開始する場合、それは同じＣＴＢ行の中で終了しなければならない。

ＷＰＰでは、画像はＣＴＢの単一の行にパーティションされる。エントロピー復号及び予測メカニズムは、他の行の中のＣＴＢからのデータを使用してよい。並列処理は、ＣＴＢ行の並列復号を通じて可能にされる。例えば、現在の行は、先行する行と並列に復号されてよい。しかしながら、現在の行の復号は、２ＣＴＢだけ、先行する行の復号処理から遅れる。この遅延は、現在の行の中の現在ＣＴＢの上のＣＴＢ及び右上のＣＴＢに関連するデータが、現在ＣＴＢがコーディングされる前に利用可能になることを保証する。このアプローチは、図式的に表すと波面として現れる。この時差のある開始は、最大で画像が含むＣＴＢ行と同じ数のプロセッサ／コアによる並列化を可能にする。ピクチャ内の近隣木ブロック行の間のピクチャ内予測が許可されるので、ピクチャ内予測を可能にするインタープロセッサ／インターコア通信が重要になり得る。ＷＰＰパーティションは、ＮＡＬ単位サイズを考慮する。従って、ＷＰＰは、ＭＴＵサイズ適合をサポートしない。しかしながら、通常スライスは、特定のコーディングオーバヘッドを伴い、ＷＰＰと関連して使用でき、所望のＭＴＵサイズ適合を実施する。

タイルは、動き制約タイルセットも含んでよい。動き制約タイルセット（motion constrained tile set (MCTS)）は、関連する動きベクトルがＭＣＴＳの内部にあるフルサンプル位置を、及び補間のためにＭＣＴＳ内のフルサンプル位置のみを必要とする分数サンプル位置を指すよう制限されるように設計されたタイルセットである。更に、ＭＣＴＳの外部のブロックから導出される時間動きベクトル予測のための動きベクトル候補の使用は、許されない。このように、各ＭＣＴＳは、ＭＣＴＳに含まれないタイルの存在無しに、独立に復号されてよい。ＨＥＶＣは、３つのＭＣＴＳ関連補足強化情報（supplemental enhancement information (SEI)）メッセージ、つまり、時間ＭＣＴＳＳＥＩメッセージ、ＭＣＴＳ抽出情報セットＳＥＩメッセージ、及びＭＣＴＳ抽出情報ネストＳＥＩメッセージを指定する。

時間ＭＣＴＳＳＥＩメッセージは、ビットストリーム内のＭＣＴＳの存在を示すために、及びＭＣＴＳをシグナリングするために、使用されてよい。ＭＣＴＳＳＥＩメッセージは、ＭＣＴＳの確認ビットストリームを生成するためにＭＣＴＳサブビットストリーム抽出（ＳＥＩメッセージのセマンティクスの部分として指定される）で使用できる補足情報を提供する。情報は、抽出情報セットの数を含み、それぞれが、ＭＣＴＳの数を定義し、ＭＣＴＳサブビットストリーム抽出処理の間に使用されるべき置換ビデオパラメータセット（replacement video parameter set (VPS)）、シーケンスパラメータセット（sequence parameter set (SPS)）、及びピクチャパラメータセット（picture parameter set (PPS)）の生バイトシーケンスペイロード（raw bytes sequence payload (RBSP)）バイトを含む。ＭＣＴＳサブビットストリーム抽出処理に従いサブビットストリームを抽出するとき、スライスアドレスに関連するシンタックス要素（first_slice_segment_in_pic_flag及びslice_segment_addressを含む）の1つ又は全部は抽出されたサブビットストリームの中で異なる値を利用し得るので、パラメータセット（ＶＰＳ、ＳＰＳ、及びＰＰＳ）は書き換えられ又は置き換えられてよく、スライスヘッダは更新されてよい。

上述のように、タイルグループは、ピクチャのタイルラスタスキャンにおいて又は長方形グループ化において、ピクチャの整数個のタイルを含む。タイルグループ内のタイルは、専ら単一のＮＡＬ単位に含まれる。タイルグループは、幾つかの例では、スライスに取って代わることができる。更なる符号化のためにピクチャをパーティションするときに利用されてよい種々のタイリング方式（つまり、タイルグループ化のためのアプローチ）がある。特定の例として、タイルグループ化は、タイルグループに一緒にグループ化されるタイルが、ピクチャ内の長方形の領域（ここでは長方形タイルグループと呼ばれる）を形成するように、制約できる。タイルグループに含まれるタイルは、タイルグループの最初のタイル及び最後のタイルを示すことにより、シグナリングされてよい。このような場合には、最初のタイルのタイルインデックスは、最後のタイルのタイルインデックスより小さい値であってよい。

タイルグループ構造（例えば、必要な場合には、ピクチャ内のタイルグループのアドレス／位置、及びタイルグループ内のタイルの数）のシグナリングのために２つの可能性がある。１つ目は、パラメータセット内で、例えばピクチャパラメータセット（picture parameter set (PPS)）内で、タイルグループ構造をシグナリングすることである。２つ目は、各タイルグループのヘッダ内で、タイルグループ構造をシグナリングすることである。２つのシグナリングの可能性は、同時に使用してはならない。各々の可能性はそれ自体の利点を有する。例えば、第１オプションは、各ピクチャの部分のみを送信可能にするために、タイルグループが、通常、ＭＣＴＳとしてコーディングされる、３６０°ビデオのようなアプリケーションにとって有利である。この場合には、ビデオコーディングレイヤ（video coding layer (VCL)）ＮＡＬ単位へのタイルの割り当ては、通常、ピクチャの既知の符号化である。第２オプションは、ＶＣＬＮＡＬ単位へのタイルの割り当てが、タイルのビット単位での実際のサイズに依存する必要があり得る、アプリケーションシナリオにおいて、例えば無線ディスプレイのような超低遅延アプリケーションにおいて、有利である。タイルグループ構造がパラメータセット内でシグナリングされるとき、タイルグループヘッダ内の幾つかのシンタックス要素は、必要ないことがあり、従って除去されてよく、又はそれらの存在は調整される必要があってよい。

幾つかのアプリケーションでは、ピクチャは幾つかのＶＣＬＮＡＬ単位にカプセル化されてよく、各ＶＣＬＮＡＬ単位は１つのタイルグループを含む。このようなアプリケーションでは、このアプリケーションの各タイルグループは１個のタイルのみを含み得るので、並列処理は、主な目的／関心ではなくてよい。例は、視点に依存する配信最適化を有する３６０度ビデオアプリケーションであり得る。このような状況では、タイルグループ構造の現在のシグナリングは、パラメータセット内で又はタイルグループヘッダ内でシグナリングされるかに拘わらず、何らかの冗長性を有し得る。

上述の問題を解決するために、タイルグループ構造シグナリングを向上する種々のメカニズムが、ここに開示される。更に説明されるように、実施形態では、エンコーダは、パラメータセットを参照するタイルグループの各々が１個のタイルのみを含むかどうかを指定するために、タイルグループにより直接又は間接に参照されるパラメータセットの中に、フラグ（例えば、single_tile_per_tile_group_flagと呼ばれるフラグ）を符号化できる。例えば、single_tile_per_tile_group_flagが、１（１）又は真に設定される場合、特定のシンタックス要素（例えば、タイルグループ内のタイルの数を指定するシンタックス要素）は、タイルグループヘッダの中で除外される。他のシンタックス要素も、ここに更に説明されるように、タイルヘッダから除外できる。更に、幾つかの実施形態では、エンコーダは、タイルグループ構造情報がパラメータセット内に存在するかどうかを指定するために、パラメータセット内にフラグ（例えば、tile_group_info_in_pps_flagと呼ばれるフラグ）を符号化できる。Tile_group_info_in_pps_flagの値は、パラメータセット及びタイルグループヘッダ内のタイルグループ構造に関連するシンタックス要素の存在を調整するために使用される。特定の実施形態では、tile_group_info_in_pps_flagは、single_tile_per_tile_group_flagの代わりに又はそれに追加して符号化できる。

図１は、ビデオ信号のコーディングの例示的な動作方法１００のフローチャートである。具体的に、ビデオ信号はエンコーダで符号化される。符号化処理は、ビデオファイルサイズを削減するために、種々のメカニズムを利用することにより、ビデオ信号を圧縮する。小さなファイルサイズほど、関連する帯域幅オーバヘッドを削減しながら、ユーザに向けて圧縮されたビデオファイルを送信することを可能にする。デコーダは、次に、エンドユーザに表示するために、圧縮されたビデオファイルを復号して元のビデオ信号を再構成する。復号処理は、通常、符号化処理のミラーであり、デコーダがビデオ信号を矛盾無く再構成することを可能にする。

ステップ１０１で、ビデオ信号はエンコーダに入力される。例えば、ビデオ信号は、メモリに格納された非圧縮ビデオファイルであってよい。別の例として、ビデオファイルは、ビデオカメラのようなビデオキャプチャ装置によりキャプチャされ、ビデオのライブストリーミングをサポートするために符号化されてよい。ビデオファイルは、オーディオコンポーネント及びビデオコンポーネントの両方を含んでよい。ビデオコンポーネントは、シーケンスの中で閲覧されるとき、動きの視覚的印象を与える一連の画像フレームを含む。フレームは、ここではルマ成分（又はルマサンプル）と呼ばれる光、及びクロマ成分（又はクロマサンプル）と呼ばれる色、の観点で表現されるピクセルを含む。幾つかの例では、フレームは、３次元表示をサポートするために、深さ値も含んでよい。

ステップ１０３で、ビデオはブロックにパーティションされる。パーティションは、圧縮のために、各フレーム内のピクセルを正方形及び／又は長方形ブロックに細分化することを含む。例えば、高効率ビデオコーディング（High Efficiency Video Coding(HEVC)）（H.２６５及びMPEG－H Part２としても知られる）では、フレームは、先ず、所定のサイズ（例えば、６４ピクセル×６４ピクセル）のブロックであるコーディング木単位（coding tree unit(CTU)）に分割できる。ＣＴＵは、ルマ及びクロマサンプルの両方を含む。コーディング木は、ＣＴＵをブロックに分割し、次に、更なる符号化をサポートする構成が達成されるまで、ブロックを繰り返し細分化するために利用されてよい。例えば、フレームのルマ成分は、個々のブロックが比較的同種の光の値を含むまで、細分化されてよい。さらに、フレームのクロマ成分は、個々のブロックが比較的同種の色の値を含むまで、細分化されてよい。したがって、パーティションメカニズムは、ビデオフレームの内容に依存して変化する。

ステップ１０５で、ステップ１０３でパーティションされた画像ブロックを圧縮するために、種々の圧縮メカニズムが利用される。例えば、インター予測及び／又はイントラ予測が利用されてよい。インター予測は、共通のシーンの中のオブジェクトは連続フレームで現れる傾向があるという事実を利用するよう設計される。したがって、参照フレーム内のオブジェクトを描写するブロックは、隣接フレーム内で繰り返し示される必要がない。具体的には、テーブルのようなオブジェクトは、複数のフレームに渡り、一定の位置に留まってよい。したがって、テーブルは一度示され、隣接フレームは参照フレームに戻り参照できる。複数のフレームに渡りオブジェクトを一致させるために、パターンマッチングメカニズムが利用されてよい。さらに、例えばオブジェクトの動き又はカメラの動きにより、動くオブジェクトが複数のフレームに渡り表示されてよい。特定の例として、ビデオは、複数のフレームに渡りスクリーンを横切って移動する自動車を示してよい。このような動きを示すために、動きベクトルが利用できる。動きベクトルは、フレーム内のオブジェクトの座標から参照フレーム内の該オブジェクトの座標へのオフセットを提供する２次元ベクトルである。したがって、インター予測は、現在フレーム内の画像ブロックを、参照フレーム内の対応するブロックからのオフセットを示す動きベクトルのセットとして、符号化できる。

イントラ予測は、共通フレーム内のブロックを符号化する。イントラ予測は、ルマ及びクロマ成分がフレーム内で密集する傾向があるという事実を利用する。例えば、木の一部の緑のパッチは、同様の緑のパッチに隣接して位置する傾向がある。イントラ予測は、複数の方向予測モード（例えば、ＨＥＶＣでは３３個）、平面モード、及び直流（direct current (DC)）モードを利用する。方向モードは、現在ブロックが対応する方向の近隣ブロックのサンプルと同様／同じであることを示す。平面モードは、行／列（例えば、平面）に沿う一連のブロックが行の端にある近隣ブロックに基づき補間できることを示す。平面モードは、事実上、変化する値の比較的一定の勾配を利用することにより、行／列に渡る光／色の円滑な遷移を示す。DCモードは、境界円滑化のために利用され、ブロックが方向予測モードの角度方向に関連する全部の近隣ブロックのサンプルに関連する平均値と同様／同じであることを示す。したがって、イントラ予測ブロックは、実際の値の代わりに、種々の関係予測モードとして、画像ブロックを表すことができる。さらに、インター予測ブロックは、実際の値の代わりに、動きベクトル値として、画像ブロックを表すことができる。いずれの場合にも、予測ブロックは、幾つかの場合に画像を正確に表さないことがある。任意の差が残差ブロックに格納される。ファイルを更に圧縮するために、変換が残差ブロックに適用されてよい。

ステップ１０７で、種々のフィルタリング技術が適用されてよい。ＨＥＶＣでは、フィルタは、インループフィルタリング方式に従い適用される。上述のブロックに基づく予測は、デコーダにおいて濃淡のむらのある画像の生成をもたらし得る。さらに、ブロックに基づく予測方式は、ブロックを符号化し、次に、参照ブロックとして後に使用するために、符号化したブロックを再構成し得る。インループフィルタリング方式は、ノイズ抑制フィルタ、デブロッキングフィルタ、適応型ループフィルタ、及びサンプル適応型オフセット（sample adaptive offset (SAO)）フィルタをブロック／フィルタに繰り返し適用する。これらのフィルタは、このような濃淡のむらのアーチファクトを緩和し、その結果、符号化されたファイルは正確に再構成できる。さら、これらのフィルタは、再構成された参照ブロック内のアーチファクトを緩和し、その結果、再構成された参照ブロックに基づき符号化される後のブロック内で追加アーチファクトを生じる可能性が低い。

ビデオ信号がパーティションされ、圧縮され、及びフィルタリングされると、結果として生じるデータは、ステップ１０９でビットストリーム内に符号化される。ビットストリームは、上述のデータ、及びデコーダにおける適正なビデオ信号再構成をサポートするための任意の所望のシグナリングデータを含む。例えば、このようなデータは、パーティションデータ、予測データ、残差ブロック、及びデコーダにコーディング指示を提供する種々のフラグを含んでよい。ビットストリームは、要求によりデコーダへ向けて送信するために、メモリに格納されてよい。ビットストリームは、複数のデコーダへ向けてブロードキャスト及び／又はマルチキャストされてもよい。ビットストリームの生成は反復処理である。したがって、ステップ１０１、１０３、１０５、１０７、及び１０９は、多数のフレーム及びブロックに渡り連続して及び／又は同時に生じてよい。図１に示す順序は明確さ及び議論の容易さのために提示され、ビデオコーディング処理を特定の順序に限定することを意図しない。

ステップ１１１で、デコーダは、ビットストリームを受信し、復号処理を開始する。具体的に、デコーダは、エントロピー復号方式を利用して、ビットストリームを対応するシンタックス及びビデオデータに変換する。ステップ１１１で、デコーダは、ビットストリームからのシンタックスを利用して、フレームのパーティションを決定する。パーティションは、ステップ１０３におけるブロックパーティションの結果と一致するべきである。ステップ１１１で利用されるようなエントロピー符号化／復号は、以下に説明される。エンコーダは、圧縮処理の間に、入力画像内の値の空間的位置に基づき幾つかの可能な選択肢からブロックパーティション方式を選択するような、多くの選択肢を生成する。正確な選択肢をシグナリングすることは、膨大な数のビンを利用し得る。ここで使用されるように、ビンは、変数として扱われる２進値である（例えば、コンテキストに依存して変化し得るビット値）。エントロピーコーディングは、許容可能な選択肢のセットを残して、エンコーダが特定の場合に明らかに実行可能ではない任意の選択肢を廃棄することを可能にする。各々の許容可能な選択肢は、次にコードワードを割り当てられる。コードワードの長さは、許容可能な選択肢の数に基づく（例えば、２個の選択肢に対して１つのビン、３～４個の選択肢に対して２つのビン、等）。エンコーダは、次に、選択された選択肢についてコードワードを符号化する。この方式は、全ての可能な選択肢の潜在的に大きな集合からの選択をユニークに示すのとは反対に、コードワードが可能な選択肢の小さな部分集合からの選択をユニークに示すために望ましい程度の大きさなので、コードワードのサイズを削減する。デコーダは、次に、エンコーダと同様の方法で許容可能な選択肢の集合を決定することにより、選択を復号する。許容可能な選択肢の集合を決定することにより、デコーダは、コードワードを読み出し、エンコーダにより行われた選択を決定できる。

ステップ１１３で、デコーダは、ブロック復号を実行する。具体的に、デコーダは、逆変換を利用して残差ブロックを生成する。次に、デコーダは、残差ブロック及び対応する予測ブロックを利用して、パーティションに従い画像ブロックを再構成する。予測ブロックは、エンコーダにおいてステップ１０５で生成されたイントラ予測ブロック及びインター予測ブロックの両方を含んでよい。再構成画像ブロックは、次に、ステップ１１１で決定されたパーティションデータに従い再構成ビデオ信号のフレームへと位置付けられる。ステップ１１３のシンタックスも、上述のようなエントロピーコーディングによりビットストリームの中でシグナリングされてよい。

ステップ１１５で、エンコーダにおけるステップ１０７と同様の方法で、再構成ビデオ信号のフレームに対してフィルタリングが実行される。例えば、ノイズ抑制フィルタ、デブロッキングフィルタ、適応型ループフィルタ、及びＳＡＯフィルタが、ブロッキングアーチファクトを除去するためにフレームに適用されてよい。フレームがフィルタリングされると、ビデオ信号は、エンドユーザによる閲覧のためにステップ１１７においてディスプレイへと出力できる。

図２は、ビデオコーディングのための例示的なコーディング及び復号（コーデック）システム２００の概略図である。具体的に、コーデックシステム２００は、動作方法１００の実装をサポートするための機能を提供する。コーデックシステム２００は、エンコーダ及びデコーダの両方の中で利用されるコンポーネントを示すために一般化される。コーデックシステム２００は、パーティションされたビデオ信号２０１を生じる、動作方法１００におけるステップ１０１及び１０３に関して上述したビデオ信号を受信しパーティションする。コーデックシステム２００は、次に、方法１００におけるステップ１０５、１０７、及び１０９に関して上述したエンコーダとして動作するとき、パーティションされたビデオ信号２０１をコーディングビットストリームへと圧縮する。デコーダとして動作するとき、コーデックシステム２００は、動作方法１００におけるステップ１１１、１１３、１１５、及び１１７に関して上述したようにビットストリームから出力ビデオ信号を生成する。コーデックシステム２００は、汎用コーダ制御コンポーネント２１１、変換スケーリング及び量子化コンポーネント２１３、イントラピクチャ推定コンポーネント２１５、イントラピクチャ予測コンポーネント２１７、動き補償コンポーネント２１９、動き推定コンポーネント２２１、スケーリング及び逆変換コンポーネント２２９、フィルタ制御分析コンポーネント２２７、インループフィルタコンポーネント２２５、復号ピクチャバッファコンポーネント２２３、及びヘッダフォーマット及びコンテキスト適応型２進算術コーディング（context adaptive binary arithmetic coding (CABAC)）コンポーネント２３１を含む。このようなコンポーネントは図示のように結合される。図２では、黒線は符号化／復号されるべきデータの動きを示し、一方で、破線は他のコンポーネントの動作を制御する制御データの動きを示す。コーデックシステム２００のコンポーネントは、エンコーダ内に全て存在してよい。デコーダは、コーデックシステム２００のコンポーネントの一部を含んでよい。例えば、デコーダは、イントラピクチャ予測コンポーネント２１７、動き補償コンポーネント２１９、スケーリング及び逆変換コンポーネント２２９、インループフィルタコンポーネント２２５、及び復号ピクチャバッファコンポーネント２２３を含んでよい。これらのコンポーネントはここで説明される。

パーティションされたビデオ信号２０１は、コーディング木によりピクセルのブロックへとパーティションされた、キャプチャされたビデオシーケンスである。コーディング木は、種々の分割モードを利用して、ピクセルのブロックをより小さなピクセルのブロックへと細分化する。これらのブロックは、次に、より小さなブロックへと更に細分化できる。ブロックは、コーディング木上のノードと呼ばれてよい。より大きな親ノードは、より小さな子ノードへと分割される。ノードが細分化される回数は、ノード／コーディング木の深さと呼ばれる。分割されたブロックは、幾つかの場合にはコーディング単位（coding unit (CU)）に含まれ得る。例えば、CUは、ルマブロック、赤色差分クロマ（Cr）ブロック、及び青色差分クロマ（Cb）ブロック、ならびにＣＵの対応するシンタックス命令を含むＣＴＵの副部分であり得る。分割モードは、利用される分割モードに依存して変化する形状のそれぞれ２、３、又は４個の子ノードにノードをパーティションするために利用される２分木（binary tree (BT)）、３分木（triple tree (TT)）、及び４分木（quad tree (QT)）を含んでよい。パーティションされたビデオ信号２０１は、汎用コーダ制御コンポーネント２１１、変換スケーリング及び量子化コンポーネント２１３、イントラピクチャ推定コンポーネント２１５、フィルタ制御分析コンポーネント２２７、及び動き推定コンポーネント２２１へと圧縮のために転送される。

汎用コーダ制御コンポーネント２１１は、アプリケーション制約に従いビットストリームへのビデオシーケンスの画像のコーディングに関連する決定を行うよう構成される。例えば、汎用コーダ制御コンポーネント２１１は、再構成品質に対するビットレート／ビットストリームサイズの最適化を管理する。このような決定は、記憶空間／帯域幅の利用可能性、及び画像解像度要求に基づき行われてよい。汎用コーダ制御コンポーネント２１１は、また、バッファアンダーラン及びオーバラン問題を緩和するために、変換速度の観点でバッファ利用を管理する。これらの問題に対応するために、汎用コーダ制御コンポーネント２１１は、他のコンポーネントによるパーティション、予測、及びフィルタリングを管理する。例えば、汎用コーダ制御コンポーネント２１１は、解像度を増大するために圧縮複雑性を動的に増大させ、解像度及び帯域幅使用を低減するために帯域幅使用を増大し又は圧縮複雑性を減少させてよい。したがって、汎用コーダ制御コンポーネント２１１は、コーデックシステム２００の他のコンポーネントを制御して、ビデオ信号再構成品質とビットレート関心事とのバランスをとる。汎用コーダ制御コンポーネント２１１は、他のコンポーネントの動作を制御する制御データを生成する。制御データも、デコーダにおける復号のためのパラメータをシグナリングするためにビットストリーム内に符号化されるようヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１へ転送される。

パーティションされたビデオ信号２０１は、インター予測のために、動き推定コンポーネント２２１及び動き補償コンポーネント２１９へも送信される。パーティションされたビデオ信号２０１のフレーム又はスライスは、複数のビデオブロックに分割されてよい。動き推定コンポーネント２２１及び動き補償コンポーネント２１９は、１つ以上の参照フレームの中の１つ以上のブロックに関連して、受信したビデオブロックのインター予測コーディングを実行し、時間予測を提供する。コーデックシステム２００は、例えばビデオデータの各ブロックについて適切なコーディングモードを選択するために、複数のコーディングパスを実行してよい。

動き推定コンポーネント２２１及び動き補償コンポーネント２１９は、高度に統合されてよいが、概念的目的のために別個に示される。動き推定コンポーネント２２１により実行される動き推定は、ビデオブロックについて動きを推定する動きベクトルを生成する処理である。動きベクトルは、例えば、予測ブロックに関連してコーディングオブジェクトの配置を示してよい。予測ブロックは、ピクセル差分の観点で、コーディングされるべきブロックに厳密に一致すると分かったブロックである。予測ブロックは、参照ブロックとも呼ばれてよい。このようなピクセル差分は、絶対値差分の和（sum of absolute difference (SAD)）、平方差分の和（sum of square difference (SSD)）、又は他の差分メトリックにより決定されてよい。ＨＥＶＣは、ＣＴＵ、コーディング木ブロック（coding tree block (CTB)）、及びＣＵを含む幾つかのコーディングオブジェクトを利用する。例えば、ＣＴＵは、ＣＴＢに分割でき、ＣＴＢは次にＣＵに含むためにＣＢに分割できる。ＣＵは、予測データを含む予測単位（prediction unit (PU)）及び／又はＣＵの変換された残差データを含む変換単位（transform unit (TU)）として符号化できる。動き推定コンポーネント２２１は、レート歪み最適化処理の部分としてレート歪み分析を用いて、動きベクトル、ＰＵ及びＴＵを生成する。例えば、動き推定コンポーネント２２１は、現在ブロック／フレームについて複数の参照ブロック、複数の動きベクトル、等を決定してよく、最適なレート歪み特性を有する参照ブロック、動きベクトル、等を選択してよい。最適なレート歪み特性は、ビデオ再構成の品質（例えば、圧縮によるデータ損失の量）及びコーディング効率（例えば、最終的な符号化のサイズ）の両方のバランスをとる。

幾つかの例では、コーデックシステム２００は、復号ピクチャバッファコンポーネント２２３に格納された参照ピクチャのサブ整数ピクチャ位置の値を計算してよい。例えば、ビデオコーデックシステム２００は、参照ピクチャの４分の１ピクセル位置、８分の１ピクセル位置、又は他の分数ピクセル位置の値を補間してよい。したがって、動き推定コンポーネント２２１は、フルピクセル位置及び分数ピクセル位置に関連して動き探索を実行し、分数ピクセル精度で動きベクトルを出力してよい。動き推定コンポーネント２２１は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することにより、インターコーディングスライスの中のビデオブロックのＰＵについて、動きベクトルを計算する。動き推定コンポーネント２２１は、計算した動きベクトルを動きデータとして、符号化のためにヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１へ、動きを動き補償コンポーネント２１９へ出力する。

動き補償コンポーネント２１９により実行される動き補償は、動き推定コンポーネント２２１により決定された動きベクトルに基づき、予測ブロックをフェッチする又は生成することを含んでよい。ここでも、動き推定コンポーネント２２１及び動き補償コンポーネント２１９は、幾つかの例では機能的に統合されてよい。現在ビデオブロックのＰＵの動きベクトルを受信すると、動き補償コンポーネント２１９は、動きベクトルの指す予測ブロックの位置を特定してよい。次に、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算してピクセル差分値を形成することにより、残差ビデオブロックが形成される。一般に、動き推定コンポーネント２２１は、ルマ成分に関連して動き推定を実行し、動き補償コンポーネント２１９は、クロマ成分及びルマ成分の両方についてルマ成分に基づき計算された動きベクトルを使用する。予測ブロック及び残差ブロックは、変換スケーリング及び量子化コンポーネント２１３へ転送される。

パーティションされたビデオ信号２０１は、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７へも送信される。動き推定コンポーネント２２１及び動き補償コンポーネント２１９と同様に、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７は、高度に統合されてよいが、概念的目的のために別個に示される。上述のようなフレーム間の動き推定コンポーネント２２１及び動き補償コンポーネント２１９により実行されるインター予測の代わりに、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７は、現在フレーム内のブロックに関連して現在ブロックをイントラ予測する。特に、イントラピクチャ推定コンポーネント２１５は、現在ブロックを符号化するために使用すべきイントラ予測モードを決定する。幾つかの例では、イントラピクチャ推定コンポーネント２１５は、複数のテストされたイントラ予測モードから、現在ブロックを符号化するための適切なイントラ予測モードを選択する。選択したイントラ予測モードは、次に、符号化のためにヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１へ転送される。

例えば、イントラピクチャ推定コンポーネント２１５は、種々のテストされたイントラ予測モードについてレート歪み分析を用いてレート歪み値を計算し、テストしたモードの中で最適なレート歪み特性を有するイントラ予測モードを選択する。レート歪み分析は、一般に、符号化ブロックと、符号化されて該符号化ブロックを生成した元の未符号化ブロックとの間の歪み（又は誤差）の量、並びに符号化ブロックを生成するために使用されたビットレート（例えば、ビット数）を決定する。イントラピクチャ推定コンポーネント２１５は、種々の符号化ブロックについて歪み及びレートから比を計算して、ブロックについて、どのイントラ予測モードが最適なレート歪み値を示すかを決定する。さらに、イントラピクチャ推定コンポーネント２１５は、レート歪み最適化（rate－distortion optimization (RDO)）に基づき、深さモデル化モード（depth modeling mode (DMM)）を用いて深さマップの深さブロックをコーディングするよう構成されてよい。

イントラピクチャ予測コンポーネント２１７は、エンコーダに実装されるとき、イントラピクチャ推定コンポーネント２１５により決定された、選択されたイントラ予測モードに基づき、予測ブロックから残差ブロックを生成し、又は、デコーダに実装されるとき、ビットストリームから残差ブロックを読み出してよい。残差ブロックは、行列として表現される、予測ブロックと元のブロックとの間の値の差分を含む。残差ブロックは、次に、変換スケーリング及び量子化コンポーネント２１３へ転送される。イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７は、ルマ及びクロマ成分の両方に対して動作してよい。

変換スケーリング及び量子化コンポーネント２１３は、残差ブロックを更に圧縮するよう構成される。変換スケーリング及び量子化コンポーネント２１３は、離散コサイン変換（discrete cosine transform (DCT)）、離散サイン変換（discrete sine transform (DST)）、又は概念的に類似する変換のような変換を残差ブロックに適用して、残差変換係数値を含むビデオブロックを生成する。ウェーブレット変換、整数変換、サブバンド変換、又は他の種類の変換も使用され得る。変換は、残差情報を、ピクセル値ドメインから周波数ドメインのような変換ドメインへと変換してよい。変換スケーリング及び量子化コンポーネント２１３は、また、例えば周波数に基づき、変換された残差情報をスケーリングするよう構成される。このようなスケーリングは、倍率を残差情報に適用することを含む。その結果、異なる周波数情報は異なる粒度で量子化され、これは再構成ビデオの最終的な視覚的品質に影響を与え得る。変換スケーリング及び量子化コンポーネント２１３は、また、ビットレートを更に低減するために、変換係数を量子化するよう構成される。量子化処理は、係数の一部又は全部に関連するビット深さを低減してよい。量子化の程度は、量子化パラメータを調整することにより、変更されてよい。幾つかの例では、変換スケーリング及び量子化コンポーネント２１３は、次に、量子化された変換係数を含む行列のスキャンを実行してよい。量子化された変換係数は、ビットストリーム内に符号化されるために、ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１へ転送される。

スケーリング及び逆変換コンポーネント２２９は、動き推定をサポートするために、変換スケーリング及び量子化コンポーネント２１３の逆処理を適用する。スケーリング及び逆変換コンポーネント２２９は、逆スケーリング、変換、及び／又は量子化を適用して、例えば別の現在ブロックのための予測ブロックになり得る参照ブロックとして後に使用するために、ピクセルドメインの残差ブロックを再構成する。動き推定コンポーネント２２１及び／又は動き補償コンポーネント２１９は、後のブロック／フレームの動き推定で使用するために、残差ブロックを対応する予測ブロックに加算して戻すことにより、参照ブロックを計算してよい。スケーリング、量子化、及び変換の間に生成されたアーチファクトを低減するために、再構成された参照ブロックにフィルタが適用される。このようなアーチファクトは、そうでなければ、後続のブロックが予測されるときに不正確な予測を生じ（及び追加アーチファクトを生成し）得る。

フィルタ制御分析コンポーネント２２７及びインループフィルタコンポーネント２２５は、残差ブロックに及び／又は再構成画像ブロックにフィルタを適用する。例えば、スケーリング及び逆変換コンポーネント２２９からの変換された残差ブロックは、元の画像ブロックを再構成するために、イントラピクチャ予測コンポーネント２１７及び／又は動き補償コンポーネント２１９からの対応する予測ブロックと結合されてよい。フィルタは、次に、再構成画像ブロックに適用されてよい。幾つかの例では、フィルタは、代わりに、残差ブロックに適用されてよい。図２の他のコンポーネントと同様に、フィルタ制御分析コンポーネント２２７及びインループフィルタコンポーネント２２５は、高度に統合され一緒に実装されてよいが、概念的目的のために別個に示される。再構成された参照ブロックに適用されるフィルタは、特定の空間領域に適用され、このようなフィルタがどのように適用されるかを調整するための複数のパラメータを含む。フィルタ制御分析コンポーネント２２７は、再構成された参照ブロックを分析して、このようなフィルタが適用されるべき場合を決定し、対応するパラメータを設定する。このようなデータは、ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１へ、符号化のためのフィルタ制御データとして転送される。インループフィルタコンポーネント２２５は、フィルタ制御データに基づき、このようなフィルタを適用する。フィルタは、デブロッキングフィルタ、ノイズ抑制フィルタ、ＳＡＯフィルタ、及び適応型ループフィルタを含んでよい。このようなフィルタは、例に依存して、（例えば、再構成されたピクセルブロック上の）空間／ピクセルドメインにおいて、又は周波数ドメインにおいて、適用されてよい。

エンコーダとして動作するとき、フィルタリングされた再構成画像ブロック、残差ブロック、及び／又は予測ブロックは、上述のように動き推定において後に使用するために、復号ピクチャバッファコンポーネント２２３に格納される。デコーダとして動作するとき、復号ピクチャバッファコンポーネント２２３は、出力ビデオ信号の部分として、再構成されフィルタリングされたブロックを格納しディスプレイへ向けて転送する。復号ピクチャバッファコンポーネント２２３は、予測ブロック、残差ブロック、及び／又は再構成画像ブロックを格納することの可能な任意のメモリ装置であってよい。

ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１は、コーデックシステム２００の種々のコンポーネントからデータを受信し、デコーダへ向けて送信するためにこのようなデータをコーディングビットストリームに符号化する。具体的に、ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１は、一般制御データ及びフィルタ制御データのような制御データを符号化するために種々のヘッダを生成する。さらに、イントラ予測及び動きデータを含む予測データ、ならびに量子化された変換係数データの形式の残差データは、全てビットストリーム内に符号化される。最終的なビットストリームは、元のパーティションされたビデオ信号２０１を再構成するためにデコーダにより所望される全ての情報を含む。このような情報は、イントラ予測モードインデックステーブル（コードワードマッピングテーブルとも呼ばれる）、種々のブロックの符号化コンテキストの定義、最も有望なイントラ予測モードの指示、パーティション情報の指示、等も含んでよい。このようなデータは、エントロピーコーディングを利用することにより、符号化されてよい。例えば、情報は、コンテキスト適応型可変長コーディング（context adaptive variable length coding (CAVLC)）、シンタックスに基づくコンテキスト適応型２進算術コーディング（syntax－based context－adaptive binary arithmetic coding (SBAC)）、確率間隔区分エントロピー（probability interval partitioning entropy (PIPE)）コーディング、又は別のエントロピーコーディング技術を利用することにより、符号化されてよい。エントロピーコーディングに従い、コーディングされたビットストリームは、別の装置（例えば、ビデオデコーダ）へ送信され、又は後の送信又は読み出しのために保存されてよい。

図３は、例示的なビデオエンコーダ３００を示すブロック図である。ビデオエンコーダ３００は、コーデックシステム２００の符号化機能を実装するために、及び／又は動作方法１００のステップ１０１、１０３、１０５、１０７及び／又は１０９を実装するために、利用されてよい。エンコーダ３００は、入力ビデオ信号をパーティションして、実質的にパーティションされたビデオ信号２０１と同様であるパーティションされたビデオ信号３０１を生じる。パーティションされたビデオ信号３０１は、次に、エンコーダ３００のコンポーネントにより圧縮されビットストリームに符号化される。

具体的に、パーティションされたビデオ信号３０１は、イントラ予測のためにイントラピクチャ予測コンポーネント３１７へ転送される。イントラピクチャ予測コンポーネント３１７は、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７と実質的に同様であってよい。パーティションされたビデオ信号３０１は、復号ピクチャバッファコンポーネント３２３の中の参照ブロックに基づくインター予測のために動き補償コンポーネント３２１へも転送される。動き補償コンポーネント３２１は、動き推定コンポーネント２２１及び動き補償コンポーネント２１９と実質的に同様であってよい。イントラピクチャ予測コンポーネント３１７及び動き補償コンポーネント３２１からの予測ブロック及び残差ブロックは、残差ブロックの変換及び量子化のために、変換及び量子化コンポーネント３１３へ転送される。変換及び量子化コンポーネント３１３は、変換スケーリング及び量子化コンポーネント２１３と実質的に同様であってよい。変換され量子化された残差ブロック及び対応する予測ブロックは（関連する制御データと一緒に）、ビットストリームへのコーディングのためにエントロピーコーディングコンポーネント３１３へ転送される。エントロピーコーディングコンポーネント３３１は、ヘッダフォーマット及びＣＡＢＡＣコンポーネント２３１と実質的に同様であってよい。

変換され量子化された残差ブロック及び／又は対応する予測ブロックは、また、動き補償コンポーネント３２１による使用のために参照ブロックへと再構成するために、変換及び量子化コンポーネント３１３から逆変換及び量子化コンポーネント３２９へ転送される。逆変換及び量子化コンポーネント３２９は、スケーリング及び逆変換コンポーネント２２９と実質的に同様であってよい。インループフィルタコンポーネント３２５の中のインループフィルタも、例に依存して、残差ブロック及び／又は再構成された参照ブロックに適用される。インループフィルタコンポーネント３２５は、フィルタ制御分析コンポーネント２２７及びインループフィルタコンポーネント２２５と実質的に同様であってよい。インループフィルタコンポーネント３２５は、インループフィルタコンポーネント２２５に関して議論したような複数のフィルタを含んでよい。フィルタリングされたブロックは、次に、動き補償コンポーネント３２１により参照ブロックとして使用するために、復号ピクチャバッファコンポーネント３２３に格納される。復号ピクチャバッファコンポーネント３２３は、復号ピクチャバッファコンポーネント２２３と実質的に同様であってよい。

図４は、例示的なビデオデコーダ４００を示すブロック図である。ビデオデコーダ４００は、コーデックシステム２００の復号機能を実装するために、及び／又は動作方法１００のステップ１１１、１１３、１１５及び／又は１１７を実装するために、利用されてよい。デコーダ４００は、例えばエンコーダ３００からビットストリームを受信し、エンドユーザに表示するためにビットストリームに基づき再構成された出力ビデオ信号を生成する。

ビットストリームは、エントロピー復号コンポーネント４３３により受信される。エントロピー復号コンポーネント４３３は、ＣＡＶＬＣ、ＣＡＢＡＣ、ＳＢＡＣ、ＰＩＰＥコーディングのようなエントロピー復号方式、又は他のエントロピーコーディング技術を実装するよう構成される。例えば、エントロピー復号コンポーネント４３３は、ビットストリーム内にコードワードとして符号化された追加データを解釈するために、ヘッダ情報を利用してコンテキストを提供してよい。復号された情報は、一般制御データ、フィルタ制御データ、パーティション情報、動きデータ、予測データ、及び残差ブロックからの量子化済み変換係数のような、ビデオ信号を復号するための任意の所望の情報を含む。量子化済み変換係数は、残差ブロックへと再構成するために、逆変換及び量子化コンポーネント４２９へ転送される。逆変換及び量子化コンポーネント４２９は、逆変換及び量子化コンポーネント３２９と同様であってよい。

再構成残差ブロック及び／又は予測ブロックは、イントラ予測動作に基づき画像ブロックへと再構成するために、イントラピクチャ予測コンポーネント４１７へ転送される。イントラピクチャ予測コンポーネント４１７は、イントラピクチャ推定コンポーネント２１５及びイントラピクチャ予測コンポーネント２１７と同様であってよい。具体的に、イントラピクチャ予測コンポーネント４１７は、フレーム内の参照ブロックの位置を特定するために予測モードを利用し、結果に残差ブロックを適用して、イントラ予測された画像ブロックを再構成する。再構成されたイントラ予測された画像ブロック及び／又は残差ブロック、及び対応するインター予測データは、それぞれ復号ピクチャバッファコンポーネント２２３及びインループフィルタコンポーネント２２５と実質的に同様であってよいインループフィルタコンポーネント４２５を介して復号ピクチャバッファコンポーネント４２３へ転送される。インループフィルタコンポーネント４２５は、再構成画像ブロック、残差ブロック、及び／又は予測ブロックをフィルタリングし、そのような情報は復号ピクチャバッファコンポーネント４２３に格納される。復号ピクチャバッファコンポーネント４２３からの再構成画像ブロックは、インター予測のために動き補償コンポーネント４２１へ転送される。動き補償コンポーネント４２１は、動き推定コンポーネント２２１及び／又は動き補償コンポーネント２１９と実質的に同様であってよい。具体的に、動き補償コンポーネント４２１は、参照ブロックからの動きベクトルを利用して、予測ブロックを生成し、結果に残差ブロックを提供して、画像ブロックを再構成する。結果として生じた再構成ブロックは、インループフィルタコンポーネント４２５を介して、復号ピクチャバッファコンポーネント４２３へ転送されてもよい。復号ピクチャバッファコンポーネント４２３は、パーティション情報によりフレームへと再構成できる、追加再構成画像ブロックを格納し続けてよい。このようなフレームは、シーケンス内に配置されてもよい。シーケンスは、再構成された出力ビデオ信号としてディスプレイに向けて出力される。

図５は、符号化ビデオシーケンスを含む例示的なビットストリーム５００を示す概略図である。例えば、ビットストリーム５００は、コーデックシステム２００及び／又はデコーダ４００による復号のために、コーデックシステム２００及び／又はエンコーダ３００により生成できる。別の例として、ビットストリーム５００は、デコーダによりステップ１１１で使用するために、方法１００のステップ１０９でエンコーダにより生成されてよい。

ビットストリーム５００は、シーケンスパラメータセット（sequence parameter set (SPS)）５１０、複数のピクチャパラメータセット（picture parameter set (PPS)）５１２、タイルグループヘッダ５１４、及び画像データ５２０を含む。ＳＰＳ５１０は、ビットストリーム５００に含まれるビデオシーケンス内の全部のピクチャに共通のシーケンスデータを含む。このようなデータは、ピクチャサイジング、ビット深さ、コーディングツールパラメータ、ビットレート制約、等を含み得る。ＰＰＳ５１２は、１つ以上の対応するピクチャに固有のパラメータを含む。従って、ビデオシーケンス内の各ピクチャは、１つのＰＰＳ５１２を参照してよい。ＰＰＳ５１２は、対応するピクチャ内のタイルについて利用可能なコーディングツール、量子化パラメータ、オフセット、ピクチャ固有コーディングツールパラメータ（例えば、フィルタ制御）、等を示すことができる。タイルグループヘッダ５１４は、ピクチャ内の各タイルグループに固有のパラメータを含む。従って、ビデオシーケンス内のタイルグループ毎に１個のタイルグループヘッダ５１４があってよい。タイルグループヘッダ５１４は、タイルグループ情報、ピクチャ順序カウント（picture order count (POC)）、参照ピクチャリスト、予測重み、タイルエントリポイント、デブロッキングパラメータ、等を含んでよい。留意すべきことに、幾つかのシステムは、スライスヘッダとしてタイルグループヘッダ５１４を参照し、このような情報を、タイルグループの代わりにスライスをサポートするために使用する。

画像データ５２０は、インター予測及び／又はイントラ予測に従い符号化されたビデオデータ、並びに対応する変換された量子化済み残差データを含む。このような画像データ５２０は、符号化の前に画像をパーティションするために使用されたパーティションに従い格納される。例えば、画像データ５２０内の画像は、タイルグループ５２３に分割される。タイル５２３は、コーディング木単位（coding tree unit (CTU)）に更に分割される。ＣＴＵは、コーディング木に基づきコーディングブロックに更に分割される。コーディングブロックは、次に、予測メカニズムに従い符号化／復号できる。画像／ピクチャは、１つ以上のタイル５２３を含むことができる。

タイル５２３は、水平及び垂直境界により生成されるピクチャのパーティションされた部分である。タイル５２３は、ラスタスキャン順序でコーディングされてよく、例に依存して、他のタイル５２３に基づくパーティションが可能であってよく、又はそうでなくてよい。各タイル５２３は、ピクチャ内でユニークなタイルインデックス５２４を有してよい。タイルインデックス５２４は、あるタイル５２３を別のものと区別するために使用できる、手順通りに選択された数値識別子である。例えば、タイルインデックス５２４は、ラスタスキャン順序で数値的に増大してよい。ラスタスキャン順序は、左から右へ及び上から下へである。留意すべきことに、幾つかの例では、タイル５２３は、タイル識別子（identifier (ID)）も割り当てられてよい。タイルＩＤは、あるタイル５２３を別のものと区別するために使用できる、割り当てられた識別子である。幾つかの例では、計算は、タイルインデックス５２４の代わりにタイルＩＤを利用してよい。幾つかの例では、更に、タイルＩＤは、タイルインデックス５２４と同じ値を有するよう割り当てられることができる。

タイルインデックス５２４は、タイル５２３を含むタイルグループを示すためにシグナリングされてよい。最初のタイルのインデックス及び最後のタイルのインデックスは、タイルグループヘッダ５１４内でシグナリングできる。幾つかの例では、最初のタイルのインデックス及び最後のタイルのインデックスは、対応するタイルＩＤによりシグナリングされる。デコーダは、次に、フラグ、最初のタイルのインデックス、及び最後のタイルのインデックスに基づき、タイルグループの構成を決定できる。エンコーダは、最適な符号化アプローチを選択するとき、デコーダにおいて復号結果を予測するために、レート歪み最適化処理の間にデコーダと同様の処理を利用できる。タイルグループの完全なメンバシップの代わりに、最初のタイルのインデックス及び最後のタイルのインデックスのみをシグナリングすることにより、相当数のビットが省略できる。これは、コーディング効率を向上し、従って、エンコーダ及びデコーダの両方のメモリリソース使用及びネットワークリソース使用を低減する。

図６は、本開示の実施形態による、例示的なタイルグループにパーティションされた例示的なピクチャ６０１を示す。例えば、ピクチャ６０1は、例えばコーデックシステム２００、エンコーダ３００、及び／又はデコーダ４００により、ビットストリーム５００に符号化され、それから復号されるビデオシーケンス内の単一のピクチャであり得る。更に、ピクチャ６０１は、方法１００に従い符号化及び復号をサポートするためにパーティションされることができる。

ピクチャ６０１は、タイル６０３にパーティションされることができる。タイル６０３は、タイル５２３と実質的に同様であってよい。タイル６０３は、長方形及び／又は正方形であってよい。タイル６０３は、それぞれ、ラスタスキャン順序で増大するタイルインデックスを割り当てられる。図示の実施形態では、タイルインデックスは０から２３まで（０～２３）に及ぶ。このようなタイルインデックスは、例であり、議論の明確さのために提供され、従って限定と考えられるべきではない。

ピクチャ６０１は、タイル０、６、１２、１８を含む左境界６０１ａと、タイル５、１１、１７、２３を含む右境界６０１ｂと、タイル０～５を含む上境界６０１ｃと、タイル１８～２３を含む下境界６０１ｄと、を含む。左境界６０１ａ、右境界６０１ｂ、上境界６０１ｃ、及び下境界６０１ｄは、ピクチャ６０１の端を形成する。更に、タイル６０３は、タイル行６０５及びタイル列６０７にパーティションされてよい。タイル行６０５は、水平方向に隣接するように位置付けられたタイル６０３のセットであり、左境界６０１ａから右境界６０１ｂまでの連続ライン（逆も同様である）を生成する。タイル列６０７は、垂直方向に隣接するように位置付けられたタイル６０３のセットであり、上境界６０１ｃから下境界６０１ｄまでの連続ライン（逆も同様である）を生成する。

タイル６０３は、１つ以上のタイルグループ６０９に含まれることができる。タイルグループ６０９は、例えば関心領域の表示をサポートするために及び／又は並列処理をサポートするために別個に抽出されコーディングされることのできる関連するタイル６０３のセットである。タイルグループ６０９内のタイル６０３は、タイルグループ６０９の外部のタイル６０３を参照することなく、コーディングできる。各タイル６０３は、対応するタイルグループ６０９に割り当てられてよく、従って、ピクチャ６０１は複数のタイルグループ６０９を含むことができる。しかしながら、議論の明確さのために、本開示は、７から１０（７～１０）及び１３から１６（１３～１６）のインデックスを有するタイル６０３を含む影付き領域として示されるタイルグループ６０９を参照する。

従って、ピクチャ６０１のタイルグループ６０９は、最初のタイルのインデックス７、及び最後のタイルのインデックス１６によりシグナリングできる。デコーダは、最初のタイルのインデックス及び最後のタイルのインデックスに基づき、タイルグループ６０９の構成を決定したいと望み得る。ここで使用されるとき、タイルグループ６０９構成は、タイルグループ６０９の中の行、列、及びタイル６０３を示す。タイルグループ６０９構成を決定するために、ビデオコーディング装置は、所定のアルゴリズムを利用できる。例えば、ビデオコーディング装置は、タイルグループ６０９の最後のタイルのインデックスとタイルグループ６０９の最初のタイルのインデックスとの間の差としてデルタタイルインデックスを設定することにより、ピクチャ６０１からパーティションされたタイルグループ６０９の中のタイル６０３の数を決定できる。タイルグループ６０９内のタイル行６０５の数は、デルタタイルインデックスを、ピクチャ６０１内のタイル列６０７の数に１を足したもので除算することにより、決定できる。更に、タイルグループ６０９内のタイル列６０７の数は、ピクチャ６０１内のタイル列６０７の数に１を足したものを法とするデルタタイルインデックスとして、決定できる。タイルグループ６０９内のタイル６０３の数は、タイルグループ６０９内のタイル列６０７の数を、タイルグループ６０９内のタイル行６０５の数により乗算することにより、決定できる。

上述のように、特定の状況では、タイルグループ構造の現在のシグナリングは、パラメータセット内で又はタイルグループヘッダ内でシグナリングされるかに拘わらず、何らかの冗長な情報を含む。この問題を解決するために、単独で取り入れられる又は１つ以上の実施形態において結合して適用される以下の態様が、上述の問題を解決するために本開示において提案される。

実施形態では、ピクチャ当たり１より多くのタイルがあるとき、パラメータセットを参照するタイルグループの各々が１個のタイルのみを含むかどうかを指定するために、タイルグループにより直接又は間接に参照されるパラメータセットの中で、フラグがシグナリングされる。パラメータセットは、シーケンスパラメータセット、ピクチャパラメータセット、又はタイルグループにより直接又は間接に参照される任意の他のパラメータセットであり得る。実施形態では、このフラグはsingle_tile_per_tile_group_flagと呼ばれてよい。実施形態では、single_tile_per_tile_group_flagの値が１に等しいとき、タイルグループヘッダ内の以下のシンタックス要素は存在しない：（１）タイルグループ内のタイルの数を指定するシンタックス要素、（２）タイルグループの最後のタイルの識別を指定するシンタックス要素、（３）タイルグループ内の最初のタイル以外の任意のタイルのタイル識別を指定するシンタックス要素。

別の実施形態では、タイルグループ構造情報は、各タイルグループにより直接又は間接に参照されるパラメータセット内で又はタイルグループヘッダ内で直接に、シグナリングされてよい。ピクチャ内のタイルの数が１より多いとき、タイルグループ構造情報がパラメータセット内に存在するかどうかを指定するために、パラメータセット内にフラグが存在してよい。パラメータセットは、シーケンスパラメータセット、ピクチャパラメータセット、又はタイルグループにより直接又は間接に参照される任意の他のパラメータセットであり得る。実施形態では、フラグはtile_group_info_in_pps_flagと呼ばれてよい。実施形態では、フラグがパラメータセット内に存在しないとき（例えば、ピクチャが１つのタイルのみを含むとき）、tile_group_info_in_pps_flagの値は０に等しいと推定される。Tile_group_info_in_pps_flagの値は、パラメータセット及びタイルグループヘッダ内のタイルグループ構造に関連するシンタックス要素の存在を調整するために使用される。これらのシンタックス要素は以下を含んでよい：（１）タイルグループ内のタイルの数を指定するシンタックス要素、（２）タイルグループの最後のタイルの識別を指定するシンタックス要素、（３）タイルグループ内の最初のタイル以外の任意のタイルのタイル識別を指定するシンタックス要素。

実施形態に従う、ＰＰＳ及びタイルグループヘッダ内の関連するシンタックス要素のシンタックス及びセマンティクスは、以下の通りである。説明は、JVET contribution JVET－L０６８６、タイトル「Draft text of video coding specification」に記載されている基本テキストに関連する。つまり、デルタ又は追加変更のみが説明され、一方で、以下で言及されない基本テキストの中のテキストは、それらが基本テキストに記載されたように適用される。基本テキストに関連するpic_parameter_set_rbsp( )関数に対する変更されたテキストは、アスタリスク（＊）により強調される。

上述のピクチャパラメータセットＲＢＳＰでは、シンタックス要素pps_pic_parameter_set_idは、他のシンタックス要素による参照のためにＰＰＳを識別する。実施形態では、pps_pic_parameter_set_idの値は、両端を含む０～６３の範囲であるべきである。シンタックス要素pps_seq_parameter_set_idは、アクティブＳＰＳのsps_seq_parameter_set_idの値を指定する。pps_seq_parameter_set_idの値は、両端を含む０～１５の範囲であるべきである。実施形態では、シンタックス要素transform_skip_enabled_flagが１に等しい場合、transform_skip_flagシンタックス要素は、残差コーディングシンタックス内に存在し得る。シンタックス要素transform_skip_enabled_flagが０に等しい場合、transform_skip_flagシンタックス要素は、残差コーディングシンタックス内に存在しない。シンタックス要素single_tile_in_pic_flagが１に等しい場合、これは、ＰＰＳを参照する各ピクチャ内に１個のタイルのみがあることを示す。シンタックス要素single_tile_in_pic_flagが０に等しい場合（つまり、if(!single_tile_in_pic_flag)）、これは、ＰＰＳを参照する各ピクチャ内に１より多くのタイルがあることを指定する。この場合、シンタックス要素single_tile_per_tile_group_flagは、ＰＰＳを参照する各タイルグループが正確に１個のタイルを含むかどうかを示すために使用される。例えば、シンタックス要素single_tile_per_tile_group_flagが１に等しい場合、これは、ＰＰＳを参照する各タイルグループが正確に１個のタイルを含むことを指定する。シンタックス要素single_tile_per_tile_group_flagが０に等しい場合、それは、パラメータセットを参照する各タイルグループが１より多くのタイルを含むことを示す。シンタックス要素tile_group_info_in_pps_flagは、タイルグループ情報がＰＰＳ内に存在するか又はＰＰＳを参照するタイルグループヘッダ内に存在するかを示すために使用される。実施形態では、シンタックス要素tile_group_info_in_pps_flagが１に等しい場合、これは、タイルグループ情報がＰＰＳ内に存在し、ＰＰＳを参照するタイルグループヘッダ内に存在しないことを指定する。シンタックス要素tile_group_info_in_pps_flagが０に等しい場合、それは、タイルグループ情報がＰＰＳ内に存在せず、ＰＰＳを参照するタイルグループヘッダ内に存在することを示す。

示された実施形態では、シンタックス要素tile_group_info_in_pps_flagが１に等しい場合（つまり、if(tile_group_info_in_pps_flag)）、これは、タイルグループ情報がＰＰＳ内に存在し、ＰＰＳを参照するタイルグループヘッダ内に存在しないことを指定し、変数num_tile_groups_in_pic_minus１は、ピクチャ内のタイルグループの数より１小さいものに等しく設定される。この変数は、ピクチャ内のタイルグループの各々を通じてループするよう、for－loopの中で使用される。シンタックス要素pps_first_tile_id[ i ]は、ピクチャ内のｉ番目のタイルグループの最初のタイルのタイルＩＤを指定する。実施形態では、pps_first_tile_id[ i ]の長さは、Ceil( Log２( NumTilesInPic ) )ビットである。pps_first_tile_id[ i ]の値は、ｊに等しくない任意のｉについて、pps_first_tile_id[ j ]の値に等しくてはならない。特に断りの無い限り、ピクチャ内のｉ番目のタイルグループの最初のタイルのタイルＩＤは、ピクチャ内の任意の他のタイルグループの最初のタイルのタイルＩＤと同じであってはならない。

ピクチャ内の各々のｉ番目のタイルグループについて、シンタックス要素single_tile_per_tile_group_flagが０に等しい場合（つまり、if(!single_tile_per_tile_group_flag)）、これは、パラメータセットを参照するｉ番目のタイルグループが１つ以上のタイルを含むことを示し、シンタックス要素pps_num_tiles_in_tile_group_minus１[ i ]に１を足したものが、ｉ番目のタイルグループの中のタイルの数を指定するために使用される。pps_num_tiles_in_tile_group_minus１[ i ]の値は、両端を含む０～NumTilesInPic －１の範囲に包含されるべきである。実施形態では、シンタックス要素pps_num_tiles_in_tile_group_minus１[ i ]が存在しないとき、pps_num_tiles_in_tile_group_minus１[ i ]の値は０に等しいと推定される。

別の例として、第２の実施形態に従う、ＰＰＳ及びタイルグループヘッダ内の関連するシンタックス要素のシンタックス及びセマンティクスは、以下の通りである。上述のように、説明は、JVET contribution JVET－L０６８６、タイトル「Draft text of video coding specification」に記載されている基本テキストに関連する。つまり、デルタ又は追加変更のみが説明され、一方で、以下で言及されない基本テキストの中のテキストは、それらが基本テキストに記載されたように適用される。基本テキストに関連するpic_parameter_set_rbsp( )関数に対する変更されたテキストは、アスタリスク（＊）により強調される。

シンタックス要素pps_pic_parameter_set_id、pps_seq_parameter_set_id、transform_skip_enabled_flag、及びsingle_tile_in_pic_flagは、基本テキスト（JVET contribution JVET－L０６８６）に従い先に上述した通りである。本実施形態では、シンタックス要素single_tile_in_pic_flagが０に等しい場合（つまり、if(!single_tile_in_pic_flag)）、これは、パラメータセットを参照する各タイルグループが１つ以上のタイルを含むことを示し、single_tile_per_tile_group_flagシンタックス要素が、ＰＰＳを参照する各タイルグループが正確に１個のタイルを含むかどうかを示すために使用される。実施形態では、single_tile_per_tile_group_flagが１に等しい場合、それは、ＰＰＳを参照する各タイルグループが正確に１個のタイルを含むことを示す。single_tile_per_tile_group_flagが０に等しい場合、それは、ＰＰＳを参照する各タイルグループが１つ以上のタイルを含むことを指定する。tile_group_info_in_pps_flagシンタックス要素は、タイルグループ情報がＰＰＳ内に存在するか又はＰＰＳを参照するタイルグループヘッダ内に存在するかを示すために使用される。実施形態では、tile_group_info_in_pps_flagが１に等しい場合、それは、タイルグループ情報がＰＰＳ内に存在し、ＰＰＳを参照するタイルグループヘッダ内に存在しないことを指定する。tile_group_info_in_pps_flagが０のとき、それは、タイルグループ情報がＰＰＳ内に存在せず、ＰＰＳを参照するタイルグループヘッダ内に存在することを示す。

示された実施形態では、tile_group_info_in_pps_flagが1に等しい場合（つまり、if(tile_group_info_in_pps_flag)）、それは、タイルグループ情報がＰＰＳ内に存在し、ＰＰＳを参照するタイルグループヘッダ内に存在しないことを示し、変数num_tile_groups_in_pic_minus１は、ピクチャ内のタイルグループの数より１小さいものに等しく設定される。この変数は、ピクチャ内のタイルグループの各々を通じてループするよう、for－loopの中で使用される。シンタックス要素pps_first_tile_id[ i ]は、ピクチャ内のｉ番目のタイルグループの最初のタイルのタイルＩＤを指定する。pps_first_tile_id[ i ]の値は、ｊに等しくない任意のｉについて、pps_first_tile_id[ j ]の値に等しくてはならない。本実施形態では、タイルグループ当たり１より多くのタイルがある場合（つまり、if(!single_tile_per_tile_group_flag)）、シンタックス要素pps_last_tile_id[ i ]は、ｉ番目のタイルグループの最後のタイルのタイルのタイルＩＤを指定する。pps_first_tile_id[ i ]及びpps_last_tile_id[ i ]の長さは、Ceil( Log２( NumTilesInPic ) )ビットである。

実施形態では、タイルグループヘッダ及びＲＢＳＰシンタックス及びセマンティクスは、以下の通りである。基本テキストに関連するtile_group_header( )関数に対する変更されたテキストは、アスタリスク（＊）により強調される。

示された実施形態では、ピクチャ内のタイルの数（NumTilesInPic）が１より多い場合、シンタックス要素first_tile_idは、タイルグループの最初のタイルのタイルＩＤを指定するために使用される。First_tile_idの長さは、Ceil( Log２( NumTilesInPic ) )ビットである。タイルグループのfirst_tile_idの値は、同じピクチャの任意の他のタイルグループのfirst_tile_idの値と等しくてはならない。single_tile_per_tile_group_flagが、タイルグループ当たり１より多くのタイルがあることを指定し（つまり、if(!single_tile_per_tile_group_flag)）、tile_group_info_in_pps_flagが、タイルグループ情報はＰＰＳ内に存在せずＰＰＳを参照するタイルグループヘッダ内に存在すると示す（つまり、!tile_group_info_in_pps_flag）場合、シンタックス要素last_tile_idが、タイルグループの最後のタイルのタイルＩＤを指定するために使用される。実施形態では、last_tile_idの長さは、Ceil( Log２( NumTilesInPic ) )ビットである。

実施形態では、NumTilesInPicが１に等しいか、又はsingle_tile_per_tile_group_flagが１に等しいとき、last_tile_idの値は、first_tile_idに等しいと推定される。実施形態では、tile_group_info_in_pps_flagが１に等しいとき、last_tile_idの値はpps_first_tile_id[ i ]の値に等しいと推定され、ここで、ｉは、first_tile_idがpps_first_tile_id[ i ]に等しくなるような値である。本実施形態では、各タイルグループはピクチャの長方形領域を含むことが更に制約されてよい。この場合、first_tile_idは、タイルグループの左上角に位置するタイルのタイルＩＤを指定し、last_tile_idは、タイルグループの右下角に位置するタイルのタイルＩＤを指定する。

実施形態では、シンタックス要素は、少なくとも以下の２つのタイルグループモードを許可するタイルグループモードを指定するために、ＰＰＳ内で更にシグナリングできる。長方形タイルグループモードと呼ばれる第１モードでは、各タイルグループはピクチャの長方形領域を含むことが更に制約される。この場合、first_tile_idは、タイルグループの左上角に位置するタイルのタイルＩＤを指定し、last_tile_idは、タイルグループの右下角に位置するタイルのタイルＩＤを指定する。タイルラスタスキャンモードと呼ばれる第２モードでは、追加の変更は行われず、各タイルグループに含まれるタイルは、ピクチャのタイルラスタスキャンの中の連続するタイルである。

図７は、例示的なビデオコーディング装置７００の概略図である。ビデオコーディング装置７００は、ここに説明したような開示の例／実施形態を実施するのに適する。ビデオコーディング装置７００は、ダウンストリームポート７２０、アップストリームポート７５０、及び／又は、ネットワークを介してデータアップストリーム及び／又はダウンストリームを通信する送信機及び／又は受信機を含むトランシーバユニット（Tx/Rx）７１０を含む。ビデオコーディング装置７００は、データを処理する論理ユニット及び／又は中央処理ユニット（central processing unit (CPU)）を含むプロセッサ７３０、及びデータを格納するメモリ７３２も含む。ビデオコーディング装置７００は、電気、光－電気（optical－to－electrical (OE)）コンポーネント、電気－光（electrical－to－optical (EO)）コンポーネント、及び／又は、電気、光又は無線通信ネットワークを介するデータの通信のためにアップストリームポート７５０及び／又はダウンストリームポート７２０に接続される無線通信コンポーネント、も含んでよい。ビデオコーディング装置７００は、データをユーザに及びから通信する入力及び／又は出力（input and/or output (I/O)）装置７６０も含んでよい。I/O装置７６０は、ビデオデータを表示するディスプレイ、オーディオデータを出力するスピーカ、等のような出力装置を含んでよい。Ｉ／Ｏ装置７６０は、キーボード、マウス、トラックボール、等のような入力装置、及び／又は、そのような出力装置とインタフェースする対応するインタフェースも含んでよい。

プロセッサ７３０は、ハードウェア及びソフトウェアにより実装される。プロセッサ７３０は、１つ以上のＣＰＵチップ、コア（例えば、マルチコアプロセッサ）、フィールドプログラマブルゲートアレイ（field－programmable gate array (FPGA)）、特定用途向け集積回路（application specific integrated circuit (ASIC)）、及びデジタル信号プロセッサ（digital signal processor (DSP)）として実装されてよい。プロセッサ７３０は、ダウンストリームポート７２０、Ｔｘ／Ｒｘ７１０、アップストリームポート７５０、及びメモリ７３２と通信する。プロセッサ７３０は、コーディングモジュール７１４を含む。コーディングモジュール７１４は、ビットストリーム５００及び／又はタイルグループ６０９にパーティションされた画像を利用してよい方法１００、８００、及び９００のような、ここに説明した開示の実施形態を実施する。コーディングモジュール７１４は、ここに説明した任意の他の方法／メカニズムも実施してよい。さらに、コーディングモジュール７１４は、コーデックシステム２００、エンコーダ３００、及び／又はデコーダ４００を実装してよい。例えば、エンコーダとして動作するとき、コーディングモジュール７１４は、少なくとも１つのタイルグループを含む少なくとも１つのピクチャのためのコーディングデータを含むビデオビットストリームを符号化できる。コーディングモジュール７１４は、更に、コーディングピクチャのタイル情報がパラメータセット内に又はタイルグループヘッダ内に存在するかを指定するフラグをパラメータセット内に符号化できる。デコーダとして動作するとき、コーディングモジュール７１４は、コーディングピクチャのタイル情報がパラメータセット内に又はタイルグループヘッダ内に存在するかを示すフラグを読み取ることができる。従って、コーディングモジュール７１４は、ビデオコーディング分野に固有の問題を解決すると共に、ビデオコーディング装置７００の機能を向上して、タイルグループシグナリングに悪影響を与えることなく、ビデオシーケンス内のデータ冗長性を低減又は除去する（従って、コーディング効率を向上する）。更に、コーディングモジュール７１４は、ビデオコーディング装置７００の異なる状態への変換を実施する。代替として、コーディングモジュール７１４は、メモリ７３２に格納されプロセッサ７３０により実行される命令として（例えば、非一時的媒体に格納されたコンピュータプログラムプロダクトとして）実装できる。

メモリ７３２は、ディスク、テープドライブ、個体ドライブ、読み出し専用メモリ（read only memory (ROM)）、ランダムアクセスメモリ（random access memory (RAM)）、フラッシュメモリ、三値連想メモリ（ternary content－addressable memory (TCAM)）、静的ランダムアクセスメモリ（static random－access memory (SRAM)）、等のような１つ以上のメモリ種類を含む。メモリ７３２は、プログラムが実行のために選択されるとき該プログラムを格納するため、及びプログラムの実行中に読み出される命令及びデータを格納するための、オーバフローデータ記憶装置として使用されてよい。

図８は、ピクチャ６０１のような画像を、ビットストリーム５００のようなビットストリームに符号化する例示的な方法８００のフローチャートである。方法８００は、方法１００を実行するとき、コーデックシステム２００、エンコーダ３００、及び／又はビデオコーディング装置７００のようなエンコーダにより利用されてよい。

方法８００は、エンコーダが複数の画像を含むビデオシーケンスを受信し、例えばユーザ入力に基づきビデオシーケンスをビットストリームに符号化することを決定するとき、開始してよい。ビデオシーケンスは、符号化の前に更なるパーティションのためにピクチャ／画像／フレームにパーティションされる。ステップ８０１で、ピクチャは、複数のタイルにパーティションされる。タイルは、複数のＣＴＵに更にパーティションできる。該ＣＴＵは、予測に基づく圧縮の適用のために、コーディングブロックに更にパーティションできる。タイルのグループは、更に、タイルグループに割り当てられる。

ステップ８０３で、タイルグループは、少なくとも１つのピクチャのためのコーディングデータを含むビットストリームに符号化される。ピクチャの各々は、少なくとも１つのタイルグループを含む。更に、フラグが、ビットストリーム内のパラメータセットに符号化される。フラグは、コーディングピクチャのタイル情報がパラメータセット内に又はタイルグループヘッダ内に存在するかを示す。タイル情報は、ピクチャのどのタイルがタイルグループに含まれるかを示す。特定の例として、フラグはtile_group_info_in_pps_flagである。例えば、フラグは、ピクチャに関連付けられたＰＰＳに符号化できる。

ステップ８０５で、タイル情報は、フラグに基づき、パラメータセット又はタイルグループヘッダのいずれかに符号化される。実施形態では、シンタックス要素tile_group_info_in_pps_flagが１に等しい場合、これは、タイルグループ情報がパラメータセット内に存在し、パラメータセットを参照するタイルグループヘッダ内に存在しないことを指定する。シンタックス要素tile_group_info_in_pps_flagが０に等しいとき、それは、タイルグループ情報がパラメータセット内に存在せず、パラメータセットを参照するタイルグループヘッダ内に存在することを示す。実施形態では、フラグがパラメータセット内に存在しないとき（例えば、ピクチャが１つのタイルのみを含むとき）、tile_group_info_in_pps_flagの値は０に等しいと推定される。タイルグループ情報は、タイルグループ内のタイルの数を指定するシンタックス要素、タイルグループの最後のタイルの識別を指定するシンタックス要素、及びタイルグループ内の最初のタイル以外の任意のタイルのタイル識別を指定するシンタックス要素、を含むことができる。

ステップ８０７で、ビデオビットストリームは、デコーダへ向けてネットワークに沿って送信又は送信される。実施形態では、ビデオビットストリームは、要求により送信される。ビデオビットストリームは、また、エンコーダによりデコーダへ自動的にプッシュアウトできる。実施形態では、コーディングビデオビットストリームは、エンコーダにおいて一時的に又は永久的に格納できる。

図９は、ピクチャ６０１のような画像を、ビットストリーム５００のようなビットストリームから復号する例示的な方法９００のフローチャートである。方法９００は、方法１００を実行するとき、コーデックシステム２００、デコーダ４００、及び／又はビデオコーディング装置７００のようなデコーダにより利用されてよい。

方法９００は、ステップ９０１で、例えば方法８００の結果として、デコーダがビデオシーケンスを表すコーディングデータのビットストリームを受信し始めると、開始する。例えば、コーディングデータは、少なくとも１つのピクチャのコーディングデータを含み、各ピクチャは、少なくとも１つのタイルグループを含む。

ステップ９０３で、ビットストリーム内のパラメータセットから、フラグがパースされる。例えば、フラグは、ピクチャに関連付けられたＰＰＳから取得できる。用語、パース又はパースする、は、ここで使用されるとき、フラグまたは他のシンタックス要素がパラメータセット内に存在するかどうかを識別し又は決定し、フラグまたは他のシンタックス要素に対応する値を取得し、及びフラグ又は他のシンタックス要素の値に関連付けられた条件を決定する処理を含むことができる。実施形態では、フラグをパースすることにより、方法９００は、コーディングピクチャのタイル情報がパラメータセット内に又はタイルグループヘッダ内に存在するかを、フラグに基づき決定できる。

ステップ９０５で、方法９００は、フラグに基づき、パラメータセット又はタイルグループヘッダのいずれかの中のタイル情報を取得する。例えば、フラグが、コーディングピクチャのタイル情報はパラメータセット内に符号化されると指定するとき、方法９００は、パラメータセットからタイル情報をパースできる。同様に、フラグが、コーディングピクチャのタイル情報はタイルグループヘッダ内に符号化されると指定するとき、方法９００は、タイルグループヘッダからタイル情報をパースできる。

ステップ９０７で、タイルグループは、ピクチャの一部を再構成するために復号できる。該一部は、次に、再構成ビデオシーケンスの部分として含まれることができる。結果として生じる再構成ビデオシーケンスは、ユーザへの表示のためにディスプレイ装置へ転送できる。結果として生じる再構成ビデオシーケンスは、デコーダのメモリ又はデータ記憶ユニットに一時的又は永久的に格納されることもできる。

図１０は、ビットストリーム５００のようなビットストリームの中の、ピクチャ６０１のような画像のビデオシーケンスをコーディングする例示的なシステム１０００の概略図である。システム１０００は、コーデックシステム２００のようなエンコーダ及びデコーダ、エンコーダ３００、デコーダ４００、及び／又はビデオコーディング装置７００により実装されてよい。更に、システム１０００は、方法１００、８００、及び／又は９００を実施するとき、利用されてよい。

システム１０００は、ビデオエンコーダ１００２を含む。ビデオエンコーダ１００２は、第１のピクチャを複数のタイルにパーティションするパーティションモジュール１００１を含む。ビデオエンコーダ１００２は、タイルグループにタイルのグループを割り当てる割り当てモジュール１００３を更に含む。ビデオエンコーダ１００２は、タイルグループをビットストリームに符号化し、及び符号化ピクチャのタイル情報がパラメータセット内に又はタイルグループヘッダ内に存在するかを示すためにフラグをビットストリーム内のパラメータセットに符号化する符号化モジュール１００５を更に含む。ビデオエンコーダ１００２は、デコーダへ向けた通信のためにビットストリームを格納する格納モジュール１００７を更に含む。ビデオエンコーダ１００２は、デコーダへビットストリームを送信する送信モジュール１００９を更に含む。ビデオエンコーダ１００２は、方法８００のステップのうちのいずれかを実行するよう更に構成されてよい。

システム１０００は、ビデオデコーダ１０１０も含む。ビデオデコーダ１０１０は、ピクチャからパーティションされたタイルのグループを含むタイルグループを含むビットストリームを受信する受信モジュール１０１１を含む。ビデオデコーダ１０１０は、ビットストリーム内のパラメータセットからフラグを取得する取得モジュール１０１３を更に含み、フラグは、符号化ピクチャのタイル情報がパラメータセット内に又はタイルグループヘッダ内に存在するかを示す。ビデオデコーダ１０１０は、特定の条件がタイリング情報の位置に関連するとき、それらが存在するかどうかを決定する決定モジュール１０１５を更に含む。例えば、決定モジュール１０１５は、single_tile_per_tile_group_flagをパースすることにより、タイルグループ当たりに単一のタイルがあるかどうかを決定できる。ビデオデコーダ１０１０は、タイルグループを復号して表示のための再構成ビデオシーケンスを生成する復号モジュール１０１７を更に含む。ビデオデコーダ１０１０は、方法９００のステップのうちのいずれかを実行するよう更に構成されてよい。

第１コンポーネントと第２コンポーネントとの間に線、トレース、又は別の媒体を除き仲介コンポーネントが存在しないとき、第１コンポーネントは、第２コンポーネントに直接接続される。第１コンポーネントと第２コンポーネントとの間に線、トレース、又は別の媒体以外の仲介コンポーネントが存在するとき、第１コンポーネントは、第２コンポーネントに間接接続される。用語「接続される」及びその変形は、直接接続及び間接接続の両方を含む。用語「約」の使用は、特に断りのない限り、後続の数値の±１０％を含む範囲を意味する。

更に理解されるべきことに、ここに説明された例示的な方法のステップは、必ずしも説明された順に実行される必要はなく、このような方法のステップの順は、単なる例であると理解されるべきである。同様に、追加ステップがこのような方法に含まれてよく、特定のステップは、本開示の種々の実施形態に従う方法において、省略され又は結合されてよい。

幾つかの実施形態が本開示において提供されたが、開示のシステム及び方法は、本開示の精神又は範囲から逸脱することなく、多くの他の特定の形式で実施され得ることが理解され得る。本発明の例は、説明のためであり限定的ではないと考えられるべきであり、ここに与えられた詳細事項に限定されることを意図しない。例えば、種々の要素又はコンポーネントは、結合され、又は別のシステムに統合されてよく、或いは、特定の機能は、省略され又は実施されなくてよい。

さらに、種々の実施形態において説明され示された技術、システム、サブシステム、及び方法は、本開示の範囲から逸脱することなく、他のシステム、コンポーネント、技術、又は方法と結合され又は統合されてよい。変更、代用、及び改造の他の例は、当業者により確認され、ここに開示した精神及び範囲から逸脱することなく行われてよい。

５００ビットストリーム
５１０シーケンスパラメータセット（SPS）
５１２ピクチャパラメータセット（PPS）
５１４タイルグループヘッダ
５２０画像データ
５２４タイルインデックス
５２３タイル

Claims

複数のピクチャのためのコーディングデータを含むビデオビットストリームを符号化するエンコーダにおいて実施される方法であって、前記複数のピクチャのうちの各ピクチャは少なくとも１つのスライスと複数のタイルとを含み、前記方法は、
前記エンコーダのプロセッサにより、コーディングピクチャのタイル情報がパラメータセット内に存在するか又はスライスヘッダ内に存在するかを示すフラグを符号化するステップと、
前記プロセッサにより、前記フラグが、コーディングピクチャの前記タイル情報は前記パラメータセット内に符号化されることを示すとき、前記タイル情報を前記パラメータセット内に符号化するステップと、
前記プロセッサにより、前記フラグが、コーディングピクチャの前記タイル情報は前記スライスヘッダ内に符号化されることを示すとき、前記タイル情報を前記スライスヘッダ内に符号化するステップと、
前記プロセッサにより、前記タイル情報に基づき、前記ビデオビットストリーム内に前記ピクチャを符号化するステップと、
を含む方法。
前記プロセッサにより、前記タイル情報を前記パラメータセット内に符号化するステップは、前記プロセッサにより、前記ピクチャ内の各スライスの最初のタイルのタイル識別子（ＩＤ）を符号化するステップを含む、請求項１に記載の方法。
前記プロセッサにより、前記タイル情報を前記パラメータセット内に符号化するステップは、
前記プロセッサにより、前記パラメータセットを参照する現在スライスが１より多くのタイルを含むかどうかを指定する第２フラグをパースするステップと、
前記プロセッサにより、前記第２フラグが、前記パラメータセットを参照する前記現在スライスが１より多くのタイルを含むことを指定するという決定に応答して、前記ピクチャ内の前記現在スライスの最後のタイルのタイルＩＤを符号化するステップと、
を更に含む、請求項２に記載の方法。
前記プロセッサにより、前記タイル情報を前記パラメータセット内に符号化するステップは、
前記プロセッサにより、前記パラメータセットを参照する現在スライスが１より多くのタイルを含むかどうかを指定する第２フラグをパースするステップと、
前記プロセッサにより、前記第２フラグが、前記パラメータセットを参照する前記現在スライスが１より多くのタイルを含むことを指定するという決定に応答して、前記ピクチャ内の前記現在スライス内のタイルの数を符号化するステップと、
を更に含む、請求項２に記載の方法。
前記プロセッサにより、前記タイル情報を前記スライスヘッダ内に符号化するステップは、
前記プロセッサにより、前記ピクチャ内のスライスの最初のタイルのタイルＩＤをスライスヘッダ内に符号化するステップと、
前記プロセッサにより、前記フラグが、前記コーディングピクチャの前記タイル情報は前記スライスヘッダ内に符号化されることを指定するかどうか、及び前記第２フラグが、前記パラメータセットを参照する現在スライスは１より多くのタイルを含むことを指定するかどうか、を決定するステップと、
前記プロセッサにより、前記フラグが、前記コーディングピクチャの前記タイル情報は前記スライスヘッダ内に符号化されることを指定する、及び前記第２フラグが、前記パラメータセットを参照する前記現在スライスは１より多くのタイルを含むことを指定する、という決定に応答して、前記ピクチャ内の前記スライスの最後のタイルのタイルＩＤを前記スライスヘッダ内に符号化するステップと、
を含む、請求項３に記載の方法。
ネットワークに沿ってデコーダへ向けて前記ビデオビットストリームを送信するステップ、を更に含む請求項１に記載の方法。
前記タイル情報は、前記ピクチャのどのタイルがスライスに含まれるかを示す、請求項１に記載の方法。
ビデオビットストリームを復号するデコーダにおいて実施される方法であって、前記ビデオビットストリームは、複数のピクチャのためのコーディングデータを含み、前記複数のピクチャのうちの各ピクチャは少なくとも１つのスライスと複数のタイルとを含み、前記方法は、
前記デコーダのプロセッサにより、コーディングピクチャのタイル情報がパラメータセット内に存在するか又はスライスヘッダ内に存在するかを示すフラグをパースするステップと、
前記プロセッサにより、前記フラグが、コーディングピクチャの前記タイル情報は前記パラメータセット内に符号化されることを示すとき、前記タイル情報を前記パラメータセットからパースするステップと、
前記プロセッサにより、前記フラグが、コーディングピクチャの前記タイル情報は前記スライスヘッダ内に符号化されることを示すとき、前記タイル情報を前記スライスヘッダからパースするステップと、
前記タイル情報に基づき、前記コーディングピクチャの復号データを取得するステップと、
を含む方法。
前記プロセッサにより、前記パラメータセット内の前記タイル情報をパースするステップは、前記ピクチャ内の各スライスの最初のタイルのタイル識別子（ＩＤ）を復号するステップを含む、請求項８に記載の方法。
前記プロセッサにより、前記パラメータセット内の前記タイル情報をパースするステップは、
前記プロセッサにより、前記パラメータセットを参照する現在スライスが１より多くのタイルを含むかどうかを指定する第２フラグをパースするステップと、
前記第２フラグが、前記パラメータセットを参照する前記現在スライスが１より多くのタイルを含むことを指定するという決定に応答して、前記ピクチャ内の前記現在スライスの最後のタイルのタイルＩＤを復号するステップと、
を更に含む、請求項９に記載の方法。
前記プロセッサにより、前記パラメータセット内の前記タイル情報をパースするステップは、
前記プロセッサにより、前記パラメータセットを参照する現在スライスが１より多くのタイルを含むかどうかを指定する第２フラグをパースするステップと、
前記第２フラグが、前記パラメータセットを参照する前記現在スライスが１より多くのタイルを含むことを指定するという決定に応答して、前記ピクチャ内の前記現在スライス内のタイルの数を復号するステップと、
を更に含む、請求項９に記載の方法。
前記プロセッサにより、前記スライスヘッダ内の前記タイル情報をパースするステップは、
スライスヘッダ内の、前記ピクチャ内のスライスの最初のタイルのタイルＩＤを復号するステップと、
前記フラグが、前記コーディングピクチャの前記タイル情報は前記スライスヘッダ内に符号化されることを指定するかどうか、及び前記第２フラグが、前記パラメータセットを参照する現在スライスは１より多くのタイルを含むことを指定するかどうか、を決定するステップと、
前記フラグが、前記コーディングピクチャの前記タイル情報は前記スライスヘッダ内に符号化されることを指定する、及び前記第２フラグが、前記パラメータセットを参照する前記現在スライスは１より多くのタイルを含むことを指定する、という決定に応答して、前記スライスヘッダ内の、前記ピクチャ内の前記スライスの最後のタイルのタイルＩＤを復号するステップと、
を含む、請求項１０に記載の方法。
前記プロセッサにより、コーディングピクチャのタイル情報がパラメータセット内に存在するか又はスライスヘッダ内に存在するかを指定する前記フラグをパースするステップは、前記フラグが前記パラメータセット内に存在しないという決定に応答して、前記フラグが、前記コーディングピクチャの前記タイル情報は前記スライスヘッダ内にのみ存在することを指定すると推定するステップを含む、請求項８に記載の方法。
前記パラメータセットはピクチャパラメータセットである、請求項１～１３のいずれかに記載の方法。
前記タイル情報は、前記ピクチャのどのタイルがスライスに含まれるかを示す、請求項８に記載の方法。
ビデオコーディング装置であって、
プロセッサと、前記プロセッサに結合された受信機と、前記プロセッサに結合された送信機と、を含み、前記プロセッサ、受信機、及び送信機は、請求項１～１５のいずれかに記載の方法を実行するよう構成される、ビデオコーディング装置。
ビデオコーディング装置による使用のためのコンピュータプログラムプロダクトを含む非一時的コンピュータ可読媒体であって、前記コンピュータプログラムプロダクトは、プロセッサにより実行されると前記ビデオコーディング装置に請求項１～１５のいずれかに記載の方法を実行させる、前記非一時的コンピュータ可読媒体に記憶されたコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体。
エンコーダであって、
ピクチャのタイル情報がパラメータセット内に存在するか又はスライスヘッダ内に存在するかを示すフラグを符号化するよう構成される第１符号化ユニットと、
第２符号化ユニットであって、
前記フラグが、ピクチャの前記タイル情報は前記パラメータセット内に符号化されると示すとき、前記パラメータセット内に前記タイル情報を符号化し、
前記フラグが、ピクチャの前記タイル情報は前記スライスヘッダ内に符号化されると示すとき、前記スライスヘッダ内に前記タイル情報を符号化し、
前記タイル情報に基づき、ビデオビットストリーム内に前記ピクチャを符号化する、
よう構成される第２符号化ユニットと、
を含むエンコーダ。
デコーダであって、
パースユニットであって、
コーディングピクチャのタイル情報がパラメータセット内に存在するか又はスライスヘッダ内に存在するかを示すフラグをパースし、
前記フラグが、コーディングピクチャの前記タイル情報は前記パラメータセット内に符号化されると示すとき、前記パラメータセットから前記タイル情報をパースし、
前記フラグが、コーディングピクチャの前記タイル情報は前記スライスヘッダ内に符号化されると示すとき、前記スライスヘッダから前記タイル情報をパースする、
よう構成されるパースユニットと、
前記タイル情報に基づき、前記コーディングピクチャの復号データを取得するよう構成される取得ユニットと、
を含むデコーダ。
請求項１～１５のいずれかに記載の方法を実行する処理回路を含むコーダ。
コンピュータ又はプロセッサに請求項１～１５のいずれかに記載の方法を実行させるコンピュータプログラム。