JP2022551001A

JP2022551001A - ビデオコード化のための方法及び装置

Info

Publication number: JP2022551001A
Application number: JP2022521968A
Authority: JP
Inventors: ジャオ，シン; チェン，リエン－フェイ; リ，シアン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2020-04-16
Filing date: 2021-04-12
Publication date: 2022-12-06
Anticipated expiration: 2041-04-12
Also published as: EP4018370A1; US20210329271A1; EP4018370A4; WO2021211449A1; CN114731447A; KR20220062652A; US11445206B2; JP7338053B2

Abstract

デコーダにおけるビデオ復号化のための方法が提供される。方法では、第１の信号伝達情報及び第２の信号伝達情報は、コード化された領域のコード化されたビデオビットストリームから決定される。第１の信号伝達情報は、第１の予測モードのコード化された領域の第１の最大変換サイズを示し、第２の信号伝達情報は、第２の予測モードのコード化された領域の第２の最大変換サイズを示す。更に、変換信号伝達情報がコード化されたビデオビットストリームに含まれるかどうかは、第１の信号伝達情報及び第２の信号伝達情報に基づいて決定される。変換信号伝達情報は、適応色変換（ＡＣＴ）がコード化された領域に適用されるかどうかを示す。コード化された領域は、引き続き、変換信号伝達情報に基づいて復号化される。

Description

（関連出願の参照）
この出願は、２０２０年４月１６日に出願された「ADAPTIVE MAX TRANSFORMSIEZE CONTROL」という名称の米国仮特許出願第６３／０１１，１１９号の優先権を主張する、２０２１年３月２４日に出願された「METHOD AND APPARATUS FOR VIDEO CODING」という名称の米国特許出願第１７／２１１，５８５号の優先権の利益を主張する。先の出願の開示全体は、その全文が参照により本明細書に援用される。

本開示は、ビデオコード化(coding)に概ね関する実施形態を記載する。より具体的には、最大変換サイズを制御するための実施形態が提供される。

本明細書で提供される背景記述は、本開示の文脈を概ね提示するためのものである。現在名前が挙げられている発明者の業績は、その業績がこの背景セクションに記載されている範囲において、並びに出願時に他の点では先行技術として適格でないことがある記述の側面において、本開示に対する先行技術として明示的にも暗示的にも認められない。

ビデオコード化(coding)及び復号化(decoding)は、動き補正を伴う画像間予測を用いて行われることができる。非圧縮デジタルビデオは、一連のピクチャ(pictures)を含むことができ、各ピクチャは、例えば、１９２０×１０８０の輝度サンプル及び関連する色サンプルの空間寸法を有する。一連の画像は、例えば、毎秒６０ピクチャ又は６０Ｈｚの、固定又は可変の（非公式にはフレームレートとしても知られる）ピクチャレートを有することができる。非圧縮ビデオは、有意なビットレート要件を有する。例えば、サンプル当たり８ビットで１０８０ｐ６０４：２：０のビデオ（６０Ｈｚフレームレートで１９２０ｘ１０８０の輝度サンプル解像度）は、１．５Ｇｂｉｔ／ｓに近い帯域幅を必要とする。そのようなビデオの１時間は、６００ギガバイト（ＧＢ）よりも多くの記憶空間を必要とする。

ビデオコード化及び復号化の１つの目的は、圧縮を通じた入力ビデオ信号における冗長性の低減であり得る。圧縮は、幾つかの場合には、２桁以上の大きさだけ、前述の帯域幅又は記憶空間の要求を低減するのに役立つ。無損失(lossless)及び損失性(lossy)圧縮の両方並びにそれらの組み合わせを利用することができる。無損失圧縮とは、元の信号の正確なコピーを圧縮された元の信号から再構成し得る技術を指す。損失性圧縮を使用するとき、再構成された信号は、元の信号と同一でないことがあるが、元の信号と再構成された信号との間の歪み(distortion)は、再構成された信号が意図された用途にとって有用にするのに十分なほどに小さい。ビデオの場合には、損失性圧縮が広く利用される。許容される歪みの量は、アプリケーションに依存し、例えば、特定の消費者ストリーミングアプリケーションのユーザは、テレビ配信アプリケーションのユーザよりも高い歪みを許容することがある。達成可能な圧縮比は、以下を反映することができる。すなわち、許容可能な(allowable)／許容できる(tolerable)歪みが高ければ高いほど、より高い圧縮比をもたらすことができる。

ビデオエンコーダ及びデコーダは、例えば、運動補償、変換、量子化、及びエントロピーコード化を含む、幾つかの広いカテゴリからの技術を利用することができる。

ビデオコーデック(video codec)技術は、イントラコード化 (intra coding)として知られる技術を含むことができる。内部コード化において、サンプル値は、以前に再構成された参照ピクチャからのサンプル又は他のデータを参照することなく表現される。幾つかのビデオコーデックにおいて、ピクチャは、サンプルのブロックに空間的に分割される。サンプルの全てのブロックがイントラモードでコード化されるとき、そのピクチャは、イントラピクチャ(intra picture)であることができる。イントラピクチャ及び独立デコーダリフレッシュピクチャのようなそれらの派生物は、デコーダ状態をリセットするために使用されることができ、従って、コード化されたビデオビットストリーム及びビデオセッションにおける最初のピクチャとして、或いは静止画像として使用されることができる。イントラブロックのサンプルは、変換に曝されることができ、変換係数は、エントロピーコード化の前に量子化されることができる。イントラ予測は、変換前の領域におけるサンプル値を最小限に抑える技術であり得る。幾つかの場合には、変換後のＤＣ値が小さければ小さいほど、ＡＣ係数が小さければ小さいほど、エントロピーコード化後のブロックを表すために所与の量子化ステップサイズで必要とされるビットはより少ない。

例えば、ＭＰＥＧ－２世代コード化技術から知られているような、従来的なイントラコード化は、イントラ予測を使用しない。しかしながら、幾つかのより新しいビデオ圧縮技術は、例えば、空間的に隣接し且つ復号順において先行するデータのブロックを符号化／復号化する間に得られる周囲のサンプルデータ及び／又はメタデータから試みる技術を含む。以下では、そのような技法を「イントラ予測」技法と呼ぶ。少なくとも幾つかの場合において、イントラ予測は、参照ピクチャからではなく再構成中の現在のピクチャからの参照データのみを使用することに注意のこと。

多くの異なる形態のイントラ予測があることができる。そのような技法のうちの１つよりも多くを所与のビデオコード化技術において使用することができるとき、使用中の技術は、イントラ予測モードにおいてコード化されることができる。特定の場合には、モードが、サブモード及び／又はパラメータを有することができ、それらは個別にコード化されることができ、或いはモード符号語に含められることができる。所与のモード／サブモード／パラメータの組み合わせのためにどの符号語を使用するかは、イントラ予測を通じたコード化効率利得に影響を有することができ、よって、符号語をビットストリームに変換するために使用されるエントロピーコード化技術も影響を有することができる。

特定のイントラ予測モードがＨ．２６４で導入され、Ｈ．２６５で改良され、共同探査モデル（ＪＥＭ：joint exploration model）、多用途ビデオコード化（ＶＶＣ：versatile video coding）、及びベンチマークセット（ＢＭＳ：benchmark set）のようなより新しいコード化技術で更に改良された。予測子ブロックは、既に利用可能なサンプルに属する隣接するサンプル値を使用して形成されることができる。隣接するサンプルのサンプル値は、方向に従って予測子ブロックにコピーされる。使用中の方向への参照は、ビットストリームでコード化されることができ、或いはそれ自体が予測されることがある。

本開示の態様は、ビデオ符号化(encoding)／復号化(decoding)のための方法及び装置を提供する。幾つかの例では、ビデオ復号化のための装置は、受信回路構成と、処理回路構成とを含む。

本開示のある態様によれば、デコーダにおいてビデオ復号化する方法が提供される。本方法では、第1の信号伝達情報及び第２の信号伝達情報が、コード化された領域のコード化されたビデオビットストリームからを決定されることができる。第１の信号伝達情報は、第１の予測モードのコード化された領域の第１の最大変換サイズを示すことができ、第２の信号伝達情報は、第２の予測モードのコード化された領域の第２の最大変換サイズを示すことができる。更に、変換信号伝達情報がコード化されたビデオビットストリームに含まれるかどうかが、第１の信号伝達情報及び第２の信号伝達情報に基づいて決定されることができる。変換信号伝達情報は、適応色変換（ＡＣＴ）がコード化された領域に対して適用されるかどうかを示すことができる。コード化された領域は、引き続き、変換信号伝達情報に基づいて復号化されることができる。

本方法において、第１の信号伝達情報は、第１の信号伝達情報が第１の値であるときに、コード化された領域の第１の最大変換サイズが６４サンプルであることを示すことができる。第２の信号伝達情報は、第２の信号伝達情報が第１の値であるときに、コード化された領域の第２の最大変換サイズが６４サンプルであることを示すことができる。

本方法において、コード化されたビデオビットストリームは、パーティション信号伝達情報を更に含むことができ、パーティション信号伝達情報は、二重木パーティションがコード化された領域に適用されるかどうかを示すことができる。

幾つかの実施形態において、変換信号伝達情報は、（ｉ）第１の予測モードのコード化された領域の第１の最大変換サイズが３２サンプルであることを示す第１の信号伝達情報、及び二重木パーティションがコード化された領域に適用されないことを示すパーティション信号伝達情報と、（ｉｉ）第２の予測モードのコード化された領域の第２の最大変換サイズが３２サンプルであることを示す第２の信号伝達情報とのうちの少なくとも１つに基づいて、コード化されたビデオビットストリームに含まれるかどうかが決定されることができる。

幾つかの実施形態において、第１の信号伝達情報は、二重木パーティションがコード化された領域に適用されることを示すパーティション信号伝達情報に基づいて決定されることができる。

幾つかの実施形態において、第１の信号伝達情報及び第２の信号伝達情報は、二重木パーティションがコード化された領域に適用されることを示すパーティション信号伝達情報に基づいて決定されることができる。

幾つかの実施形態において、第１の最大変換サイズは、二重木パーティションがコード化された領域に適用されないことを示すパーティション信号伝達情報に基づいて、第２の最大変換サイズに等しいことができる。

本方法において、第１の信号伝達情報及び第２の信号伝達情報は、シーケンスパラメータセット、ピクチャパラメータセット、及びスライスヘッダのうちの１つにおける構文要素によって示されることができる。

本開示の別の態様によれば、デコーダのためのビデオ復号化の方法が提供される。本方法では、第１の信号伝達情報及び第２の信号伝達情報がコード化された領域のコード化されたビデオビットストリームからを受信されることができる。第１の信号伝達情報は、第１のパーティションモードに基づいてコード化された領域の第１の最大変換サイズを示すことができる。第２の信号伝達情報は、第２のパーティションモードに基づいてコード化された領域の第２の最大変換サイズを示すことができる。更に、変換信号伝達情報がコード化されたビデオビットストリームからを決定されることができ、変換信号伝達情報は、適用色変換（ＡＣＴ）がコード化された領域に対して適用されるかどうかを示すことができる。コード化された領域は、引き続き、変換信号伝達情報に基づいて復号化されることができる。

本方において、第１の信号伝達情報は、第１の信号伝達情報が第１の値であるときに、コード化された第１の最大変換サイズを示すことができ、第２の信号伝達情報は、第２の信号伝達情報が第１の値であるときに、コード化された領域の第２の最大変換サイズが６４サンプルであることを示すことができる。

幾つかの実施形態において、変換信号伝達情報は、第２のパーティションモードが３２サンプルであることに基づいて、第２の信号伝達情報がコード化された領域の第２の最大変換サイズを示すことに基づいて、決定されることができる。

幾つかの実施形態において、第２のパーティションモードが適用されていることと、ＡＣＴがコード化された領域に対して適用されることを示す変換信号伝達情報とに基づいて、コード化された領域の最大変換サイズが３２サンプルであると決定されることができる。

幾つかの実施形態において、コード化された領域の最大変換サイズは、（ｉ）第２のパーティションモードが適用されていないこと及び（ｉｉ）ＡＣＴがコード化された領域に対して適用されないことを示す変換信号伝達情報のうちの少なくとも１つに基づいて、６４サンプルであると決定されることができる。

幾つかの例では、受信回路構成と、処理回路構成とを含む、ビデオ復号化のための装置が、上述の方法のうちの１つ以上を実行するように構成される。

開示する主題の更なる構成、性質、及び様々な利点は、以下の詳細な記述及び添付の図面からより明らかになるであろう

ある実施態様に従った通信システム（１００）の簡略ブロック図の概略的な図示である。

ある一実施態様に従った通信システム（２００）の簡略ブロック図の概略的な図示である。

ある実施態様に従ったデコーダの簡略ブロック図の概略的な図示である。

ある実施態様に従ったエンコーダの簡略ブロック図の概略的な図示である。

別の実施態様に従ったエンコーダのブロック図を示している。

別の実施態様に従ったデコーダのブロック図を示している。

四分木に二分木を加えたもの（ＱＴＢＴ：quad-tree plus binary tree）を使用することによる例示的なブロック区切りを示している。

ＱＴＢＴを使用することによる例示的なブロック区切りの対応するツリー表現を示している。

垂直中央側面三分木区切りを示している。

水平中央側面三分木区切りを示している。

ある実施態様に従った色空間変換を実行するための例示的なエンコーダを図示している。

ある実施態様に従ったビットストリームを残差信号に変換するための例示的なデコーダを図示している。

本開示の幾つかの実施形態に従った第１のプロセスの例を概説するフローチャートを示している。

本開示の幾つかの実施形態に従った第２のプロセスの例を概説するフローチャートを示している。

ある実施態様に従ったコンピュータシステムの概略図である。

図１は、本開示のある実施態様に従った通信システム（１００）の簡略化されたブロック図を示している。通信システム（１００）は、例えば、ネットワーク（１５０）を介して、互いに通信することができる複数の端末デバイスを含む。例えば、通信システム（１００）は、ネットワーク（１５０）を介して相互接続された第１のペアの端末デバイス（１１０）及び（１２０）を含む。図１の例において、第１のペアの端末デバイス（１１０）及び（１２０）は、データの一方向送信を行う。例えば、端末デバイス（１１０）は、ネットワーク（１５０）を介して他の端末デバイス（１２０）に送信するために、ビデオデータ（例えば、端末デバイス（１１０）によってキャプチャされるビデオピクチャのストリーム）をコード化することがある。コード化されたビデオデータは、１つ以上のコード化されたビデオビットストリームの形態で送信されることができる。端末デバイス（１２０）は、ネットワーク（１５０）からコード化されたビデオデータを受信し、コード化されたビデオデータを復号化してビデオピクチャを復元し、復元されたビデオデータに従ってビデオピクチャを表示することがある。一方向性データ伝送は、媒体提供アプリケーション及び同等のものにおいて一般的なことがある。

別の例において、通信システム（１００）は、例えば、ビデオ会議中に発生することがあるコード化されたビデオデータの双方向伝送を行う第２のペアの端末デバイス（１３０）及び（１４０）を含む。データの双方向伝送のために、ある例において、端末デバイス（１３０）及び（１４０）の各端末デバイスは、ネットワーク（１５０）を介して端末デバイス（１３０）及び（１４０）の他方の端末デバイスに伝送するために、ビデオデータ（例えば、端末デバイスによってキャプチャされるビデオピクチャのストリーム）をコード化することがある。端末デバイス（１３０）及び（１４０）の各端末デバイスは、端末デバイス（１３０）及び（１４０）の他方の端末デバイスによって送信されるコード化されたビデオデータを受信することもあり、コード化されたビデオデータを復号化してビデオピクチャを復元することがあり、復元されたビデオデータに従ってアクセス可能なディスプレイデバイスでビデオピクチャを表示することがある。

図１の例において、端末デバイス（１１０）、（１２０）、（１３０）及び（１４０）は、サーバ、パーソナルコンピュータ及びスマートフォンとして示されることがあるが、本開示の原理は、それらに限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤ及び／又は専用のビデオ会議機器との適用を見出す。ネットワーク（１５０）は、例えば、ワイヤライン（有線）及び／又は無線通信ネットワークを含む、端末デバイス（１１０）、（１２０）、（１３０）及び（１４０）の間でコード化されたビデオデータを伝達する、任意の数のネットワークを表す。通信ネットワーク（１５０）は、回線交換及び／又はパケット交換チャネル内のデータを交換することがある。代表的なネットワークは、通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワーク及び／又はインターネットを含む。本開示の目的のために、ネットワーク（１５０）のアーキテクチャ及びトポロジは、以下に説明されない限り、本開示の動作に重要でないことがある。

図２は、開示する主題のためのアプリケーションの例として、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダの配置を図示している。開示する主題は、例えば、ビデオ会議、デジタルＴＶ、ＣＤ、ＤＶＤ、メモリスティック及び同等物を含むデジタル媒体上の圧縮ビデオの格納などを含む、他のビデオ使用可能アプリケーションに等しく適用可能であることができる。

ストリーミングシステムは、例えば、圧縮されていないビデオピクチャのストリーム（２０２）を生成する、ビデオソース（２０１）を含むことができるキャプチャサブシステム（２１３）、例えば、デジタルカメラを含んでよい。ある例において、ビデオピクチャのストリーム（２０２）は、デジタルカメラによって撮られるサンプルを含む。符号化されたビデオデータ（２０４）（又はコード化されたビデオビットストリーム）と比較されるときの高いデータボリュームを強調するために太線として描かれたビデオピクチャのストリーム（２０２）は、ビデオソース（２０１）に結合されたビデオエンコーダ（２０３）を含む電子デバイス（２２０）によって処理されることができる。ビデオエンコーダ（２０３）は、以下により詳細に記載されるような開示する主題の態様を可能にするか或いは実装するために、ハードウェア、ソフトウェア、又はそれらの組み合わせを含むことができる。ビデオピクチャのストリーム（２０２）と比較されるときのより低いデータボリュームを強調するために細線として描かれた符号化されたビデオデータ（２０４）（又は符号化されたビデオビットストリーム（２０４））は、将来の使用のためにストリーミングサーバ（２０５）に格納されることができる。図２のクライアントサブシステム（２０６）及び（２０８）のような１つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ（２０５）にアクセスして、符号化されたビデオデータ（２０４）のコピー（２０７）及び（２０９）を取り出すことができる。クライアントサブシステム（２０６）は、例えば、電子デバイス（２３０）内にビデオデコーダ（２１０）を含むことができる。ビデオデコーダ（２１０）は、符号化されたビデオデータの入力コピー（２０７）を復号化し、ディスプレイ（２１２）（例えばディスプレイスクリーン）又は他のレンダリングデバイス（図示せず）にレンダリングされることができるビデオピクチャの出力ストリーム（２１１）を生成する。幾つかのストリーミングシステムにおいて、符号化されたビデオデータ（２０４）、（２０７）及び（２０９）（例えば、ビデオビットストリーム）は、特定のビデオコード化／圧縮標準に従って符号化されることができる。それらの標準の例は、ＩＴＵ－Ｔ推奨Ｈ．２６５を含む。ある例において、開発中のビデオコード化標準は、多用途ビデオコード化（ＶＶＣ：Versatile Video Coding）として非公式に知られている。開示する主題事項は、ＶＶＣの文脈で使用されることがある。

電子デバイス（２２０）及び（２３０）は、他のコンポーネント（図示せず）を含むことができることに留意のこと。例えば、電子デバイス（２２０）は、ビデオデコーダ（図示せず）を含むことができ、電子デバイス（２３０）は、ビデオエンコーダ（図示せず）含むこともできる。

図３は、本開示のある実施態様に従ったビデオデコーダ（３１０）のブロック図を示している。ビデオデコーダ（３１０）は、電子デバイス（３３０）に含まれることができる。電子デバイス（３３０）は、受信機（３３１）（例えば、受信回路構成）を含むことができる。図２の例では、ビデオデコーダ（２１０）の代わりにビデオデコーダ（３１０）を使用することができる。

受信機（３３１）は、ビデオデコーダ（３１０）によって復号化されるべき１つ以上のコード化されたビデオシーケンスを受信することがあり、同一又は別の実施形態では、一度に１つのコード化されたビデオシーケンスを受信することがあり、各々のコード化されたビデオシーケンスの復号化は、他のコード化されたビデオシーケンスから独立している。コード化されたビデオシーケンスは、チャネル（３０１）から受信されることがあり、チャネル（３０１）は、コード化されたビデオデータを格納する記憶デバイスへのハードウェア／ソフトウェアリンクであることがある。受信機（３３１）は、コード化されたビデオデータを、他のデータ、例えば、コード化されたオーディオデータ及び／又は補助的なデータストリームと共に受信することがあり、それらは、それらのそれぞれの使用エンティティ（図示せず）に転送されることがある。受信機（３３１）は、コード化されたビデオシーケンスを他のデータから分離することがある。ネットワークジッタと闘うために、バッファメモリ（３１５）が、受信機（３３１）とエントロピーデコーダ／パーサ（３２０）（以下「パーサ（３２０）」）との間に結合されることがある。特定のアプリケーションにおいて、バッファメモリ（３１５）は、ビデオデコーダ（３１０）の一部である。他において、それはビデオデコーダ（３１０）の外側にあることができる（図示せず）。更に他において、例えば、ネットワークジッタと闘うために、ビデオデコーダ（３１０）の外側にあるバッファメモリ（図示せず）であることができ、加えて、例えば、再生タイミングを処理するために、ビデオデコーダ（３１０）の内側にある別のバッファメモリ（３１５）であることができる。受信機（３３１）が、十分な帯域幅及び制御可能性を有する記憶／転送デバイス(store/forward device)から或いは同期ネットワーク(isosynchronous network)からデータを受信しているときに、バッファメモリ（３１５）は必要とされないことがあるか、或いは小さくあることができる。インターネットのようなベストエフォートパケットネットワークでの使用のために、バッファメモリ（３１５）は要求されることがあり、比較的大きくなることができ、有利に適応サイズであることができ、ビデオデコーダ（３１０）の外側にあるオペレーティングシステム又は類似の要素（図示せず）に少なくとも部分的に実装されることがある。

ビデオデコーダ（３１０）は、コード化されたビデオシーケンスからシンボル（３２１）を再構成するためのパーサ（３２０）を含むことがある。それらのシンボルのカテゴリは、ビデオデコーダ（３１０）の動作を管理するために使用される情報と、図３に示されたように、電子デバイス（３３０）の不可欠な部分ではないが、電子デバイス（３３０）に結合されることができる、レンダリングデバイス（３１２）（例えば、ディスプレイスクリーン）のようなレンダリングデバイスを制御するための潜在的な情報とを含む。レンダリングデバイスの制御情報は、補足拡張情報（ＳＥＩ(Supplemental Enhancement Information)メッセージ）又はビデオユーザビリティ情報（ＶＵＩ(Video Usability Information)）パラメータセットフラグメント（図示せず）の形態にあることがある。パーサ（３２０）は、受信されるコード化されたビデオシーケンスを構文解析／エントロピー復号化することがある。コード化されたビデオシーケンスのコード化は、ビデオコード化技術又は標準に従うことができ、可変長コード化、ハフマンコード化、コンテキスト感度を伴う又は伴わない算術コード化などを含む、様々な原理に従うことができる。パーサ（３２０）は、グループに対応する少なくとも１つのパラメータに基づいて、ビデオデコーダ内のピクセルのサブグループのうちの少なくとも１つについてのサブグループパラメータのセットである、コード化されたビデオシーケンスから抽出されることがある。サブグループは、ピクチャのグループ（ＧＯＰ(Groups of Pictures)）、ピクチャ、タイル、スライス、マクロブロック、コード化単位（ＣＵ(Coding Units)）、ブロック、変換単位（ＴＵ(Transform Units)）、予測単位（ＰＵ(Prediction Units)）などを含む。パーサ（３２０）は、変換係数、量子化パラメータ値、運動ベクトルなどのような、コード化されたビデオシーケンス情報を抽出されることもある。

パーサ（３２０）は、シンボル（３２１）を生成するように、バッファメモリ（３１５）から受信するビデオシーケンスに対してエントロピー復号化／構文解析動作を実行することがある。

シンボル（３２１）の再構成は、コード化されたビデオピクチャ又はそれらの部分（インターピクチャ(ピクチャ間)(inter picture)及びイントラピクチャ(ピクチャ内)(intra picture)、インターブロック(ブロック間)(inter block)よびイントラブロック(ブロック内)(intra block)のような）のタイプ及び他の要因に依存して、複数の異なるユニットを含むことができる。どのユニットが含められ、どのように含められるかは、パーサ（３２０）によってコード化されたビデオシーケンスから構文解析されたサブグループ制御情報によって制御されることができる。パーサ（３２０）と以下の複数ユニットとの間のそのようなサブグループ制御情報の流れは、明瞭性のために図示されていない。

すでに述べた機能ブロックの他に、ビデオデコーダ（３１０）は、以下に記載するような多数の機能ユニットに概念的に細分化されることができる。商業的制約の下で作動する実用的な実装において、これらのユニットの多くは、互いに密接に相互作用し、少なくとも部分的には互いに統合されることができる。しかしながら、開示する主題事項を記載する目的のために、以下の機能単位に概念的に細分化することが適切である。

第１のユニットは、スケーラ／逆変換ユニット（３５１）である。スケーラ／逆変換ユニット（３５１）は、パーサ（３２０）からシンボル（３２１）として使用する変換、ブロックサイズ、量子化係数、量子化スケーリング行列などを含む、制御情報並びに量子化された変換係数を受信する。スケーラ／逆変換ユニット（３５１）は、アグリゲータ（３５５）に入力されることができるサンプル値を含むブロックを出力することができる。

幾つかの場合において、スケーラ／逆変換（３５１）の出力サンプルは、イントラコード化されたブロック、すなわち、以前に再構成されたピクチャからの予測情報を使用していないが、現在のピクチャの以前に再構成された部分からの予測情報を使用することができる、ブロックに関連することができる。そのような予測情報は、ピクチャ内予測ユニット（３５２）によって提供されることができる。幾つかの場合において、ピクチャ内予測ユニット（３５２）は、現在のピクチャバッファ（３５８）からフェッチされる周囲の既に再構成された情報を使用して、再構成中の同じサイズ及び形状のブロックのブロックを生成する。現在のピクチャバッファ（３５８）は、例えば、部分的に再構成された現在のピクチャ及び／又は完全に再構成された現在のピクチャをバッファする。アグリゲータ（３５５）は、幾つかの場合に、サンプル毎に、イントラ予測ユニット（３５２）が生成した予測情報を、スケーラ／逆変換ユニット（３５１）によって提供されるような出力サンプル情報に追加する。

他の場合には、スケーラ／逆変換ユニット（３５１）の出力サンプルは、インターコード化された(inter coded)潜在的に運動補償されたブロックに関連することができる。そのような場合は、運動補償予測ユニット３５３が、参照ピクチャメモリ３５７にアクセスして、予測のために使用されるサンプルをフェッチすることができる。フェッチされたサンプルをブロックに関連するシンボル（３２１）に従って運動補償した後に、これらのサンプルは、アグリゲータ（３５５）によって、出力サンプル情報を生成するために、（この場合には、残差サンプル又は残差信号と呼ぶ）スケーラ／逆変換ユニット（３５１）の出力に加えられることができる。運動補償予測ユニット（３５３）が予測サンプルをフェッチする参照ピクチャメモリ（３５７）内のアドレスは、例えば、Ｘ、Ｙ、及び参照ピクチャコンポーネントを有することができるシンボル（３２１）の形態で運動補償予測ユニット（３５３）に利用可能な、運動ベクトルによって制御されることができる。運動補償は、サブサンプルの正確な運動ベクトルが使用されているときに参照ピクチャメモリ（３５７）からフェッチされるようなサンプル値の補間、運動ベクトル予測メカニズムなどを含むことができる。

アグリゲータ（３５５）の出力サンプルは、ループフィルタユニット（３５６）内の様々なループフィルタリング技術を受けることができる。ビデオ圧縮技術は、（コード化されたビデオビットストリームとも呼ぶ）コード化されたビデオシーケンスに含まれるパラメータによって制御され、パーサ（３２０）からのシンボル（３２１）としてループフィルタユニット（３５６）に利用可能にされるが、コード化されたピクチャ又はコード化されたビデオシーケンスの（復号化順において）以前の部分の復号化中に得られるメタ情報に応答することもできると共に、以前に再構成され且つループフィルタリングされたサンプル値に応答することができる、ループ内フィルタ技術を含むことができる。

ループフィルタユニット（３５６）の出力は、レンダリングデバイス（３１２）に出力されることができると共に、将来のピクチャ間予測における使用のために参照画像メモリ（３５７）に格納されることができる、サンプルストリームであることができる。

特定のコード化されたピクチャは、ひとたび完全に再構成されると、将来の予測のための参考ピクチャとして使用されることができる。例えば、ひとたび現在のピクチャに対応するコード化されたピクチャが完全に再構成され、コード化されたピクチャが（例えば、パーサ（３２０）によって）参照ピクチャとして識別されると、現在のピクチャバッファ（３５８）は、参照ピクチャメモリ（３５７）の一部となることができ、新しい現在のピクチャバッファは、後続のコード化されたピクチャの再構成を開始する前に再割り当てされることができる。

ビデオデコーダ（３１０）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような標準における所定のビデオ圧縮技術に従って復号化動作を実行することがある。コード化されたビデオシーケンスは、コード化されたビデオシーケンスがビデオ圧縮技術又は標準の構文(syntax)及びビデオ圧縮技術又は標準において文書化されるようなプロファイルの両方に従うという意味で、使用されているビデオ圧縮技術又は標準によって指定される構文に適合することがある。具体的には、プロファイルは、特定のツールを、ビデオ圧縮技術又は標準において使用可能な全てのツールからそのプロファイルの下で使用可能な唯一のツールとして選択することができる。コンプライアンスのためにも必要なことは、コード化されたビデオシーケンスの複雑さがビデオ圧縮技術又は標準のレベルによって定義されるような範囲内にあることである。幾つかの場合において、レベルは、最大ピクチャサイズ、最大フレームレート、（例えば、毎秒メガサンプルで測定される）最大再構成サンプルレート、最大参照ピクチャサイズなどを制限する。レベルによって設定される制限値は、幾つかの場合において、コード化されたビデオシーケンスにおいて信号伝達される仮想基準デコーダ（ＨＲＤ：Hypothetical Reference Decoder）バッファ管理のためのＨＲＤ仕様とメタデータを通じて更に制限されることができる。

ある実施形態において、受信機（３３１）は、コード化されたビデオと共に追加の（冗長）データを受信することがある。追加のデータは、コード化されたビデオシーケンスの一部として含まれることがある。追加のデータは、データを適切に復号化するために及び／又は元のビデオデータをより正確に再構成するために、ビデオデコーダ（３１０）によって使用されることがある。追加のデータは、例えば、時間的、空間的、又は信号雑音比（ＳＮＲ）強化層、冗長スライス、冗長ピクチャ、前方エラー補正コードなどの形態にあることができる。

図４は、本開示のある実施態様に従ったビデオエンコーダ（４０３）のブロック図を示している。ビデオエンコーダ（４０３）は、電子デバイス（４２０）に含まれる。電子デバイス（４２０）は、送信機（４４０）（例えば、送信回路構成）を含む。図２の例において、ビデオエンコーダ（２０３）の代わりにビデオエンコーダ（４０３）を使用することができる。

ビデオエンコーダ（４０３）は、ビデオエンコーダ（４０３）によってコード化されるビデオイメージをキャプチャすることがある（図４の例では電子デバイス（４２０）の一部ではない）ビデオソース（４０１）からビデオサンプルを受け取ることがある。別の例において、ビデオソース（４０１）は、電子デバイス（４２０）の一部である。

ビデオソース（４０１）は、任意の適切なビット深さ（例えば、８ビット、１０ビット、１２ビット、．．．）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢ、．．．）、及び任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であり得る、デジタルビデオサンプルストリームの形態で、ビデオエンコーダ（４０３）によってコード化されるソースビデオシーケンスを提供することがある。メディア配信システム(media serving system)において、ビデオソース（４０１）は、事前に準備されたビデオを格納する記憶デバイスであることがある。ビデオ会議システムにおいて、ビデオソース（４０１）は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであることがある。ビデオデータは、シーケンスで見られるときに動きを伝える複数の個々のピクチャとして提供されることがある。ピクチャ自体は、ピクセルの空間アレイとして組織されてよく、各ピクセルは、使用中のサンプリング構造、色空間などに依存して、１つ以上のサンプルを含むことができる。当業者は、ピクセルとサンプルとの間の関係を容易に理解することができる。以下の記載は、サンプルに焦点を当てている。

ある実施形態によれば、ビデオエンコーダ（４０３）は、ソースビデオシーケンスのピクチャを、リアルタイムで又はアプリケーションによって要求される任意の他の時間制約の下で、コード化されたビデオシーケンス（４４３）にコード化して圧縮することができる。適切なコード化速度を強制することは、コントローラ（４５０）の１つの機能である。幾つかの実施形態において、コントローラ（４５０）は、以下に記載されるような他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。結合は、明瞭性のために示されていない。コントローラ（４５０）によって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化器、レート歪み最適化技術のラムダ値、．．．）、ピクチャサイズ、ピクチャのグループ（ＧＯＰ）レイアウト、最大運動ベクトルサーチ範囲などを含むことができる。コントローラ（４５０）は、特定のシステム設計のために最適化されたビデオエンコーダ（４０３）に関連する他の適切な機能を有するように構成されることができる。

幾つかの実施態様において、ビデオエンコーダ（４０３）は、コード化ループで動作するように構成される。過剰に単純化された記述として、ある例において、コード化ループは、（例えば、コード化されるべき入力ピクチャ及び参照ピクチャに基づいて、シンボルストリームのようなシンボルを生成することに関与する）ソースコーダ（４３０）と、ビデオエンコーダ（４０３）に埋め込まれる（ローカル）デコーダ（４３３）とを含むことができる。デコーダ（４３３）は、（リモート）デコーダが生成するのと類似の方法においてシンボルを再構成してサンプルデータを生成する（何故ならば、シンボルとコード化されたビデオビットストリームとの間のあらゆる圧縮は、開示する主題事項において考慮されるビデオ圧縮技術において無損失であるからである）。再構成されたサンプルストリーム（サンプルデータ）は、参照ピクチャメモリ（４３４）に入力される。シンボルストリームの復号化は、復号器場所（ローカル又はリモート）と無関係にビット正確な結果をもたらすので、参照ピクチャメモリ（４３４）中のコンテンツも、ローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えると、エンコーダの予測部は、デコーダが復号化中に予測を使用するときに「見る」のと全く同じサンプル値を参照ピクチャサンプルとして「見る」。参照ピクチャ同期性（及び、例えば、チャンネルエラーに起因する、同期性を維持し得ない場合の、結果として生じるドリフト）のこの基本原理は、幾つかの関連技術においても同様に使用される。

「ローカル」デコーダ（４３３）の動作は、図３に関連して既に上記で詳述したビデオデコーダ（３１０）のような「リモート」デコーダと同じであることができる。しかしながら、図３も簡単に参照すると、シンボルが利用可能であり、エントロピーコーダ（４４５）及びパーサ（３２０）によるコード化されたビデオシーケンスへのシンボルの符号化／復号化は無損失であり得るため、バッファメモリ（３１５）及びパーサ（３２０）を含むビデオデコーダ（３１０）のエントロピー復号化部は、ローカルデコーダ（４３３）に完全には実装されないことがある。

この時点で行われることができる観察は、デコーダ内に存在する構文解析／エントロピー復号化を除くあらゆるデコーダ技術が、対応するエンコーダ内に実質的に同一の機能的形態で存在する必要があることである。この理由のために、開示する主題事項は、デコーダ動作に焦点を当てる。エンコーダ技術の記述は、それらが包括的に記載されるデコーダ技術の逆であるので、省略されることができる。特定の領域においてのみ、より詳細な記述が必要とされ、以下に提供される。

動作中、幾つかの例において、ソースコーダ（４３０）は、「基準画像(reference pictures)」として指定されたビデオシーケンスからの１つ以上の以前に符号化された画像を参照して入力ピクチャを予測的にコード化する、運動補償予測コード化を実行することがある。このようにして、コード化エンジン（４３２）は、入力ピクチャのピクセルブロックと入力ピクチャに対する予測参照として選択されることがある参照ピクチャのピクセルブロックとの間の差をコード化する。

ローカルビデオデコーダ（４３３）は、ソースコーダ（４３０）によって生成されるシンボルに基づいて、参照ピクチャとして指定されることがあるピクチャのコード化されたビデオデータを復号化することがある。コード化エンジン（４３２）の動作は、有利に損失性プロセスであることがある。コード化されたビデオデータが（図４に示されていない）ビデオデコーダで復号化されることがあるときに、再構成されたビデオシーケンスは、典型的には、幾つかのエラーを伴うソースビデオシーケンスのレプリカであることがある。ローカルビデオデコーダ４３３は、参照ピクチャ上でビデオデコーダによって実行されることがあり、再構成された参照ピクチャを参照ピクチャキャッシュ（４３４）に格納させることがある、復号化プロセスを複製する。このようにして、ビデオエンコーダ（４０３）は、（伝送エラーのない）遠端ビデオデコーダによって得られる再構成された参照ピクチャとして共通のコンテンツを有する再構成された参照ピクチャのコピーをローカルに格納することがある。

予測器（４３５）は、コード化エンジン（４３２）のために予測サーチを実行することがある。すなわち、コード化されるべき新しいピクチャのために、予測器（４３５）は、新しいピクチャのための適切な予測参照として役立つことがある、（候補参照ピクチャブロックとしての）サンプルデータ、又は参照ピクチャ運動ベクトル、ブロック形状などのような特定のメタデータについて、参照ピクチャメモリ（４３４）をサーチすることがある。予測器（４３５）は、適切な予測参照を見出すためにサンプルブロック毎ベースで作動することがある。幾つかの場合には、予測器（４３５）によって得られるサーチ結果によって決定されるときに、入力ピクチャが、参照ピクチャメモリ（４３４）に格納された複数の参照ピクチャから引き出される予測参照を有することがある。

コントローラ（４５０）は、例えば、ビデオデータを符号化するために使用されるパラメータ及びサブグループパラメータの設定を含む、ソースコーダ（４３０）のコード化動作を管理することがある。

全ての前述の機能ユニットの出力は、エントロピーコーダ（４４５）内でエントロピーコード化を受けることがある。エントロピーコーダ（４４５）は、ハフマンコード化、可変長コード化、算術コード化などのような技術に従ってシンボルを損失性圧縮することによって、様々な機能ユニットによって生成されるようなシンボルをコード化されたビデオシーケンスに変換する。

送信機（４４０）は、エントロピーコーダ（４４５）によって生成されるようなコード化されたビデオシーケンスをバッファに入れて、通信チャネル（４６０）を介した送信の準備を行うことがあり、通信チャネル（４６０）は、コード化されたビデオデータを格納する記憶デバイスへのハードウェア／ソフトウェアリンクであることがある。送信機（４４０）は、ビデオコーダ（４０３）からのコード化されたビデオデータを、送信されるべき他のデータ、例えば、コード化されたオーディオデータ及び／又は（ソースを図示しない）補助的データストリームとマージ(併合)させることがある。

コントローラ（４５０）は、ビデオエンコーダ（４０３）の動作を管理することがある。コード化の間に、コントローラ（４５０）は、各コード化されたピクチャに特定のコード化されたピクチャタイプを割り当てることがあり、それは、それぞれのピクチャに適用されることがあるコード化技術に影響を及ぼすことがある。例えば、ピクチャは、しばしば、以下のピクチャタイプのうちの１つとして割り当てられることがある。

イントラピクチャ(Intra Picture)（Ｉピクチャ）は、予測のソースとしてシーケンス内の任意の他のピクチャを使用しないでコード化及び復号化されることがあるものであることがある。幾つかのビデオコーデックは、例えば、独立デコーダリフレッシュ(Independent Decoder Refresh)（「ＩＤＲ」）ピクチャを含む、異なるタイプのイントラピクチャを可能にする。当業者は、Ｉ画像のそれらの変形及びそれらのそれぞれの用途及び構成を知っている。

予測ピクチャ(predicative picture)（Ｐピクチャ）は、各ブロックのサンプル値を予測するために、最大で１つの運動ベクトル及び参照インデックスを使用してイントラ予測(内部予測)(intra prediction)又はインター予測(相互予測)(inter prediction)を使用してコード化され且つ復号化されることがあるものであることがある。

双方向予測ピクチャ(bi-directionally predictive picture)（Ｂピクチャ）は、各ブロックのサンプル値を予測するために、最大で２つの運動ベクトル及び参照インデックスを使用してイントラ予測又はインター予測を使用してコード化され且つ復号化されることがあるものであることがある。同様に、複数の予測ピクチャは、単一のブロックの再構成のために、２つよりも多くの参照ピクチャ及び関連するメタデータを使用することができる。

ソースピクチャは、一般的には、複数のサンプルブロック（例えば、各々が４×４、８×８、４×８、又は１６×１６サンプルのブロック）に空間的に細分化され、ブロック毎ベースでコード化されることがある。ブロックは、ブロックのそれぞれのピクチャに適用されるコード化割り当てによって決定されるような他の（既にコード化された）ブロックを参照して予測的にコード化されることがある。例えば、Ｉピクチャのブロックは、非予測的にコード化されてよく、或いは、それらは、同じピクチャの既にコード化されたブロックを参照して予測的にコード化されてよい（空間的予測又はイントラ予測）。Ｐピクチャのピクセルブロックは、１つの以前にコード化された参照ピクチャを参照して、空間的予測又は時間的予測を介して予測的にコード化されてよい。Ｂピクチャのブロックは、１つ又は２つの以前にコード化された参照ピクチャを参照して空間的予測を介して或いは時間的予測を介して予測的にコード化されてよい。

ビデオエンコーダ（４０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような所定のビデオコード化技術又は標準に従ってコード化動作を実行することがある。その動作において、ビデオエンコーダ（４０３）は、入力ビデオシーケンスにおける時間的及び空間的冗長性を活用する予測コード化動作を含む、様々な圧縮動作を実行することがある。従って、コード化されたビデオデータは、使用されているビデオコード化技術又は標準によって指定された構文に適合することがある。

ある実施形態において、送信機（４４０）は、符号化されたビデオと共に追加のデータを送信することがある。ソースコーダ（４３０）は、コード化されたビデオシーケンスの一部としてそのようなデータを含むことがある。追加のデータは、時間的／空間的／ＳＮＲ強化層、冗長ピクチャ及びスライスのような他の形態の冗長データ、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメントなどを含んでよい。

ビデオは、時間的シーケンスにおいて複数のソースピクチャ（ビデオピクチャ）としてキャプチャされることがある。（しばしば、イントラ予測と省略する）イントラピクチャ予測(ピクチャ内予測)は、所与のピクチャ内の空間的相関を利用し、インターピクチャ予測(ピクチャ間予測)は、ピクチャ間の（時間的又は他の）相関を利用する。ある例では、現在のピクチャと呼ぶ符号化／復号化の下にある特定のピクチャがブロックに仕切られる。現在のピクチャ内のブロックが、ビデオ内の以前にコード化され且つ依然としてバッファに入れられた参照ピクチャ内の参照ブロックに類似するとき、現在のピクチャ内のブロックは、運動ベクトルと呼ぶベクトルによってコード化されることができる。運動ベクトルは、参照ピクチャ内の参照ブロックを指し、複数の参照ピクチャが使用中である場合には、参照ピクチャを識別する第３の寸法を有することができる。

幾つかの実施形態では、ピクチャ間予測において双予測技術を使用することができる。双予測技術によれば、ビデオ内の現在のピクチャに対する復号順序において両方とも先行する（しかしながら、表示順序において、それぞれ過去及び将来であることがある）第１の参照ピクチャ及び第２の参照ピクチャのような２つの参照ピクチャが使用される。現在のピクチャ内のブロックは、第１の参照ピクチャ内の第１の参照ブロックを指す第１の運動ベクトルと、第２の参照ピクチャ内の第２の参照ブロックを指す第２の運動ベクトルとによってコード化されることができる。ブロックは、第１の参照ブロックと第２の参照ブロックとの組み合わせによって予測されることができる。

更にコード化効率を改善するために、ピクチャ間予測にマージモード技法を使用することができる。

本開示の幾つかの実施形態によれば、インターピクチャ予測及びイントラピクチャ予測のような予測は、ブロックの単位で実行される。例えば、ＨＥＶＣ標準によれば、ビデオピクチャのシーケンス中のピクチャは、圧縮のためにコード化ツリー単位（ＣＴＵ：coding tree unit）に分割され、ピクチャ内のＣＴＵは、６４×６４ピクセル、３２×３２ピクセル、又は１６×１６ピクセルのような、同じサイズを有する。一般に、ＣＴＵは、１つのルマ(輝度)ＣＴＢと２つのクロマ(彩度)ＣＴＢである、３つのコード化ツリーブロック（ＣＴＢ：coding tree block）を含む。各ＣＴＵは、１つ又は複数のコード化単位（ＣＵ：coding units）に再帰的に四分木分割されることができる。例えば、６４×６４ピクセルのＣＴＵは、６４×６４ピクセルの１個のＣＵ、３２×３２ピクセルの４個のＣＵ、又は１６×１６ピクセルの１６個のＣＵに分割されることができる。ある例では、各ＣＵが、インター予測タイプ又はイントラ予測タイプのような、ＣＵについての予測タイプを決定するために分析される。ＣＵは、時間的及び／又は空間的予測可能性に依存して１つ以上の予測単位（ＰＵ：prediction units）に分割される。一般に、各ＰＵは、１個のルマ予測ブロック（ＰＢ：prediction block）と、２個のクロマＰＢを含む。ある実施形態では、コード化（符号化／復号化）における予測動作が、予測ブロックのユニットにおいて実行される。予測ブロックの一例としてルマ予測ブロックを用いるとき、予測ブロックは、８×８ピクセル、１６×１６ピクセル、８×１６ピクセル、１６×８ピクセル及び同等のもののような、ピクセルについての値（例えば、ルマ値）の行列を含む。

図５は、本開示の別の実施態様に従ったビデオエンコーダ（５０３）の図を示している。ビデオエンコーダ（５０３）は、ビデオピクチャのシーケンス内の現在のビデオピクチャ内のサンプル値の処理ブロック（例えば、予測ブロック）を受信して、処理ブロックをコード化されたビデオシーケンスの部分であるコード化されたピクチャに符号化するように構成される。ある例において、ビデオエンコーダ（５０３）は、図２の例におけるビデオエンコーダ（２０３）の代わりに使用される。

ＨＥＶＣの例において、ビデオエンコーダ（５０３）は、８×８サンプルの予測ブロック及び同等のもののような、処理ブロックについてのサンプル値の行列を受信する。ビデオエンコーダ（５０３）は、処理ブロックが、例えば、レート歪み最適化を使用して、イントラモード、インターモード、又は双予測モードを使用して、最良にコード化されるかどうかを決定する。処理ブロックがイントラモードでコード化されるべきときに、ビデオエンコーダ５０３は、イントラ予測技術を使用して、処理ブロックをコード化されたピクチャに符号化してよく、処理ブロックがインターモード又は双予測モードでコード化されるべきときに、ビデオエンコーダ（５０３）は、インター予測技術又は双予測技術をそれぞれ使用して、処理ブロックをコード化されたピクチャに符号化してよい。特定のビデオコード化技術において、マージモードは、１つ以上の運動ベクトルが予測器の外側のコード化された運動ベクトル成分の利益なしに１つ以上の運動予測器から導出されるピクチャ間予測サブモードであることができる。特定の他のビデオコード化技術では、対象ブロックに適用可能な運動ベクトル成分が存在することがある。ある例において、ビデオエンコーダ（５０３）は、処理ブロックのモードを決定するためのモード決定モジュール（図示せず）のような他のコンポーネントを含む。

図５の例において、ビデオエンコーダ（５０３）は、図５に示すように互いに結合された、インターエンコーダ（５３０）、イントラエンコーダ（５２２）、残差計算器（５２３）、スイッチ（５２６）、残差エンコーダ（５２４）、汎用コントローラ(general controller)（５２１）、及びエントロピーエンコーダ（５２５）を含む。

インターエンコーダ（５３０）は、現在のブロック（例えば、処理ブロック）のサンプルを受信し、そのブロックを参照ピクチャ内の１つ以上の参照ブロック（例えば、以前のピクチャ内及び後のピクチャ内のブロック）と比較し、インター予測情報（例えば、インター符号化技術に従った冗長情報の記述、運動ベクトル、マージモード情報）を生成し、任意の適切な技術を使用してインター予測情報に基づいてインター予測結果（例えば、予測ブロック）を計算するように構成される。幾つかの例において、参照ピクチャは、符号化されたビデオ情報に基づいて復号化される復号化された参照ピクチャである。

イントラエンコーダ（５２２）は、現在のブロック（例えば、処理ブロック）のサンプルを受信するように構成され、幾つかの場合には、そのブロックを同じピクチャ内で既にコード化されているブロックと比較し、変換後に量子化された係数を生成し、幾つかの場合には、イントラ予測情報（例えば、１つ以上のイントラ符号化技術に従ったイントラ予測方向情報）も生成するように構成される。ある例において、イントラエンコーダ（５２２）は、同じピクチャ内のイントラ予測情報及び参照ブロックに基づいてイントラ予測結果（例えば、予測ブロック）も計算する。

汎用コントローラ（５２１）は、汎用制御データ(general control data)を決定して、汎用制御データに基づいてビデオエンコーダ（５０３）の他のコンポーネントを制御するように構成される。ある例において、汎用コントローラ（５２１）は、ブロックのモードを決定し、そのモードに基づいてスイッチ（５２６）に制御信号を提供する。例えば、モードがイントラモードであるとき、汎用コントローラ（５２１）は、スイッチ（５２６）を制御して、残差計算器（５２３）による使用のためのイントラモード結果を選択し、エントロピーエンコーダ（５２５）を制御して、イントラ予測情報を選択し、ビットストリームにイントラ予測情報を含め、モードがインターモードにあるとき、汎用コントローラ（５２１）は、スイッチ（５２６）を制御して、残差計算器（５２３）による使用のためのインター予測結果を選択し、エントロピーエンコーダ（５２５）を制御して、インター予測情報を選択し、ビットストリームにインター予測情報を含める。

残差計算器（５２３）は、受信したブロックとイントラエンコーダ（５２２）又はインターエンコーダ（５３０）から選択された予測結果との間の差（残差データ）を計算するように構成される。残差エンコーダ（５２４）は、残差データに基づいて作動して、残差データを符号化して、変換係数を生成するように構成される。ある例において、残差エンコーダ（５２４）は、残差データを空間領域(spatial domain)から周波数領域(frequency domain)に変換して、変換係数を生成するように構成される。次に、変換係数は、量子化された変換係数を得るために、量子化処理を受ける。様々な実施形態において、ビデオエンコーダ（５０３）は、残差デコーダ（５２８）も含む。残差デコーダ（５２８）は、逆変換を実行して、復号化された残差データを生成するように構成される。復号化された残差データは、イントラエンコーダ（５２２）及びインターエンコーダ（５３０）によって適切に使用されることができる。例えば、インターエンコーダ（５３０）は、復号化された残差データ及びインター予測情報に基づいて復号化されたブロックを生成することができ、イントラエンコーダ（５２２）は、復号化された残差データ及びイントラ予測情報に基づいて復号化されたブロックを生成することができる。復号化されたブロックは、復号化されたピクチャを生成するように適切に処理され、復号化されたピクチャは、幾つかの例において、メモリ回路（図示せず）内にバッファされることができ、参照ピクチャとして使用されることができる。

エントロピーエンコーダ（５２５）は、符号化されたブロックを含むようにビットストリームをフォーマットするように構成される。エントロピーエンコーダ（５２５）は、ＨＥＶＣ標準のような適切な標準に従った様々な情報を含むように構成される。ある例において、エントロピーエンコーダ（５２５）は、汎用制御データ、選択された予測情報（例えば、イントラ予測情報又はインター予測情報）、残差情報、及びビットストリーム内の他の適切な情報を含むように構成される。開示の主題事項によれば、インターモード又は双予測モードのいずれかのマージサブモードにおいてブロックをコード化するときに、残差情報はないことに留意のこと。

図６は、本開示の別の実施態様に従ったビデオデコーダ（６１０）の図を示している。ビデオデコーダ（６１０）は、コード化されたビデオシーケンスの部分であるコード化されたピクチャを受信し、コード化されたピクチャを復号化して再構成されたピクチャを生成するように構成される。ある例において、ビデオデコーダ（６１０）は、図２の例におけるビデオデコーダ（２１０）の代わりに使用される。

図６の例において、図６に示すように互いに結合された、ビデオデコーダ（６１０）は、エントロピーデコーダ（６７１）、インターデコーダ（６８０）、残差デコーダ（６７３）、再構成モジュール（６７４）、及びイントラデコーダ（６７２）を含む。

エントロピーデコーダ（６７１）は、コード化されたピクチャから、そのコード化されたピクチャが構成される構文要素を表す特定のシンボルを再構成するように構成されることができる。そのようなシンボルは、例えば、ブロックがコード化されるモード（例えば、イントラモード、インターモード、双予測モード、マージサブモード又は別のサブモードにおける後者の２つ）、イントラデコーダ（６７２）又はインターデコーダ（６８０）によってそれぞれ予測のために使用される特定のサンプル又はメタデータを識別することができる（例えば、イントラ予測情報又はインター予測情報のような）予測情報、例えば、量子化された変換係数の形態における残差情報、及び同等のものを含むことができる。ある例において、予測モードがインターモード又は双予測モードであるとき、インター予測情報はインターデコーダ（６８０）に提供され、予測タイプがイントラ予測タイプであるとき、イントラ予測情報はイントラデコーダ（６７２）に提供される。残差情報は、逆量子化を受けることができ、残差デコーダ（６７３）に提供される。

インターデコーダ（６８０）は、インター予測情報を受信し、インター予測情報に基づいてインター予測結果を生成するように構成される。

イントラデコーダ（６７２）は、イントラ予測情報を受信し、イントラ予測情報に基づいて予測結果を生成するように構成される。

残差デコーダ（６７３）は、脱量子化変換係数を抽出するために逆量子化を実行し、脱量子化変換係数を処理して残差を周波数領域から空間領域に変換するように構成される。残差デコーダ（６７３）は、（量子化器パラメータ（ＱＰ：Quantizer Parameter）を含むように）特定の制御情報を必要とすることもあり、その情報は、エントロピーデコーダ（６７１）によって提供されることがある（データ経路は示されていない。何故ならば、これは低ボリューム制御情報のみであることがあるからである）。

再構成モジュール（６７４）は、空間領域において、残差デコーダ（６７３）による出力としての残差と（場合によっては、インター予測モジュール又はイントラ予測モジュールによる出力としての）予測結果とを組み合わせて、再構成ブロックを形成するように構成され、それは再構成されるピクチャの部分であることがあり、ひいては、それは再構成されるビデオの部分であることがある。視覚品質を向上させるために、非ブロック化動作(deblocking operation)及び同等の動作のような他の適切な動作を実行し得ることに留意のこと。

ビデオエンコーダ（２０３）、（４０３）及び（５０３）、並びにビデオデコーダ（２１０）、（３１０）及び（６１０）は、任意の適切な技術を用いて実装されることができる。ある実施形態において、ビデオエンコーダ（２０３）、（４０３）及び（５０３）、並びにビデオデコーダ（２１０）、（３１０）及び（６１０）は、１つ以上の集積回路を使用して実装されることができる。別の実施形態において、ビデオエンコーダ（２０３）、（４０３）及び（４０３）、並びにビデオデコーダ（２１０）、（３１０）及び（６１０）は、ソフトウェア命令を実行する１つ以上のプロセッサを使用して実現されることができる。

本開示の態様は、ＨＥＶＣ（高効率ビデオ符号化(High Efficiency Video Coding)）、例えば、多用途ビデオコード化（ＶＶＣ：Versatile Video Coding）を超える、次世代ビデオコード化のための技術を提供する。例えば、（ｉ）最大変換サイズ及び（ｉｉ）最大変換サイズと変換分割スキーム（例えば、サブブロック変換(sub-block transform)（ＳＢＴ）及びイントラサブ分割(Intra sub-partitioning)（ＩＳＰ））との間の相互作用を制御するためのスキームを提供することができる。

ＨＥＶＣでは、様々な局所特性に適応するコード化ツリーとして示される四分木構造を使用することによって、コード化ツリー単位（ＣＴＵ）を複数のコード化単位（ＣＵ）に分割することができる。インターピクチャ（時間的）予測又はイントラピクチャ（空間的）予測を使用してピクチャ領域をコード化するかどうかの決定は、ＣＵレベルで行われることができる。各ＣＵは、ＰＵ分割タイプに従って、１つ、２つ、又は４つの予測ユニット（ＰＵ）に更に分割されることができる。１つのＰＵの内側では、同じ予測プロセスが適用されることができ、関連情報はＰＵベースでデコーダに送信されることができる。ＰＵ分割タイプに基づく予測プロセスを適用することによって残差ブロックを得た後に、ＣＵが、ＣＵについてのコード化ツリーのような別の四分木構造に従って、変換ユニット（ＴＵ）に分割されることができる。ＨＥＶＣ構造の重要な構成は、ＨＥＶＣがＣＵ、ＰＵ及びＴＵを含む複数のパーティション概念を有し得ることである。ＨＥＶＣでは、ＣＵ又はＴＵが、正方形の形状のみであり得る一方で、ＰＵは、インター予測ブロックのために正方形又は長方形の形状であり得る。ＨＥＶＣでは、１つのコード化ブロックが４つの正方形サブブロックに更に分割されることがあり、変換は、各サブブロック（すなわち、ＴＵ）に対して実行されることができる。各ＴＵは、（例えば、四分木分割を用いて）より小さなＴＵに更に再帰的に分割されることができ、それは残差四分木(Residual Quad-Tree)（ＲＱＴ）と呼ばれる。

ピクチャ境界で、ＨＥＶＣは、サイズがピクチャ境界に適合するまでブロックが四分木分割を維持することができるように、四分木分割を暗黙的に利用することができる。

ＶＶＣでは、四分木（ＱＴ）に二分木（ＢＴ）を加えたものを用いるブロック分割構造が提案される。ＱＴＢＴ構造は、複数の区切りタイプの概念を取り除くことができる。例えば、ＱＴＢＴ構造は、ＣＵ、ＰＵ及びＴＵの概念の分離を除去し、ＣＵ区切り形状についてより柔軟性をサポートすることができる。ＱＴＢＴブロック構造（又はＱＴＢＴ構造）では、ＣＵが正方形又は長方形の形状のいずれかを有することができる。図７Ａ及び図７Ｂに示すように、ＣＴＵは、先ず、四分木構造によって区切られることができる。四分木リーフノードは、二分木構造によって更に仕切られることができる。二分木分割には、２つの分割タイプ、すなわち、対称水平分割及び対称垂直分割がある。二分木リーフノードは、ＣＵと呼ばれることができ、そのセグメント化は、如何なる更なる区切りなしで予測及び変換処理のために使用されることができる。よって、ＣＵ、ＰＵ及びＴＵは、ＱＴＢＴコード化ブロック構造において同じブロックサイズを有することができる。実験ソフトウェア共同探究モデル（ＪＥＭ：Joint Exploration Model）では、ＣＵが、時折、異なる色成分のコード化ブロック（ＣＢ：coding blocks）を含み得る。例えば、４：２：０のクロマフォーマットのＰスライス及びＢスライスの場合、１つのＣＵは、１つのルマＣＢと、２つのクロマＣＢを含むことができる。１つのＣＵは、時折、単一の成分のＣＢを含むことができる。例えば、Ｉスライスの場合、１つのＣＵは、１つのみのルマＣＢ又は２つだけのクロマＣＢを含むことができる。

幾つかの実施形態において、以下のパラメータは、ＱＴＢＴ分割スキームについて以下のように定義されることができる。すなわち、（１）ＣＴＵサイズは、ＨＥＶＣにおけると同じ概念を有する四分木のルートノードサイズに言及し、（２）ＭｉｎＱＴＳｉｚｅは、最小の許容される四分木リーフノードサイズに言及し、（３）ＭａｘＢＴＳｉｚｅは、最大の許容される二分木ルートノードサイズに言及し、（４）ＭａｘＢＴＤｅｐｔｈは、最大の許容される二分木深さに言及し、（５）ＭｉｎＢＴＳｉｚｅは、最小の許容される二分木のリーフノードサイズに言及する。

ＱＴＢＴ分割構造（又はＱＴＢＴ構造）の一例において、ＣＴＵサイズは、２つの対応する６４×６４ブロックのクロマサンプルを備える１２８×１２８ルマサンプルとして設定されることができ、ＭｉｎＱＴＳｉｚｅは、１６×１６として設定されることができ、ＭａｘＢＴＳｉｚｅは、６４×６４として設定されることができ、ＭｉｎＢＴＳｉｚｅ（幅及び高さの両方）は、４×４として設定されることができ、ＭａｘＢＴＤｅｐｔｈは、４として設定されることができる。四分木分割は、複数の四分木リーフノードを生成するために、先ずＣＴＵに適用されることができる。四分木リーフノードは、１６×１６（すなわち、ＭｉｎＱＴＳｉｚｅ）から１２８×１２８（すなわち、ＣＴＵサイズ）までのサイズを有することがある。リーフ四分木ノードが１２８×１２８であるならば、リーフ四分木は、二分木によって更に分割されないことがある。何故ならば、サイズは、ＭａｘＢＴＳｉｚｅ（すなわち６４×６４）を超えるからである。さもなければ、リーフ四分木ノードは、二分木によって更に分割されることができる。従って、四分木リーフノードは、二分木のためのルートノードであることもでき、四分木リーフは、０のような二分木深さを有することができる。二分木深さがＭａｘＢＴＤｅｐｔｈ（例えば、４）に達するとき、更なる分割は考慮されない。二分木ノードがＭｉｎＢＴＳｉｚｅ（例えば４）に等しい幅を有するとき、更なる水平分割は考慮されない。同様に、二分木ノードがＭｉｎＢＴＳｉｚｅに等しい高さを有するとき、更なる垂直分割は考慮されない。ません。二分木のリーフノードは、如何なる更なる分割も伴わずに、予測及び変換処理によって更に処理されることができる。ＪＥＭにおいて、最大ＣＴＵサイズは、２５６×２５６ルマサンプルである。

図７Ａは、ＱＴＢＴを使用することによるブロック分割の例を示しており、図７Ｂは、対応するツリー表現を示している。実線は、四分木分割を示しており、点線は、二分木分割を示している。二分木の各分割（例えば、非リーフ）ノードでは、どの分割タイプ（例えば、水平又は垂直）が使用されるかを示すために、１つのフラグが信号伝達されることができ、ここで、０は、水平分割を示すことができ、１は、垂直分割を示すことができる。四分木分割については、分割タイプを示す必要はない。何故ならば、四分木分割は、等しいサイズを備える４つのサブブロックを生成するために、ブロックを常に水平方向及び垂直方向の両方に分割するからである。

加えて、ＱＴＢＴスキーム（又はＱＴＢＴ構造）は、ルマ及びクロマが別々のＱＴＢＴ構造を持つための柔軟性を提供することができる。現在、Ｐスライス及びＢスライスのために、１つのＣＴＵ中のルマＣＴＢ及びクロマＣＴＢは、同じＱＴＢＴ構造を共有する。しかしながら、Ｉスライスについて、ルマＣＴＢは、ＱＴＢＴ構造によってＣＵに分割され、クロマＣＴＢは、別のＱＴＢ構造によってクロマＣＵに分割される。よって、Ｉスライス中のＣＵは、ルマ成分のコード化ブロック又は２つのクロマ成分のコード化ブロックを含むことができ、Ｐスライス又はＢスライス中のＣＵは、全ての３つの色成分のコード化ブロックを含むことができる。

ＨＥＶＣでは、双予測が４×８及び８×４ブロックについてサポートされず、インター予測が４×４ブロックについてサポートされないように、小さいブロックについてのインター予測は、運動補償のメモリアクセスを減らすために制限される。ＪＥＭ－７．０で実装されるようなＱＴＢＴにおいて、これらの制限は取り除かれる。

ＶＣＣでは、マルチタイプツリー（ＭＴＴ：Multi-type-tree）構造も提案される。ＭＴＴは、ＱＴＢＴよりも柔軟なツリー構造である。ＭＴＴでは、例えば、図８Ａ及び図８Ｂに示すように、四分木及び二分木以外に、水平及び垂直中心側の三分木が導入される。図８Ａは、垂直中心側三分木分割であり、図８Ｂは、水平中心側三分木分割である。三分木分割の鍵となる利点は、以下を含む。すなわち、（ａ）三分木分割は、四分木分割及び二分木分割を補完することができる。三分木分割は、ブロック中心に位置するオブジェクトをキャプチャすることができる一方で、四分木及び二分木は、ブロック中心に沿って常に分割される。（ｂ）提案される三分木の区切りの幅及び高さは、常に２の冪乗であるので、追加の変換は必要とされない。２レベルツリーの設計は、主に複雑さの低減によって動機付けられる。理論的には、ツリーを横断する複雑さは、Ｔ^Ｄであり、ここで、Ｔは、分割タイプの数を示し、Ｄは、ツリーの深さである。

ＨＥＶＣにおいて、一次変換は、４ポイント、８ポイント、１６ポイント、３２ポイントＤＣＴ－２であることができ、変換コア行列は、８ビット整数（すなわち、８ビット変換コア）を用いて表されることができる。より小さなＤＣＴ－２の変換コア行列は、以下に示すように、より大きなＤＣＴ－２の部分であることができる。

ＤＣＴ－２コアは、対称特性／反対称特性を示す。よって、いわゆる「部分バタフライ(partial butterfly)」実装が演算カウントの数（乗法、加法／減法、シフト）を減らすためにサポートされ、部分バタフライを用いて行列乗法の同一の結果を得ることができる。

ＶＶＣでは、ＨＥＶＣと同じ４ポイント、８ポイント、１６ポイント及び３２ポイントのＤＣＴ－２変換の他に、追加的な２ポイント及び６４ポイントのＤＣＴ－２変換も含まれる。ＶＶＣにおいて定義される６４ポイントＤＣＴ－２コアは、６４×６４行列として以下に示されことができる

ＨＥＶＣで利用されてきたＤＣＴ‐２及び４×４ＤＳＴ‐７に加えて、適応多重変換（ＡＭＴ：Adaptive Multiple Transform、拡張多重変換（ＥＭＴ：Enhanced Multiple Transform）、又は多重変換選択（ＭＴＳ：Multiple Transform Selection））スキームが、インターコード化ブロック及びイントラコード化ブロックの両方についての残差コード化のためにＶＶＣにおいて使用されてきた。ＭＴＳは、ＨＥＶＣにおける現在の変換以外に、ＤＣＴ／ＤＳＴファミリーから複数の選択される変換を使用することができる。新しく導入された変換行列は、ＤＳＴ－７、ＤＣＴ－８である。表１は、選択されるＤＳＴ／ＤＣＴの基本関数を示している。

ＶＶＣにおける一次変換行列は、８ビット表現において使用される。ＡＭＴは、幅及び高さの両方が３２以下のＣＵに適用され、ＡＭＴを適用するかどうかは、ｍｔｓ＿ｆｌａｇと呼ばれるフラグによって制御されることができる。ｍｔｓ＿ｆｌａｇが０に等しいときには、ＤＣＴ－２のみが残差をコード化するために適用される。ｍｔｓ＿ｆｌａｇが１に等しいときには、インデックスｍｔｓ＿ｉｄｘは、表２に従って使用されるべき水平変換及び垂直変換を指定するために２つのビンを使用して更に信号伝達され、ここで、値１は、ＤＳＴ－７を使用することを意味し、値２は、ＤＣＴ－８を使用することを意味する。

基底ベクトルによって構成される行列であるＤＳＴ－７の変換コアは、以下に表されることもできる

ＶＶＣにおいて、最大変換サイズは、６４長（例えば、６４×６４ブロック）又は３２長（例えば、３２×３２ブロック）として指定されることができ、選択は、シーケンスパラメータセット（ＳＰＳ）で信号伝達されることができる。ＳＰＳ内の関連する構文(syntax)及び意味論(semantics)は、以下のように表３で記載されることができる

表３に示すように、最大変換サイズフラグ（例えばｓｐｓ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）を適用して、最大変換サイズを示すことができる。１に等しい最大変換サイズフラグ（例えば、ｓｐｓ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）は、ルマサンプルにおける最大変換サイズが６４に等しいことを指定することができる。０に等しい最大変換サイズフラグ（例えば、ｓｐｓ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）は、ルマサンプルの最大変換サイズが３２に等しいことを指定することができる。

加えて、ＣｔｂＳｉｚｅＹが６４未満であるとき、ｓｐｓ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇの値は、０に等しくあり得る。変数ＭｉｎＴｂＬｏｇ２ＳｉｚｅＹ、ＭａｘＴｂＬｏｇ２ＳｉｚｅＹ、ＭｉｎＴｂＳｉｚｅＹ、及びＭａｘＴｂＳｉｚｅＹは、式（１）～（４）で以下のように導出される。

幾つかの実施形態では、ＲＧＢビデオコンテンツの効率的なコード化のために、ループ内色変換を利用して、ＶＶＣにおけるような画像ブロックの異なる特性を処理することができる。色変換は異なるＣＵについて適応的に使用されることができるので、コード化ツールとしての色変換を適応色変換（ＡＣＴ）と呼ぶことができる。ＡＣＴは、幾つかの例において残差領域(residue domain)で作動することができる。ＣＵレベルフラグは、ＡＣＴの使用法を示すように信号伝達されることがある。

例えば、スクリーンコンテンツは、しばしば、ＲＧＢ色空間でキャプチャされる。ＲＧＢ色空間における画像ブロックについては、通常、色空間変換が色成分間の冗長性を除去するのに有用であるように、異なる色成分間に強い相関があり得る。しかしながら、スクリーンコンテンツについては、非常に飽和した色を有する異なる構成を含む多くの画像ブロックが存在することがあり、それはより少ない色成分間の相関をもたらす。それらのブロックについては、ＲＧＢ色空間内で直接的にコード化することがより効果的なことがある。従って、色空間変換は、異なる特性を有する画像ブロックに適応的に適用されることができる。

ある例において、順方向ＡＣＴ色変換（例えば、エンコーダで実行される変換）は、ＲＧＢ色空間内の画像ブロックをＹＣｏＣｇ色空間に変換するために、式（５）で以下のように実行されてよい。

逆方向ＡＣＴ色変換（例えば、デコーダで実行される逆変換）は、以下のように式（６）で実行されてよい。

図９は、色空間変換を実行するための例示的なエンコーダ（１１００）を示している。エンコーダ（１１００）のコンポーネントは、例えば、処理回路構成（例えば、１つ以上のプロセッサ）、ソフトウェア、又はそれらの組み合わせによって実装されることができる。

図９において、予測は、適用される色空間変換の前に実行される。例えば、インター予測又はイントラ予測は、残差信号を生成するために現在のブロックに対して実行されることができる。残差信号は、式（５）における変換のような順方向変換を実行するために順方向色空間変換ユニット（１１０２）に提供されることができる。順色空間変換の出力は、クロスコンポーネント予測（ＣＣＰ：cross component prediction）ユニット（１１０４）に提供されることができる。ＣＣＰユニット（１１０４）の出力は、変換係数を生成するためにあるタイプの離散コサイン変換（ＤＣＴ：discrete cosine transform）のような変換を実行するために、変換（Ｔ）ユニット（１１０６）に提供されることができる。変換ユニット（１１０６）の出力は、量子化係数を生成するために量子化器（Ｑ）（１１０８）に提供されることができる。量子化された係数は、量子化された係数のビンをビットストリーム内のビットに変換するために、エントロピーコーダユニット（１１１０）に提供されることができる。エントロピーコーダユニット（１１１０）は、現在のブロックに関連するイントラ予測モード又は運動ベクトル（ＭＶ：motion vector）情報、及びその情報をビットストリームに符号化するエントロピーを受信することがある。

エンコーダ（１１００）は、残差信号を再構成するためのコンポーネントを含んでもよい。例えば、量子化係数は、逆量子化器（ＩＱ）ユニット（１１１２）に提供されてよい。逆量子化器（ＩＱ）ユニットの出力は、逆変換（ＩＴ：inverse transform）ユニット（１１１４）に提供されてよい。逆変換ユニット（１１１４）の出力は、逆ＣＣＰユニット（１１１６）に提供されてよい。逆ＣＣＰユニット（１１１６）の出力は、逆色空間変換ユニット（１１１８）に提供されてよく、式（６）に示す変換のような逆色変換が、再構成された残差信号を生成するために実行されてよい。

図１０は、ビットストリームを残差信号に変換するための例示的なデコーダ（１２００）を示している。デコーダ（１２００）のコンポーネントは、例えば、処理回路構成（例えば、１つ以上のプロセッサ）、ソフトウェア、又はそれらの組み合わせによって実装されることができる。

図１０に示すビットストリームは、図９の例におけるエントロピーコーダ（１１１０）によって生成されるビットストリームであってよい。ビットストリームは、エントロピーデコーダユニット（１２０２）に提供されてよい。エントロピーデコーダユニット（１２０２）の出力は、逆量子化器（ＩＱ）ユニット（１２０４）に提供されてよい。逆量子化器（ＩＱ）ユニット（１２０４）の出力は、逆変換（ＩＴ）ユニット（１２０６）に提供されてよい。逆変換（ＩＴ）ユニット（１２０６）の出力は、逆ＣＣＰユニット（１２０８）に提供されてよい。逆ＣＣＰユニット（１２０８）の出力は、逆色空間変換ユニット（１２１０）に提供されてよく、その場合には、式（６）に示す変換のような逆色変換が、残差信号を生成するために実行されてよい。イントラ予測又はインター予測が、現在のブロックを再構成するために残差信号と組み合わされる予測ブロックを生成するために実行されてよい。

上述のように、図９及び図１０に示すコンポーネントは、プロセッサによって、或いは各ユニットの機能を実行するように設計された特殊化された集積回路のような回構成路によって実行されるソフトウェアにおいて実装されてよい。

幾つかの実施形態において、ＡＣＴがＳＰＳにおいて有効にされるとき、最大変換サイズは、例えば、ＶＣＣにおいて、３２長（例えば、３２×３２ブロック又は３２サンプル）に制限されることができる。すなわち、最大変換サイズが６４長（例えば、６４×６４ブロック又は６４サンプル）として信号伝達されならば、ＡＣＴが適用されないことがあり、ＡＣＴを有効にするための関連するＳＰＳフラグは信号伝達されないことがある。関連する構文を表４に示すことができる。

例えば、ＶＶＣでは、表５に示すように、二重木(dual tree)が適用されるときに、ＡＣＴは適用されない。

例えば、ＶＶＣにおいて、最大変換サイズは、ＳＰＳで信号伝達される。しかしながら、ＡＣＴが適用されるとき、二重木コード化されたスライス（例えば、二重木パーティションモードを通じてコード化されるスライスのブロック）について、ＡＣＴは二重木コード化されたスライスにおいて使用されないことがあるが、最大変換サイズは３２長のみであることができる。これは二重木コード化されたスライスのコード化性能を制限することがある。

表６に示す現在の開示のある実施形態において、イントラスライス及びインタースライスのために適用される最大変換サイズは、デコーダに別個に信号伝達されることができる。ある例において、イントラスライスは、イントラ予測モードによってコード化されるスライスを含むことができる。インタースライスは、イントラ予測モード及びインター予測モードのうちの１つ又は組み合わせによってコード化されるブロックを含むことができる。例えば、ブロックの第１の部分は、インター予測モードによってコード化されることができ、ブロックの第２の部分は、イントラ予測モードによってコード化されることができる。インタースライスは、イントラ予測モードによって全てコード化されるブロック、又はインター予測モードによって全てコード化されるブロックを含むこともできる。

表６に示すように、イントラスライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｉｎｔｒａ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）及びインタースライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｉｎｔｅｒ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）のような別々のフラグに信号伝達することができる。最大変換サイズフラグは、例えば、ルマサンプルにおける最大変換サイズを示すことができる。例えば、最大変換サイズフラグは、最大変換サイズが第１の最大値であるか或いは第２の最大値であるかを示すことができる。１に等しいイントラスライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｉｎｔｒａ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）は、ルマサンプル中の最大変換サイズイントラスライスが６４（例えば、６４×６４ブロック）に等しいことを指定することができる。０に等しいイントラスライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｉｎｔｒａ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）は、ルマサンプル中のイントラスライスにおける最大変換サイズが３２（例えば、３２×３２ブロック）に等しいことを指定することができる。加えて、１に等しいインタースライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｉｎｔｅｒ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）は、ルマサンプル中の最大変換サイズインタースライスが６４（例えば、６４×６４ブロック）に等しいことを指定することができる。０に等しいインタースライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｉｎｔｅｒ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）は、ルマサンプル中のインタースライスにおける最大変換サイズが３２（例えば、３２×３２ブロック）に等しいことを指定することができる。

表６を依然として参照すると、パーティションモードフラグ（例えば、ｑｔｔｔ＿ｄｕａｌ＿ｔｒｅｅ＿ｉｎｔｒ＿ｆｌａｇ）及びＡＣＴイネーブルフラグ（例えば、ｓｐｓ＿ａｃｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）を信号伝達することができる。パーティションモードフラグ（例えば、ｑｔｂｔｔ＿ｄｕａｌ＿ｔｒｅｅ＿ｉｎｔｒ＿ｆｌａｇ）は、二重木パーティションモードがイントラスライスに適用されるかどうかを示すことができる。ＡＣＴイネーブルフラグ（例えば、ｓｐｓ＿ａｃｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）は、ＡＣＴがインタースライスのイントラスライスに適用されるかどうかを示すことができる。表６に示すように、イントラスライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｉｎｔｒａ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）が０に等しく、パーティションモードフラグ（例えば、ｑｔｂｔｔ＿ｄｕａｌ＿ｔｒｅｅ＿ｉｎｔｒａ＿ｆｌａｇ）が０に等しいか、或いはインタースライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｉｎｔｅｒ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）が０に等しいとき、ＡＣＴイネーブルフラグ（例えば、ｓｐｓ＿ａｃｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）に信号伝達することができる。

ある実施形態において、イントラスライスについての最大変換サイズ（例えば、ｓｐｓ＿ｉｎｔｒａ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）は、パーティションモードフラグ（例えば、ｑｔｂｔｔ＿ｄｕａｌ＿ｔｒｅｅ＿ｉｎｔｒａ＿ｆｌａｇ）が真(true)として（或いは第１の値として）コード化されるときにのみコード化されることができ、例えば、二重木パーティションモードが適用されることを示す。

ある実施形態において、イントラスライス及びインタースライスについて適用される最大変換サイズは、パーティションモードフラグ（例えば、ｆｌａｇｑｔｂｔｔ＿ｄｕａｌ＿ｔｒｅｅ＿ｉｎｔｒ＿ｆｌａｇ）が真としてコード化されるときにのみ、別個に信号伝達されることができる。パーティションモードフラグ（例えば、ｑｔｔｔ＿ｄｕａｌ＿ｔｒｅｅ＿ｉｎｔｒ＿ｆｌａｇ）が真でないならば、最大変換サイズは信号伝達され、イントラスライスとインタースライスの間で共有される。

最大変換サイズは、ＳＰＳ、スライスヘッダ又はピクチャヘッダ（ＰＨ：picture header）のような、コード化されたビットストリームの様々な部分において信号伝達されることができる。

幾つかの実施形態では、二重木コード化されたスライスについて適用される最大変換サイズ及び単一木(single tree)コード化されたスライスについての最大変換サイズは、別々に信号伝達されることができる。関連する構文を表７に示し得る。

表７に示すように、二重木コード化されたスライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｄｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）及び単一木コード化されたスライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｓｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）に信号伝達することができる。最大変換サイズフラグは、例えば、ルマサンプル中の最大変換サイズを示すことができる。例えば、最大変換サイズフラグは、最大変換サイズが第１の最大値であるか或いは第２の最大値であるかを示すことができる。１に等しい二重木コード化されたスライス（例えば、ｓｐｓ＿ｄｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）についての最大変換サイズフラグは、ルマサンプル中の二重木コード化されたスライスについて適用される最大変換サイズが６４（例えば、６４×６４ブロック）に等しいことを指定することができる。０に等しい二重木コード化されたスライス（例えば、ｓｐｓ＿ｄｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）についての最大変換サイズフラグは、ルマサンプル中の二重木コード化されたスライスについて適用される最大変換サイズが３２（例えば、３２×３２ブロック）に等しいことを指定することができる。１に等しい単一木コード化されたスライス（例えば、ｓｐｓ＿ｓｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）についての最大変換サイズフラグは、ルマサンプル中の単一木コード化されたスライスについて適用される最大変換サイズが６４に等しいことを指定することができる。０に等しい単一木コード化されたスライス（例えば、ｓｐｓ＿ｓｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）についての最大変換サイズフラグは、ルマサンプル中の単一木コード化されたスライスについて適用される最大変換サイズが３２に等しいことを指定することができる。

表７を依然として参照すると、クロマアレイタイプが３（例えば、平面モード(planar mode)）であり、単一木コード化されたスライスについての最大変換サイズフラグ（例えば、ｓｐｓ＿ｓｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）が０に等しいとき、ＡＣＴイネーブルフラグ（例えば、ｓｐｓ＿ａｃｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）に信号伝達することができる。

幾つかの実施形態において、最大変換サイズは、例えば、ＳＰＳヘッダ（例えば、ｓｐｓ＿ｓｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ又はｓｐｓ＿ｄｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）における最大変換サイズパラメータのみならず、ツリータイプ（又はパーティションツリータイプ）及び適応色変換（ＡＣＴ）が使用されるかどうかの条件に基づいても決定されることができる。ある例では、ＳＰＳヘッダにおけるＡＣＴ信号が有効にされ（例えば、ｓｐｓ＿ａｃｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇが真であり）、現在のツリータイプが単一木であるとき、現在のスライスにおいて適用される最大変換サイズは、３２ポイント変換（例えば、３２×３２ブロック）に制約されることができる。さもなければ、６４ポイント変換（例えば、６４×６４ブロック）は、現在のスライスに適用されることができる。その例を以下のように式（７）～（１０）に示す。

式（７）～（１０）に示すように、最大変換サイズフラグ（例えば、ｓｐｓ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）が１に等しいとき、ルマサンプル中の最大変換サイズは６４に等しい。最大変換サイズフラグ（例えば、ｄｓｐｓ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）が０に等しいとき、ルマサンプル中の最大変換サイズは３２に等しい。Ｙ方向におけるコード化単位サイズ（例えば、ＣｔｂＳｉｚｅＹなど）が６４未満であるとき、最大変換サイズフラグ（例えば、ｓｐｓ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）の値は０に等しくあり得る。加えて、変数ＭｉｎＴｂＬｏｇ２ＳｉｚｅＹ、ＭａｘＴｂＬｏｇ２ＳｉｚｅＹ、ＭｉｎＴｂＳｉｚｅＹ、及びＭａｘＴｂＳｉｚｅＹは、以下のように式（７）～（１０）から導出されることができる。

式（１０）に示すように、ツリータイプが単一木で、ＡＣＴイネーブルフラグ（例えば、ｓｐｓ＿ａｃｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）が真であるとき、ルマサンプル中の最大変換サイズは３２に等しい。さもなければ、ツリータイプが単一木でないか、或いはＡＣＴイネーブルフラグが真でないならば、ルマサンプル中の最大変換サイズは６４に等しい。

別の実施形態では、表８に示すように、ＡＣＴイネーブルフラグ（例えば、ｓｐｓ＿ａｃｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）は、ＳＰＳにおいて独立して信号伝達されることができる。よって、表７と比較して、ＡＣＴイネーブルフラグ（例えば、ｓｐｓ＿ａｃｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）は、信号伝達されることができ、最大変換サイズフラグ（例えば、ｓｐｓ＿ｓｔ＿ｍａｘ＿ｌｕｍａ＿ｔｒａｎｓｆｏｒｍ＿ｓｉｚｅ＿６４＿ｆｌａｇ）と無関係であることができる。

上述の方法は、別々に使用されることができ、或いは任意の順序で組み合わされることができる。本開示において、高いレベルの構文要素は、ビデオパラメータセット（ＶＰＳ：Video Parameter Set）、ＳＰＳ、ピクチャパラメータセット（ＰＰＳ：Picture Parameter Set）、スライスヘッダ、タイルヘッダ、タイルグループヘッダのうちの１つを指すことができる。ＣＴＵヘッダは、（例えば、ヘッダ情報として）各ＣＴＵについて信号伝達される構文要素を指すことができる。本開示において、変換サイズは、最大変換幅及び／高さ、又は最大変換ユニット面積サイズ(maximum transform unit area size)を指すことができる。

図１１及び図１２は、本開示の実施形態に従ったプロセス（１３００）及びプロセス（１４００）の概略するフローチャートを示している。プロセス（１３００）及び（１４００）は、コード化されたビデオビットストリームの復号化プロセス中に使用されることができる。様々な実施形態において、プロセス（１３００）及び（１４００）は、端末デバイス（１１０）、（１２０）、（１３０）及び（１４０）中の処理回路、ビデオエンコーダ（２０３）の機能を実行する処理回路構成、ビデオデコーダ（２１０）の機能を実行する処理回路構成、ビデオデコーダ（３１０）の機能を実行する処理回路構成、ビデオエンコーダ（４０３）の機能を実行する処理回路構成、デコーダ（１２００）の機能を実行する処理回路構成、エンコーダ（１１００）の機能を実行する処理回路構成、及び同等物のような、処理回路構成によって実行されることができる。幾つかの実施形態において、プロセス（１３００）及び（１４００）は、ソフトウェア命令において実装されることができ、よって、処理回路構成がソフトウェア命令を実行するとき、処理回路構成は、それぞれ、プロセス（１３００）及び（１４００）を実行する。

図１１に示されるように、プロセス（１３００）は、（Ｓ１３０１）で開始し、（Ｓ１３１０）に進む。

（Ｓ１３１０）で、第１の信号伝達情報及び第２の信号伝達情報は、コード化された領域のコード化されたビデオビットストリームから決定されることができる。第１の信号伝達情報は、第１の予測モードのコード化された領域の第１の最大変換サイズを示すことができ、第２の信号伝達情報は、第２の予測モードのコード化された領域の第２の最大変換サイズを示すことができる。

（Ｓ１３２０）で、変換信号伝達情報がコード化されたビデオビットストリームに含まれるかどうかは、第１の信号伝達情報及び第２の信号伝達情報に基づいて決定されることができる。例えば、変換信号伝達情報は、（ｉ）第１の信号伝達情報が、第１予測モードのコード化された領域の第１の最大変換サイズが第１のサンプル数（例えば、３２サンプル）であることを示し、パーティション信号伝達情報が、二重木パーティションがコード化された領域に適用されていないことを示すときに、又は（ｉｉ）第２の信号伝達情報が、第２の予測モードのコード化された領域の第２の最大変換サイズが第２のサンプル数（例えば、３２サンプル）であることを示すときに、コード化されたビデオビットストリームに含められることができる。さもなければ、変換信号伝達情報は符、コード化されたビデオビットストリームに含められないことがある。変換信号伝達情報は、適応色変換（ＡＣＴ）がコード化された領域に適用されるかどうかを示すことができる。

（Ｓ１３３０）で、コード化された領域は、引き続き、変換信号伝達情報に基づいて復号化されることができる。

プロセス（１３００）において、第１の信号伝達情報は、第１の信号伝達情報が第１の値であるときに、第１の予測モードのためのコード化された領域の第１の最大変換サイズが６４サンプルのような値であることを示すことができる。第２の信号伝達情報は、第２の信号伝達情報が第１の値であるときに、第２の予測モードのためのコード化された領域の第２の最大変換サイズが６４サンプルのような値であることを示すことができる。

プロセス（１３００）において、コード化されたビデオビットストリームは、パーティション信号伝達情報を更に含むことができ、パーティション信号伝達情報は、二重木パーティションがコード化された領域に適用されるかどうかを示すことができる。

幾つかの実施形態において、変換信号伝達情報は、（ｉ）第１の予測モードのコード化された領域の第１の最大変換サイズを示す第１の信号伝達情報が第１の数のサンプル（例えば、３２サンプル）であり、且つ二重木パーティションを示すパーティション信号伝達情報がコード化された領域に適用されないこと、及び（ｉｉ）第２の予測モードのコード化された領域の第２の最大変換サイズを示す第２の信号伝達情報が第２の数のサンプル（例えば、３２サンプル）であることのうちの１つに基づいて、コード化されたビデオビットストリームに含まれるかどうかが決定されることができる。

本方法において、第１の信号伝達情報及び第２の信号伝達情報は、シーケンスパラメータセット、ピクチャパラメータセット、及びスライスヘッダのうちの１つにおける構文要素によって示されことができる。

図１２に示すように、プロセス（１４００）は、（Ｓ１４０１）で開始し、（Ｓ１４１０）に進む。

（Ｓ１４１０）で、第１の信号伝達情報及び第２の信号伝達情報は、コード化された領域のコード化されたビデオビットストリームから受信されることができる。第１の信号伝達情報は、第１のパーティションモードに基づいて、コード化された領域の第１の最大変換サイズを示すことができる。第２の信号伝達情報は、第２のパーティションモードに基づいて、コード化された領域の第２の最大変換サイズを示すことができる。

（Ｓ４３２０）で、変換信号情報は、コード化されたビデオビットストリームから決定されることができ、変換信号伝達情報は、適応色変換（ＡＣＴ）がコード化された領域に対して適用されるかどうかを示すことができる。

（Ｓ１４３０）で、コード化された領域は、引き続き、変換信号伝達情報に基づいて復号化されることができる。

プロセス（１４００）において、第１の信号伝達情報は、第１の信号伝達情報が第１の値であるときに、コード化された領域の第１の最大変換サイズが６４サンプルであることを示すことができ、第２の信号伝達情報は、第２の信号伝達情報が第１の値であるときに、コード化された領域の第２の最大変換サイズが６４サンプルであることを示すことができる。

幾つかの実施形態において、変換信号伝達情報は、第２のパーティションモードが３２サンプルであることに基づいてコード化された領域の第２の最大変換サイズを示す第２の信号伝達情報に基づいて決定されることができる。

幾つかの実施形態において、コード化された領域の最大変換サイズは、第２パーティションモードが適用されていること及びＡＣＴがコード化された領域に対して適用されることが変換信号伝達情報によって示されることに基づいて、３２サンプルであると決定されることができる。

幾つかの実施形態において、コード化された領域の最大変換サイズは、（ｉ）適用されていない第２パーティションモード、及び（ｉｉ）ＡＣＴがコード化された領域に対して適用されていないことを示す変換信号伝達情報のうちの１つに基づいて、６４サンプルであると決定されることができる。

上述の技術は、コンピュータ読取可能な命令を用いてコンピュータソフトウェアとして実装されることができ、１つ以上のコンピュータ読取可能な媒体に物理的に格納されることができる。例えば、図１３は、開示する主題事項の特定の実施形態を実装するのに適したコンピュータシステム（１５００）を示す。

コンピュータソフトウェアは、１つ以上のコンピュータ中央処理装置（ＣＰＵ）、グラフィックス処理装置（ＧＰＵ）、及び同等物によって、直接的に、或いは解釈、マイクロコード実行、及び同等のことを通じて実行されることができる命令を含むコードを作成するために、アセンブリ、コンパイル、リンク、又は類似のメカニズムの対象となることがある、任意の適切な機械コード又はコンピュータ言語を使用してコード化されることができる。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネット、及び同等物を含む、様々なタイプのコンピュータ又はそれらのコンポーネント上で実行されることができる。

コンピュータシステム（１５００）のための図１３に示すコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実装するコンピュータソフトウェアの使用範囲又は機能性に関する如何なる制限を示唆することも意図しない。コンポーネントの構成も、コンピュータシステム（１５００）の例示的な実施形態に示すコンポーネントの任意の１つ又は組み合わせに関する如何なる従属性又は要件も有するものとして解釈されてはならない。

コンピュータシステム（１５００）は、特定のヒューマンインターフェース入力デバイスを含むことがある。そのようなヒューマンインターフェース入力デバイスは、例えば、（キーストローク、スワイプ、データグローブの動きのような）触覚入力、（音声、拍手のような）音声入力、（ジェスチャのような）視覚入力、嗅覚入力（図示せず）を通じて、１人以上の人間ユーザによる入力に応答することがある。ヒューマンインターフェースデバイスは、（発話、音楽、周囲音のような）オーディオ、（スキャンされた画像、静止画像カメラから得られる写真画像のような）画像、（２次元ビデオ、立体ビデオを含む３次元ビデオのような）ビデオのような、人間による意識的入力に必ずしも直接的に関係しない特定の媒体をキャプチャするために使用されることもできる。

入力ヒューマンインターフェースデバイスは、キーボード（１５０１）、マウス（１５０２）、トラックパッド（１５０３）、タッチスクリーン（１５１０）、データグローブ（図示せず）、ジョイスティック（１５０５）、マイクロホン（１５０６）、スキャナ（１５０７）、カメラ（１５０８）の１つ以上（それらのうちの１つのみが示されている）を含んでよい。

コンピュータシステム（１５００）は、特定のヒューマンインターフェース出力デバイスを含むこともある。そのようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、及び嗅覚／味覚を通じて、１人以上の人間ユーザの感覚を刺激することがある。そのようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（１５１０）、データグローブ（図示せず）、ジョイスティック（１５０５）による触覚フィードバック、しかしながら、入力デバイスとして機能しない触覚フィードバックデバイスもある）、（スピーカー（１５０９）、ヘッドフォン（図示せず）のような）オーディオ出力デバイス、（各々がタッチスクリーン入力能力を備える或いは備えない、各々が触覚フィードバック能力を備える或いは備えない－それらのうちの一部は、立体画像出力のような手段を通じて二次元視覚出力又は三次元よりも多くの次元の出力を出力し得ることがある－ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーン、仮想現実メガネ（図示せず）、ホログラフィックディスプレイ及びスモークタンク（図示せず）のような）視覚出力デバイス、及びプリンタ（図示せず）を含むことがある。

コンピュータシステム（１５００）は、人間がアクセス可能な記憶デバイス、及び、ＣＤ／ＤＶＤ又は同等の媒体を有するＣＤ／ＤＶＤＲＯＭ／ＲＷ（１５２０）を含む光媒体（１５２１）、サムドライブ（１５２２）、取り外し可能なハードドライブ又はソリッドステートドライブ（１５２３）、テープ及びフロッピーディスク（図示せず）のようなレガシー磁気媒体、セキュリティドングル（図示せず）のような特殊化されたＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイス、及び同等物のような、それらの関連する媒体を含むこともできる。

当業者は、現在開示されている主題事項に関連して使用されるような「コンピュータ読取可能な媒体」という用語が、伝送媒体、搬送波、又は他の過渡信号を包含しないことも理解するはずである。

コンピュータシステム（１５００）は、１つ以上の通信ネットワークへのインターフェースを含むこともできる。ネットワークは、例えば、無線、有線、光であることができる。ネットワークは、更に、ローカル、ワイドエリア、メトロポリタン、車両及び産業、リアルタイム、遅延耐性などであることができる。ネットワークの例は、イーサネット、無線ＬＡＮのようなローカルエリアネットワーク、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥ及び同等物を含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、及び地上放送ＴＶを含むＴＶワイヤライン又は無線ワイドエリアデジタルネットワーク、ＣＡＮＢｕｓを含む車両及び産業、及び同等のものを含む。特定のネットワークは、一般的に、（例えば、コンピュータシステム（１５００）のＵＳＢポートのような）特定の汎用データポート又は周辺バス（１５４９）に取り付けられる外部ネットワークインターフェースアダプタを必要とし、他のネットワークは、一般的には、以下に記載するシステムバスへの取付によってコンピュータシステム（１５００）のコアに統合される（例えば、ＰＣコンピュータシステムへのイーサネットインターフェース又はスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）。これらのネットワークのうちのいずれかを使用して、コンピュータシステム（１５００）は、他のエンティティと通信することができる。そのような通信は、単指向性、受信のみ（例えば、放送テレビ）、単指向性送信専用（例えば、特定のＣＡＮｂｕｓデバイスへのＣＡＮｂｕｓ）、又は、例えば、ローカル又はワイドエリアデジタルネットワークを使用する他のコンピュータシステムへの双指向性であることができる。特定のプロトコル及びプロトコルスタックは、上述のように、それらのネットワーク及びネットワークインタフェースの各々で使用されることができる。

前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶デバイス、及びネットワークインタフェースは、コンピュータシステム（１５００）のコア（１５４０）に取り付けられることができる。

コア（１５４０）は、１つ以上の中央処理装置（ＣＰＵ）（１５４１）、グラフィックス処理装置（ＧＰＵ）（１５４２）、フィールドプログラマブルゲート領域（ＦＰＧＡ）（１５４３）の形態における特殊なプログラマブル処理装置、特定のタスク用のハードウェアアクセラレータ（１５４４）などを含むことができる。これらのデバイスは、読出し専用メモリ（ＲＯＭ）（１５４５）、ランダムアクセスメモリ（１５４６）、内部非ユーザアクセス可能ハードドライブのような内部大容量記憶装置、ＳＳＤ、及び同等物（１５４７）と共に、システムバス（１５４８）を通じて接続されることがある。幾つかのコンピュータシステムにおいて、システムバス（１５４８）は、追加のＣＰＵ、ＧＰＵ、及び同等物による拡張を可能にするために、１つ以上の物理プラグの形態においてアクセス可能である。周辺デバイスは、コアのシステムバス（１５４８）に直接的に、或いは周辺バス（１５４９）を通じて取り付けられるすることができる。周辺バスのためのアーキテクチャは、ＰＣＩ、ＵＳＢ、及び同等物を含む。

ＣＰＵ（１５４１）、ＧＰＵ（１５４２）、ＦＰＧＡ（１５４３）及びアクセラレータ（１５４４）は、組み合わせにおいて、上述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（１５４５）又はＲＡＭ（１５４６）に格納されることができる。移行データは、ＲＡＭ（１５４６）に格納されることもできるが、永久データは、例えば、内部大容量記憶装置（１５４７）に格納されることができる。１つ以上のＣＰＵ（１５４１）、ＧＰＵ（１５４２）、大容量記憶装置（１５４７）、ＲＯＭ（１５４５）、ＲＡＭ（１５４６）及び同等物と密接に関連付けられることができるキャッシュメモリの使用を通じて、メモリデバイスのいずれかへの高速格納及び検索を可能にすることができる。

コンピュータ読取可能な媒体は、様々なコンピュータ実装される動作を実行するためのコンピュータコードをその上に有することができる。媒体及びコンピュータコードは、本開示の目的のために特別に設計及び構成されるものであることができ、或いはコンピュータソフトウェア技術に熟練した者によく知られており且つ入手可能な種類のものであることができる。

一例として、限定によってなく、アーキテクチャ（１５００）、具体的には、コア（１５４０）を有する、コンピュータシステムは、１つ以上の有形のコンピュータ読取可能な媒体に具現されるソフトウェアを実行する（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ及び同等物を含む）プロセッサの結果としての機能性を提供することができる。そのようなコンピュータ読取可能な媒体は、上記で紹介したようなユーザアクセス可能な大容量記憶装置に関連する媒体、並びにコア内部大容量記憶装置（１５４７）又はＲＯＭ（１５４５）のような非一時的な性質のコア（１５４０）の特定の記憶装置であり得る。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに格納されることができ、コア（１５４０）によって実行されることができる。コンピュータ読取可能な媒体は、特定のニーズに従った１つ以上のメモリデバイス又はチップを含むことができる。ソフトウェアは、コア（１５４０）に、具体的には、その中の（ＣＰＵ、ＧＰＵ、ＦＰＧＡ及び同等物を含む）プロセッサに、ＲＡＭ（１５４６）に格納されるデータ構造を定義すること及びソフトウェアによって定義されるプロセスに従ってそのようなデータ構造を修正することを含む、本明細書に記載する特定のプロセス又は特定の部分を実行させることができる。追加的に又は代替的に、コンピュータシステムは、回路構成（例えば、アクセラレータ（１５４４））内に配線された或いは他の方法で具現されるロジック(論理)の結果としての機能性を提供することができ、それは、本明細書に記載する特定のプロセス又は特定のプロセスの特定の部分を実行するために、ソフトウェアの代わりに又はソフトウェアと共に作動することができる。ソフトウェアへの言及は、ロジックを含み、必要に応じて、その逆も可能である。コンピュータ読取可能な媒体への言及は、実行のためのソフトウェアを格納する（集積回路のような）回路、実行のためのロジックを具現する回路、又は適切な場合には、その両方を包含することができる。本開示は、ハードウェア及びソフトウェアの任意の適切な組み合わせを包含する。
（付録Ａ：頭字語）
ＨＥＶＣ：高効率ビデオコード化
ＨＤＲ：高ダイナミックレンジ
ＳＤＲ：標準ダイナミックレンジ
ＶＶＣ：多用途ビデオコード化
ＪＶＥＴ：共同ビデオ探究チーム
ＭＰＭ：最確モード
ＷＡＩＰ：広角イントラ予測
ＣＵ：コード化ユニット
ＰＵ：予測ユニット
ＩＳＰ：イントラサブパーティション
ＳＢＴ：サブブロック変換
ＣＢＦ：コード化されたブロックフラグ

この開示は、幾つかの例示的な実施形態を記載したが、本開示の範囲内にある変更、置換、及び様々な代替均等物がある。よって、当業者は、本明細書に明示的に示されていないか或いは記載されていないが、本開示の原理を具体化し、よって、本開示の精神及び範囲内にある、多数のシステム及び方法を考案することができることが理解されるであろう。

Claims

デコーダのためのビデオ復号化の方法であって、
コード化された領域のコード化されたビデオビットストリームから第1の信号伝達情報及び第２の信号伝達情報を受信することであって、前記第１の信号伝達情報は、イントラ予測モードに基づく前記コード化された領域のイントラ最大変換サイズを示し、前記第２の信号伝達情報は、インター予測モードに基づく前記コード化された領域のインター最大変換サイズを示す、受信することと、
前記受信する第１の信号伝達情報によって示される前記イントラ最大変換サイズ及び前記受信する第２の信号伝達情報によって示される前記インター最大変換サイズに基づいて、適応色変換（ＡＣＴ）が前記コード化された領域に対して適用されるかどうかを決定することと、
前記ＡＣＴが適用されるかどうかが決定されることに基づいて前記コード化された領域を復号化することと、を含む、
方法。
前記第１の信号伝達情報は、前記第１の信号伝達情報が第１の値であるときに、前記コード化された領域の前記イントラ最大変換サイズが６４サンプルであることを示し、
前記第２の信号伝達情報は、前記第２の信号伝達情報が前記第１の値であるときに、前記コード化された領域の前記インター最大変換サイズが６４サンプルであることを示す、
請求項１に記載の方法。
前記コード化されたビデオビットストリームは、パーティション信号伝達情報を更に含み、該パーティション信号伝達情報は、二重木パーティションが前記コード化された領域に適用されるかどうかを示す、請求項２に記載の方法。
前記ＡＣＴが適用されるかどうかを決定することは、
（ｉ）前記イントラ予測モードに基づく前記コード化された領域の前記イントラ最大変換サイズが３２サンプルであることを示す前記第１の信号伝達情報、及び前記二重木パーティションが前記コード化された領域に適用されないことを示す前記パーティション信号伝達情報と、
（ｉｉ）前記インター予測モードに基づく前記コード化された領域の前記インター最大変換サイズが３２サンプルであることを示す前記第２の信号伝達情報と
のうちの１つに基づいて、
前記ＡＣＴが適用されるかどうかを決定することを更に含む、
請求項３に記載の方法。
前記第１の信号伝達情報を受信することは、
前記二重木パーティションが前記コード化された領域に適用されることを示す前記パーティション信号伝達情報に基づいて、前記第１の信号伝達情報を受信することを含む、請求項３に記載の方法。
前記受信することは、
前記二重木パーティションが前記コード化された領域に適用されることを示す前記パーティション信号伝達情報に基づいて、前記第１の信号伝達情報及び前記第２の信号伝達情報を受信することを更に含む、請求項３に記載の方法。
前記イントラ最大変換サイズは、前記二重木パーティションが前記コード化された領域に適用されないことを示す前記パーティション信号伝達情報に基づいて、前記インター最大変換サイズに等しい、請求項３に記載の方法。
前記第１の信号伝達情報及び前記第２の信号伝達情報は、シーケンスパラメータセット、ピクチャパラメータセット、及びスライスヘッダのうちの１つにおける構文要素によって示される、請求項１に記載の方法。
デコーダのためのビデオ復号化の方法であって、
コード化された領域のコード化されたビデオビットストリームから第１の信号伝達情報及び第２の信号伝達情報を受信することであって、前記第１の信号伝達情報は、二重木パーティションモードに基づいて前記コード化された領域の二重木最大変換サイズを示し、前記第２の信号伝達情報は、単一木パーティションモードに基づいて前記コード化された領域の単一木最大変換サイズを示す、受信することと、
前記受信する第１の信号伝達情報によって示される前記二重木最大変換サイズ及び前記受信する第２の信号伝達情報によって示される前記単一木最大変換サイズに基づいて、適用色変換（ＡＣＴ）が前記コード化された領域に対して適用されるかどうか決定することと、
前記ＡＣＴが適用されるかどうかが決定されることに基づいて前記コード化された領域を復号化することと、含む、
方法。
前記第１の信号伝達情報は、前記第１の信号伝達情報が第１の値であるときに、前記コード化された前記二重木最大変換サイズを示し、
前記第２の信号伝達情報は、前記第２の信号伝達情報が前記第１の値であるときに、前記コード化された領域の前記単一木最大変換サイズが６４サンプルであることを示す、
請求項９に記載の方法。
前記決定することは、
前記単一木パーティションモードが３２サンプルであることに基づいて、前記第２の信号伝達情報が前記コード化された領域の前記単一木最大変換サイズを示すことに基づいて、前記ＡＣＴが前記コード化された領域に対して適用されることを決定することを更に含む、
請求項１０に記載の方法。
前記単一木パーティションモードが適用されていることと、前記ＡＣＴが前記コード化された領域に対して適用されていることとに基づいて、前記コード化された領域の最大変換サイズが３２サンプルであると決定することを更に含む、請求項９に記載の方法。
（ｉ）前記単一木パーティションモードが適用されていないこと、及び
（ｉｉ）前記ＡＣＴが前記コード化された領域に対して適用されていないこと
のうちの１つに基づいて、
前記コード化された領域の最大変換サイズが６４サンプルであることを決定することを更に含む、
請求項９に記載の方法。
処理回路構成を含むビデオ復号化のための装置であって、
前記処理回路構成は、
コード化された領域のコード化されたビデオビットストリームから第1の信号伝達情報及び第２の信号伝達情報を受信するように構成され、前記第１の信号伝達情報は、イントラ予測モードに基づく前記コード化された領域のイントラ最大変換サイズを示し、前記第２の信号伝達情報は、インター予測モードに基づく前記コード化された領域のインター最大変換サイズを示し、
前記受信する第１の信号伝達情報によって示される前記イントラ最大変換サイズ及び前記受信する第２の信号伝達情報によって示される前記インター最大変換サイズに基づいて、適応色変換（ＡＣＴ）が前記コード化された領域に対して適用されるかどうかを決定するように構成され、
前記ＡＣＴが適用されるかどうかが決定されることに基づいて前記コード化された領域を復号化するように構成される、
装置。
前記第１の信号伝達情報は、前記第１の信号伝達情報が第１の値であるときに、前記コード化された領域の前記イントラ最大変換サイズが６４サンプルであることを示し、
前記第２の信号伝達情報は、前記第２の信号伝達情報が前記第１の値であるときに、前記コード化された領域の前記第インター最大変換サイズが６４サンプルであることを示す、
請求項１４に記載の装置。
前記コード化されたビデオビットストリームは、パーティション信号伝達情報を更に含み、該パーティション信号伝達情報は、二重木パーティションが前記コード化された領域に適用されるかどうかを示す、請求項１５に記載の装置。
前記処理回路構成は、
（ｉ）前記イントラ予測モードに基づく前記コード化された領域の前記イントラ最大変換サイズが３２サンプルであることを示す前記第１の信号伝達情報、及び前記二重木パーティションが前記コード化された領域に適用されないことを示す前記パーティション信号伝達情報と、
（ｉｉ）前記インター予測モードに基づく前記コード化された領域の前記インター最大変換サイズが３２サンプルであることを示す前記第２の信号伝達情報と
のうちの１つに基づいて、
前記ＡＣＴが適用されるかどうかを決定するように更に構成される、
請求項１６に記載の装置。
前記処理回路構成は、
前記二重木パーティションが前記コード化された領域に適用されることを示す前記パーティション信号伝達情報に基づいて、前記第１の信号伝達情報を受信するように更に構成される、
請求項１６に記載の装置。
前記処理回路構成は、
前記二重木パーティションが前記コード化された領域に適用されることを示す前記パーティション信号伝達情報に基づいて、前記第１の信号伝達情報及び前記第２の信号伝達情報を受信するように更に構成される、
請求項１６に記載の装置。
前記イントラ最大変換サイズは、前記二重木パーティションが前記コード化された領域に適用されないことを示す前記パーティション信号伝達情報に基づいて、前記インター最大変換サイズに等しい、請求項１６に記載の装置。