JP7412443B2

JP7412443B2 - 非線形ループフィルタリングのための方法および装置

Info

Publication number: JP7412443B2
Application number: JP2021561991A
Authority: JP
Inventors: イシン・ドゥ; シン・ジャオ; シアン・リ; シャン・リュウ
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2019-09-06
Filing date: 2020-07-21
Publication date: 2024-01-12
Anticipated expiration: 2040-07-21
Also published as: EP4026323A4; CN113748678B; WO2021045847A1; US11140388B2; EP4026323A1; US20210385448A1; CN113748678A; JP2022529354A; US20210076031A1

Description

参照による援用
本出願は、２０１９年９月６日に出願された米国仮出願第６２／８９６，９９７号の「改良された非線形ループフィルタリング」の優先権を主張した、２０２０年７月９日に出願された米国特許出願第１６／９２４，８４５号の「非線形ループフィルタリングのための方法および装置」の優先権を主張する。その内容を全て参照により本明細書に組み込むものとする。

本開示は、一般にビデオコーディングに関する実施形態を説明する。

本明細書中に提供される「背景技術」の記述は、開示の文脈を一般的に提供するのを目的としている。出願時に先行技術としての資格を有しない記述の態様は勿論のこと、現在指名されている発明者の成果は、本背景技術セクションにおいて記述されている程度において、本開示に対する先行技術として明示的にも黙示的にも認められてはいない。

ビデオコーディングおよび復号は、動き補償を伴うイントラピクチャ予測を使用して実行されることができる。非圧縮デジタルビデオは一連のピクチャを含むことができ、各ピクチャは、例えば、１９２０×１０８０ルマサンプルと関連するクロマサンプルの空間次元を持っている。該一連のピクチャは、例えば毎秒６０ピクチャまたは６０Ｈｚの固定または可変ピクチャレート（非公式には「フレームレート」とも呼ばれる）を持つことができる。非圧縮ビデオには、顕著なビットレート要件がある。例えば、サンプルあたり８ビットでの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚフレームレートでの１９２０×１０８０ルマサンプル解像度）には、１．５Ｇｂｉｔ／ｓに近い帯域幅が必要となる。このようなビデオを１時間使用するには、６００ＧＢｙｔｅｓを超えた記憶空間が必要である。

ビデオコーディングおよび復号の１つの目的は、圧縮によって入力ビデオ信号の冗長性を減らすことであり得る。圧縮は、前述の帯域幅または記憶空間の要件を、場合によっては２桁以上削減するのに役立つ。可逆圧縮と非可逆圧縮の両方、およびそれらの組み合わせを使用することができる。可逆圧縮とは、圧縮された元の信号から元の信号の正確なコピーを再構築できる技法を指す。非可逆圧縮を使用する場合、再構築された信号は元の信号と同一ではない可能性があるが、元の信号と再構築された信号の間の歪みは、再構築された信号を意図されたアプリケーションに役立てる程度に小さい。ビデオの場合、非可逆圧縮が広く採用されている。許容される歪みの量はアプリケーションによって異なる。例えば、特定のコンシューマストリーミングアプリケーションのユーザは、テレビ発行アプリケーションのユーザよりも高い歪みを許容できる。達成可能な圧縮率は、受け入れ可能／許容可能な歪みが大きいほど、圧縮率が高くなることを反映することができる。

ビデオエンコーダおよびデコーダは、例えば、動き補償、変換、量子化、およびエントロピーコーディングを含むいくつかの広範なカテゴリからの技術を利用することができる。

ビデオコーデック技術は、イントラコーディングとして知られる技法を含み得る。イントラコーディングでは、サンプル値は、予め再構築された参照ピクチャからのサンプルまたは他のデータを参照せずに表される。一部のビデオコーデックでは、ピクチャは空間的にサンプルのブロックに細分される。サンプルのすべてのブロックがイントラモードでコード化されると、そのピクチャはイントラピクチャになる可能性がある。イントラピクチャとその独立したデコーダリフレッシュピクチャなどの派生物は、デコーダの状態をリセットするために使用できるため、コード化されたビデオビットストリームとビデオセッションの最初のピクチャとして、または静止画像として使用されることができる。イントラブロックのサンプルは変換にさらされることができ、変換係数はエントロピーコーディングの前に量子化されることができる。イントラ予測は、事前変換領域でサンプル値を最小化する技法であり得る。場合によっては、変換後のＤＣ値が小さく、ＡＣ係数が小さいほど、エントロピーコーディング後のブロックを表すために所定の量子化ステップサイズで必要なビットが少なくなる。

例えばＭＰＥＧ－２世代コーディング技術から知られているような従来のイントラコーディングは、イントラ予測を使用しない。しかしながら、いくつかのより新しいビデオ圧縮技術は、例えば、空間的に隣接し、デコード順の先に位置する、エンコード／デコード中に得られたサンプルデータおよび／またはメタデータの周りのデータブロックのから試みる技法を含む。そのような技法は、以降、「イントラ予測」技法と呼ばれる。少なくともいくつかのケースでは、イントラ予測は、再構築中の現在ピクチャからの参照データのみを使用し、参照ピクチャからの参照データを使用しないことに注意されたい。

イントラ予測はさまざまな形態で存在し得る。そのような技法の２つまたは複数が所定のビデオコーディング技術に使用できる場合、使用中の技法はイントラ予測モードでコード化されることができる。場合によっては、モードはサブモードやパラメータを有することができ、それらを個別にコード化するか、もしくはモードコードワードに含めることができる。どのコードワードが所定のモード／サブモード／パラメータの組み合わせに使用されるかは、イントラ予測によるコーディング効率の向上に影響を与える可能性があるので、コードワードをビットストリームに変換するために使用されるエントロピーコーディング技術に影響を与える可能性がある。

イントラ予測の特定のモードはＨ．２６４で提出され、Ｈ．２６５で改良され、さらに共同探索モデル（ＪＥＭ）、多用途ビデオコーディング（ＶＶＣ）、およびベンチマークセット（ＢＭＳ）などのより新しいコーディング技術で改良された。予測器ブロックは、すでに利用可能なサンプルに属する隣接サンプル値を使用して形成されることができる。隣接サンプルのサンプル値は、方向に従って予測器ブロックにコピーされる。使用中の方向への参照は、ビットストリームでコード化されるか、もしくはそれ自体を予測され得る。

図１Ａを参照し、右下に示されたのは、Ｈ．２６５の３３通りの予測可能な予測器方向（３５通りのイントラモードの３３通りの角度モードに対応する）である。矢印が収束する点（１０１）は、予測されているサンプルを表す。矢印は、サンプルが予測されている方向を表す。例えば、矢印（１０２）は、サンプル（１０１）が、１つまたは複数のサンプルから右上に向けて、水平軸から４５度の角度で予測されることを示す。同様に、矢印（１０３）は、サンプル（１０１）が、１つまたは複数のサンプルからサンプル（１０１）の左下に向けて、水平軸から２２．５度の角度で予測されることを示す。

引き続き図１Ａを参照し、左上には、４×４サンプルの正方形ブロック（１０４）（太い破線で示される）が示されている。正方形ブロック（１０４）は、それぞれが、「Ｓ」、Ｙ次元におけるその位置（例えば、行インデックス）、およびＸ次元におけるその位置（例えば、列インデックス）でラベル付けされた１６個のサンプルを含む。例えば、サンプルＳ２１は、Ｙ次元（上から）における２番目のサンプルかつＸ次元（左から）における１番目のサンプルである。同様に、サンプルＳ４４は、ＹおよびＸ次元の両方においてブロック（１０４）における４番目のサンプルである。ブロックがサイズで４×４サンプルなので、Ｓ４４は、右下にある。さらに、同様な番号付け体系に従う参照サンプルが示されている。参照サンプルは、Ｒ、ブロック（１０４）に対するそのＹ位置（例えば、行インデックス）およびＸ位置（列インデックス）でラベル付けされる。Ｈ．２６４とＨ．２６５の両方で、予測サンプルは再構築中のブロックに隣接している。したがって、負の値を使用する必要はない。

イントラピクチャ予測は、シグナリングされた予測方向で適切の隣接サンプルから参照サンプル値をコピーすることで機能することができる。例えば、仮に、コード化されたビデオビットストリームは、このブロックについて矢印（１０２）（すなわち、サンプルが、１つまたは複数の予測サンプルから右上に、水平から４５度の角度で予測される）と一致する予測方向を示すシグナリングを含むとする。この場合、サンプルＳ４１、Ｓ３２、Ｓ２３、およびＳ１４は同一の参照サンプルＲ０５から予測される。その後、サンプルＳ４４は、参照サンプルＲ０８から予測される。

特定の場合において、複数の参照サンプルの値は、参照サンプルを算出するために、特に方向が４５度で均等に分割されていない場合に、例えば補間によって組み合わせられることができる。

ビデオコーディング技術が発展するにつれて、予測可能な方向の数は増加した。Ｈ．２６４（２００３年）では、９通りの異なる方向を表すことができた。Ｈ．２６５（２０１３年）で３３通りに増加し、ＪＥＭ／ＶＶＣ／ＢＭＳは開示時に最大６５通りの方向をサポートできる。最も見込みのある方向を識別するための実験が行われ、エントロピーコーディングにおける特定の技法は、数が少ないビットにおける見込みの高い方向を表すために使用され、見込みの低い方向に対する特定のペナルティを受け入れる。さらに、方向自体は、隣接する、すでにデコードされたブロックで使用される隣接方向から予測される場合がある。

図１Ｂは、経時的な予測方向の増加数を示すために、ＪＥＭによる６５通りのイントラ予測方向を示す概略図（１８０）を示す。

方向を表すコード化されたビデオビットストリームにおけるイントラ予測方向ビットのマッピングは、ビデオコーディング技術ごとに異なる可能性があり、また、例えば、イントラ予測モードへ乃至コードワードへの予測方向の単純な直接マッピングから、最も可能性の高いモードや類似した技法を含む複雑な適応方式までの範囲とすることができる。しかしながら、すべての場合において、他の特定の方向よりも統計的にビデオコンテンツで発生する可能性が低い特定の方向が存在する可能性がある。ビデオ圧縮の目的は冗長性の削減であるため、適切に機能するビデオコーディング技術では、これらの可能性の低い方向は、可能性の高い方向よりも多くのビット数で表される。

動き補償は、非可逆圧縮技術であり得、予め再構築されたピクチャまたはその一部（参照ピクチャ）からのサンプルデータのブロックを、動きベクトル（以降、「ＭＶ」）によって示される方向に空間的にシフトした後、新しく再構築されたピクチャまたはピクチャ部分の予測に使用する技術に関連し得る。場合によっては、参照ピクチャは現在再構築中のピクチャと同じになることがある。ＭＶは、ＸとＹの２次元、または、第３次元が、使用中の参照ピクチャを示す３次元を持つことができる（後者は間接的に時間次元になることができる）。

一部のビデオ圧縮技術では、サンプルデータの特定の領域に適用可能なＭＶは、他のＭＶから、例えば再構築中の領域に空間的に隣接し、デコード順でそのＭＶよりも前であるサンプルデータの別の領域に関連するＭＶから予測されることができる。そうすることで、ＭＶのコード化に必要なデータの量を大幅に減らすことができ、これにより冗長性を取り除き、圧縮を強化する。例えば、カメラから導出される入力ビデオ信号（「ナチュラルビデオ」と呼ばれる）をコード化する際に、単一のＭＶが適用される領域より大きい領域が同様の方向に移動する統計的可能性があるため、ＭＶ予測は有効に働くことができる。したがって、場合によっては、隣接領域のＭＶから導出された類似の動きベクトルを使用して予測することができる。その結果、特定の領域に対して検出されたＭＶは、周囲のＭＶから予測されたＭＶと類似または同一であり、逆に、エントロピーコーディング後、ＭＶを直接コード化する場合よりも少ないビット数で表されることができる。場合によっては、ＭＶ予測は、元の信号（つまり、「サンプルストリーム」）から導出される信号（つまり、「ＭＶ」）の可逆圧縮の例になってもよい。他の場合では、例えばいくつかの周囲のＭＶから予測子を計算するときの丸め誤差のために、ＭＶ予測自体は非可逆になる可能性がある。

Ｈ．２６５／ＨＥＶＣ（ＩＴＵ－ＴＲｅｃ．Ｈ．２６５、「高効率ビデオコーディング」、２０１６年１２月）には、様々なＭＶ予測メカニズムが記載されている。Ｈ．２６５が提供する多くのＭＶ予測メカニズムのうち、ここで説明するのは、以降、「空間マージ」と呼ばれる技法である。

図２を参照し、現在ブロック（２０１）は、空間的にシフトされた同じサイズの以前のブロックから予測可能であるとエンコーダによって動き探索過程において発見されたサンプルを含むことができる。そのＭＶを直接コード化する代わりに、Ａ０、Ａ１、およびＢ０、Ｂ１、Ｂ２（それぞれ２０２から２０６）で示される５つの周囲のサンプルのいずれか１つに関連付けられるＭＶを使用して、１つ以上の参照ピクチャに関連付けられるメタデータから、例えば最新の（デコード順で）参照ピクチャから、ＭＶを導出することができる。Ｈ．２６５では、ＭＶ予測は、隣接ブロックが使用しているのと同じ参照ピクチャからの予測子を使用することができる。

本開示の態様は、ビデオエンコード／デコードのための方法および装置を提供する。いくつかの例では、ビデオデコードのための装置は、処理回路を備える。前記処理回路は、コード化ビデオシーケンスのピクチャにおけるコーディングブロックのコード化情報をデコードすることができる。前記コード化情報は、クリッピングインデックスｍを示すことができ、前記クリッピングインデックスｍは、前記コーディングブロックに適用されるフィルタのクリッピング値を示す。前記処理回路は、前記クリッピングインデックスに関連付けられる前記クリッピング値を決定することができる。前記クリッピング値は、第１の関数と第２の関数との乗算に基づくことができる。前記第１の関数は、ビット深度Ｂに依存し、かつ前記クリッピングインデックスｍから独立しており、前記第２の関数は、前記クリッピングインデックスｍに依存し、かつ前記ビット深度Ｂから独立している。前記処理回路は、前記クリッピング値に対応する前記フィルタを前記コーディングブロックに適用することにより、フィルタリングされたコーディングブロックを生成することができる。一実施形態では、前記第１の関数は、２^Ｂに比例する。

一実施形態では、前記クリッピング値は、整数である。前記処理回路は、２^Ｂ２^－αｍに基づいて前記クリッピング値を決定することができる。前記第１の関数は２^Ｂであり、前記第２の関数は２^－αｍであり、αは、前記フィルタの強度に関連付けられる定数値である。

一実施形態では、前記フィルタは、前記クリッピング値に依存するクリッピング関数を含む非線形適応ループフィルタである。

一例では、前記クリッピングインデックスｍは、０、１、２、および３のうちの１つである。

一実施形態では、前記定数値αは、前記コーディングブロックがルマコーディングブロックであることに基づく第１の定数値であり、前記定数値αは、前記コーディングブロックがクロマコーディングブロックであることに基づく第２の定数値である。一例では、前記第１の定数値は、第２の定数値とは異なる。一例では、前記第１の定数値は２．３であり、前記第２の定数値は２．６である。

一実施形態では、前記クリッピングインデックスｍを示す前記コード化情報は、前記ピクチャの適応パラメータセット（ＡＰＳ）でシグナリングされる。前記処理回路は、前記コーディングブロックに対するフィルタセットインデックスを受信し、前記フィルタセットインデックスに基づいて、複数のフィルタセットから前記フィルタを決定することができる。

本開示の態様は、ビデオデコードのためにコンピュータによって実行されると、前記コンピュータにビデオデコードのための方法のいずれかを実行させる命令を記憶した非一時的なコンピュータ読取可能な媒体も提供する。

開示された主題のさらなる特徴、本質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになるであろう。

イントラ予測モードの例示的なサブセットの概略図である。例示的なイントラ予測方向の説明図である。一例における現在ブロックおよびその周辺の空間的マージ候補の概略図である。一実施形態による通信システム（３００）の概略ブロック図である。一実施形態による通信システム（４００）の概略ブロック図である。一実施形態によるデコーダの概略ブロック図である。一実施形態によるエンコーダの概略ブロック図である。別の実施形態によるエンコーダのブロック図を示す。別の実施形態によるデコーダのブロック図を示す。本開示の実施形態によるフィルタ形状の例を示す。本開示の実施形態による、勾配を算出するために使用されるサブサンプリングされた位置の例を示す。本開示の実施形態による、勾配を算出するために使用されるサブサンプリングされた位置の例を示す。本開示の実施形態による、勾配を算出するために使用されるサブサンプリングされた位置の例を示す。本開示の実施形態による、勾配を算出するために使用されるサブサンプリングされた位置の例を示す。本開示の一実施形態による仮想境界フィルタリングプロセスの一例を示す。本開示の一実施形態による仮想境界フィルタリングプロセスの一例を示す。本開示の実施形態による仮想境界での対称パディング操作の例を示す。本開示の実施形態による仮想境界での対称パディング操作の例を示す。本開示の実施形態による仮想境界での対称パディング操作の例を示す。本開示の実施形態による仮想境界での対称パディング操作の例を示す。本開示の実施形態による仮想境界での対称パディング操作の例を示す。本開示の実施形態による仮想境界での対称パディング操作の例を示す。本開示の一実施形態によるクリッピング値とビット深度Ｂおよびクリッピングインデックスｍとの間の関係を示すテーブルを示す。本開示の一実施形態によるクリッピング値とビット深度Ｂおよびクリッピングインデックスｍとの間の関係を示すテーブルを示す。本開示の一実施形態によるプロセス（１５００）を概説するフローチャートを示す。一実施形態によるコンピュータシステムの概略図である。

図３は、本開示の一実施形態による通信システム（３００）の概略ブロック図を示している。通信システム（３００）は、例えばネットワーク（３５０）を介して互いに通信可能な複数の端末装置を含む。例えば、通信システム（３００）は、ネットワーク（３５０）を介して相互接続された第１の対の端末装置（３１０）および（３２０）を含む。図３の例では、第１の対の端末装置（３１０）および（３２０）は、データの単方向送信を実行する。例えば、端末装置（３１０）は、ネットワーク（３５０）を介して他方の端末装置（３２０）へ送信するためにビデオデータ（例えば、端末装置（３１０）によってキャプチャされたビデオピクチャのストリーム）をコード化し得る。エンコードされたビデオデータは、１つまたは複数のコード化されたビデオビットストリームの形で送信されることができる。端末装置（３２０）は、ネットワーク（３５０）からコード化ビデオデータを受信し、コード化ビデオデータをデコードしてビデオピクチャを復元し、復元されたビデオデータに従ってビデオピクチャを表示することができる。単方向のデータ送信は、メディア供給アプリケーションなどで一般的である。

他の例では、通信システム（３００）は、例えば、ビデオ会議中に発生し得るコード化ビデオデータの双方向送信を実行する第２の対の端末装置（３３０）および（３４０）を含む。データの双方向送信の場合、一例では、端末装置（３３０）および（３４０）のそれぞれは、ネットワーク（３５０）を介して端末装置（３３０）および（３４０）のうちの他方の端末装置へ送信するためにビデオデータ（例えば、端末装置によってキャプチャされたビデオピクチャのストリーム）をコード化し得る。端末装置（３３０）および（３４０）のそれぞれは、端末装置（３３０）および（３４０）のうちの他方の端末装置で送信されたコード化ビデオデータを受信することができ、コード化ビデオデータをデコードしてビデオピクチャを復元することができ、復元されたビデオデータに従ってビデオピクチャをアクセス可能な表示装置に表示することができる。

図３の例では、端末装置（３１０）、（３２０）、（３３０）および（３４０）は、サーバ、パーソナルコンピュータおよびスマートフォンとして示され得るが、しかし、本開示の原理はこれに制限されることはない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤー、および／または専用のビデオ会議機器における用途を見出す。ネットワーク（３５０）は、例えば有線および／または無線通信ネットワークを含む、端末装置（３１０）、（３２０）、（３３０）および（３４０）間でコード化ビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク（３５０）は、回線交換および／またはパケット交換チャネルでデータを交換することができる。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび／またはインターネットを含む。本議論の目的のために、ネットワーク（３５０）のアーキテクチャおよびトポロジーは、以下で説明されない限り、本開示の動作にとって重要でないかもしれない。

図４は、開示された主題の適用の例として、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置を示している。開示された主題は、例えば、ビデオ会議、デジタルＴＶ、および、ＣＤ、ＤＶＤ、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの記憶など、を含む他のビデオ対応アプリケーションに等しく適用可能である。

ストリーミングシステムは、例えば非圧縮のビデオピクチャ（４０２）のストリームを作成するデジタルカメラなどのビデオソース（４０１）を含むことができるキャプチャサブシステム（４１３）を含んでもよい。一例では、ビデオピクチャ（４０２）のストリームは、デジタルカメラによって取得されたサンプルを含む。エンコードされたビデオデータ（４０４）（又はコード化されたビデオビットストリーム）と比較して高データ量を強調するために太線で示されたビデオピクチャ（４０２）のストリームは、ビデオソース（４０１）に結合されたビデオエンコーダ（４０３）を含む電子デバイス（４２０）によって処理されることができる。ビデオエンコーダ（４０３）は、以下でより詳細に説明されるように、開示された主題の態様を可能にするか或いは実施するためのハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。ビデオピクチャ（４０２）のストリームと比較してより低いデータ量を強調するために細い線で示された、エンコードされたビデオデータ（４０４）（またはエンコードされたビデオビットストリーム（４０４））は、将来使うためにストリーミングサーバ（４０５）に記憶されることができる。図４のクライアントサブシステム（４０６）および（４０８）のような１つまたは複数のストリーミングクライアントサブシステムは、ストリーミングサーバ（４０５）にアクセスして、エンコードされたビデオデータ（４０４）のコピー（４０７）および（４０９）を検索することができる。クライアントサブシステム（４０６）は、例えば、電子デバイス（４３０）におけるビデオデコーダ（４１０）を含むことができる。ビデオデコーダ（４１０）は、エンコードされたビデオデータの入り方向コピー（４０７）をデコードし、ディスプレイ（４１２）（例えば、表示画面）または他のレンダリングデバイス（示されていない）でレンダリングできるビデオピクチャ（４１１）の出方向ストリームを作成する。一部のストリーミングシステムにおいて、エンコードされたビデオデータ（４０４）、（４０７）、および（４０９）（例えば、ビデオビットストリーム）は、特定のビデオコーディング／圧縮規格に従ってエンコードされることができる。これらの規格の例は、ＩＴＵ－Ｔ勧告Ｈ．２６５を含む。一例では、開発中のビデオコーディング規格は、非公式的に多用途ビデオコーディング（ＶＶＣ）として知られている。開示された主題は、ＶＶＣの文脈に使用され得る。

なお、電子デバイス（４２０）および（４３０）は、他の構成要素（図示せず）を含むことができる。例えば、電子デバイス（４２０）は、ビデオデコーダ（図示せず）を含むことができ、電子デバイス（４３０）は、ビデオエンコーダ（図示せず）を含むこともできる。

図５は、本開示の一実施形態によるビデオデコーダ（５１０）のブロック図を示す。ビデオデコーダ（５１０）は、電子デバイス（５３０）に含まれることができる。電子デバイス（５３０）は、受信機（５３１）（例えば、受信回路）を含むことができる。ビデオデコーダ（５１０）は、図４の例におけるビデオデコーダ（４１０）の代わりに使用されることができる。

受信機（５３１）は、ビデオデコーダ（５１０）によってデコードされる１つまたは複数のコード化ビデオシーケンスを受信することができ、同一または別の実施形態では、一度に１つのコード化ビデオシーケンスを受信してもよく、各コード化ビデオシーケンスのデコードは、他のコード化ビデオシーケンスから独立している。コード化ビデオシーケンスは、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得るチャネル（５０１）から受信されることができる。受信機（５３１）は、それぞれの使用エンティティ（示されていない）に転送され得る他のデータ、例えば、コード化オーディオデータおよび／または補助データストリームとともに、エンコードされたビデオデータを受信し得る。受信機（５３１）は、コード化ビデオシーケンスを他のデータから分離することができる。ネットワークジッタを防止するために、バッファメモリ（５１５）は、受信機（５３１）とエントロピーデコーダ／パーサ（５２０）（以降、「パーサ（５２０）」）の間に結合されてもよい。特定のアプリケーションでは、バッファメモリ（５１５）は、ビデオデコーダ（５１０）の一部である。他の場合、ビデオデコーダ（５１０）（示されていない）の外部に存在し得る。さらに他の場合、例えば、ネットワークジッタを防止するためにビデオデコーダ（５１０）の外部にバッファメモリ（示されていない）が存在し、さらに、例えば、再生タイミングを取り扱うためにビデオデコーダ（５１０）の内部に別のバッファメモリ（５１５）が存在し得る。受信機（５３１）が十分な帯域幅および可制御性を有する記憶／転送装置から、または等同期ネットワークからデータを受信する際に、バッファメモリ（５１５）は必要とされないことがあり、または小さくされることがある。インターネットなどのベストエフォートパケットネットワークで使用するために、バッファメモリ（５１５）が必要になる場合があり、バッファメモリ（５１５）は、比較的大きいことがあり、有利には適応サイズであることができ、オペレーティングシステムまたはビデオデコーダ（５１０）の外部の類似の要素（示されていない）に少なくとも部分的に実施され得る。

ビデオデコーダ（５１０）は、コード化ビデオシーケンスからシンボル（５２１）を再構築するパーサ（５２０）を含んでもよい。これらのシンボルのカテゴリは、ビデオデコーダ（５１０）の操作を管理するために使用される情報、および、電子デバイス（５３０）の不可欠な部分ではないが、図５に示されるように電子デバイス（５３０）に結合され得るレンダリングデバイス（５１２）（例えば、表示画面）のようなレンダリングデバイスを制御する潜在的情報を含む。レンダリングデバイスのための制御情報は、補助強化情報（ＳＥＩメッセージ）またはビデオユーザビリティ情報（ＶＵＩ）パラメータセットフラグメント（示されていない）の形態であってよい。パーサ（５２０）は、受信されたコード化ビデオシーケンスを構文解析／エントロピーデコードすることができる。コード化ビデオシーケンスのコーディングは、ビデオコーディング技術または規格に合わせることができ、可変長コーディング、ハフマンコーディング、文脈感受性を有するもしくは有さない算術コーディングなどを含む様々な原理に従うことができる。パーサ（５２０）は、グループに対応する少なくとも１つのパラメータに基づいて、コード化ビデオシーケンスからビデオデコーダ内の画素の少なくとも１つのサブグループのためのサブグループパラメータのセットを抽出することができる。サブグループは、ピクチャ群（ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット（ＣＵ）、ブロック、変換ユニット（ＴＵ）、予測ユニット（ＰＵ）などを含むことができる。パーサ（５２０）は、コード化ビデオシーケンスから変換係数、量子化パラメータ値、動きベクトルなどのような情報をも抽出することができる。

パーサ（５２０）は、シンボル（５２１）を作成するために、バッファメモリ（５１５）から受信されたビデオシーケンスに対してエントロピーデコード／構文解析操作を実行することができる。

シンボル（５２１）の再構築は、コード化ビデオピクチャまたはその一部（例えば、インターおよびイントラピクチャ、インターおよびイントラブロック）のタイプ、および他の要因に応じて、複数の異なるユニットが関与することができる。どのユニットが、どのように関与するかは、パーサ（５２０）によってコード化ビデオシーケンスから構文解析されたサブグループ制御情報によって制御されることができる。パーサ（５２０）と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、明確にするために示されていない。

すでに述べた機能ブロックに加え、ビデオデコーダ（５１０）は、以下で説明されるようにいくつかの機能ユニットに概念的に細分されることができる。商業的な制約の下で実際の実施操作にあたっては、これらのユニットの多くは互いに密接に相互作用し、少なくとも一部は互いに統合することができる。しかしながら、開示された主題の説明の目的で、以下の機能ユニットへの概念的な細分は、適切に行われる。

第１のユニットは、スケーラ／逆変換ユニット（５５１）である。スケーラ／逆変換ユニット（５５１）は、使用する変換、ブロックサイズ、量子化因子、量子化スケーリング行列などを含む制御情報と、量子化された変換係数をシンボル（５２１）としてパーサ（５２０）から受信する。スケーラ／逆変換ユニット（５５１）は、アグリゲータ（５５５）に入力可能なサンプル値を含むブロックを出力することができる。

場合によっては、スケーラ／逆変換ユニット（５５１）の出力サンプルは、イントラコーディングブロック、すなわち、予め再構築されたピクチャからの予測情報を使用していないが、現在ピクチャの予め再構築された部分からの予測情報を使用できるブロックに関係することがある。このような予測情報は、イントラピクチャ予測ユニット（５５２）によって提供されることができる。場合によっては、イントラピクチャ予測ユニット（５５２）は、現在ピクチャバッファ（５５８）から取り出された周囲の既に再構築された情報を用いて、再構築中のブロックの同じサイズおよび形状のブロックを生成する。現在ピクチャバッファ（５５８）は、例えば、一部再構築された現在ピクチャおよび／または完全に再構築された現在ピクチャをバッファリングする。アグリゲータ（５５５）は、場合によっては、サンプルごとに、イントラ予測ユニット（５５２）が生成した予測情報を、スケーラ／逆変換ユニット（５５１）によって提供される出力サンプル情報に追加する。

他の場合では、スケーラ／逆変換ユニット（５５１）の出力サンプルは、インターコード化された、潜在的に動き補償されたブロックに関係することがある。このような場合、動き補償予測ユニット（５５３）は、参照ピクチャメモリ（５５７）にアクセスして、予測に使用されるサンプルを取り出すことができる。取り出されたサンプルをブロックに関係するシンボル（５２１）に従って動き補償した後、出力サンプル情報を生成するように、これらのサンプルは、アグリゲータ（５５５）によってスケーラ／逆変換ユニット（５５１）の出力に追加されることができる（この場合、残差サンプルまたは残差信号と呼ばれる）。動き補償予測ユニット（５５３）が予測サンプルを取り出す参照ピクチャメモリ（５５７）内のアドレスは、例えば、Ｘ、Ｙ、および参照ピクチャ成分を有し得るシンボル（５２１）の形態で動き補償予測ユニット（５５３）に利用可能な動きベクトルによって制御されることができる。動き補償は、サブサンプル正確な動きベクトルが使用中であるときに参照ピクチャメモリ（５５７）から取り出されたサンプル値の補間、動きベクトル予測メカニズムなどを含むこともできる。

アグリゲータ（５５５）の出力サンプルは、ループフィルタユニット（５５６）において様々なループフィルタリング技法を受けられる。ビデオ圧縮技術は、コード化ビデオシーケンス（コード化されたビデオビットストリームとも呼ばれる）に含まれる、パーサ（５２０）からのシンボル（５２１）としてループフィルタユニット（５５６）に利用可能とされたパラメータによって制御されることができ、それに、コード化ピクチャまたはコード化ビデオシーケンスの（デコード順で）前の部分のデコード中に取得されたメタ情報に応じるとともに、予め再構築されループフィルタリングされたサンプル値に応じることもできるループ内フィルタ技術を含むことができる。

ループフィルタユニット（５５６）の出力は、レンダリングデバイス（５１２）へ出力されることができるとともに、将来のインターピクチャ予測で使用するために参照ピクチャメモリ（５５７）に記憶されることができるサンプルストリームであり得る。

特定のコード化ピクチャは、完全に再構築されると、将来の予測のために参照ピクチャとして使用されることができる。例えば、現在ピクチャに対応するコード化ピクチャが完全に再構築され、コード化ピクチャが（例えば、パーサ（５２０）によって）参照ピクチャとして識別されると、現在ピクチャバッファ（５５８）は、参照ピクチャメモリ（５５７）の一部になることができ、次のコード化ピクチャの再構築を開始する前に新しい現在ピクチャバッファを再割当てすることができる。

ビデオデコーダ（５１０）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような規格での所定のビデオ圧縮技術に従ってデコード操作を実行することができる。コード化ビデオシーケンスが、ビデオ圧縮技術または規格のシンタックスと、ビデオ圧縮技術または規格で文書化されたプロファイルとの両方に準拠しているという意味で、コード化ビデオシーケンスは、使用されているビデオ圧縮技術または規格によって指定されるシンタックスに準拠し得る。具体的には、プロファイルは、ビデオ圧縮技術または規格で使用可能なすべてのツールから、特定のツールをそのプロファイルで使用できる唯一のツールとして選択することができる。コード化ビデオシーケンスの複雑さがビデオ圧縮技術または規格のレベルで定義される範囲内にあることも、コンプライアンスに必要である。場合によっては、最大ピクチャサイズ、最大フレームレート、最大再構築サンプルレート（例えば、１秒あたりのメガサンプルで測定される）、最大参照ピクチャサイズなどがレベルによって制限される。レベルによって設定された制限は、場合によっては、コード化ビデオシーケンスでシグナリングされたＨＲＤバッファ管理のための仮想参照デコーダ（ＨＲＤ）仕様およびメタデータによってさらに制限され得る。

一実施形態では、受信機（５３１）は、エンコードされたビデオとともに追加の（冗長な）データを受信することができる。追加のデータは、コード化ビデオシーケンスの一部として含まれてもよい。追加のデータは、データを適切にデコードし、および／または、元のビデオデータをより正確に再構築するためにビデオデコーダ（５１０）によって使用され得る。追加のデータは、例えば、時間的、空間的、または信号対雑音比（ＳＮＲ）エンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方向誤り訂正コードなどの形態にされることができる。

図６は、本開示の一実施形態によるビデオエンコーダ（６０３）のブロック図を示す。ビデオエンコーダ（６０３）は、電子デバイス（６２０）に含まれる。電子デバイス（６２０）は、送信機（６４０）（例えば、送信回路）を含む。図４の例におけるビデオエンコーダ（４０３）の代わりにビデオエンコーダ（６０３）を使用することができる。

ビデオエンコーダ（６０３）は、ビデオエンコーダ（６０３）によってコード化されるビデオ画像をキャプチャし得るビデオソース（６０ｌ）（図６の例では電子デバイス（６２０）の一部ではない）からビデオサンプルを受信することができる。他の例では、ビデオソース（６０１）は、電子デバイス（６２０）の一部である。

ビデオソース（６０１）は、ビデオエンコーダ（６０３）によってコード化されるソースビデオシーケンスを、任意の適切なビット深度（例えば、８ビット、１０ビット、１２ビット、・・・）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢ、・・・）および任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であり得るデジタルビデオサンプルストリームの形態で提供し得る。メディア供給システムでは、ビデオソース（６０１）は、予め準備されたビデオを記憶する記憶装置であり得る。ビデオ会議システムでは、ビデオソース（６０１）は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであり得る。ビデオデータは、順番に見られるときに動きが与えられる複数の個別のピクチャとして提供されてもよい。ピクチャ自体は、画素の空間アレイとして編成されてもよく、各画素は、使用中のサンプリング構造、色空間などに応じて１つまたは複数のサンプルを含むことができる。当業者は、画素とサンプルとの関係を容易に理解することができる。以下の説明ではサンプルを中心に説明する。

一実施形態によれば、ビデオエンコーダ（６０３）は、リアルタイムでまたはアプリケーションが要求する任意の他の時間制約の下でソースビデオシーケンスのピクチャをコード化し、コード化ビデオシーケンス（６４３）に圧縮することができる。適切なコーディング速度を実施することは、コントローラ（６５０）の機能の１つである。一部の実施形態では、コントローラ（６５０）は、以下で説明される他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。分かりやすくするために、カップリングは示されていない。コントローラ（６５０）によって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化、レート歪み最適化技法のラムダ値、・・・）、ピクチャサイズ、ピクチャ群（ＧＯＰ）レイアウト、最大動きベクトル検索範囲などを含むことができる。コントローラ（６５０）は、特定のシステム設計に対して最適化されたビデオエンコーダ（６０３）に関する他の適切な機能を有するように構成されることができる。

一部の実施形態では、ビデオエンコーダ（６０３）は、コーディングループで動作するように構成される。過度に簡略化した説明として、一例では、コーディングループは、ソースコーダ（６３０）（例えば、コード化対象となる入力ピクチャおよび参照ピクチャに基づくシンボルストリームなどのシンボルの作成を担当する）、およびビデオエンコーダ（６０３）に埋め込まれた（ローカル）デコーダ（６３３）を含むことができる。デコーダ（６３３）は、シンボルを再構築して、（リモート）デコーダが作成するのと同様な方法でサンプルデータを作成する（シンボルとコード化されたビデオビットストリーム間の如何なる圧縮は、開示された主題で考慮されるビデオ圧縮技術では可逆であるためである）。再構築されたサンプルストリーム（サンプルデータ）は参照ピクチャメモリ（６３４）に入力される。シンボルストリームのデコードにより、デコーダの位置（ローカルまたはリモート）に関係なくビット正確な結果が得られるため、参照ピクチャメモリ（６３４）のコンテンツもローカルエンコーダとリモートエンコーダの間でビット正確である。言い換えれば、エンコーダの予測部分は、参照ピクチャサンプルとして、デコード中に予測を使用するときにデコーダが「見る」のと全く同じサンプル値を「見る」。参照ピクチャの同期性の該基本原理（および例えばチャネルエラーに起因して同期性を維持できない場合に生じるドリフト）は、いくつかの関連分野にも使用されている。

「ローカル」デコーダ（６３３）の動作は、前文で図５に関連して既に詳細に説明された、ビデオデコーダ（５１０）などの「リモート」デコーダの動作と同様であり得る。しかしながら、図５も簡単に参照すると、シンボルが使用可能であり、エントロピーコーダ（６４５）およびパーサ（５２０）によるコード化ビデオシーケンスへのシンボルのエンコード／デコードは可逆であり得るので、バッファメモリ（５１５）、およびパーサ（５２０）を含むビデオデコーダ（５１０）のエントロピーデコード部分は、ローカルデコーダ（６３３）では完全に実装されない場合がある。

これで分かるように、デコーダに存在する構文解析／エントロピーデコード以外の如何なるデコーダ技術も、対応するエンコーダに実質的に同一の機能的形態で必ず存在する必要がある。このため、開示された主題は、デコーダ操作に焦点を合わせている。エンコーダ技術の説明は、包括的に説明されたデコーダ技術の逆であるため、省略できる。特定の領域でのみ、より詳細な説明が必要であり、以下に提供される。

操作中、一部の例では、ソースコーダ（６３０）は、「参照ピクチャ」として指定されたビデオシーケンスからの１つまたは複数の予めコード化されたピクチャを参照して入力ピクチャを予測的にコード化する動き補償予測コーディングを実行してもよい。このようにして、コーディングエンジン（６３２）は、入力ピクチャの画素ブロックと、入力ピクチャへの予測基準として選択され得る参照ピクチャの画素ブロックとの差異をコード化する。

ローカルビデオデコーダ（６３３）は、ソースコーダ（６３０）で作成されたシンボルに基づいて、参照ピクチャとして指定され得るピクチャのコード化ビデオデータをデコードすることができる。コーディングエンジン（６３２）の操作は、有利にはロッシープロセスであり得る。コード化ビデオデータがビデオデコーダ（図６に示されていない）でデコードされ得るとき、再構築されたビデオシーケンスは、通常、いくつかのエラーを伴うソースビデオシーケンスのレプリカであってもよい。ローカルビデオデコーダ（６３３）は、ビデオデコーダによって参照ピクチャに対して実行され得るデコードプロセスを再現し、再構築された参照ピクチャを参照ピクチャキャッシュ（６３４）に記憶させることができる。このようにして、ビデオエンコーダ（６０３）は、遠端ビデオデコーダによって取得される再構築された参照ピクチャと共通するコンテンツ（送信エラー無し）を有する再構築された参照ピクチャのコピーをローカルに記憶し得る。

予測器（６３５）は、コーディングエンジン（６３２）の予測検索を実行することができる。つまり、コード化対象となる新しいピクチャについて、予測器（６３５）は、（候補の参照画素ブロックとしての）サンプルデータ、または、参照ピクチャの動きベクトル、ブロック形状など、新しいピクチャの適切な予測基準として機能し得る特定のメタデータを参照ピクチャメモリ（６３４）で検索することができる。予測器（６３５）は、適切な予測基準を見つけるために、サンプルブロック/画素ブロックごとに操作することができる。場合によっては、予測器（６３５）で取得された検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（６３４）に記憶された複数の参照ピクチャから引き出された予測基準を有してもよい。

コントローラ（６５０）は、例えば、ビデオデータを符号化するために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ（６３０）のコーディング操作を管理することができる。

前述のすべての機能ユニットの出力は、エントロピーコーダ（６４５）においてエントロピーコーディングを受けられる。エントロピーコーダ（６４５）は、例えば、ハフマンコーディング、可変長コーディング、算術コーディングなどの技術に従ってシンボルを可逆圧縮することにより、様々な機能ユニットによって生成されたシンボルをコード化ビデオシーケンスに変換する。

送信機（６４０）は、エンコードされたビデオデータを記憶する記憶装置へのハードウェア／ソフトウェアリンクであり得る通信チャネル（６６０）を介した送信の準備のために、エントロピーコーダ（６４５）によって作成されたコード化ビデオシーケンスをバッファリングすることができる。送信機（６４０）は、ビデオコーダ（６０３）からのコード化ビデオデータを、送信されるべき他のデータ、例えば、コード化オーディオデータおよび／または補助データストリーム（ソースは示されていない）とマージすることができる。

コントローラ（６５０）は、ビデオエンコーダ（６０３）の操作を管理し得る。コーディング中、コントローラ（６５０）は、各コード化ピクチャに特定のコード化ピクチャタイプを割り当てることができ、これは、それぞれのピクチャに適用され得るコーディング技法に影響を及ぼし得る。例えば、ピクチャは、多くの場合、次のピクチャタイプのいずれかとして割り当てられ得る。

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の他のいかなるピクチャを使用せずにコード化および復号され得るものであり得る。一部のビデオコーデックは、例えば、インディペンデントデコーダリフレッシュ（ＩｎｄｅｐｅｎｄｅｎｔＤｅｃｏｄｅｒＲｅｆｒｅｓｈ、「ＩＤＲ」）ピクチャを含む、異なるタイプのイントラピクチャを許容する。当業者は、Ｉピクチャの変形およびそれらのそれぞれの用途および特徴を知っている。

予測ピクチャ（Ｐピクチャ）は、各ブロックのサンプル値を予測するために最大１つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測によりコード化および復号され得るものであり得る。

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために最大２つの動きベクトルおよび参照インデックスを使用したイントラ予測またはインター予測によりコード化および復号され得るものであり得る。同様に、多重予測ピクチャは、単数のブロックの再構築のために２つを超えた参照ピクチャおよび関連メタデータを使用することができる。

ソースピクチャは、一般に、複数のサンプルブロック（例えば、それぞれ、４×４、８×８、４×８、または１６×１６サンプルのブロック）に空間的に細分され、ブロック単位でコード化され得る。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割り当てによって決定された他の（既にコード化された）ブロックを参照して予測的にコード化され得る。例えば、Ｉピクチャのブロックは、非予測的にコード化されてもよく、或いは、同一のピクチャの既にコード化されたブロック（空間予測またはイントラ予測）を参照して予測的にコード化されてもよい。Ｐピクチャの画素ブロックは、１つの予めコード化された参照ピクチャを参照して、空間予測を介してまたは時間予測を介して予測的にコード化され得る。Ｂピクチャのブロックは、１つまたは２つの予めコード化された参照ピクチャを参照して、空間予測を介してまたは時間予測を介して予測的にコード化され得る。

ビデオエンコーダ（６０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５などの予め設定されたビデオコーディング技術または規格に従って、コーディング操作を実行することができる。操作中、ビデオエンコーダ（６０３）は、入力ビデオシーケンスの時間的および空間的冗長性を利用する予測コーディング操作を含む、様々な圧縮操作を実行することができる。したがって、コード化ビデオデータは、使用されるビデオコーディング技術または規格によって指定されたシンタックスに準拠する場合がある。

一実施形態では、送信機（６４０）は、エンコードされたビデオとともに追加のデータを送信することができる。ソースコーダ（６３０）は、このようなデータをコード化ビデオシーケンスの一部として含み得る。追加のデータは、時間的／空間的／ＳＮＲエンハンスメントレイヤ、冗長なピクチャやスライスなどの他の形態での冗長データ、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメントなどを含み得る。

ビデオは、時系列で複数のソースピクチャ（ビデオピクチャ）としてキャプチャされ得る。イントラピクチャ予測（「イントラ予測」と略されることが多い）は、所定のピクチャにおける空間相関を利用し、インターピクチャ予測は、ピクチャ間の（時間的または他の）相関を利用する。一例では、現在ピクチャと呼ばれるエンコード／デコード中の特定のピクチャは、ブロックに分割される。現在ピクチャにおけるブロックが、ビデオにおける予めコード化され、まだバッファリングされている参照ピクチャの参照ブロックに類似している場合、現在ピクチャにおけるブロックは、動きベクトルと呼ばれるベクトルによってコード化されることができる。動きベクトルは、参照ピクチャの参照ブロックを指し、複数の参照ピクチャが使用されている場合、参照ピクチャを識別する第３次元を有することができる。

一部の実施形態では、インターピクチャ予測において双予測法を使用することができる。双予測法によれば、ビデオにおける現在ピクチャよりもデコード順序がそれぞれ前である（ただし、表示順序でそれぞれ過去および未来にあり得る）第１の参照ピクチャおよび第２の参照ピクチャのような２つの参照ピクチャを使用する。現在ピクチャにおけるブロックは、第１の参照ピクチャにおける第１の参照ブロックを指す第１の動きベクトル、および第２の参照ピクチャにおける第２の参照ブロックを指す第２の動きベクトルによってコード化されることができる。ブロックは、第１の参照ブロックと第２の参照ブロックとの組み合わせによって予測されることができる。

さらに、マージモード技法をインターピクチャ予測に適用して、コーディング効率を向上させることができる。

本開示の一部の実施形態によれば、インターピクチャ予測およびイントラピクチャ予測などの予測は、ブロック単位で実行される。例えば、ＨＥＶＣ規格によれば、一連のビデオピクチャにおけるピクチャは、圧縮のためにコーディングツリーユニット（ＣＴＵ）に分割され、ピクチャにおけるＣＴＵは、６４×６４画素、３２×３２画素、または１６×１６画素など、同一のサイズを有する。一般に、ＣＴＵは、１つの輝度ＣＴＢと２つの彩度ＣＴＢである３つのコーディングツリーブロック（ＣＴＢ）を含む。各ＣＴＵは、１つまたは複数のコーディングユニット（ＣＵ）に再帰的に四分木分割されることができる。例えば、６４×６４画素のＣＴＵは、１つの６４×６４画素のＣＵ、４つの３２×３２画素のＣＵ、または１６つの１６×１６画素のＣＵに分割されることができる。一例では、各ＣＵを解析して、インター予測タイプまたはイントラ予測タイプなど、ＣＵの予測タイプを決定する。ＣＵは、時間的および／または空間的予測可能性に応じて、１つまたは複数の予測ユニット（ＰＵ）に分割される。通常、各ＰＵは、１つの輝度予測ブロック（ＰＢ）と２つの彩度ＰＢを含む。一実施形態では、コーディング（エンコード／デコード）における予測操作は、予測ブロックの単位で実行される。輝度予測ブロックを予測ブロックの例として用いて、予測ブロックは、８×８画素、１６×１６画素、８×１６画素、１６×８画素などの画素の値（例えば、輝度値）の行列を含む。

図７は、本開示の他の実施形態によるビデオエンコーダ（７０３）の図を示す。ビデオエンコーダ（７０３）は、一連のビデオピクチャにおける現在ビデオピクチャにおけるサンプル値の処理ブロック（例えば、予測ブロック）を受信し、処理ブロックを、コード化ビデオシーケンスの一部であるコード化ピクチャにエンコードするように構成される。一例では、図４の例におけるビデオエンコーダ（４０３）の代わりにビデオエンコーダ（７０３）を使用する。

ＨＥＶＣの例では、ビデオエンコーダ（７０３）は、８×８サンプルのような予測ブロックなどの処理ブロックのサンプル値の行列を受信する。ビデオエンコーダ（７０３）は、例えばレート歪み最適化を用いて、処理ブロックをイントラモード、インターモード、または双予測モードにより最も良くコード化するか否かを決定する。処理ブロックがイントラモードでコード化されようとする場合、ビデオエンコーダ（７０３）は、イントラ予測法を用いて処理ブロックをコード化ピクチャにエンコードすることができる。また、処理ブロックがインターモードまたは双予測モードでコード化されようとする場合、ビデオエンコーダ（７０３）は、それぞれインター予測または双予測法を用いて、処理ブロックをコード化ピクチャにエンコードすることができる。特定のビデオコーディング技術では、マージモードは、予測器外のコード化動きベクトル成分の利便を介することなく、１つまたは複数の動きベクトル予測器から動きベクトルを導出するインターピクチャ予測サブモードであり得る。特定の他のビデオコーディング技術では、対象ブロックに適用可能な動きベクトル成分が存在し得る。一例では、ビデオエンコーダ（７０３）は、処理ブロックのモードを決定するためのモード決定モジュール（図示せず）などの他の構成要素を含む。

図７の例では、ビデオエンコーダ（７０３）は、図７に示すように互いに結合されたインターエンコーダ（７３０）、イントラエンコーダ（７２２）、残差算出部（７２３）、スイッチ（７２６）、残差エンコーダ（７２４）、統括制御部（７２１）およびエントロピーエンコーダ（７２５）を含む。

インターエンコーダ（７３０）は、現在ブロック（例えば、処理ブロック）のサンプルを受信し、該ブロックを参照ピクチャにおける１つまたは複数の参照ブロック（例えば、前のピクチャおよび後のピクチャにおけるブロック）と比較し、インター予測情報（例えば、インターエンコード法による冗長情報の記述、動きベクトル、マージモード情報）を生成し、インター予測情報に基づいて任意の適切な技法を用いてインター予測結果（例えば、予測ブロック）を算出するように構成される。一部の例では、参照ピクチャは、エンコードされたビデオ情報に基づいてデコードされたデコード参照ピクチャである。

イントラエンコーダ（７２２）は、現在ブロック（例えば、処理ブロック）のサンプルを受信し、場合によっては該ブロックを同一のピクチャで既にコード化されたブロックと比較し、変換後に、量子化された係数を生成し、場合によってはイントラ予測情報（例えば、１つまたは複数のイントラエンコード法によるイントラ予測方向情報）をも生成するように構成される。一例では、イントラエンコーダ（７２２）は、イントラ予測情報および同一のピクチャにおける参照ブロックに基づいてイントラ予測結果（例えば、予測ブロック）も算出する。

統括制御部（７２１）は、統括制御データを決定し、統括制御データに基づいてビデオエンコーダ（７０３）の他の構成要素を制御するように構成される。一例では、統括制御部（７２１）は、ブロックのモードを決定し、モードに基づいて制御信号をスイッチ（７２６）に提供する。例えば、モードがイントラモードである場合、統括制御部（７２１）は、残差算出部（７２３）が使用するためのイントラモード結果を選択するようにスイッチ（７２６）を制御するとともに、イントラ予測情報を選択してイントラ予測情報をビットストリームに含ませるようにエントロピーエンコーダ（７２５）を制御する。また、モードがインターモードである場合、統括制御部（７２１）は、残差算出部（７２３）が使用するためのインター予測結果を選択するようにスイッチ（７２６）を制御するとともに、インター予測情報を選択してインター予測情報をビットストリームに含ませるようにエントロピーエンコーダ（７２５）を制御する。

残差算出部（７２３）は、受信されたブロックとイントラエンコーダ（７２２）またはインターエンコーダ（７３０）から選択された予測結果との差（残差データ）を算出するように構成される。残差エンコーダ（７２４）は、残差データに基づいて動作し、残差データをエンコードして変換係数を生成するように構成される。一例では、残差エンコーダ（７２４）は、残差データを空間領域から周波数領域へと変換し、変換係数を生成するように構成される。その後、変換係数は量子化処理を受けて、量子化された変換係数が得られる。様々な実施形態では、ビデオエンコーダ（７０３）は、残差デコーダ（７２８）をも含む。残差デコーダ（７２８）は、逆変換を実行し、デコード残差データを生成するように構成される。デコード残差データは、イントラエンコーダ（７２２）およびインターエンコーダ（７３０）によって適切に使用されることができる。例えば、インターエンコーダ（７３０）は、デコード残差データよびインター予測情報に基づいて、デコードブロックを生成することができ、イントラエンコーダ（７２２）は、デコード残差データおよびイントラ予測情報に基づいて、デコードブロックを生成することができる。一部の例では、デコードブロックは、デコードピクチャを生成するように適切に処理され、デコードピクチャは、メモリ回路（図示せず）にバッファリングされ、参照ピクチャとして使用されることができる。

エントロピーエンコーダ（７２５）は、ビットストリームをフォーマットしてエンコードブロックを生成するように構成される。エントロピーエンコーダ（７２５）は、ＨＥＶＣ規格などの適切な規格に従う様々な情報をビットストリームに含ませるように構成される。一例では、エントロピーエンコーダ（７２５）は、統括制御データ、選択された予測情報（例えば、イントラ予測情報またはインター予測情報）、残差情報、および他の適切な情報をビットストリームに含ませるように構成される。開示された主題によれば、インターモードまたは双予測モードのマージサブモードでブロックをコード化する場合、残差情報はないことに留意されたい。

図８は、本開示の他の実施形態によるビデオデコーダ（８１０）の図を示す。ビデオデコーダ（８１０）は、コード化ビデオシーケンスの一部であるコード化ピクチャを受信し、コード化ピクチャをデコードして、再構築ピクチャを生成するように構成される。一例では、図４の例におけるビデオデコーダ（４１０）の代わりにビデオデコーダ（８１０）を使用する。

図８の例では、ビデオデコーダ（８１０）は、図８に示されるように互いに結合されたエントロピーデコーダ（８７１）、インターデコーダ（８８０）、残差デコーダ（８７３）、再構築モジュール（８７４）、およびイントラデコーダ（８７２）を含む。

エントロピーデコーダ（８７１）は、コード化ピクチャから、コード化ピクチャを構成するシンタックス要素を表す特定のシンボルを再構築するように構成されることができる。このようなシンボルは、例えば、ブロックがコード化されるモード（例えば、イントラモード、インターモード、双予測モード、後の２つのマージサブモードまたは他のサブモード）、それぞれイントラデコーダ（８７２）またはインターデコーダ（８８０）による予測に使用される特定のサンプルまたはメタデータを識別できる予測情報（例えば、イントラ予測情報またはインター予測情報）、例えば、量子化された変換係数の形態での残差情報などを含むことができる。一例では、予測モードがインターまたは双予測モードであれば、インター予測情報は、インターデコーダ（８８０）に提供される。また、予測タイプがイントラ予測タイプであれば、イントラ予測情報は、イントラデコーダ（８７２）に提供される。残差情報は、逆量子化を施されることができ、残差デコーダ（８７３）に提供される。

インターデコーダ（８８０）は、インター予測情報を受信し、インター予測情報に基づいてインター予測結果を生成するように構成される。

イントラデコーダ（８７２）は、イントラ予測情報を受信し、イントラ予測情報に基づいて予測結果を生成するように構成される。

残差デコーダ（８７３）は、逆量子化を実行して、逆量子化された変換係数を抽出し、逆量子化された変換係数を処理して残差を周波数領域から空間領域に変換するように構成される。残差デコーダ（８７３）は、（量子化器パラメータ（ＱＰ）を含めるように）特定の制御情報をも必要とする場合があり、この情報は、エントロピーデコーダ（８７１）によって提供されてもよい（データパスは、低ボリューム制御情報のみであり得るため、示されていない）。

再構築モジュール（８７４）は、空間領域において、残差デコーダ（８７３）によって出力された残差と、（場合によってはインターまたはイントラ予測モジュールによって出力される）予測結果とを組み合わせて、再構築ビデオの一部となり得る再構築ピクチャの一部であり得る再構築ブロックを形成するように構成される。なお、視覚的品質を改善するために、デブロッキング操作などの他の適切な操作を実行することができる。

なお、ビデオエンコーダ（４０３）、（６０３）および（７０３）とビデオデコーダ（４１０）、（５１０）および（８１０）は、任意の適切な技法を用いて実施されることができる。一実施形態では、ビデオエンコーダ（４０３）、（６０３）および（７０３）とビデオデコーダ（４１０）、（５１０）および（８１０）は、１つまたは複数の集積回路を用いて実施されることができる。他の実施形態では、ビデオエンコーダ（４０３）、（６０３）および（７０３）とビデオデコーダ（４１０）、（５１０）および（８１０）は、ソフトウェア命令を実行する１つまたは複数のプロセッサを用いて実施されることができる。

ブロックベースのフィルタ適応を有する適応ループフィルタ（ＡｄａｐｔｉｖｅＬｏｏｐＦｉｌｔｅｒ、ＡＬＦ）は、アーチファクトを減らすためにエンコーダ／デコーダによって適用されることができる。ルマ成分の場合、例えば局所的な勾配の方向および活性度に基づいて、複数のフィルタ（例えば、２５個のフィルタ）のうちの１つが４×４のルマブロックに対して選択されることができる。

ＡＬＦは、任意の適切な形状およびサイズを持つことができる。図９を参照すると、ＡＬＦ（９１０）～（９１１）は、ＡＬＦ（９１０）の場合は５×５の菱形、ＡＬＦ（９１１）の場合は７×７の菱形といったように、菱形形状を持っている。ＡＬＦ（９１０）では、要素（９２０）～（９３２）は、フィルタリングプロセスに使用されて菱形形状を形成することができる。要素（９２０）～（９３２）には７つの値（例えば、Ｃ０～Ｃ６）が使用可能である。ＡＬＦ（９１１）では、要素（９４０）～（９６４）は、フィルタリングプロセスに使用されて菱形形状を形成することができる。要素（９４０）～（９６４）には１３個の値（例えば、Ｃ０～Ｃ１２）が使用可能である。

図９を参照すると、いくつかの例では、菱形形状を有する２つのＡＬＦ（９１０）～（９１１）が使用される。５×５の菱形のフィルタ（９１０）がクロマ成分（例えば、クロマブロック、クロマＣＢ）に適用されることができ、７×７の菱形のフィルタ（９１１）がルマ成分（例えば、ルマブロック、ルマＣＢ）に適用されることができる。ＡＬＦでは、他の適切な形状およびサイズが使用されることができる。例えば、９×９の菱形のフィルタが使用されることができる。

値（例えば、（９１０）のＣ０～Ｃ６、または（９２０）のＣ０～Ｃ１２）によって示される位置におけるフィルタ係数は、非ゼロであってもよい。さらに、ＡＬＦがクリッピング関数を含む場合、その位置におけるクリッピング値は、非ゼロであってもよい。

ルマ成分のブロック分類の場合、４×４ブロック（またはルマブロック、ルマＣＢ）は、複数（例えば、２５）のクラスのうちの１つと類別または分類されることができる。また、方向性パラメータＤおよび活性度値Ａの量子化値

に基づいて、式（１）を用いて分類インデックスＣを導出することができる。

方向性パラメータＤおよび量子化値

を算出するために、１次元ラプラシアンを用いて、垂直方向、水平方向、２つの対角方向（例えば、ｄ１、ｄ２）の勾配ｇ_ｖ、ｇ_ｈ、ｇ_ｄ１、よびｇ_ｄ２をそれぞれ以下のように算出することができる。

ここで、インデックスｉおよびｊは、４×４ブロック内の左上サンプルの座標を指し、Ｒ（ｋ，ｌ）は、座標（ｋ，ｌ）における再構築サンプルを示す。方向（例えば、ｄ１およびｄ２）は、２つの対角方向を指すことができる。

上述したブロック分類の複雑さを低減するために、サブサンプリングされた１次元ラプラシアン計算を適用することができる。図１０Ａ～１０Ｄは、垂直方向（図１０Ａ）、水平方向（図１０Ｂ）、および２つの対角方向ｄ１（図１０Ｃ）、ｄ２（図１０Ｄ）の勾配ｇ_ｖ、ｇ_ｈ、ｇ_ｄ１、およびｇ_ｄ２をそれぞれ算出するために使用されるサブサンプリング位置の例を示す。同じサブサンプリング位置が、異なる方向の勾配計算に使用されることができる。図１０Ａでは、ラベル「Ｖ」は、垂直勾配ｇ_ｖを算出するためのサブサンプリング位置を示している。図１０Ｂでは、ラベル「Ｈ」は、水平勾配ｇ_ｈを算出するためのサブサンプリング位置を示している。図１０ＡＣでは、ラベル「Ｄ１」は、ｄ１斜め勾配ｇ_ｄ１を算出するためのサブサンプリング位置を示している。図１０Ｄでは、ラベル「Ｄ２」は、ｄ２斜め勾配ｇ_ｄ２を算出するためのサブサンプリング位置を示している。

水平方向および垂直方向の勾配ｇ_ｖ、ｇ_ｈの最大値

と最小値

は、以下のように設定されることができる。

２つの対角方向の勾配ｇ_ｄ１、ｇ_ｄ２の最大値

と最小値

は、以下のように設定されることができる。

方向性パラメータＤは、上記の値と２つの閾値ｔ_１およびｔ_２に基づいて、以下のように導出されることができる。

ステップ１では、

および

が真の場合、Ｄは０に設定される。

ステップ２では、

の場合、ステップ３に進み、そうでない場合、ステップ４に進む。

ステップ３では、

の場合、Ｄは２に設定され、そうでない場合、Ｄは１に設定される。

ステップ４では、

の場合、Ｄは４に設定され、そうでない場合、Ｄは３に設定される。

活性度値Ａは、次のように算出されることができる。

Ａは、さらに、０以上４以下の範囲に量子化されることができ、量子化値は、

で表される。

ピクチャのクロマ成分の場合、ブロック分類が適用されないため、クロマ成分ごとに単一セットのＡＬＦ係数を適用することができる。

幾何学的変換がフィルタ係数および対応するフィルタクリッピング値（クリッピング値とも呼ばれる）に適用されることができる。ブロック（例えば、４×４ルマブロック）をフィルタリングする前に、例えば、該ブロックに対して算出された勾配値（例えば、ｇ_ｖ、ｇ_ｈ、ｇ_ｄ１、および／または、ｇ_ｄ２）に応じて、回転または斜めおよび垂直反転などの幾何学的変換をフィルタ係数ｆ（ｋ，ｌ）および対応するフィルタクリッピング値ｃ（ｋ，ｌ）に適用することができる。フィルタ係数ｆ（ｋ，ｌ）および対応するフィルタクリッピング値ｃ（ｋ，ｌ）に適用される幾何学的変換は、フィルタによってサポートされる領域におけるサンプルに幾何学的変換を適用することと等価であり得る。幾何学的変換は、それぞれの方向性を揃えることで、ＡＬＦが適用される異なるブロックをより似たものにすることができる。

斜め反転、垂直反転、および回転を含む３つの幾何学的変換は、それぞれ、式（９）～（１１）で説明されるように実行されることができる。

ここで、ＫはＡＬＦまたはフィルタのサイズであり、０≦ｋ，ｌ≦Ｋ－１は係数の座標である。例えば、位置（０，０）は、フィルタｆまたはクリッピング値行列（またはクリッピング行列）ｃの左上隅にあり、位置（Ｋ－１，Ｋ－１）は、フィルタｆまたはクリッピング値行列（またはクリッピング行列）ｃの右下隅にある。ブロックに対して算出された勾配値に応じて、変換をフィルタ係数ｆ（ｋ，ｌ）およびクリッピング値ｃ（ｋ，ｌ）に適用することができる。変換と４つの勾配との間の関係の一例を表１にまとめる。

いくつかの実施形態では、ＡＬＦフィルタパラメータは、ピクチャの適応パラメータセット（ＡＰＳ）でシグナリングされる。ＡＰＳでは、１つまたは複数のセット（例えば、２５セットまで）のルマフィルタ係数およびクリッピング値インデックスがシグナリングされ得る。一例では、１つまたは複数のセットのうちの１セットは、ルマフィルタ係数および１つまたは複数のクリッピング値インデックスを含み得る。１つまたは複数のセット（例えば、８セットまで）のクロマフィルタ係数およびクリッピング値インデックスがシグナリングされ得る。シグナリングオーバーヘッドを低減するために、ルマ成分の異なる分類の（例えば、異なる分類インデックスを有する）フィルタ係数をマージすることができる。スライスヘッダでは、現在のスライスに使用されるＡＰＳのインデックスがシグナリングされ得る。

一実施形態では、クリッピング値インデックス（クリッピングインデックスとも呼ばれる）は、ＡＰＳからデコードされることができる。クリッピング値インデックスは、例えば、クリッピング値インデックスと対応するクリッピング値との間の関係に基づいて、対応するクリッピング値を決定するために使用されることができる。この関係は、事前定義され、デコーダに記憶されることができる。一例では、この関係は、クリッピング値インデックスと対応するクリッピング値のルマテーブル（例えば、ルマＣＢに使用される）、クリッピング値インデックスと対応するクリッピング値のクロマテーブル（例えば、クロマＣＢに使用される）などのテーブルによって記述される。クリッピング値は、ビット深度Ｂに依存することができる。ビット深度Ｂは、内部ビット深度、フィルタリングされるＣＢ内の再構築サンプルのビット深度などを指すことができる。いくつかの例では、テーブル（例えば、ルマテーブル、クロマテーブル）は、式（１２）を用いて得られる。

ここで、ＡｌｆＣｌｉｐはクリッピング値、Ｂはビット深度（例えば、ｂｉｔＤｅｐｔｈ）、Ｎ（例えば、Ｎ＝４）は許容されるクリッピング値の数、（ｎ－１）はクリッピング値インデックス（クリッピングインデックスまたはｃｌｉｐＩｄｘとも呼ばれる）である。表２は、Ｎ＝４の場合の式（１２）を用いて得られるテーブルの一例である。クリッピングインデックス（ｎ－１）は、表２では０、１、２、および３であることができ、ｎはそれぞれ１、２、３、および４であり得る。表２は、ルマブロックまたはクロマブロックに使用されることができる。

現在のスライスのスライスヘッダでは、１つまたは複数のＡＰＳインデックス（例えば、７つのＡＰＳインデックスまで）が、現在のスライスに使用できるルマフィルタセットを指定するためにシグナリングされ得る。フィルタリングプロセスは、ピクチャレベル、スライスレベル、ＣＴＢレベルなど、１つまたは複数の適切なレベルで制御され得る。一実施形態では、フィルタリングプロセスは、さらにＣＴＢレベルで制御されることができる。フラグは、ＡＬＦがルマＣＴＢに適用されるか否かを示すためにシグナリングされ得る。ルマＣＴＢは、複数の固定フィルタセット（例えば、１６個の固定フィルタセット）、およびＡＰＳでシグナリングされたフィルタセット（シグナリングされたフィルタセットとも呼ばれる）の中から、フィルタセットを選択することができる。フィルタセットインデックスは、適用されるフィルタセット（例えば、複数の固定フィルタセットおよびシグナリングされたフィルタセットのうちのフィルタセット）を示すために、ルマＣＴＢに対してシグナリングされることができる。複数の固定フィルタセットは、エンコーダおよびデコーダで事前定義され、ハードコードされることができ、事前定義されたフィルタセットと呼ばれることができる。

クロマ成分の場合、現在のスライスに使用されるクロマフィルタセットを示すために、ＡＰＳインデックスをスライスヘッダでシグナリングすることができる。ＣＴＢレベルでは、ＡＰＳに１つを超えたクロマフィルタセットがある場合、クロマＣＴＢごとにフィルタセットインデックスをシグナリングすることができる。

フィルタ係数は、１２８に等しいノルムで量子化されることができる。乗算の複雑さを低減するために、ビットストリーム適合性を適用して、非中央位置の係数値が－２ ^７以上２ ^７－１以下の範囲になるようにすることができる。一例では、中心位置係数はビットストリームでシグナリングされず、１２８に等しいと見なすことができる。

いくつかの実施形態では、クリッピングインデックスおよびクリッピング値のシンタックスおよびセマンティクスは、以下のように定義される。

ａｌｆ＿ｌｕｍａ＿ｃｌｉｐ＿ｉｄｘ［ｓｆＩｄｘ］［ｊ］は、ｓｆＩｄｘで示されるシグナリングされたルマフィルタのｊ番目の係数を乗算する前に使用するクリッピング値のクリッピングインデックスを指定するために使用されることができる。ビットストリーム適合性の要件は、ａｌｆ＿ｌｕｍａ＿ｃｌｉｐ＿ｉｄｘ［ｓｆＩｄｘ］［ｊ］（ｓｆＩｄｘ＝０からａｌｆ＿ｌｕｍａ＿ｎｕｍ＿ｆｉｌｔｅｒｓ＿ｓｉｇｎａｌｌｅｄ＿ｍｉｎｕｓ１およびｊ＝０から１１）の値が、０以上３以下の範囲内であるべきことを含み得る。

要素ＡｌｆＣｌｉｐＬ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ｆｉｌｔＩｄｘ］［ｊ］（ｆｉｌｔＩｄｘ＝０からＮｕｍＡｌｆＦｉｌｔｅｒｓ－１およびｊ＝０から１１）を持つルマフィルタクリッピング値ＡｌｆＣｌｉｐＬ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］は、ｂｉｔＤｅｐｔｈがＢｉｔＤｅｐｔｈＹに等しく設定され、ｃｌｉｐＩｄｘがａｌｆ＿ｌｕｍａ＿ｃｌｉｐ＿ｉｄｘ［ａｌｆ＿ｌｕｍａ＿ｃｏｅｆｆ＿ｄｅｌｔａ＿ｉｄｘ［ｆｉｌｔＩｄｘ］［ｊ］に等しく設定されることに応じて、表２で指定されるように導出されることができる。

ａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｉｄｘ［ａｌｔＩｄｘ］［ｊ］は、インデックスａｌｔＩｄｘを持つ代替クロマフィルタのｊ番目の係数を乗算する前に使用するクリッピング値のクリッピングインデックスを指定するために使用されることができる。ビットストリーム適合性の要件は、ａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｉｄｘ［ａｌｔＩｄｘ］［ｊ］（ａｌｔＩｄｘ＝０からａｌｆ＿ｃｈｒｏｍａ＿ｎｕｍ＿ａｌｔ＿ｆｉｌｔｅｒｓ＿ｍｉｎｕｓ１、ｊ＝０から５）の値が、０以上３以下の範囲内であるべきことを含み得る。

要素ＡｌｆＣｌｉｐＣ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ａｌｔＩｄｘ］［ｊ］（ａｌｔＩｄｘ＝０からａｌｆ＿ｃｈｒｏｍａ＿ｎｕｍ＿ａｌｔ＿ｆｉｌｔｅｒｓ＿ｍｉｎｕｓ１、ｊ＝０から５）を持つクロマフィルタクリッピング値ＡｌｆＣｌｉｐＣ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ａｌｔＩｄｘ］は、ｂｉｔＤｅｐｔｈがＢｉｔＤｅｐｔｈＣに等しく設定され、ｃｌｉｐＩｄｘがａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｉｄｘ［ａｌｔＩｄｘ］［ｊ］に等しく設定されることに応じて、表２で指定されるように導出されることができる。

一実施形態では、フィルタリングプロセスは以下のように説明されることができる。デコーダ側では、ＣＴＢに対してＡＬＦが有効である場合、ＣＵ（またはＣＢ）内のサンプルＲ（ｉ，ｊ）がフィルタリングされることができ、その結果、以下で式（１３）を用いて示されるように、フィルタリングされたサンプル値Ｒ’（ｉ，ｊ）が得られる。一例では、ＣＵの各サンプルがフィルタリングされる。

ここで、ｆ（ｋ，ｌ）はデコードされたフィルタ係数を示し、Ｋ（ｘ，ｙ）はクリッピング関数であり、ｃ（ｋ，ｌ）はデコードされたクリッピングパラメータ（またはクリッピング値）を示す。変数ｋおよびｌは、－Ｌ／２とＬ／２の間で変化することができ、ここで、Ｌはフィルタ長を示す。クリッピング関数Ｋ（ｘ，ｙ）＝ｍｉｎ（ｙ，ｍａｘ（－ｙ，ｘ））は、クリッピング関数Ｃｌｉｐ３（－ｙ，ｙ，ｘ）に対応する。クリッピング関数Ｋ（ｘ，ｙ）を組み込むことで、ループフィルタリング法（例えばＡＬＦ）は非線形プロセスとなり、非線形ＡＬＦと呼ばれることができる。

非線形ＡＬＦでは、複数セットのクリッピング値が表３に提供されることができる。一例では、ルマセットは、４つのクリッピング値｛１０２４，１８１，３２，６｝を含み、クロマセットは、４つのクリッピング値｛１０２４，１６１，２５，４｝を含む。ルマセットの４つのクリッピング値は、ルマブロックのサンプル値（１０ビットでコード化されたもの）の全範囲（例えば、１０２４）を対数領域でほぼ均等に分割することで選択されることができる。クロマセットの場合、その範囲が４～１０２４となり得る。

選択されたクリッピング値は、次のように「ａｌｆ＿ｄａｔａ」シンタックス要素でコード化されることができ、即ち、適切なエンコードスキーム（例えば、Ｇｏｌｏｍｂエンコードスキーム）を使用して、表３に示すような選択されたクリッピング値に対応するクリッピングインデックスをエンコードすることができる。エンコードスキームは、フィルタセットインデックスをエンコードするために使用されるものと同じエンコードスキームであり得る。

一実施形態では、仮想境界フィルタリングプロセスを使用して、ＡＬＦのラインバッファ要件を低減することができる。したがって、修正されたブロック分類およびフィルタリングが、ＣＴＵ境界（例えば、水平ＣＴＵ境界）付近のサンプルに対して採用され得る。仮想境界（１１３０）は、図１１Ａに示すように、水平ＣＴＵ境界（１１２０）を「Ｎ_{ｓａｍｐｌｅｓ}」サンプルだけシフトすることにより、ラインとして定義されることができ、ここで、Ｎ_{ｓａｍｐｌｅｓ}は正の整数であり得る。一例では、Ｎ_{ｓａｍｐｌｅｓ}は、ルマ成分の場合は４に等しく、また、Ｎ_{ｓａｍｐｌｅｓ}は、クロマ成分の場合は２に等しい。

図１１Ａを参照すると、修正されたブロック分類が、ルマ成分に対して適用され得る。一例では、仮想境界（１１３０）より上にある４×４ブロック（１１１０）の１次元ラプラシアン勾配計算のために、仮想境界（１１３０）より上のサンプルのみが使用される。同様に、図１１Ｂを参照すると、ＣＴＵ境界（１１２１）からシフトされた、仮想境界（１１３１）より下にある４×４ブロック（１１１１）の１次元ラプラシアン勾配計算のために、仮想境界（１１３１）より下のサンプルのみが使用される。活性度値Ａの量子化は、１次元ラプラシアン勾配計算に使用されるサンプル数の減少を考慮に入れることで、適宜スケーリングされることができる。

フィルタリングプロセスの場合、仮想境界での対称パディング操作を、ルマ成分とクロマ成分の両方に使用することができる。図１２Ａ～１２Ｆは、仮想境界におけるルマ成分のこのように修正されたＡＬＦフィルタリングの例を示している。フィルタリングされるサンプルが仮想境界より下に位置する場合、仮想境界より上に位置する隣接サンプルをパディングすることができる。フィルタリングされるサンプルが仮想境界より上に位置する場合、仮想境界より下に位置する隣接サンプルをパディングすることができる。図１２Ａを参照すると、隣接サンプルＣ０は、仮想境界（１２１０）より下に位置するサンプルＣ２でパディングされることができる。図１２Ｂを参照すると、隣接サンプルＣ０は、仮想境界（１２２０）より上に位置するサンプルＣ２でパディングされることができる。図１２Ｃを参照すると、隣接サンプルＣ１～Ｃ３は、それぞれ、仮想境界（１２３０）より下に位置するサンプルＣ５～Ｃ７でパディングされることができる。図１２Ｄを参照すると、隣接サンプルＣ１～Ｃ３は、それぞれ、仮想境界（１２４０）より上に位置するサンプルＣ５～Ｃ７でパディングされることができる。図１２Ｅを参照すると、隣接サンプルＣ４～Ｃ８は、それぞれ、仮想境界（１２５０）より下に位置するサンプルＣ１０、Ｃ１１、Ｃ１２、Ｃ１１、およびＣ１０でパディングされることができる。図１２Ｆを参照すると、隣接サンプルＣ４～Ｃ８は、それぞれ、仮想境界（１２６０）より上に位置するサンプルＣ１０、Ｃ１１、Ｃ１２、Ｃ１１、およびＣ１０でパディングされることができる。

いくつかの例では、サンプルおよび隣接サンプルが、仮想境界の左側（または右側）および右側（または左側）に位置する場合に、上記の説明を適切に適応させることができる。

ルマ成分またはクロマ成分に適用される式（１２）は、式（１２’）のように書き換えることができる。

式（１２’）から分かるように、ＡＬＦにおけるクリッピング値（例えば、ＡｌｆＣｌｉｐ）は、ビット深度Ｂに依存する。さらに、クリッピング値は、２^Ｂ２^{（Ｂ（１－ｎ）／Ｎ）}に依存している。一実施形態では、Ｎが指定された場合（例えば、Ｎ＝４）、２^{（Ｂ（１－ｎ）／Ｎ）}は、ビット深度Ｂおよびクリッピングインデックス（ｎ－１）に依存している。したがって、丸め前の２^Ｂ２^{（Ｂ（１－ｎ）／Ｎ）}は２^Ｂに比例せず、そして、式（１２）または（１２’）を使用してクリッピング値を決定することは、いくつかの実施形態では効率的ではない可能性がある。

本開示の態様は、フィルタリング（例えば、非線形ループフィルタリング）で使用されるクリッピング値を導出することを含む。ＡＬＦで使用されるクリッピング値（例えば、ＡｌｆＣｌｉｐ）は、ビット深度Ｂおよびクリッピングインデックスに基づいて決定されることができる。本開示の態様によれば、クリッピング値のビット深度Ｂおよびクリッピングインデックスへの依存性は、コーディング効率を向上させるために分離されることができる。

クリッピング値は、クリッピングインデックスと関連付けることができる。クリッピング値は、第１の関数と第２の関数との乗算に基づくことができる。一実施形態では、クリッピング値は、第１の関数と第２の関数との乗算である複合関数によって決定されることができる。第１の関数は、ビット深度Ｂに依存することができ、クリッピングインデックスから独立しているため、クリッピングインデックスに依存しない。一例では、第１の関数は２^Ｂに比例するため、コーディング効率を向上させる。第２の関数は、クリッピングインデックスに依存し、ビット深度Ｂから独立することができるため、ビット深度Ｂに依存しない。

一実施形態では、式（１４）を用いて、ルマＣＢおよびクロマＣＢのＡＬＦで使用されるクリッピング値（例えば、ＡｌｆＣｌｉｐ）を導出することができる。

ここで、ＡｌｆＣｌｉｐはクリッピング値であり、ＢはＡＬＦの内部ビット深度または入力サンプルのビット深度を意味し、定数値αは非線形ＡＬＦフィルタの強度を制御する係数を意味し、ｍはクリッピングインデックスであり、Ｎは許容されるクリッピング値の数（例えば４）を示す。クリッピングインデックスｍは、０、・・・およびＮ－１であり得る。定数値αは、２．１、２．２、２．３、２．４、２．５、２．６、２．７および２．８を含むことができるが、これらに限定されない。

式（１４）に示す一例では、第１の関数は２^Ｂであり、第２の関数は２^－α＊ｍである。第１の関数は、ビット深度Ｂに依存しており、クリッピングインデックスｍから独立している。したがって、第１の関数は、クリッピングインデックスｍに依存しない。第２の関数は、クリッピングインデックスｍに依存しており、ビット深度Ｂから独立している。したがって、第２の関数は、ビット深度Ｂに依存しない。値２^{Ｂ－α＊ｍ}を丸めて（例えば、整数値に切り上げたり切り捨てたりして）、クリッピング値を生成することができる。

ルマ成分（またはＣＢ）とクロマ成分（またはＣＢ）は、式（１４）に示すような同じ関係を用いることができる。ルマＣＢの場合、定数値αは、第１の定数値であり得る。クロマＣＢの場合、定数値αは、第２の定数値であり得る。いくつかの例では、第１の定数値は、第２の定数値と同一である。いくつかの例では、第１の定数値は、第２の定数値とは異なる。

クリッピング値とクリッピングインデックスとの関係は、上に示した式（１４）のような方程式を用いて指定されることができる。また、この関係は、ルックアップテーブル（例えば、図１３～１４に示されるようなもの）などの他の適切な方法を用いて指定されることもできる。図１３は、本開示の一実施形態による、クリッピング値とビット深度Ｂおよびクリッピングインデックスｍとの関係を示す例示的なテーブルである。テーブル中のクリッピング値は、定数値αが２．３、Ｎが４である場合の式（１４）に基づいて決定されることができる。一例では、このテーブルは、ルマＣＢに適用されることができ、クリッピング値は、ルマクリッピング値（例えば、ＡｌｆＣｌｉｐ_Ｌ）と称することができる。

図１３を参照すると、クリッピングインデックス（例えば、ｃｌｉｐＩｄｘ）が０である場合、式（１４）を用いて決定されたクリッピング値は、式（１３）を用いて決定されたクリッピング値と同一である。クリッピングインデックス（例えば、ｃｌｉｐＩｄｘ）が１、２、または３である場合、式（１４）を用いて決定されたクリッピング値（イタリック体で強調表示されている）は、式（１３）を用いて決定されたクリッピング値（クロスアウトされている）とは異なる。例えば、ｂｉｔＤｅｐｔｈが８、ｃｌｉｐＩｄｘが１である場合、式（１４）を用いて決定されたクリッピング値は５２であり、式（１３）を用いて決定されたクリッピング値は６４である。

図１４は、本開示の一実施形態による、クリッピング値とビット深度Ｂおよびクリッピングインデックスｍとの関係を示す例示的なテーブルである。テーブル中のクリッピング値は、定数値αが２．６、Ｎが４である場合の式（１４）に基づいて決定される。一例では、図１４のテーブルは、クロマＣＢに適用されることができ、クリッピング値は、クロマクリッピング値（例えば、ＡｌｆＣｌｉｐ_Ｃ）と称することができる。

図１４を参照すると、クリッピングインデックス（例えば、ｃｌｉｐＩｄｘ）が０である場合、式（１４）を用いて決定されたクリッピング値は、式（１３）を用いて決定されたクリッピング値と同一である。クリッピングインデックス（例えば、ｃｌｉｐＩｄｘ）が１、２、または３である場合、式（１４）を用いて決定されたクリッピング値（イタリック体で強調表示されている）は、式（１３）を用いて決定されたクリッピング値（クロスアウトされている）とは異なる。例えば、ｂｉｔＤｅｐｔｈが８、ｃｌｉｐＩｄｘが１である場合、式（１４）を用いて決定されたクリッピング値は４２であり、式（１３）を用いて決定されたクリッピング値は６４である。

上述したように、ルマ成分（例えば、ルマＣＢ）およびクロマ成分（例えば、クロマＣＢ）は、式（１４）によって導出される異なるクリッピング値を使用することができる。例えば、式（１４）を用いてクリッピング値を導出する際に、図１３に示すルマ成分の場合には定数値αは２．３となり、図１４に示すクロマ成分の場合には定数値αは２．６となる。いくつかの例では、定数値αが２．３であると、ルマ成分について最適なコーディング効率が得られ、定数値αが２．６であると、クロマ成分について最適なコーディング効率が得られる。

上述したように、クリッピングインデックスは、例えば、クリッピングインデックスと対応するクリッピング値との関係に基づいて、対応するクリッピング値を決定するために使用されることができる。この関係は、事前定義され、デコーダに記憶されることができる。この関係は、事前定義されてデコーダに記憶され得るテーブル（例えば、図１３～１４に示されるようなもの）、方程式などによって記述されることができる。いくつかの例では、テーブル、および／または、方程式で使用されるパラメータ（例えば、ビット深度Ｂ、定数値α、Ｎ）がシグナリングされる。

式（１４）を用いたＡＬＦクリッピング値の決定は、式（１２）を用いた場合とは異なることがある。いくつかの違いを以下に示しており（イタリック体で強調表示されている）、また、取り消し線を付けたテキストが削除されたテキストを示す図１３～１４に示されたテーブルに示している。

ａｌｆ＿ｌｕｍａ＿ｃｌｉｐ＿ｉｄｘ［ｓｆＩｄｘ］［ｊ］は、ｓｆＩｄｘで示されるシグナリングされたルマフィルタのｊ番目の係数を乗算する前に使用する対応するクリッピング値のクリッピングインデックスを指定することができる。一例では、ａｌｆ＿ｌｕｍａ＿ｃｌｉｐ＿ｉｄｘ［ｓｆＩｄｘ］［ｊ］（ｓｆＩｄｘ＝０..ａｌｆ＿ｌｕｍａ＿ｎｕｍ＿ｆｉｌｔｅｒｓ＿ｓｉｇｎａｌｌｅｄ＿ｍｉｎｕｓ１およびｊ＝０..１１）の値が、０以上３以下の範囲内であることが、ビットストリーム適合性の要件となる。

要素ＡｌｆＣｌｉｐ_Ｌ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ｆｉｌｔＩｄｘ］［ｊ］（ｆｉｌｔＩｄｘ＝０..ＮｕｍＡｌｆＦｉｌｔｅｒｓ－１およびｊ＝０..１１）を持つルマフィルタクリッピング値ＡｌｆＣｌｉｐ_Ｌ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］は、例えば、ｂｉｔＤｅｐｔｈがＢｉｔＤｅｐｔｈ_Ｙに等しく設定され、ｃｌｉｐＩｄｘがａｌｆ＿ｌｕｍａ＿ｃｌｉｐ＿ｉｄｘ［ａｌｆ＿ｌｕｍａ＿ｃｏｅｆｆ＿ｄｅｌｔａ＿ｉｄｘ［ｆｉｌｔＩｄｘ］］［ｊ］に等しく設定されることに応じて、図１３に示されるテーブルで指定されるように導出されることができる。

ａｌｆ＿ｃｈｒｏｍａ＿ｎｕｍ＿ａｌｔ＿ｆｉｌｔｅｒｓ＿ｍｉｎｕｓ１＋１は、クロマ成分の代替フィルタの数を指定することができる。

０に等しいａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｆｌａｇ［ａｌｔＩｄｘ］は、インデックスａｌｔＩｄｘを持つクロマフィルタを使用する際に、クロマ成分に線形適応ループフィルタリングを適用することを指定でき、１に等しいａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｆｌａｇ［ａｌｔＩｄｘ］は、インデックスａｌｔＩｄｘを持つクロマフィルタを使用する際に、クロマ成分に非線形適応ループフィルタリングを適用することを指定できる。存在しない場合、ａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｆｌａｇ［ａｌｔＩｄｘ］は０に等しいと推測されることができる。

ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ａｂｓ［ａｌｔＩｄｘ］［ｊ］は、インデックスａｌｔＩｄｘを持つ代替クロマフィルタのｊ番目のクロマフィルタ係数の絶対値を指定することができる。ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ａｂｓ［ａｌｔＩｄｘ］［ｊ］が存在しない場合、０に等しいと推測されることができる。一例では、ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ａｂｓ［ａｌｔＩｄｘ］［ｊ］の値が、０以上２^７－１以下の範囲内であることが、ビットストリーム適合性の要件となる。

指数ゴロム二値化ｕｅｋ（ｖ）の次数ｋは３に等しく設定されることができる。

ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ｓｉｇｎ［ａｌｔＩｄｘ］［ｊ］は、インデックスａｌｔＩｄｘを持つ代替クロマフィルタのｊ番目のクロマフィルタ係数の符号を以下のように指定することができる。
ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ｓｉｇｎ［ａｌｔＩｄｘ］［ｊ］が０に等しい場合、対応するクロマフィルタ係数は正の値を持つことができる。
それ以外の場合（ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ｓｉｇｎ［ａｌｔＩｄｘ］［ｊ］が１に等しい場合）、対応するクロマフィルタ係数は負の値を持つことができる。

ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ｓｉｇｎ［ａｌｔＩｄｘ］［ｊ］が存在しない場合は、０に等しいと推測されることができる。

要素ＡｌｆＣｏｅｆｆ_Ｃ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ａｌｔＩｄｘ］［ｊ］（ａｌｔＩｄｘ＝０..ａｌｆ＿ｃｈｒｏｍａ＿ｎｕｍ＿ａｌｔ＿ｆｉｌｔｅｒｓ＿ｍｉｎｕｓ１、ｊ＝０..５）を持つクロマフィルタ係数ＡｌｆＣｏｅｆｆ_Ｃ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ａｌｔＩｄｘ］は、以下のように導出されることができる。

ＡｌｆＣｏｅｆｆ_Ｃ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ａｌｔＩｄｘ］［ｊ］＝ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ａｂｓ［ａｌｔＩｄｘ］［ｊ］＊（１－２＊ａｌｆ＿ｃｈｒｏｍａ＿ｃｏｅｆｆ＿ｓｉｇｎ［ａｌｔＩｄｘ］［ｊ］）式（１５）

一例では、ＡｌｆＣｏｅｆｆ_Ｃ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ａｌｔＩｄｘ］［ｊ］（ａｌｔＩｄｘ＝０..ａｌｆ＿ｃｈｒｏｍａ＿ｎｕｍ＿ａｌｔ＿ｆｉｌｔｅｒｓ＿ｍｉｎｕｓ１、ｊ＝０..５）の値が、－２^７－１以上２^７－１以下の範囲内であることが、ビットストリーム適合性の要件となる。

ａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｉｄｘ［ａｌｔＩｄｘ］［ｊ］は、インデックスａｌｔＩｄｘを持つ代替クロマフィルタのｊ番目の係数を乗算する前に使用するクリッピング値のクリッピングインデックスを指定することができる。一例では、ａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｉｄｘ［ａｌｔＩｄｘ］［ｊ］（ａｌｔＩｄｘ＝０..ａｌｆ＿ｃｈｒｏｍａ＿ｎｕｍ＿ａｌｔ＿ｆｉｌｔｅｒｓ＿ｍｉｎｕｓ１、ｊ＝０..５）の値が、０以上３以下の範囲内であることが、ビットストリーム適合性の要件となる。

要素ＡｌｆＣｌｉｐ_Ｃ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ａｌｔＩｄｘ］［ｊ］（ａｌｔＩｄｘ＝０..ａｌｆ＿ｃｈｒｏｍａ＿ｎｕｍ＿ａｌｔ＿ｆｉｌｔｅｒｓ＿ｍｉｎｕｓ１、ｊ＝０..５）を持つクロマフィルタのクリッピング値ＡｌｆＣｌｉｐ_Ｃ［ａｄａｐｔａｔｉｏｎ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄ］［ａｌｔＩｄｘ］は、例えば、ｂｉｔＤｅｐｔｈがＢｉｔＤｅｐｔｈ_Ｃに等しく設定され、ｃｌｉｐＩｄｘがａｌｆ＿ｃｈｒｏｍａ＿ｃｌｉｐ＿ｉｄｘ［ａｌｔＩｄｘ］［ｊ］に等しく設定されることに応じて、図１３に示されるテーブルで指定されるように導出されることができる。

図１５は、本開示の一実施形態によるプロセス（１５００）を概説するフローチャートである。プロセス（１５００）は、コード化ビデオシーケンスのピクチャにおけるＣＢを再構築するために使用されることができる。様々な実施形態において、プロセス（１５００）は、端末装置（３１０）、（３２０）、（３３０）および（３４０）における処理回路、ビデオエンコーダ（４０３）の機能を実行する処理回路、ビデオデコーダ（４１０）の機能を実行する処理回路、ビデオデコーダ（５１０）の機能を実行する処理回路、ビデオエンコーダ（６０３）の機能を実行する処理回路などの処理回路によって実行される。いくつかの実施形態では、プロセス（１５００）はソフトウェア命令で実装されるため、処理回路がソフトウェア命令を実行すると、処理回路はプロセス（１５００）を実行する。このプロセスは、（Ｓ１５０１）で開始し、（Ｓ１５１０）に進む。

（Ｓ１５１０）では、コード化ビデオシーケンスのピクチャにおけるＣＢのコード化情報をデコードすることができる。該コード化情報は、クリッピングインデックスｍを示すことができる。クリッピングインデックスｍは、ＣＢに適用されるフィルタのクリッピング値を示すことができる。ＣＢ内の再構築サンプルは、フィルタによってフィルタリングされ得る。いくつかの例では、フィルタは、式（１３）に対応する非線形ＡＬＦである。フィルタは、式（１３）を参照して以上で説明したように、フィルタ係数（例えば、ｆ（ｋ，ｌ））および対応するクリッピング値（例えば、ｃ（ｋ，ｌ））によって特徴付けられることができる。例えば、フィルタは、（例えば、式（１３）に示すように）クリッピング値に依存しているクリッピング関数（例えば、Ｃｌｉｐ３（－ｙ，ｙ，ｘ））を含む。ＣＢは、ルマＣＢまたはクロマＣＢであり得る。

フィルタリングプロセスは、ピクチャレベル、スライスレベル、ＣＴＢレベルなど、１つまたは複数の適切なレベルで制御され得る。いくつかの例では、クリッピングインデックスを示すコード化情報は、ピクチャのＡＰＳにおいてピクチャレベルでシグナリングされる。ＡＰＳでシグナリングされるコード化情報は、フィルタ係数とクリッピングインデックスとを含む少なくとも１つのシグナリングされたフィルタセットを含むことができる。また、フィルタセットインデックスは、例えば、ＣＢにどのＡＬＦを使用するかを示すために、ＣＴＢに対してシグナリングされることができる。フィルタセットインデックスは、例えば、デコーダによって受信されることができる。フィルタセットインデックスに基づいて、フィルタは複数のフィルタセットから決定され、その後、ＣＢに適用されることができる。いくつかの実施形態では、複数のフィルタセットは、少なくとも１つのシグナリングされたフィルタセットおよび複数の事前定義されたフィルタセットによって形成され得る。

（Ｓ１５２０）では、クリッピングインデックスに関連付けられたクリッピング値（例えば、ＡｌｆＣｌｉｐ、ＡｌｆＣｌｉｐＬ、またはＡｌｆＣｌｉｐＣ）を決定することができる。クリッピング値は、第１の関数と第２の関数との乗算に基づくことができる。第１の関数は、ビット深度Ｂに依存することができ、クリッピングインデックスｍから独立することができ、また、第２の関数は、クリッピングインデックスｍに依存することができ、ビット深度Ｂから独立することができる。第１の関数は、２^Ｂに比例することができるため、コーディング効率を向上させる。一実施形態では、クリッピング値は整数であり、第１の関数は２^Ｂであり、第２の関数は２^－αｍであり、ここで、αはフィルタの強度に関連付けられる定数値である。一例では、クリッピング値（例えば、整数）は、２^Ｂ２^－αｍに基づいて決められる。

上述したように、一例では、クリッピング値は、２^Ｂ２^－αｍの値を整数に丸めることに等しい。値２^Ｂ２^－αｍを、整数（例えば、最も近い整数）に切り上げたり切り捨てたりして、クリッピング値を生成することができる。一例では、クリッピング値は２^Ｂ２^－αｍを最も近い整数に丸めたものである。

ビット深度Ｂは、内部ビット深度、ＣＢ内の再構築サンプルのビット深度などであり得る。また、クリッピングインデックスｍは、非負の整数であり得る。一例では、クリッピングインデックスは、０からクリッピングインデックスの許容されるクリッピング値の数Ｎ（例えば、４）までの範囲のうちの１つである。クリッピングインデックスは、０、．．．、（Ｎ－１）のうちの１つであり得る。一例では、Ｎは４であり、従って、クリッピングインデックスは、０、１、２、および３のうちの１つである。ビット深度Ｂおよび許容されるクリッピング値の数Ｎは、事前定義され、エンコーダおよび／またはデコーダに記憶されることができる。あるいは、ビット深度Ｂおよび／またはＮは、デコーダにシグナリングされることができる。

定数値αは、ＣＢがルマＣＢであることに基づく第１の定数値とすることができ、また、定数値αは、ＣＢがクロマＣＢであることに基づく第２の定数値とすることができる。第１の定数値と第２の定数値は同一であっても異なっていてもよい。コーディング効率を向上させるために、第１の定数値および第２の定数値に最適値を使用することができる。一例では、第１の定数値は、ルマＣＢについては２．３であり、第２の定数値は、クロマＣＢについては２．６である。第１の定数値および／または第２の定数値は、事前定義され、エンコーダおよび／またはデコーダに記憶されることができる。あるいは、第１の定数値および／または第２の定数値は、デコーダにシグナリングされることができる。

一実施形態では、クリッピング値は、クリッピング値とクリッピングインデックスとの間の関係に基づいて、クリッピングインデックスから決定されることができる。この関係は、クリッピング値が、第１の関数（例えば、２^Ｂに比例する）と第２の関数との乗算によって決定されることを示すことができる。一例では、クリッピングインデックスｍおよびビット深度Ｂに基づいてクリッピング値を決定するために、ルックアップテーブル（例えば、図１３のルマＣＢ用のテーブル、図１４のクロマＣＢ用のテーブル）を使用することができる。

（Ｓ１５３０）では、ＣＢにフィルタを適用することにより、フィルタリングされたＣＢを生成することができる。

プロセス（１５００）は、適切に適応されることができる。プロセス（１５００）のステップは、変更および／または省略され得る。また、追加のステップを加えることができる。任意の適切な実装の順序を使用することができる。

以上で説明された技法は、コンピュータ読取可能な命令を使用するコンピュータソフトウェアとして実行され、１つまたは複数のコンピュータ読取可能な媒体に物理的に記憶されることができる。例えば、図１６は、開示された主題の特定の実施形態を実行することに適したコンピュータシステム（１６００）を示す。

コンピュータソフトウェアは、アセンブリ、コンパイル、リンク、またはそのようなメカニズムを施されて、１つまたは複数のコンピュータ中央処理装置（ＣＰＵ）、グラフィックスプロセッシングユニット（ＧＰＵ）などによって直接、または解釈、マイクロコード実行などによって実行されることができる命令を含むコードを作成する任意の適切な機械コードまたはコンピュータ言語を用いてコード化されることができる。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームデバイス、モノのインターネットデバイスなどを含む、様々なタイプのコンピュータまたはそのコンポーネント上で実行されることができる。

コンピュータシステム（１６００）について、図１６に示される例示的なコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実施するコンピュータソフトウェアの使用または機能の範囲に関していかなる限定を示唆することも意図しない。コンポーネントの構成は、コンピュータシステム（１６００）の例示的な実施形態で示されるコンポーネントのうちのいずれか１つ又は組み合わせに関する任意の依存性又は必要性を有するとして解釈されるべきではない。

コンピュータシステム（１６００）は、特定のヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（キーストローク、スワイプ、データグローブの動きなど）、オーディオ入力（音声、拍手など）、視覚入力（ジェスチャーなど）、嗅覚入力（示されていない）によって、１人以上のユーザによる入力に応答することができる。ヒューマンインターフェースデバイスは、オーディオ（音声、音楽、環境音など）、画像（走査画像、静止画像カメラから取得される写真画像など）、ビデオ（２次元ビデオ、立体ビデオを含む３次元ビデオなど）など、人間による意識的な入力に必ずしも直接関係しない特定のメディアをキャプチャすることにも使用できる。

入力ヒューマンインターフェースデバイスは、キーボード（１６０１）、マウス（１６０２）、トラックパッド（１６０３）、タッチスクリーン（１６１０）、データグローブ（図示せず）、ジョイスティック（１６０５）、マイクフォン（１６０６）、スキャナ（１６０７）、カメラ（１６０８）（それぞれ１つのみ示されている）のうちの１つまたは複数を含み得る。

コンピュータシステム（１６００）は、特定のヒューマンインターフェース出力デバイスをも含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音声、光、および嗅覚／味覚を介して１人以上のユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（１６１０）、データグローブ（図示せず）、またはジョイスティック（１６０５）による触覚フィードバックがあるが、入力デバイスとして機能しない触覚フィードバックデバイスであってもよい）、オーディオ出力デバイス（スピーカ（１６０９）、ヘッドホン（示されていない）など）、視覚出力デバイス（ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含むスクリーン（１６１０）（それぞれタッチスクリーン入力能力を有するかもしくは有せず、それぞれ触覚フィードバック能力を有するかもしくは有しない。それらの一部は、ステレオグラフィック出力などの手段を介して、２次元の視覚出力または３次元以上の出力を出力することができる）、仮想現実眼鏡（示されていない）、ホログラフィックディスプレおよびスモークタンク（示されていない）など）、およびプリンタ（示されていない）を含み得る。

コンピュータシステム（１６００）は、人間がアクセス可能な記憶装置およびそれらの関連する媒体、例えば、ＣＤ／ＤＶＤなどの媒体（１６２１）付きのＣＤ／ＤＶＤＲＯＭ／ＲＷ（１６２０）を含む光学媒体、サムドライブ（１６２２）、リムーバブルハードドライブまたはソリッドステートドライブ（１６２３）、テープやフロッピーディスクなどの従来の磁気媒体（示されていない）、セキュリティドングルなどの専用のＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイス（示されていない）などをも含むことができる。

ここで開示された主題に関連して使用される「コンピュータ読取可能な媒体」という用語は、送信媒体、搬送波、または他の一時的な信号を包含しないことをも当業者が理解するべきである。

コンピュータシステム（１６００）は、１つまたは複数の通信ネットワーク（１６５５）へのインターフェース（１６５４）をさらに含むことができる。ネットワークは、例えば、無線、有線、光学的であり得る。ネットワークは、さらに、ローカル、広域、大都市圏、車両用および産業用、リアルタイム、遅延耐性などであり得る。ネットワークの例は、イーサネット、無線ＬＡＮなどのローカルエリアネットワーク、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、および地上放送ＴＶを含むＴＶ有線または無線広域デジタルネットワーク、ＣＡＮＢｕｓを含む車両用や産業用などを含む。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス（１６４９）（例えば、コンピューターシステム（１６００）のＵＳＢポートなど）に接続された外部ネットワークインターフェースアダプターを必要とする。他のものは一般に、以下で説明するようにシステムバスに接続することにより、コンピューターシステム（１６００）のコアに統合される（例えば、ＰＣコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピューターシステムへのセルラーネットワークインターフェース）。これらのネットワークのいずれかを用いて、コンピュータシステム（１６００）は、他のエンティティと通信することができる。このような通信は、単方向、受信のみ（例えば、放送ＴＶ）、単方向の送信のみ（例えば、特定のＣＡＮｂｕｓデバイスへのＣＡＮｂｕｓ）、または双方向、例えばローカルまたはワイドエリアデジタルネットワークを用いる他のコンピュータシステムへの送信であり得る。特定のプロトコルおよびプロトコルスタックを上述したこれらのネットワークおよびネットワークインターフェースのそれぞれで使用することができる。

前述のヒューマンインターフェースデバイス、人間がアクセス可能な記憶装置、およびネットワークインターフェースは、コンピュータシステム（１６００）のコア（１６４０）に接続されることができる。

コア（１６４０）は、１つまたは複数の中央処理装置（ＣＰＵ）（１６４１）、グラフィックスプロセッシングユニット（ＧＰＵ）（１６４２）、フィールドプログラマブルゲートエリア（ＦＰＧＡ）（１６４３）の形態での専用プログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ（１６４４）、グラフィックアダプタ（１６５０）などを含むことができる。これらのデバイスは、リードオンリーメモリ（ＲＯＭ）（１６４５）、ランダムアクセスメモリ（１６４６）、非ユーザアクセス可能な内部ハードドライブ、ＳＳＤなどの内部大容量記憶装置（１６４７）とともに、システムバス（１６４８）を介して接続されてもよい。一部のコンピュータシステムでは、システムバス（１６４８）は、１つまたは複数の物理プラグの形態でアクセスでき、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にする。周辺機器は、コアのシステムバス（１６４８）に直接、または周辺バス（１６４９）を介して接続されることができる。一例では、ディスプレイ（１６１０）は、グラフィックアダプタ（１６５０）に接続されることができる。周辺バスのアーキテクチャは、ＰＣＩ、ＵＳＢなどを含む。

ＣＰＵ（１６４１）、ＧＰＵ（１６４２）、ＦＰＧＡ（１６４３）、およびアクセラレータ（１６４４）は、組み合わせて、前述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（１６４５）またはＲＡＭ（１６４６）に記憶されることができる。推移データはＲＡＭ（１６４６）にも記憶できるが、永続データは、例えば、内部大容量ストレージ（１６４７）に記憶されることができる。１つまたは複数のＣＰＵ（１６４１）、ＧＰＵ（１６４２）、大容量ストレージ（１６４７）、ＲＯＭ（１６４５）、ＲＡＭ（１６４６）などと密接に関連付けることができるキャッシュメモリを使用することにより、任意のメモリデバイスへの高速保存および検索が可能になる。

コンピュータ読取可能な媒体は、様々なコンピュータ実施操作を実行するためのコンピュータコードを備えることができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構築されたものであり得るか、もしくは、それらは、コンピュータソフトウェア技術の当業者に周知であって利用可能な種類のものであり得る。

限定ではなく、一例として、アーキテクチャを有するコンピュータシステム（１６００）、特にコア（１６４０）は、１つまたは複数の有形のコンピュータ読取可能な媒体に組み込まれたソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）の結果としての機能性を提供することができる。このようなコンピュータ読取可能な媒体は、以上で紹介したようにユーザがアクセス可能な大容量ストレージ、および、コア内部大容量ストレージ（１６４７）またはＲＯＭ（１６４５）などの非一時的な性質を持つコア（１６４０）の特定のストレージに関連付けられた媒体であり得る。本開示の様々な実施形態を実行するソフトウェアは、このようなデバイスに記憶され、コア（１６４０）によって実行されることができる。コンピュータ読取可能な媒体は、特定の必要に応じて、１つまたは複数のメモリデバイスまたはチップを含むことができる。ソフトウェアは、コア（１６４０）、具体的にはその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、ＲＡＭ（１６４６）に記憶されたデータ構造を定義すること、および、ソフトウェアで定義されたプロセスに従ってこのようなデータ構造を変更する言を含む、ここで説明する特定のプロセスまたは特定のプロセスの特定の部分を実行させることができる。加えて、または、代替として、コンピュータシステムは、本明細書に記載された特定のプロセスまたは特定のプロセスの特定の部分を実行するためにソフトウェアの代わりにまたは一緒に動作することができる回路（例えば、アクセラレータ（１６４４））に有線接続されたまたは組み込まれたロジックの結果としての機能性を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを含むことができ、その逆も同様である。コンピュータ読取可能な媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶する回路（集積回路（ＩＣ）など）、実行のためのロジックを具現化する回路、またはその両方を含むことができる。本開示は、ハードウェアとソフトウェアの任意の適切な組み合わせを含む。

付録Ａ：頭字語
ＪＥＭ：ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅｌ（共同探索モデル）
ＶＶＣ：ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（多用途ビデオコーディング）
ＢＭＳ：ＢｅｎｃｈｍａｒｋＳｅｔ（ベンチマークセット）
ＭＶ：ＭｏｔｉｏｎＶｅｃｔｏｒ（動きベクトル）
ＨＥＶＣ：ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（高効率ビデオコーディング）
ＭＰＭ：ｍｏｓｔｐｒｏｂａｂｌｅｍｏｄｅ（最確モード）
ＷＡＩＰ：Ｗｉｄｅ－ＡｎｇｌｅＩｎｔｒａＰｒｅｄｉｃｔｉｏｎ（広角イントラ予測）
ＳＥＩ：ＳｕｐｐｌｅｍｅｎｔａｒｙＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ（補助強化情報）
ＶＵＩ：ＶｉｄｅｏＵｓａｂｉｌｉｔｙＩｎｆｏｒｍａｔｉｏｎ（ビデオユーザビリティ情報）
ＧＯＰ：ＧｒｏｕｐｓｏｆＰｉｃｔｕｒｅｓ（ピクチャ群）
ＴＵ：ＴｒａｎｓｆｏｒｍＵｎｉｔｓ（変換ユニット）
ＰＵ：ＰｒｅｄｉｃｔｉｏｎＵｎｉｔｓ（予測ユニット）
ＣＴＵ：ＣｏｄｉｎｇＴｒｅｅＵｎｉｔｓ（コーディングツリーユニット）
ＣＴＢ：ＣｏｄｉｎｇＴｒｅｅＢｌｏｃｋｓ（コーディングツリーブロック）
ＰＢ：ＰｒｅｄｉｃｔｉｏｎＢｌｏｃｋｓ（予測ブロック）
ＨＲＤ：ＨｙｐｏｔｈｅｔｉｃａｌＲｅｆｅｒｅｎｃｅＤｅｃｏｄｅｒ（仮想参照デコーダ）
ＳＤＲ：ｓｔａｎｄａｒｄｄｙｎａｍｉｃｒａｎｇｅ（標準ダイナミックレンジ）
ＳＮＲ：ＳｉｇｎａｌＮｏｉｓｅＲａｔｉｏ（信号対雑音比）
ＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔｓ（中央処理装置）
ＧＰＵ：ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔｓ（グラフィックスプロセッシングユニット）
ＣＲＴ：ＣａｔｈｏｄｅＲａｙＴｕｂｅ（陰極線管）
ＬＣＤ：Ｌｉｑｕｉｄ－ＣｒｙｓｔａｌＤｉｓｐｌａｙ（液晶ディスプレイ）
ＯＬＥＤ：ＯｒｇａｎｉｃＬｉｇｈｔ－ＥｍｉｔｔｉｎｇＤｉｏｄｅ（有機発光ダイオード）
ＣＤ：ＣｏｍｐａｃｔＤｉｓｃ（コンパクトディスク）
ＤＶＤ：ＤｉｇｉｔａｌＶｉｄｅｏＤｉｓｃ（デジタルビデオディスク）
ＲＯＭ：Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ（リードオンリーメモリ）
ＲＡＭ：ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ（ランダムアクセスメモリ）
ＡＳＩＣ：Ａｐｐｌｉｃａｔｉｏｎ－ＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ（特定用途向け集積回路）
ＰＬＤ：ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ（プログラマブルロジックデバイス）
ＬＡＮ：ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ（ローカルエリアネットワーク）
ＧＳＭ：ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ（グローバルモバイル通信システム）
ＬＴＥ：Ｌｏｎｇ－ＴｅｒｍＥｖｏｌｕｔｉｏｎ（長期的な進化）
ＣＡＮＢｕｓ：ＣｏｎｔｒｏｌｌｅｒＡｒｅａＮｅｔｗｏｒｋＢｕｓ（コントローラエリアネットワークバス）
ＵＳＢ：ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ（ユニバーサルシリアルバス）
ＰＣＩ：ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ（ペリフェラルコンポーネントインターコネクト）
ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｅａｓ（フィールドプログラマブルゲートエリア）
ＳＳＤ：Ｓｏｌｉｄ－ＳｔａｔｅＤｒｉｖｅ（ソリッドステートドライブ）
ＩＣ：ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ（集積回路）
ＣＵ：ＣｏｄｉｎｇＵｎｉｔ（コーディングユニット）
ＰＤＰＣ：ＰｏｓｉｔｉｏｎＤｅｐｅｎｄｅｎｔＰｒｅｄｉｃｔｉｏｎＣｏｍｂｉｎａｔｉｏｎ（位置依存イントラ予測組み合わせ）
ＩＳＰ：ＩｎｔｒａＳｕｂ－Ｐａｒｔｉｔｉｏｎｓ（イントラサブパーティション）
ＳＰＳ：ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔｔｉｎｇ（シーケンスパラメータセット）

本開示は一部の例示的な実施形態を説明してきたが、本開示の範囲内に含まれる変更、置換、および様々な代替の均等物が存在する。したがって、当業者は、本明細書では明示的に示されていないか、または記載されていないが、本開示の原理を具現化し、その思想および範囲内に含まれる様々なシステムおよび方法を考案できることが理解されるであろう。

1648 システムバス
1650 グラフィックアダプタ
1654 ネットワークインターフェース

Claims

デコーダにおけるビデオデコードのための方法であって、
コード化ビデオシーケンスのピクチャにおけるコーディングブロックのコード化情報をデコードするステップであって、前記コード化情報は、クリッピングインデックスｍを示し、前記クリッピングインデックスｍは、前記コーディングブロックに適用されるフィルタのクリッピング値を示す、ステップと、
前記クリッピングインデックスｍに関連付けられる前記クリッピング値を決定するステップであって、前記クリッピング値は、第１の関数と第２の関数との乗算に基づくものであり、前記第１の関数は、ビット深度Ｂに依存し、かつ前記クリッピングインデックスｍから独立しており、前記第２の関数は、前記クリッピングインデックスｍに依存し、かつ前記ビット深度Ｂから独立しており、各前記クリッピングインデックスｍに対する前記第２の関数は、Ｎから独立しており、前記Ｎは、前記クリッピング値を含む許容されるクリッピング値の総数である、ステップと、
前記クリッピング値に対応する前記フィルタを前記コーディングブロックに適用することにより、フィルタリングされたコーディングブロックを生成するステップと、
を含み、
前記クリッピング値は、整数であり、
前記クリッピング値を決定する前記ステップは、２ ^Ｂ２ ^－αｍに基づいて前記クリッピング値を決定するステップを含み、前記第１の関数は２ ^Ｂであり、前記第２の関数は２ ^－αｍであり、αは前記フィルタの強度に関連付けられる定数値であり、
前記定数値αは、前記コーディングブロックがルマコーディングブロックである場合、第１の定数値であり、前記定数値αは、前記コーディングブロックがクロマコーディングブロックである場合、前記第１の定数値と異なる第２の定数値である、ビデオデコードのための方法。
前記フィルタは、前記クリッピング値に依存するクリッピング関数を含む非線形適応ループフィルタである、請求項１に記載の方法。
前記クリッピングインデックスｍは、０、１、２、および３のうちの１つである、請求項１に記載の方法。
前記第１の定数値は２．３であり、前記第２の定数値は２．６である、請求項１に記載の方法。
前記クリッピングインデックスｍを示す前記コード化情報は、前記ピクチャの適応パラメータセット（ＡＰＳ）でシグナリングされる、請求項１に記載の方法。
前記コーディングブロックに対するフィルタセットインデックスを受信するステップと、
前記フィルタセットインデックスに基づいて、複数のフィルタセットから前記フィルタを決定するステップと、をさらに含む、請求項５に記載の方法。
ビデオデコードのための装置であって、
請求項１～６のいずれか１項に記載の方法を実行するように構成される処理回路、
を備える装置。
コンピュータに、請求項１～６のいずれか１項に記載の方法を実行させるように構成されるプログラム。