JP2023531866A

JP2023531866A - ビデオコーディングのための方法、装置、非一時的コンピュータ可読記憶媒体およびコンピュータプログラム

Info

Publication number: JP2023531866A
Application number: JP2022568636A
Authority: JP
Inventors: リー，グイチュン; リー，シャン; リウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2021-05-25
Filing date: 2021-10-08
Publication date: 2023-07-26
Also published as: KR20230010739A; EP4133721A4; WO2022250723A1; EP4133721A1; US20220385905A1; US11652996B2; CN115699738A

Abstract

本開示の態様は、ビデオエンコーディング／デコーディングのための方法、装置、および非一時的コンピュータ可読記憶媒体を含む。装置は、コーディング領域のクロマ成分の量子化パラメータのオフセットを（ｉ）クロマ成分のピクセル値範囲、（ｉｉ）クロマ成分の複雑度レベル、または（ｉｉｉ）クロマ成分のノイズレベルのうちの１つに基づいて決定する処理回路を含む。処理回路は、量子化パラメータおよび決定されたオフセットに基づいて、コーディング領域の変換係数に対して量子化処理を実行する。処理回路は、量子化された変換係数を含むビデオビットストリームを生成する。

Description

［関連出願の相互参照］
本出願は、2021年5月25日に出願された米国仮出願第63/193,003号、"Adaptive Chroma QP Offset"に対する優先権の利益を主張する、2021年10月6日に出願された米国特許出願第１7/495,535号、"METHOD AND APPARATUS FOR VIDEO CODING"に対する優先権の利益を主張する。先行出願の開示は、その全体が参照により本出願に組み込まれる。

本開示は、概してビデオコーディングに関連する実施形態を説明する。

本明細書で提供される背景技術の説明は、本開示のコンテンツを概して示すことを目的としている。現在名前を挙げられている発明者の業績は、本背景技術に記載された範囲において、また、出願時に従来技術として認められない可能性のある記載の態様は、明示的にも黙示的にも本開示に対する従来技術として認められない。

ビデオコーディング（Video coding）およびデコーディング（decoding）は、動き補償を伴うインターピクチャ（inter-picture）予測を使用して実行されることができる。非圧縮デジタルビデオは一連のピクチャを含むことができ、各ピクチャは、例えば、１９２０×１０８０ルミナンス（luminance）サンプルと関連するクロミナンス（chrominance）サンプルの空間寸法（spatial dimension）を有している。一連のピクチャは、例えば毎秒６０ピクチャまたは６０Ｈｚの、固定または可変ピクチャレート（非公式には「フレームレート」とも呼ばれる）を有することができる。非圧縮ビデオは、顕著なビットレート要件を有する。例えば、サンプルあたり８ビットでの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚフレームレートでの１９２０×１０８０ルミナンスサンプル解像度）は、１．５Ｇｂｉｔ／ｓに近い帯域幅を必要とする。１時間のこのようなビデオは、６００ＧＢｙｔｅｓを超えるストレージ空間を必要とする。

ビデオコーディングおよびデコーディングの１つの目的は、圧縮を通じた入力ビデオ信号の冗長性の削減であることができる。圧縮は、前述の帯域幅またはストレージ空間の要件を、場合によっては２桁以上削減するのに役立つことができる。ロスレス（lossless）圧縮とロッシー（lossy）圧縮の両方、およびそれらの組み合わせを使用することができる。ロスレス圧縮は、圧縮された元の信号から元の信号の正確なコピーを再構成できる技法を指す。ロッシー圧縮を使用する場合、再構成された信号は元の信号と同一ではない可能性があるが、元の信号と再構成された信号との間の歪みは、再構成された信号が意図されたアプリケーションに役立つように十分小さい。ビデオの場合、ロッシー圧縮が広く採用されている。許容される歪みの量はアプリケーションに依存する。例えば、特定のコンシューマストリーミングアプリケーションのユーザは、テレビ配信アプリケーションのユーザよりも高い歪みを許容する場合がある。達成可能な圧縮率（compression ratio）は：受け入れ可能／許容可能な歪みが大きいほど、圧縮率が高くなることができることを反映することができる。

ビデオエンコーダおよびデコーダは、例えば、動き補償（motion compensation）、変換、量子化、およびエントロピーコーディングを含むいくつかの幅広いカテゴリからの技法を利用することができる。

ビデオコーデック技術は、イントラコーディング（intra coding）として知られる技法を含むことができる。イントラコーディングでは、サンプル値は、以前に再構成された参照（reference）ピクチャからのサンプルまたは他のデータを参照せずに表される。いくつかのビデオコーデックでは、ピクチャは空間的にサンプルのブロックに細分される（subdivided）。サンプルのすべてのブロックがイントラモードでコーディングされる（coded）とき、そのピクチャはイントラピクチャであることができる。イントラピクチャと、独立したデコーダリフレッシュピクチャなどのその派生物とは、デコーダの状態をリセットするために使用することができ、したがって、コーディングされたビデオビットストリームとビデオセッションの最初のピクチャとして、または静止画像として使用されることができる。イントラブロックのサンプルは変換にさらされることができ、変換係数はエントロピーコーディングの前に量子化されることができる。イントラ予測は、変換前領域（pre-transform domain）でサンプル値を最小化する技法であることができる。場合によっては、変換後のＤＣ値が小さく、ＡＣ係数が小さいほど、エントロピーコーディング後のブロックを表すために所与の量子化ステップサイズで必要なビットが少なくなる。

例えばＭＰＥＧ－２世代コーディング技術から知られているような従来のイントラコーディングは、イントラ予測を使用しない。しかし、いくつかのより新しいビデオ圧縮技術は、例えば、空間的に隣接し、デコーディング順において先行するデータのブロックのエンコーディングおよび／またはデコーディング中に得られた周囲のサンプルデータおよび／またはメタデータから、試みる技法を含む。そのような技法は、以降、「イントラ予測」技法と呼ばれる。少なくともいくつかのケースでは、イントラ予測は、再構成中の現在のピクチャからの参照データのみを使用し、参照ピクチャからのものを使用しないことに留意されたい。

イントラ予測は多くのさまざまな形態であることができる。そのような技法の１つ超が所与のビデオコーディング技術において使用することができる場合、使用中の技法はイントラ予測モードでコーディングされることができる。場合によっては、モードはサブモードおよび／またはパラメータを有することができ、それらは個別にコーディングされることができるまたはモードコードワードに含まれることができる。どのコードワードが所与のモード、サブモード、および／またはパラメータの組み合わせに使用されるかは、イントラ予測によるコーディング効率ゲインに影響を与える可能性があるので、コードワードをビットストリームに変換するために使用されるエントロピーコーディング技術も影響を与える可能性がある。

イントラ予測の特定のモードはＨ．２６４で導入され、Ｈ．２６５で洗練され、共同探索モデル（ＪＥＭ）、多用途ビデオコーディング（ＶＶＣ）、およびベンチマークセット（ＢＭＳ）などのより新しいコーディング技術でさらに洗練された。予測子ブロック（predictor block）が、すでに利用可能なサンプルに属する隣接サンプル値を使用して形成されることができる。隣接サンプルのサンプル値は、方向に従って予測子ブロックにコピーされる。使用中の方向への参照は、ビットストリームでコーディングされることができるまたはそれ自体を予測され得る。

図１Ａを参照すると、右下に示されたのは、Ｈ．２６５の３３の可能な予測方向（３５のイントラ予測モードのうちの３３の角度モードに対応）から知られる９の予測方向のサブセットである。矢印が収束する点（１０１）は、予測されているサンプルを表す。矢印は、サンプルが予測されている方向を表す。例えば、矢印（１０２）は、サンプル（１０１）が、水平から４５度の角度で、右上の１つまたは複数のサンプルから予測されることを示す。同様に、矢印（１０３）は、サンプル（１０１）が、水平から２２．５度の角度で、サンプル（１０１）の左下の１つまたは複数のサンプルから予測されることを示す。

引き続き図１Ａを参照すると、左上には、４×４サンプルの正方形ブロック（１０４）（太い破線で示される）が示されている。正方形ブロック（１０４）は、それぞれが、「Ｓ」、Ｙ次元におけるその位置（例えば、行インデックス）、およびＸ次元におけるその位置（例えば、列インデックス）でラベル付けされた１６サンプルを含む。例えば、サンプルＳ２１は、Ｙ次元（上から）における２番目のサンプルかつＸ次元（左から）における１番目のサンプルである。同様に、サンプルＳ４４は、ＹおよびＸ次元の両方においてブロック（１０４）における４番目のサンプルである。ブロックはサイズが４×４サンプルなので、Ｓ４４は、右下にある。さらに、同様な番号付け体系に従う参照サンプルが示されている。参照サンプルは、Ｒ、ブロック（１０４）に対するそのＹ位置（例えば、行インデックス）およびＸ位置（列インデックス）でラベル付けされる。Ｈ．２６４とＨ．２６５の両方において、予測サンプルは再構成中のブロックに隣接している。したがって、負の値を使用する必要がない。

イントラピクチャ予測は、シグナリングされた予測方向によって適切に隣接するサンプルから参照サンプル値をコピーすることによって機能することができる。例えば、コードディングされたビデオビットストリームが、このブロックについて矢印（１０２）と一致する予測方向－すなわち、サンプルが、水平から４５度の角度で右上の１つまたは複数の予測サンプルから予測されるーことを示すシグナリングを含むと仮定する。この場合、サンプルＳ４１、Ｓ３２、Ｓ２３、およびＳ１４は同じ参照サンプルＲ０５から予測される。サンプルＳ４４は、次いで、参照サンプルＲ０８から予測される。

場合によっては、複数の参照サンプルの値は、参照サンプルを算出するために、特に方向が４５度で均等に分割されていない場合に、例えば補間によって、組み合わされ得る。

ビデオコーディング技術が発展するにつれて、可能な方向の数は増加した。Ｈ．２６４（２００３年）では、９の異なる方向を表すことができた。Ｈ．２６５（２０１３年）では３３に増加し、ＪＥＭ／ＶＶＣ／ＢＭＳは開示時に最大６５の方向をサポートできる。最も可能性の高い方向を識別するための実験が行われ、エントロピーコーディングにおける特定の技法は、少ない数のビットで見込みの最も可能性の高い方向を表すために使用され、可能性の低い方向に対する特定のペナルティを容認する。さらに、方向自体は、隣接する、すでにデコーディングされたブロックで使用される隣接方向から予測される場合がある。

図１Ｂは、経時的な予測方向の増加する数を示すために、ＪＥＭによる６５のイントラ予測方向を示す概略図（１０５）を示す。

方向を表すコーディングされたビデオビットストリームにおけるイントラ予測方向ビットのマッピングは、ビデオコーディング技術ごとに異なる可能性があり、また、例えば、予測方向の単純な直接マッピングからイントラ予測モード、コードワード、ほとんどの可能性のあるモードを含む複雑な適応スキーム、および類似した技法まで及ぶことができる。しかし、すべての場合において、他の特定の方向よりも統計的にビデオコンテンツにおいて発生する可能性が低い特定の方向が存在する可能性がある。ビデオ圧縮の目的は冗長性の削減であるため、うまく機能するビデオコーディング技術では、これらの可能性の低い方向は、可能性の高い方向よりも多くのビット数で表される。

動き補償は、ロッシー圧縮技術であることができ、かつ、以前に再構成されたピクチャまたはその一部（参照ピクチャ）からのサンプルデータのブロックが、動きベクトル（以下ＭＶ）によって示される方向に空間的にシフトされた後に、新しく再構成されたピクチャまたはその一部の予測のために使用される技術に関連付けることができる。場合によっては、参照ピクチャは、現在再構成中のピクチャと同じであることができる。ＭＶは、ＸおよびＹの２次元、または３次元を有することができ、第３の次元は、使用中の参照ピクチャの表示である（後者は、間接的に、時間次元であることができる）。

いくつかのビデオ圧縮技術では、サンプルデータのある領域に適用可能なＭＶは、他のＭＶから、例えば、再構成中の領域に空間的に隣接し、デコーディング順にそのＭＶに先行するサンプルデータの別の領域に関連するものから予測することができる。これにより、ＭＶのコーディングに必要なデータ量を大幅に削減することができ、それによって冗長性を除去し、圧縮を増加させる。ＭＶ予測は、例えば、カメラ（ナチュラルビデオとして知られる）から導出される入力ビデオ信号をコーディングする際に、単一のＭＶが適用される領域よりも大きい領域が同様の方向に移動する統計的可能性があり、従って、ある場合には、隣接領域のＭＶから導出された同様の動きベクトルを用いて予測することができるので、効果的に機能することができる。その結果、所与の領域で見つかったMVは、周囲のＭＶから予測されるＭＶと類似または同一になり、そして、それは、エントロピーコーディングの後、ＭＶを直接コーディングする場合に使用されるであろうものよりも、より少ない数のビットで表すことができる。場合によっては、ＭＶ予測は、元の信号（すなわち、サンプルストリーム）から導出された信号（すなわち、ＭＶ）のロスレス圧縮の例であることができる。他の場合には、ＭＶ予測それ自体は、例えば、いくつかの周囲のＭＶから予測子を計算する際の丸め誤差のために、ロッシーである可能性がある。

様々なＭＶ予測メカニズムが、Ｈ．２６５／ＨＥＶＣ（ITU-T Rec. H.265,“High Efficiency Video Coding”, December 2016）に記述されている。Ｈ．２６５が提供する多くのＭＶ予測メカニズムのうち、本明細書に記載されるものは、以下「空間マージ」と呼ばれる技法である。

図１Ｃを参照すると、現在のブロック（１１１）は、空間的にシフトされた同じサイズの以前のブロックから予測可能であることが、動き探索処理中にエンコーダによって見出されたサンプルを含むことができる。ＭＶを直接コーディングする代わりに、ＭＶは、Ａ０、Ａ１、およびＢ０、Ｂ１、Ｂ２（それぞれ１１２から１１６）で示される５つの周囲のサンプルのいずれかに関連付けられたＭＶを使用して、１つ以上の参照ピクチャに関連付けられたメタデータから、例えば、最新の（デコーディング順において）参照ピクチャから導出することができる。Ｈ.２６５では、ＭＶ予測は、隣接するブロックが使用しているのと同じ参照ピクチャからの予測子を使用することができる。

本開示の態様は、ビデオエンコーディング／デコーディングのための装置を提供する。装置は、（ｉ）クロマ成分（chroma component）のピクセル値範囲、（ｉｉ）クロマ成分の複雑度（complexity）レベル、または（ｉｉｉ）クロマ成分のノイズレベルのうちの１つに基づいて、コーディング領域のクロマ成分の量子化パラメータのオフセットを決定する処理回路を含む。処理回路は、量子化パラメータおよび決定されたオフセットに基づいて、コーディング領域の変換係数に対して量子化処理を実行する。処理回路は、量子化された変換係数を含むビデオビットストリームを生成する。

一実施形態では、処理回路は量子化パラメータのオフセットを含むビデオビットストリームを生成する。

一実施形態では、処理回路は、コーディング領域のルマ成分（luma component）のピクセル値範囲を決定する。処理回路は、ルマ成分のピクセル値範囲とクロマ成分のピクセル値範囲の範囲比（range ratio）を決定する。処理回路は、範囲比と範囲しきい値との間の比較に基づいて量子化パラメータのオフセットを決定する。

一実施形態では、ルマ成分およびクロマ成分のそれぞれについて、それぞれの成分のピクセル値範囲は、それぞれの成分のピクセルの最大ピクセル値と最小ピクセル値との間の差である。

一実施形態では、処理回路は、コーディング領域のルマ成分の複雑度レベルを決定する。処理回路は、ルマ成分の複雑度レベルとクロマ成分の複雑度レベルとの間の複雑度比（complexity ratio）を決定する。処理回路は、複雑度比と複雑度しきい値との間の比較に基づいて量子化パラメータのオフセットを決定する。

一実施形態では、ルマ成分とクロマ成分のそれぞれについて、それぞれの成分の複雑度レベルは、（ｉ）それぞれの成分のピクセルのピクセル値の分散、（ｉｉ）それぞれの成分の残差（residuals）の絶対差の和、または（ｉｉｉ）それぞれの成分の残差の絶対変換差（absolute transformed differences）の和のうちの１つに基づいている。

一実施形態では、処理回路は、クロマ成分のノイズレベルとノイズしきい値との間の比較に基づいて量子化パラメータのオフセットを決定する。

一実施形態では、処理回路は、コーディング領域のルマ成分のノイズレベルを決定する。処理回路は、ルマ成分のノイズレベルとクロマ成分のノイズレベルとの間のノイズ比を決定する。処理回路は、ノイズ比とノイズ比しきい値との間の比較に基づいて量子化パラメータのオフセットを決定する。

一実施形態では、ルマ成分およびクロマ成分のそれぞれについて、それぞれの成分のノイズレベルは、それぞれの成分のピクセルに適用されるエッジ検出と、エッジ検出の結果に適用されるラプラシアン畳み込みに基づいている。

本開示の態様は、ビデオのエンコーディング／デコーディングのための方法を提供する。方法は、ビデオのエンコーディング／デコーディングのために装置によって実行される処理のいずれか１つまたはそれらの組み合わせを実行することができる。方法では、量子化パラメータのオフセットが、（ｉ）クロマ成分のピクセル値範囲、（ｉｉ）クロマ成分の複雑度レベル、または（ｉｉｉ）クロマ成分のノイズレベルのうちの１つに基づいて、コーディング領域のクロマ成分に対して決定される。量子化パラメータおよび決定されたオフセットに基づいて、コーディング領域の変換係数に対して量子化処理が実行される。ビデオビットストリームが量子化された変換係数を含むように生成される。

開示の態様はまた、少なくとも１つのプロセッサによって実行されると、少なくとも１つのプロセッサにビデオのエンコーディング／デコーディングのための方法のいずれか１つまたはそれらの組み合わせを実行させる命令を格納する非一時的コンピュータ可読媒体を提供する。

開示された主題のさらなる特徴、性質、および様々な利点は、以下の詳細な説明および添付の図面からより明らかになる。

イントラ予測モードの例示的なサブセットの概略図である。

例示的なイントラ予測方向の図である。

１つの例における現在のブロックとその周囲の空間マージ候補の概略図である。

一実施形態による通信システムの簡略化されたブロック図の概略図である。

一実施形態によるデコーダの簡略化されたブロック図の概略図である。

一実施形態によるエンコーダの簡略化されたブロック図の概略図である。

別の実施形態によるエンコーダのブロック図を示す。

別の実施形態によるデコーダのブロック図を示す。

本開示の一実施形態による例示的なノイズ検出プロセスを示す。

本開示の一実施形態による８ビットコーディング領域の色成分の例示的なヒストグラムを示す。

一実施形態による例示的なフローチャートを示す。

一実施形態によるコンピュータシステムの概略図である。

Ｉ．ビデオデコーダおよびエンコーダシステム

図２は、本開示の一実施形態による通信システム（２００）の簡略化されたブロック図を示す。通信システム（２００）は、例えばネットワーク（２５０）を介して、互いに通信することができる複数の端末装置を含む。例えば、通信システム（２００）は、ネットワーク（２５０）を介して相互接続された第１の端末装置（２１０）および（２２０）のペアを含む。図２の例では、第１の端末装置（２１０）および（２２０）のペアは、データの一方向伝送を行う。例えば、端末装置（２１０）は、ネットワーク（２５０）を介して他の端末装置（２２０）に伝送するために、ビデオデータ（例えば、端末装置（２１０）によってキャプチャされるビデオピクチャのストリーム）をコーディングし得る。エンコーディングされたビデオデータは、１つ以上のコーディングされたビデオビットストリームの形態で伝送することができる。端末装置（２２０）は、ネットワーク（２５０）からコーディングされたビデオデータを受信し、コーディングされたビデオデータをデコーディングして、ビデオピクチャを復元し、復元されたビデオデータに従ってビデオピクチャを表示し得る。一方向データ伝送は、メディア提供アプリケーション等において一般的であり得る。

別の例では、通信システム（２００）は、例えばビデオ会議中に発生し得るコーディングされたビデオデータの双方向伝送を行う第２の端末装置（２３０）および（２４０）のペアを含む。データの双方向伝送のために、一例では、端末装置（２３０）および（２４０）の各端末装置が、ネットワーク（２５０）を介して端末装置（２３０）および（２４０）の他方の端末装置に伝送するために、ビデオデータ（例えば、端末装置によってキャプチャされるビデオピクチャのストリーム）をコーディングし得る。端末装置（２３０）および（２４０）の各端末装置はまた、端末装置（２３０）および（２４０）の他方の端末装置によって伝送されたコーディングされたビデオデータを受信し、コーディングされたビデオデータをデコーディングして、ビデオピクチャを復元し、復元されたビデオデータに従って、アクセス可能なディスプレイ装置でビデオピクチャを表示し得る。

図２の例では、端末装置（２１０）、（２２０）、（２３０）および（２４０）は、サーバ、パーソナルコンピュータおよびスマートフォンとして示され得るが、本開示の原理は、そのように限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレーヤおよび／または専用のビデオ会議装置への適用を見出す。ネットワーク（２５０）は、例えば有線および／または無線通信ネットワークを含む、端末装置（２１０）、（２２０）、（２３０）および（２４０）の間でコーディングされたビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク（２５０）は、回線交換および／またはパケット交換チャネル内でデータを交換し得る。代表的なネットワークは、電気通信ネットワーク、ローカルエリアネットワーク、ワイドエリアネットワークおよび／またはインターネットを含む。本説明の目的のために、ネットワーク（２５０）のアーキテクチャおよびトポロジーは、以下に説明しない限り、本開示の動作には重要ではない。

図３は、開示された主題のアプリケーションの一例として、ストリーミング環境におけるビデオエンコーダおよびビデオデコーダの配置を示す。開示された主題は、例えば、ビデオ会議、デジタルＴＶ、ＣＤ、ＤＶＤ、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの格納などを含む、他のビデオ対応アプリケーションにも同様に適用可能であることができる。

ストリーミングシステムは、例えば、非圧縮のビデオピクチャのストリーム（３０２）を生成するビデオソース（３０１）、例えばデジタルカメラを含むことができる、キャプチャサブシステム（３１３）を含み得る。一例では、ビデオピクチャのストリーム（３０２）は、デジタルカメラによって撮影されるサンプルを含む。エンコーディングされたビデオデータ（３０４）（またはコーディングされたビデオビットストリーム）と比較するときに高いデータボリュームを強調する太い線として描かれたビデオピクチャのストリーム（３０２）は、ビデオソース（３０１）に結合されたビデオエンコーダ（３０３）を含む電子デバイス（３２０）によって処理することができる。ビデオエンコーダ（３０３）は、以下により詳細に説明されるように、開示された主題の態様を可能にするまたは実装するために、ハードウェア、ソフトウェア、またはそれらの組み合わせを含むことができる。ビデオピクチャのストリーム（３０２）と比較するときにより低いデータボリュームを強調するために細い線として示されたエンコーディングされたビデオデータ（３０４）（またはエンコーディングされたビデオビットストリーム（３０４））は、将来の使用のためにストリーミングサーバ（３０５）に格納することができる。図３のクライアントサブシステム（３０６）および（３０８）のような１つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ（３０５）にアクセスして、エンコーディングされたビデオデータ（３０４）のコピー（３０７）および（３０９）を取り出すことができる。クライアントサブシステム（３０６）は、例えば電子デバイス（３３０）内にビデオデコーダ（３１０）を含むことができる。ビデオデコーダ（３１０）は、エンコーディングされたビデオデータの入力コピー（３０７）をデコーディングし、ディスプレイ（３１２）（例えばディスプレイスクリーン）または他のレンダリングデバイス（図示せず）上にレンダリングすることができるビデオピクチャ（３１１）の出力ストリームを生成する。いくつかのストリーミングシステムでは、エンコーディングされたビデオデータ（３０４）、（３０７）、および（３０９）（例えば、ビデオビットストリーム）は、特定のビデオコーディング／圧縮規格に従ってエンコーディングすることができる。これらの規格の例は、ＩＴＵ－Ｔ勧告Ｈ．２６５を含む。一例では、開発中のビデオコーディング規格は、Versatile Video Coding（多用途ビデオコーディング）（ＶＶＣ）として非公式に知られている。開示された主題は、ＶＶＣの文脈で使用され得る。

電子デバイス（３２０）および（３３０）は、他のコンポーネント（図示せず）を含むことができることに留意されたい。例えば、電子デバイス（３２０）は、ビデオデコーダ（図示せず）を含むことができ、電子デバイス（３３０）は、ビデオエンコーダ（図示せず）を含むこともできる。

図４は、本開示の一実施形態によるビデオデコーダ（４１０）のブロック図を示す。ビデオデコーダ（４１０）は、電子デバイス（４３０）に含まれることができる。電子デバイス（４３０）は、受信器（４３１）（例えば、受信回路）を含むことができる。ビデオデコーダ（４１０）は、図３の例のビデオデコーダ（３１０）の代わりに使用することができる。

受信器（４３１）は、ビデオデコーダ（４１０）によってデコーディングされることになる１つ以上のコーディングされたビデオシーケンスを受信し得る；同じまたは別の実施形態では、一度に１つのコーディングされたビデオシーケンスであり、各コーディングされたビデオシーケンスのデコーディングは、他のコーディングされたビデオシーケンスから独立している。コーディングされたビデオシーケンスは、チャネル（４０１）から受信され得、このチャネルは、エンコーディングされたビデオデータを格納するストレージデバイスへのハードウェア／ソフトェアリンクであり得る。受信器（４３１）は、エンコーディングされたビデオデータを、それぞれの使用エンティティ（図示せず）に転送され得る他のデータ、例えばコーディングされたオーディオデータおよび／または補助データストリームと共に受信し得る。受信器（４３１）は、コーディングされたビデオシーケンスを他のデータから分離し得る。ネットワークジッタに対抗するために、バッファメモリ（４１５）が、受信器（４３１）とエントロピーデコーダ／パーサ（４２０）（以下、「パーサ（４２０）」）との間に結合され得る。特定のアプリケーションでは、バッファメモリ（４１５）はビデオデコーダ（４１０）の一部である。他のものでは、それはビデオデコーダ（４１０）の外側にあることができる（図示せず）。さらに別のものでは、例えばネットワークジッタに対抗するために、ビデオデコーダ（４１０）の外側のバッファメモリ（図示せず）と、さらに、例えば再生タイミングを処理するために、ビデオデコーダ（４１０）の内側の別のバッファメモリ（４１５）があることができる。受信器（４３１）が、十分な帯域幅および可制御性を有するストア／フォワードデバイスから、または等同期ネットワークからデータを受信している場合、バッファメモリ（４１５）は不要であってもよく、または小さくすることができる。インターネットのようなベストエフォート型パケットネットワークでの使用のために、バッファメモリ（４１５）は、必要とされ得、比較的大きくすることができ、有利に適応サイズにすることができ、ビデオデコーダ（４１０）の外側のオペレーティングシステムまたは類似の要素（図示せず）に少なくとも部分的に実装され得る。

ビデオデコーダ（４１０）は、コーディングされたビデオシーケンスからシンボル（４２１）を再構成するためのパーサ（４２０）を含み得る。これらのシンボルのカテゴリは、ビデオデコーダ（４１０）の動作を管理するために使用される情報、および、図４に示されたように、電子デバイス（４３０）の必須の（integral）部分ではないが、電子デバイス（４３０）に結合されることができるレンダリングデバイス（４１２）（例えば、表示スクリーン）のようなレンダリングデバイスを制御する潜在的な情報を含む。レンダリングデバイス（複数可）のための制御情報は、補足拡張情報（ＳＥＩメッセージ）またはビデオユーザビリティ情報（ＶＵＩ）パラメータセットフラグメント（図示せず）の形式であり得る。パーサ（４２０）は、受信されるコーディングされたビデオシーケンスを解析（parse）／エントロピーデコーディングし（entropy-decode）得る。コーディングされたビデオシーケンスのコーディングは、ビデオコーディング技術または規格に従うことができ、可変長コーディング、ハフマンコーディング、コンテキスト感度を伴うまたは伴わない算術コーディングなどを含む種々の原理に従うことができる。パーサ（４２０）は、グループに対応する少なくとも１つのパラメータに基づいて、ビデオデコーダ内のピクセルのサブグループのうちの少なくとも１つに対するサブグループパラメータのセットを、コーディングされたビデオシーケンスから抽出し得る。サブグループは、ピクチャのグループ（ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット（Coding Units）（ＣＵ）、ブロック、変換ユニット（Transform Units）（ＴＵ）、予測ユニット（Prediction Units）（ＰＵ）などを含むことができる。パーサ（４２０）はまた、変換係数などのコーディングされたビデオシーケンス情報から、量子化パラメータ値、ＭＶ等を抽出し得る。

パーサ（４２０）は、シンボル（４２１）を生成するように、バッファメモリ（４１５）から受信したビデオシーケンスにエントロピーデコーディング／解析動作を実行し得る。

シンボル（４２１）の再構成は、コーディングされたビデオピクチャまたはその部分のタイプ（例えば、インターおよびイントラピクチャ、インターおよびイントラブロック）、および他の要因に応じて、複数の異なるユニットを含むことができる。どのユニットが関与し、どのように関与するかは、パーサ（４２０）によってコーディングされたビデオシーケンスから解析されたサブグループ制御情報によって制御されることができる。パーサ（４２０）と以下の複数ユニットとの間のこのようなサブグループ制御情報のフローは、明確にするために図示されていない。

すでに述べた機能ブロックの他に、ビデオデコーダ（４１０）は、概念的に、以下に説明するように、いくつかの機能ユニットに細分される（subdivided）ことができる。商業的制約の下で動作する実用的な実装では、これらのユニットの多くは互いに密接に相互作用し、少なくとも部分的に互いに統合することができる。しかし、開示された主題を説明するためには、以下の機能ユニットに概念的に細分されることが適切である。

第１のユニットは、スケーラ／逆変換ユニット（４５１）である。スケーラ／逆変換ユニット（４５１）は、パーサ（４２０）からシンボル（複数可）（４２１）として、使用する変換、ブロックサイズ、量子化係数、量子化スケーリング行列などを含む制御情報と共に、量子化された変換係数を受信する。スケーラ／逆変換ユニット（４５１）は、アグリゲータ（４５５）に入力されることができるサンプル値を含むブロックを出力することができる。

場合によっては、スケーラ／逆変換ユニット（４５１）の出力サンプルは、イントラコーディングされたブロック、すなわち、以前に再構成されたピクチャからの予測情報を使用していないが、現在のピクチャの以前に再構成された部分からの予測情報を使用することができるブロックに関連付けることができる。このような予測情報は、イントラピクチャ予測ユニット（４５２）によって提供することができる。場合によっては、イントラピクチャ予測ユニット４５２は、現在のピクチャバッファ（４５８）から取り出された周囲の既に再構成された情報を使用して、再構成中のブロックの同じサイズおよび形状のブロックを生成する。現在のピクチャバッファ（４５８）は、例えば、部分的に再構成された現在のピクチャおよび／または完全に再構成された現在のピクチャをバッファする。アグリゲータ（４５５）は、場合によっては、サンプル毎に、イントラピクチャ予測ユニット（４５２）が生成した予測情報を、スケーラ／逆変換ユニット（４５１）によって提供されるように、出力サンプル情報に追加する。

他の場合には、スケーラ／逆変換ユニット（４５１）の出力サンプルは、インターコーディングされた、潜在的に動き補償ブロックに関係することができる。このような場合、動き補償予測ユニット（４５３）は、予測に使用されるサンプルを取り出すために参照ピクチャメモリ（４５７）にアクセスすることができる。ブロックに関連するシンボル（４２１）に従って、取り出されたサンプルを動き補償した後、これらのサンプルは、アグリゲータ（４５５）によって、出力サンプル情報を生成するために、スケーラ／逆変換ユニット（４５１）の出力（この場合、残差サンプルまたは残差信号と呼ばれる）に追加されることができる。動き補償予測ユニット（４５３）が予測サンプルを取り出す参照ピクチャメモリ（４５７）内のアドレスは、例えばＸ、Ｙ、および参照ピクチャ成分を有することができるシンボル（４２１）の形態で、動き補償予測ユニット（４５３）に利用可能であるＭＶによって制御することができる。動き補償は、また、サブサンプルの正確なＭＶが使用されているときに参照ピクチャメモリ（４５７）から取り出されるサンプル値の補間、動きベクトル予測メカニズムなどを含むことができる。

アグリゲータ（４５５）の出力サンプルは、ループフィルタユニット（４５６）内の種々のループフィルタリング技術の対象であることができる。ビデオ圧縮技術は、コーディングされたビデオシーケンス（コーディングされたビデオビットストリームとも呼ばれる）に含まれるパラメータによって制御され、パーサ（４２０）からシンボル（４２１）としてループフィルタユニット（４５６）に利用可能にされるインループフィルタ技術を含むことができるが、コーディングされたピクチャまたはコーディングされたビデオシーケンスの以前の（デコーディング順で）部分のデコーディングの間に得られたメタ情報に応答することができると共に、以前に再構成されループフィルタリングされたサンプル値に応答することもできる。

ループフィルタユニット（４５６）の出力は、レンダリングデバイス（４１２）に出力することができ、また将来のインターピクチャ予測に使用するために参照ピクチャメモリ（４５７）に格納することができるサンプルストリームであることができる。

特定のコーディングされたピクチャは、いったん完全に再構成されると、将来の予測のための参照ピクチャとして使用することができる。例えば、現在のピクチャに対応するコーディングされたピクチャが完全に再構成され、コーディングされたピクチャが参照ピクチャとして（例えば、パーサ（４２０）によって）識別されると、現在のピクチャバッファ（４５８）は参照ピクチャメモリ（４５７）の一部となることができ、新しい現在のピクチャバッファが、次のコーディングされたピクチャの再構成を開始する前に再割当てされることができる。

ビデオデコーダ（４１０）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５などの規格の所定のビデオ圧縮技術に従ってデコーディング動作を実行し得る。コーディングされたビデオシーケンスは、コーディングされたビデオシーケンスが、ビデオ圧縮技術または規格の構文（syntax）およびビデオ圧縮技術または規格に文書化されているプロファイルの両方に従うという意味で、使用されているビデオ圧縮技術または規格によって指定された構文に適合し得る。具体的には、プロファイルは、特定のツールを、そのプロファイルの下で使用するために利用可能な唯一のツールとして、ビデオ圧縮技術または規格で利用可能なすべてのツールから選択することができる。また、準拠のために必要なことは、コーディングされたビデオシーケンスの複雑さが、ビデオ圧縮技術または規格のレベルによって定義される範囲内にあることであり得る。ある場合には、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート（例えば、毎秒メガサンプルで測定される）、最大参照ピクチャサイズなどを制限する。レベルによって設定された制限は、場合によっては、仮想参照デコーダ（ＨＲＤ）仕様と、コーディングされたビデオシーケンスでシグナリングされる（signaled）ＨＲＤバッファ管理のためのメタデータを通してさらに制限することができる。

一実施形態では、受信器（４３１）は、エンコーディングされたビデオと共に追加の（冗長な）データを受信し得る。追加のデータは、コーディングされたビデオシーケンス（複数可）の一部として含まれ得る。追加のデータは、データを適切にデコーディングするため、および／または元のビデオデータをより正確に再構成するために、ビデオデコーダ（４１０）によって使用され得る。追加のデータは、例えば、時間的、空間的、または信号雑音比（ＳＮＲ）強化層、冗長スライス、冗長ピクチャ、前方誤り訂正コードなどの形態であることができる。

図５は、本開示の一実施形態によるビデオエンコーダ（５０３）のブロック図を示す。ビデオエンコーダ（５０３）は、電子デバイス（５２０）に含まれる。電子デバイス（５２０）は、送信器（５４０）（例えば、送信回路）を含む。ビデオエンコーダ（５０３）は、図３の例のビデオエンコーダ（３０３）の代わりに用いることができる。

ビデオエンコーダ（５０３）は、ビデオエンコーダ（５０３）によってコーディングされることになるビデオイメージ（複数可）をキャプチャし得るビデオソース（５０１）（図５の例では電子デバイス（５２０）の一部ではない）からビデオサンプルを受信し得る。別の例では、ビデオソース（５０１）は、電子デバイス（５２０）の一部である。

ビデオソース（５０１）は、任意の適切なビット深さ（例えば、８ビット、１０ビット、１２ビット、...）、任意の色空間（例えば、BT.601 Y CrCB、RGB、...）、および任意の適切なサンプリング構造（例えば、Y CrCb 4:2:0、Y CrCb 4:4:4）であることができるデジタルビデオサンプルストリームの形態で、ビデオエンコーダ（５０３）によってコーディングされることになるソースビデオシーケンスを提供し得る。メディア供給システムでは、ビデオソース（５０１）は、事前に準備されたビデオを格納するストレージデバイスであり得る。ビデオ会議システムでは、ビデオソース（５０１）は、ローカル画像情報をビデオシーケンスとしてキャプチャするカメラであり得る。ビデオデータは、シーケンスで見たときに動きを伝える複数の個々のピクチャとして提供され得る。ピクチャ自体は、ピクセルの空間アレイとして構成され得、各ピクセルは、使用中のサンプリング構造、色空間などに応じて、１つ以上のサンプルを含むことができる。当業者は、ピクセルとサンプルとの間の関係を容易に理解することができる。以下の説明は、サンプルに焦点を当てている。

一実施形態によれば、ビデオエンコーダ（５０３）は、ソースビデオシーケンスのピクチャを、リアルタイムで、またはアプリケーションによって要求される任意の他の時間制約下で、コーディングされたビデオシーケンス（５４３）にコーディングおよび圧縮し得る。適切なコーディング速度を実施することは、コントローラ（５５０）の一つの機能である。いくつかの実施形態では、コントローラ（５５０）は、以下に記載されるように、他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。結合は、明確にするために示されていない。コントローラ（５５０）によって設定されるパラメータは、レート制御関連パラメータ（ピクチャスキップ、量子化器、レート歪み最適化技法のラムダ値、...）、ピクチャサイズ、ピクチャのグループ（ＧＯＰ）レイアウト、最大ＭＶ許容参照エリアなどを含むことができる。コントローラ（５５０）は、特定のシステム設計のために最適化されたビデオエンコーダ（５０３）に関連する他の適切な機能を有するように構成することができる。

いくつかの実施形態では、ビデオエンコーダ（５０３）は、コーディングループで動作するように構成される。過度に単純化された説明として、一例では、コーディングループは、ソースコーダ（５３０）（例えば、コーディングされることになる入力ピクチャおよび参照ピクチャ（複数可）に基づいて、シンボルストリームなどのシンボルを生成することを担当する）と、ビデオエンコーダ（５０３）に埋め込まれた（ローカル）デコーダ（５３３）とを含むことができる。デコーダ（５３３）は、（リモート）デコーダが生成するのと同様にサンプルデータを生成するようにシンボルを再構成する（シンボルとコーディングされたビデオビットストリームとの間の任意の圧縮が開示された主題において考慮されるビデオ圧縮技術においてロスレスであるので）。再構成されたサンプルストリーム（サンプルデータ）は、参照ピクチャメモリ（５３４）に入力される。シンボルストリームのデコーディングは、デコーダ位置（ローカルまたはリモート）に依存しないビット正確な（bit-exact）結果をもたらすので、参照ピクチャメモリ（５３４）中のコンテンツもまた、ローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えると、エンコーダの予測部分は、デコーダがデコーディング中に予測を使用するときに「見る」のとまったく同じサンプル値を参照ピクチャサンプルとして「見る」。参照ピクチャの同期性（および、例えば、チャンネルエラーのために同期性を維持できない場合の結果として生じるドリフト）のこの基本原理は、いくつかの関連技術においても同様に使用される。

「ローカル」デコーダ（５３３）の動作は、ビデオデコーダ（４１０）などの「リモート」デコーダと同じであることができ、これは、図４と関連して既に上述した。しかし、図４も簡単に参照すると、シンボルが利用可能であり、エントロピーコーダ（５４５）およびパーサ（４２０）によるコーディングされたビデオシーケンスへのシンボルのエンコーディング／デコーディングがロスレスであることができるので、バッファメモリ（４１５）およびパーサ（４２０）を含むビデオデコーダ（４１０）のエントロピーデコーディング部分は、ローカルデコーダ（５３３）に完全には実装されなくてもよい。

この時点で行うことができる観察は、デコーダに存在する解析／エントロピーデコーディングを除く任意のデコーダ技術も、対応するエンコーダに実質的に同一の機能的形態で存在する必要があることである。この理由のために、開示された主題はデコーダ動作に焦点を当てる。エンコーダ技術の説明は、包括的に記述されたデコーダ技術の逆であるため、省略することができる。特定の分野においてのみ、より詳細な説明が必要であり、以下に提供される。

動作中、いくつかの例では、ソースコーダ（５３０）は、「参照ピクチャ」として指定されたビデオシーケンスからの１つ以上の以前にコーディングされたピクチャを参照して入力ピクチャを予測的にコーディングする動き補償予測コーディングを実行し得る。このようにして、コーディングエンジン（５３２）は、入力ピクチャのピクセルブロックと、入力ピクチャに対する予測参照（複数可）として選択され得る参照ピクチャ（複数可）のピクセルブロックとの間の差分をコーディングする。

ローカルビデオデコーダ（５３３）は、ソースコーダ（５３０）によって生成されたシンボルに基づいて、参照ピクチャとして指定され得るピクチャのコーディングされたビデオデータをデコーディングし得る。コーディングエンジン（５３２）の動作は、有利には、ロッシー（lossy）プロセスであり得る。コーディングされたビデオデータがビデオデコーダ（図５には示されていない）でデコーディングされ得る場合、再構成されたビデオシーケンスは、典型的には、いくつかのエラーを伴うソースビデオシーケンスのレプリカであり得る。ローカルビデオデコーダ（５３３）は、参照ピクチャに対してビデオデコーダによって実行され得、再構成された参照ピクチャを参照ピクチャキャッシュ（５３４）に格納させ得るデコーディング処理を複製する。このようにして、ビデオエンコーダ（５０３）は、遠端のビデオデコーダ（送信エラーがない）によって得られる再構成された参照ピクチャとして、共通のコンテンツを有する再構成された参照ピクチャのコピーを、ローカルに格納し得る。

予測器（predictor）（５３５）は、コーディングエンジン（５３２）のための予測探索を実行し得る。すなわち、コーディングされることになる新しいピクチャに対して、予測器（５３５）は、新しいピクチャに対する適切な予測参照として機能し得る、参照ピクチャＭＶ、ブロック形状などの特定のメタデータまたはサンプルデータ（候補参照ピクセルブロックとして）について参照ピクチャメモリ（５３４）を検索し得る。予測器（５３５）は、適切な予測参照を見出すために、サンプルのブロックごとのピクセルのブロックベース（sample block-by-pixel block basis）で動作し得る。場合によっては、予測器（５３５）によって得られた検索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（５３４）に格納された複数の参照ピクチャから描画された（drawn）予測参照を有し得る。

コントローラ（５５０）は、例えば、ビデオデータをエンコーディングするために使用されるパラメータおよびサブグループパラメータの設定を含む、ソースコーダ（５３０）のコーディング動作を管理し得る。

すべての前述の機能ユニットの出力は、エントロピーコーダ（５４５）におけるエントロピーコーディングの対象となり得る。エントロピーコーダ（５４５）は、ハフマンコーディング、可変長コーディング、算術コーディングなどの技術に従って、シンボルをロスレス圧縮することによって、種々の機能ユニットによって生成されたシンボルをコーディングされたビデオシーケンスに変換する。

送信器（５４０）は、エンコーディングされたビデオデータを格納するストレージデバイスへのハードウェア／ソフトェアリンクであり得る通信チャネル（５６０）を介した送信を準備するために、エントロピーコーダ（５４５）によって生成されたコーディングされたビデオシーケンス（複数可）をバッファし得る。送信器（５４０）は、ビデオコーダ（５０３）からのコーディングされたビデオデータを、送信されることになる他のデータ、例えばコーディングされたオーディオデータおよび／または補助的なデータストリーム（図示せず）とマージし得る。

コントローラ（５５０）は、ビデオエンコーダ（５０３）の動作を管理し得る。コーディングの間、コントローラ（５５０）は、各コーディングされたピクチャに、特定のコーディングされたピクチャタイプを割り当て得、これは、それぞれのピクチャに適用され得るコーディング技術に影響を及ぼし得る。例えば、ピクチャは、しばしば、次のピクチャタイプの１つとして割り当てられ得る：

イントラピクチャ（Ｉピクチャ）は、予測のソースとしてシーケンス内の他のピクチャを使用せずに、コーディングされ得るおよびデコードされ得るものであり得る。いくつかのビデオコーデックは、例えば、独立したデコーダリフレッシュ（「ＩＤＲ」）ピクチャを含む、異なるタイプのイントラピクチャを許容する。当業者は、Ｉピクチャのこれらの変形例、並びにそれらのそれぞれの用途および特徴を認識している。

予測ピクチャ（Ｐピクチャ）は、各ブロックのサンプル値を予測するために、最大で１つのＭＶおよび参照インデックスを使用するイントラ予測またはインター予測を使用して、コーディングされ得るおよびデコードされ得るものであり得る。

双方向予測ピクチャ（Ｂピクチャ）は、各ブロックのサンプル値を予測するために、最大で２つのＭＶおよび参照インデックスを使用するイントラ予測またはインター予測を使用して、コーディングされ得るおよびデコードされ得るものであり得る。同様に、複数の予測ピクチャ（multiple-predictive pictures）は、１つのブロックの再構成のために、２より多い参照ピクチャおよび関連するメタデータを使用することができる。

ソースピクチャは、通常、空間的に複数のサンプルブロック（例えば、4×4、8×8、4×8、または16×16の各サンプルのブロック）に細分され、ブロック毎にコーディングされる。ブロックは、ブロックのそれぞれのピクチャに適用されるコーディング割り当てによって決定されるように、他の（既にコーディングされた）ブロックを参照して予測的にコーディングされ得る。例えば、Ｉピクチャのブロックは、非予測的にコーディングされ得る、または、それらは、同じピクチャの既にコーディングされたブロックを参照して予測的にコーディングされ得る（空間予測またはイントラ予測）。Ｐピクチャのピクセルブロックは、以前にコーディングされた１つの参照ピクチャを参照して、空間的予測を介してまたは時間的予測を介して、予測的にコーディングされ得る。Ｂピクチャのブロックは、１つまたは２つの以前にコーディングされた参照ピクチャを参照して、空間的予測を介してまたは時間的予測を介して、予測的にコーディングされ得る。

ビデオエンコーダ（５０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５などの所定のビデオコーディング技術または規格に従ってコーディング動作を実行し得る。その動作において、ビデオエンコーダ（５０３）は、入力ビデオシーケンスにおける時間的および空間的冗長性を活用する予測コーディング動作を含む種々の圧縮動作を実行し得る。従って、コーディングされたビデオデータは、使用されているビデオコーディング技術または規格によって指定された構文に適合し得る。

一実施形態では、送信器（５４０）は、エンコーディングされたビデオと共に追加データを送信し得る。ソースコーダ（５３０）は、コーディングされたビデオシーケンスの一部としてそのようなデータを含み得る。追加データは、時間的／空間的／ＳＮＲ強調層、冗長ピクチャおよびスライスなどの他の形式の冗長データ、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメントなどを含み得る。

ビデオは、時間シーケンスにおいて複数のソースピクチャ（ビデオピクチャ）としてキャプチャされ得る。イントラピクチャ予測（しばしば、イントラ予測と略される）は、所与のピクチャにおける空間的相関を利用し、インターピクチャ予測は、ピクチャ間の（時間的または他の）相関を利用する。一例では、現在のピクチャと呼ばれるエンコーディング／デコーディング中の特定のピクチャは、ブロックに分割される。現在のピクチャのブロックが、ビデオの以前にコーディングされ且つ依然としてバッファされている参照ピクチャの参照ブロックに類似する場合、現在のピクチャのブロックは、ＭＶと呼ばれるベクトルによってコーディングされることができる。ＭＶは、参照ピクチャの参照ブロックを指し、複数の参照ピクチャが使用されている場合には、参照ピクチャを識別する３次元を有することができる。

いくつかの実施形態では、双予測（bi-prediction）技術が、インターピクチャ予測において使用されることができる。双予測技術によれば、両方ともビデオ内の現在のピクチャよりデコーディング順で先行する（ただし、表示順序では、それぞれ過去および将来であり得る）第１の参照ピクチャおよび第２の参照ピクチャなどの２つの参照ピクチャが使用される。現在のピクチャのブロックは、第１の参照ピクチャの第１の参照ブロックを指す第１のＭＶ、および第２の参照ピクチャの第２の参照ブロックを指す第２のＭＶによってコーディングすることができる。ブロックは、第１の参照ブロックおよび第２の参照ブロックの組み合わせによって予測することができる。

さらに、コーディング効率を改善するために、インターピクチャ予測にマージモード技法を使用することができる。

本開示のいくつかの実施形態によれば、インターピクチャ予測およびイントラピクチャ予測などの予測は、ブロック単位（ブロックユニット）で実行される。例えば、ＨＥＶＣ規格によれば、ビデオピクチャのシーケンス中のピクチャは、圧縮のためにコーディングツリーユニット（ＣＴＵ）に分割され、ピクチャ中のＣＴＵは、64×64ピクセル、32×32ピクセル、または16×16ピクセルなどの、同じサイズを有する。一般的に、ＣＴＵは、３つのコーディングツリーブロック（ＣＴＢ）を含み、これは、１つのルマ（luma）ＣＴＢおよび２つのクロマ（chroma）ＣＴＢである。各ＣＴＵは、１つまたは複数のコーディングユニット（ＣＵ）に再帰的にクワッドツリー（４分木）（quadtree）分割することができる。例えば、64×64ピクセルのＣＴＵは、64×64ピクセルの１ＣＵ、32×32ピクセルの４ＣＵ、または16×16ピクセルの１６ＣＵに分割することができる。一例では、各ＣＵは、インター予測タイプまたはイントラ予測タイプなどの、ＣＵの予測タイプを決定するために分析される。ＣＵは、時間的および／または空間的予測可能性に応じて１つまたは複数の予測ユニット（予測単位）（ＰＵ）に分割される。一般に、各ＰＵはルマ予測ブロック（ＰＢ）、および２つのクロマＰＢを含む。一実施形態では、コーディング（エンコーディング／デコーディング）における予測演算（prediction operation）は、予測ブロックのユニットにおいて実行される。予測ブロックの一例としてルマ予測ブロックを用いると、予測ブロックは、8×8ピクセル、16×16ピクセル、8×16ピクセル、16×8ピクセルなど、ピクセルに対する値（例えば、ルマ値）の行列を含む。

図６は、本開示の別の実施形態によるビデオエンコーダ（６０３）の図を示す。ビデオエンコーダ（６０３）は、ビデオピクチャのシーケンス内の現在のビデオピクチャ内のサンプル値の処理ブロック（例えば、予測ブロック）を受信し、処理ブロックをコーディングされたビデオシーケンスの一部であるコーディングされたピクチャにエンコードするように構成される。一例では、ビデオエンコーダ（６０３）は、図３の例のビデオエンコーダ（３０３）の代わりに使用される。

ＨＥＶＣの例では、ビデオエンコーダ（６０３）は、8×8サンプルの予測ブロックなどの処理ブロックに対するサンプル値のマトリックスを受信する。ビデオエンコーダ（６０３）は、処理ブロックが、例えば、レート歪み最適化を使用して、イントラモード、インターモード、または双予測モードを使用して、最良にコーディングされるかどうかを決定する。処理ブロックがイントラモードでコーディングされることになる場合、ビデオエンコーダ（６０３）は、処理ブロックをコーディングされたピクチャにエンコードするためにイントラ予測技法を使用し得る；処理ブロックがインターモードまたは双予測モードでコーディングされることになる場合、ビデオエンコーダ（６０３）は、処理ブロックをコーディングされたピクチャにエンコードするために、インター予測技法または双予測技法をそれぞれ使用し得る。特定のビデオコーディング技術では、マージモードは、予測器の外側のコーディングされたＭＶ成分（MV component）の利益なしに、ＭＶが１つ以上のＭＶ予測器から導出されるインターピクチャ予測サブモードであることができる。特定の他のビデオコーディング技術では、対象ブロックに適用可能なＭＶ成分が存在し得る。一例では、ビデオエンコーダ（６０３）は、処理ブロックのモードを決定するためのモード決定モジュール（図示せず）などの他のコンポーネントを含む。

図６の例では、ビデオエンコーダ（６０３）は、図６に示すように一緒に結合されたインターエンコーダ（６３０）、イントラエンコーダ（６２２）、残差（residue）計算器（６２３）、スイッチ（６２６）、残差エンコーダ（６２４）、汎用（general）コントローラ（６２１）、およびエントロピーエンコーダ（６２５）を含む。

インターエンコーダ（６３０）は、現在のブロック（例えば、処理ブロック）のサンプルを受信し、ブロックを参照ピクチャ内の１つ以上の参照ブロック（例えば、以前のピクチャ内および後のピクチャ内のブロック）と比較し、インター予測情報（例えば、インターエンコーディング技術による冗長情報の記述、ＭＶ、マージモード情報）を生成し、任意の適切な技術を使用して、インター予測情報に基づいてインター予測結果（例えば、予測ブロック）を計算するように構成される。いくつかの例では、参照ピクチャは、エンコーディングされたビデオ情報に基づいてデコーディングされるデコーディングされた参照ピクチャである。

イントラエンコーダ（６２２）は、現在のブロック（例えば、処理ブロック）のサンプルを受信するように構成され、場合によっては、ブロックを、同じピクチャ内で既にコーディングされているブロックと比較し、変換後に量子化された係数を生成し、場合によっては、イントラ予測情報（例えば、１つ以上のイントラエンコーディング技術に従ったイントラ予測方向情報）も生成する。一例では、イントラエンコーダ（６２２）は、また、同じピクチャ内の参照ブロックおよびイントラ予測情報に基づいて、イントラ予測結果（例えば、予測ブロック）を計算する。

汎用コントローラ（６２１）は、汎用制御データを決定し、汎用制御データに基づいてビデオエンコーダ（６０３）の他のコンポーネントを制御するように構成される。一例では、汎用コントローラ（６２１）は、ブロックのモードを決定し、そのモードに基づいてスイッチ（６２６）に制御信号を提供する。例えば、モードがイントラモードの場合、汎用コントローラ（６２１）は、スイッチ（６２６）を制御して、残差計算器（６２３）による使用のためにイントラモード結果を選択し、エントロピーエンコーダ（６２５）を制御して、イントラ予測情報を選択し、ビットストリームにイントラ予測情報を含める；モードがインターモードの場合、汎用コントローラ（６２１）は、スイッチ（６２６）を制御して、残差計算器（６２３）による使用のためにインター予測結果を選択し、エントロピーエンコーダ（６２５）を制御して、インター予測情報を選択し、ビットストリームにインター予測情報を含める。

残差計算器（６２３）は、受信されたブロックと、イントラエンコーダ（６２２）またはインターエンコーダ（６３０）から選択された予測結果との間の差（残差データ）を計算するように構成される。残差エンコーダ（６２４）は、残差データに基づいて動作し、残差データをエンコーディングして変換係数を生成するように構成される。一例では、残差エンコーダ（６２４）は、残差データを空間ドメインから周波数ドメインに変換し、変換係数を生成するように構成される。次いで、変換係数は、量子化された変換係数を得るために量子化処理にかけられる。様々な実施形態では、ビデオエンコーダ（６０３）は、残差デコーダ（６２８）も含む。残差デコーダ（６２８）は、逆変換を実行し、デコーディングされた残差データを生成するように構成される。デコーディングされた残差データは、イントラエンコーダ（６２２）およびインターエンコーダ（６３０）によって適切に使用することができる。例えば、インターエンコーダ（６３０）は、デコーディングされた残差データおよびインター予測情報に基づいてデコーディングされたブロックを生成することができ、イントラエンコーダ（６２２）は、デコーディングされた残差データおよびイントラ予測情報に基づいてデコーディングされたブロックを生成することができる。
デコーディングされたブロックは、デコーディングされたピクチャを生成するために適切に処理され、デコーディングされたピクチャは、メモリ回路（図示せず）にバッファされ、いくつかの例では参照ピクチャとして使用されることができる。

エントロピーエンコーダ（６２５）は、エンコーディングされたブロックを含むようビットストリームをフォーマットするように構成される。エントロピーエンコーダ（６２５）は、ＨＥＶＣなどの適切な規格に従って種々の情報を含むように構成される。一例では、エントロピーエンコーダ（６２５）は、汎用制御データ、選択された予測情報（例えば、イントラ予測情報またはインター予測情報）、残差情報、およびビットストリーム内の他の適切な情報を含むように構成される。開示された主題によれば、インターモードまたは双予測モードのいずれかのマージサブモードでブロックをコーディングする場合、残差情報は存在しないことに留意されたい。

図７は、本開示の別の実施形態によるビデオデコーダ（７１０）の図を示す。ビデオデコーダ（７１０）は、コーディングされたビデオシーケンスの一部であるコーディングされたピクチャを受信し、コーディングされたピクチャをデコーディングして再構成されたピクチャを生成するように構成される。一例では、ビデオデコーダ（７１０）は、図３の例のビデオデコーダ（３１０）の代わりに使用される。

図７の例では、ビデオデコーダ（７１０）は、図７に示すように一緒に結合されたエントロピーデコーダ（７７１）、インターデコーダ（７８０）、残差デコーダ（７７３）、再構成モジュール（７７４）、およびイントラデコーダ（７７２）を含む。

エントロピーデコーダ（７７１）は、コーディングされたピクチャから、そのコーディングされたピクチャが構成される構文要素を表す特定のシンボルを再構成するように構成することができる。このようなシンボルは、例えば、ブロックがコーディングされるモード（例えば、イントラモード、インターモード、双予測モード、マージサブモードまたは別のサブモードにおける後者の２つ）、イントラデコーダ（７７２）またはインターデコーダ（７８０）それぞれによって予測のために使用される特定のサンプルまたはメタデータを識別することができる予測情報（例えば、イントラ予測情報またはインター予測情報など）、例えば、量子化された変換係数の形態の残差情報などを含むことができる。一例では、予測モードがインターまたは双予測モードである場合、インター予測情報がインターデコーダ（７８０）に提供される；予測タイプがイントラ予測タイプである場合、イントラ予測情報がイントラデコーダ（７７２）に提供される。残差情報は、逆量子化を受けることができ、残差デコーダ（７７３）に提供される。

インターデコーダ（７８０）は、インター予測情報を受信し、インター予測情報に基づいてインター予測結果を生成するように構成される。

イントラデコーダ（７７２）は、イントラ予測情報を受信し、イントラ予測情報に基づいて予測結果を生成するように構成される。

残差デコーダ（７７３）は、非量子化変換係数（de-quantized transform coefficients）を抽出するために逆量子化を実行し、残差を周波数領域から空間領域に変換するために非量子化変換係数を処理するように構成される。残差デコーダ（７７３）はまた、（量子化パラメータ（ＱＰ）を含む）特定の制御情報を必要とし得、その情報は、エントロピーデコーダ（７７１）によって提供され得る（データ経路は、低ボリューム制御情報のみであり得るため、図示されていない）。

再構成モジュール（７７４）は、空間領域において、残差デコーダ（７７３）による出力としての残差と、予測結果（場合によっては、インターまたはイントラ予測モジュールによる出力として）とを組み合わせて、再構成されたブロックを形成するように構成され、この再構成されたブロックは、再構成されたピクチャの一部であり得、この再構成されたピクチャの一部は、再構成されたビデオの一部であり得る。ブロック解除操作（deblocking operation）等のような他の適切な操作を行って、視覚品質を改善することができることに留意されたい。

なお、ビデオエンコーダ（３０３）、（５０３）、および（６０３）、並びにビデオデコーダ（３１０）、（４１０）、および（７１０）は、任意の適切な技法を用いて実装することができる。一実施形態では、ビデオエンコーダ（３０３）、（５０３）、および（６０３）、並びにビデオデコーダ（３１０）、（４１０）、および（７１０）は、１つ以上の集積回路を使用して実装することができる。別の実施形態では、ビデオエンコーダ（３０３）、（５０３）、および（６０３）、並びにビデオデコーダ（３１０）、（４１０）、および（７１０）は、ソフトウェア命令を実行する１つ以上のプロセッサを使用して実装することができる。

ＩＩ．ＶＶＣにおける量子化

ＶＶＣなどのいくつかの関連する例では、最大量子化パラメータ（ＱＰ）値を５１から６３に拡張することができ、それに応じて初期ＱＰのシグナリングを変更することができる。スライスSliceQpYのルマ量子化パラメータの初期値は、スライスslice_qp_deltaの量子化パラメータオフセットの非０（non-zero）値がコーディングされている場合に、スライスセグメント層で変更することができる。具体的には、構文要素init_qp_minus26の値を（-26+QpBdOffsetY）から+37の範囲にあるように変更することができ、QpBdOffsetYはルマ量子化パラメータオフセットを表す。変換ブロックのサイズが４の累乗（power of 4）でない場合、変換プロセスによる暗黙のスケーリングを補正するために、変換係数は181/256（または181/128）を掛けるのではなく、QPまたはQP levelScaleテーブルの変更と一緒に処理することができる。変換スキップブロックでは、ＱＰが４に等しい場合、量子化ステップサイズが１になるため、最小許容ＱＰを４と定義することができる。

ＨＥＶＣまたはＨ．２６４などの関連する例では、ルマ量子化パラメータＱＰ_Ｙをクロマ量子化パラメータＱＰ_Ｃに変換するために固定ルックアップテーブルが使用される。ＶＶＣでは、より柔軟なルマからクロマへのＱＰマッピングが使用される。固定テーブルを持つ代わりに、ルマからクロマへのＱＰマッピング関係は、柔軟な区分線形モデルを使用してシーケンスパラメータセット（ＳＰＳ）でシグナリングすることができる。柔軟な区分線形モデルの制約は、各区分の勾配を負にできないことである（すなわち、ルマＱＰが増加すると、クロマＱＰはフラットのまままたは増加しなければならないが、減少することはできない）。区分線形モデルは：（１）モデル内のピースの数；（２）各ピースの入力（ルマ）および出力（クロマ）デルタＱＰ；によって定義することができる。区分線形モデルの入力範囲は[-QpBdOffsetY,63]であり、区分線形モデルの出力範囲は[-QpBdOffsetC,63]であり、QpBdOffsetCはクロマ量子化パラメータオフセットを表す。ＱＰマッピング関係は、Ｃｂ、Ｃｒ、およびジョイントＣｂ／Ｃｒコーディングに対して個別にシグナリングすることができる、または２つのタイプの残差コーディング（residual coding）すべてに対して結合してシグナリングすることができる。

ＨＥＶＣと同様に、ＣＵレベルのＱＰ適合がＶＶＣでは許可される。ルマ成分およびクロマ成分のデルタＱＰ値は別々にシグナリングすることができる。クロマ成分については、許容されるクロマＱＰオフセット値は、例えばＨＥＶＣと同様の方法で、ピクチャパラメータセット（ＰＰＳ）内のオフセットリストの形式でシグナリングすることができる。オフセットリストは、Ｃｂ、Ｃｒ、およびジョイントＣｂ／Ｃｒ残差コーディングに対して別々に定義することができる。Ｃｂ、Ｃｒ、およびジョイントＣｂ／Ｃｒオフセットリストの各々に対して最大６のオフセット値を許容することができる。ＣＵレベルでは、ＣＵのクロマＱＰを調整するためにオフセットリスト内のオフセット値のうちの１つが使用されていることを示すために、インデックスをシグナリングすることができる。ＣＵクロマＱＰオフセットシグナリングはまた、仮想パイプラインデコーディングユニット（ＶＰＤＵ）CU QPデルタ可用性と一致させることができる。サイズが６４×６４より大きいＣＵの場合、ＣＵが非ゼロのコーディングされたブロックフラグ（ＣＢＦ）を有するかどうかに関係なく、クロマＱＰオフセットを第１の変換ユニットで送信することができる。

関連するいくつかの例では、表１に示すように、クロマＱＰオフセットをスライスヘッダでシグナリングすることができる。

表１では、１に等しい構文要素pps_slice_chroma_qp_offsets_present_flagは、構文要素sh_cb_qp_offsetおよびsh_cr_qp_offsetが関連付けられたスライスヘッダに存在することを指定する。０に等しい構文要素pps_slice_chroma_qp_offsets_present_flagは、構文要素sh_cb_qp_offsetおよびsh_cr_qp_offsetが関連付けられたスライスヘッダに存在しないことを指定する。存在しない場合、構文要素pps_slice_chroma_qp_offsets_present_flagの値は０に等しいと推測される。

構文要素sh_cb_qp_offsetは、量子化パラメータＱｐ’_Ｃｂの値を決定する場合に、構文要素pps_cb_qp_offsetの値に加える差分を指定する。例えば、構文要素sh_cb_qp_offsetの値は、－１２から＋１２までの範囲でなければならない。構文要素sh_cb_qp_offsetが存在しない場合、０と等しいと推測される。pps_cb_qp_offset+sh_cb_qp_offsetの値は、－１２から＋１２の範囲でなければならない。

構文要素sh_cr_qp_offsetは、量子化パラメータＱｐ’_Ｃｒの値を決定する場合に、構文要素pps_cr_qp_offsetの値に加える差分を指定する。例えば、構文要素sh_cr_qp_offsetの値は、－１２から＋１２までの範囲でなければならない。構文要素sh_cr_qp_offsetが存在しない場合、０と等しいと推測される。pps_cr_qp_offset+sh_cr_qp_offsetの値は、－１２から＋１２までの範囲でなければならない。

構文要素sh_joint_cbcr_qp_offsetは、量子化パラメータＱｐ’_ＣｂＣｒの値を求める場合に、構文要素pps_joint_cbcr_qp_offset_valueの値に加える差分を指定する。例えば、構文要素sh_joint_cbcr_qp_offsetの値は、－１２から＋１２までの範囲でなければならない。構文要素sh_joint_cbcr_qp_offsetが存在しない場合、０と等しいと推測される。pps_joint_cbcr_qp_offset_value+sh_joint_cbcr_qp_offsetの値は、－１２から＋１２までの範囲でなければならない。

ＩＩＩ．ノイズ検出

図８は、本開示の一実施形態による例示的なノイズ検出プロセスを示す。例示的なノイズ検出プロセスは、ピクチャレベル、スライスレベル、タイルレベル、ブロックレベルなどのような１つ以上のレベルで使用することができる。

一実施形態では、例示的なノイズ検出プロセスは、コーディング領域（例えば、ピクチャ、スライス、またはブロック）で使用され、各ピクセルはＩ（x, y）として表され、（x, y）はそれぞれのピクセルの座標を表す。ソーベル演算（Sobel operation）をエッジ検出で使用して、ノイズ検出からエッジを除外することができる。ソーベル演算の出力は式（１）で記述することができる：

エッジマップは、Ｇのしきい値Ｇ_ｔｈを使用して決定することができる。ラプラシアン演算によるノイズ検出では、Ｇ＜Ｇ_ｔｈのピクセルのみを使用することができる。ピクチャのノイズレベル計算は、式（２）で記述することができる：

式（２）において、ＷおよびＨはそれぞれコーディング領域の幅および高さであり、Ｎは式（３）で記述されるラプラシアン演算子である：

ＩＶ．適応クロマＱＰオフセット

場合によっては、ルマ成分およびクロマ成分のコーディング効率（および／またはレート節約）が十分にバランスされておらず、これは、ビデオエンコーディングおよび／またはデコーディングの非効率をもたらすことがある。

本開示は、エンコーダおよび／またはデコーダにおいてクロマＱＰオフセットを適応的に調整する方法を含む。適応調整は、Ｙ、Ｕ、およびＶなどの異なる色成分間のコーディング効率（および／またはレート節約）のより良いバランスを提供するために、ソースビデオ信号または以前にコーディングされた情報に基づくことができる。

クロマＱＰオフセット値は、異なる実施形態において別々にまたは共同で導出することができる。一実施形態では、クロマＱＰオフセット値は、各クロマ成分（Ｃｂ、Ｃｒ、またはジョイントＣｂ／Ｃｒ）に対して別々に導出することができる。１つの実施形態では、クロマＱＰオフセット値をＣｂ成分およびＣｒ成分の両方に対して共同で導出することができる。

なお、以下の説明でクロマが使用される場合、クロマＣｂ、クロマＣｒ、またはジョイントクロマＣｂ／Ｃｒを指すことがある。

本開示の態様によると、ピクセル値範囲を、クロマＱＰオフセットを決定するために使用することができる。コーディングされることになる複数のピクセルを含むコーディング領域について（例えば、コーディングブロック、スライス、タイル、ピクチャなど）、コーディング領域の色成分（例えば、ルマまてゃクロマ）のピクセル値範囲を、色成分のピクセルの最小ピクセル値と色成分のピクセルの最大ピクセル値との間の範囲（または差）として定義することができる。例えば、８ビットのコーディング領域の場合、ピクセル値範囲は２５６（例えば、すべてのピクセル値は０から２５５の間である）に等しい又は２５６未満である（例えば、０の値を持つピクセルはなく、すべてのピクセル値は１から２５５の間である）ことができる。

１つの実施形態では、範囲比がコーディング領域のルマ成分のピクセル範囲とコーディング領域のクロマ成分のピクセル範囲との間で導出される。範囲比を１つ以上の範囲しきい値と比較して、クロマＱＰオフセットを決定することができる。一例では、比較に１つの範囲しきい値が使用される。範囲比が範囲しきい値より大きい場合、クロマＱＰオフセットはdQP1として設定される。それ以外の場合、クロマＱＰオフセットはdQP2として設定される。別の例では、複数の範囲しきい値が比較において使用される。範囲比が第１の範囲しきい値と第２の範囲しきい値との間にある場合、クロマＱＰオフセットはdQP1として設定される。範囲比が第２の範囲しきい値と第３の範囲しきい値との間にある場合、クロマＱＰオフセットはdQP2として設定される。他の実施形態では、２より多いオフセット（例えば、dQP3、dQP4など）および／または３より多いしきい値を使用することができることに留意されたい。

いくつかの実施形態では、色成分のピクセル値範囲を色成分のヒストグラムに基づいて導出することができる。図９は、本開示の一実施形態による８ビットコーディング領域の色成分の例示的なヒストグラムを示す。ヒストグラムは、色成分のピクセルの分布を示す。ヒストグラムのＸ軸は、８ビットコーディング領域のピクセルに対して利用可能なピクセル値（０から２５５）を表す。ヒストグラムのＹ軸は、各ピクセル値のピクセル数を表す。ヒストグラム内の非０ビン（non-zero bin）は、少なくとも１つのピクセルが入るピクセル値間隔（pixel value interval）に対応する。ヒストグラムの範囲は、ヒストグラム内の非０ビンの最大ピクセル値と非０ビンの最小ピクセル値との間の範囲（または差）として導出することができる。図９の例では、ヒストグラムの範囲はＰｍａｘ－Ｐｍｉｎである。

一実施形態では、ヒストグラムベースの方法を使用して適応クロマＱＰオフセット（複数可）を導出することができる。ヒストグラムベースの方法では、ルマ、クロマＣｂ、および／またはクロマＣｒ成分のヒストグラムを最初に生成することができる。ルマヒストグラムとクロマヒストグラム（複数可）の特性（例えばヒストグラムの範囲）の間の関係を使用して、クロマＱＰオフセット（複数可）を導出することができる。ヒストグラムの非０ビンのピクセル値の範囲は、クロマＱＰオフセット（複数可）導出に使用することができる。例えば、ルマヒストグラム範囲とそれぞれのクロマ成分のヒストグラム範囲の比に応じて、各クロマ成分のクロマＱＰオフセットを導出することができる。この比はヒストグラム範囲比と呼ぶことができる。

１つの例では、ヒストグラム範囲比を以下のようにクロマＣｂとＣｒに対して別々に導出することができる：
Range_ratio_Luma_Cb=hist_range_luma/hist_range_Cb （式．４）
Range_ratio_Luma_Cr=hist_range_luma/hist_range_Cr （式．５）

上式において、hist_range_lumaはルマ成分のヒストグラム範囲を示し、hist_range_CbはクロマＣｂ成分のヒストグラム範囲を示し、hist_range_CrはクロマＣｒ成分のヒストグラム範囲を示す。各成分のヒストグラム範囲は、それぞれの成分のヒストグラムにおける、非０ビンの最大ピクセル値と非０ビンの最小ピクセル値との間の差として導出することができる。

別の例では、ヒストグラム範囲比は、次のようにＣｂ成分とＣｒ成分について一緒に求めることができる：
hist_range_chroma_joint=（hist_range_Cb*w1+hist_range_Cr*w2）/（w1+w2）（式．６）
Range_ratio_Luma_Chroma_joint=hist_range_luma/hist_range_chroma_joint （式．７）

式（６）において、w1および2は重み係数である。

いくつかの実施形態では、１つ以上のしきい値をクロマＱＰオフセット（複数可）の導出に使用することができる。

１つの実施形態では、１つのしきい値をクロマＱＰオフセット（複数可）の導出に使用することができる。例えば、式（４）、（５）、または（６）のうちの１つから導出されるヒストグラム範囲比がしきい値より大きい場合、対応するクロマ成分のクロマＱＰオフセットをdQP1として設定することができる。ヒストグラム範囲比がしきい値以下の場合、対応するクロマ成分のクロマＱＰオフセットをdQP2として設定することができる。一例では、dQP1は－１に等しく、dQP2は０に等しくすることができる。別の例では、dQP1は０に等しく、dQP2は１に等しくすることができる。その他の例では、dQP1とdQP2は－１２から＋１２まで（－１２、＋１２含む）の範囲内の異なる値にすることができる。

一実施形態では、クロマＱＰオフセット（複数可）の導出に複数のしきい値を使用することができる。例えば、式（４）、（５）、または（６）のうちの１つから導出される比などのヒストグラム範囲比が第１のしきい値と第２のしきい値との間にある場合、対応するクロマ成分のクロマＱＰオフセットをdQP1として設定することができる。ヒストグラム範囲比が第２しきい値と第３しきい値との間にある場合、対応するクロマ成分のクロマＱＰオフセットをdQP2として設定することができる。他の実施形態では、２より多いオフセット（例えば、dQP3、dQP4など）および／または３より多いしきい値を使用できることに留意されたい。

本開示の態様によれば、複雑度ベースの方法（complexity based method）を使用して適応クロマＱＰオフセット（複数可）を導出することができる。複雑度ベースの方法では、ルマ、クロマＣｂ、および／またはクロマＣｒ成分の複雑度レベル（complexity levels）を最初に導出することができる。１つの例では、色成分（例えば、ルマまたはクロマ成分）のピクセルの分散を色成分の複雑度レベルとして使用することができる。別の例では、イントラ予測および／またはインター予測における色成分の残差の絶対差の和（ＳＡＤ）を色成分の複雑度レベルとして使用することができる。別の例では、イントラ予測および／またはインター予測における色成分の残差の絶対変換差の和（ＳＡＴＤ）を、色成分の複雑度レベルとして使用することができる。

いくつかの実施形態では、ルマの複雑度レベルとクロマ成分の複雑度レベルとの間の複雑度比を使用して、クロマ成分のクロマＱＰオフセットを導出することができる。

１つの実施形態では、複雑度比がしきい値より大きい場合、クロマＱＰオフセットをdQP1として設定することができる。それ以外の場合は、クロマＱＰオフセットをdQP2として設定することができる。

１つの実施形態では、複数のしきい値を複雑度比と比較して、クロマ成分のクロマＱＰオフセットを導出することができる。例えば、複雑度比が第１のしきい値と第２のしきい値との間にある場合、クロマＱＰオフセットをdQP1として設定することができる。複雑度比が第２のしきい値と第３のしきい値との間にある場合、クロマＱＰオフセットをdQP2として設定することができる。他の実施形態では、２より多いオフセット（例えば、dQP3、dQP4など）および／または３より多いしきい値を使用できることに留意されたい。

開示の態様によれば、ノイズ情報ベースの方法を使用して、適応クロマＱＰオフセット（複数可）を導出することができる。ノイズ情報ベースの方法では、ルマ、クロマＣｂ、および／またはクロマＣｒ成分のノイズレベルを最初に導出することができる。１つの例では、図８に示すノイズ検出プロセスを使用して、色成分のノイズレベルを導出することができる。別の例では、他のノイズアルゴリズムを使用して色成分のノイズレベルを導出することができる。

１つの実施形態では、例えば式（２）によって計算されるクロマ成分のノイズレベルがしきい値より大きい場合、クロマ成分のクロマＱＰオフセットをdQP1として設定することができる。それ以外の場合は、クロマＱＰオフセットをdQP2として設定することができる。

１つの実施形態では、ルマ成分のノイズレベルとクロマ成分のノイズレベルとの間のノイズ比を使用して、クロマ成分のクロマＱＰオフセットを決定することができる。一例では、ノイズ比がしきい値より大きい場合、クロマ成分のクロマＱＰオフセットをdQP1として設定することができる。それ以外の場合は、クロマＱＰオフセットをdQP2として設定することができる。別の例では、複数のしきい値をノイズ比と比較して、クロマ成分のクロマＱＰオフセットを導出することができる。例えば、ノイズ比が第１のしきい値と第２のしきい値との間にある場合、クロマＱＰオフセットをdQP1として設定することができる。ノイズ比が第２のしきい値と第３のしきい値との間にある場合、クロマＱＰオフセットをdQP2として設定することができる。他の実施形態では、２より多いオフセット（例えば、dQP3、dQP4など）および／または３より多いしきい値を使用できることに留意されたい。

開示の態様によれば、導出されたクロマＱＰオフセット（複数可）は、コーディングされたビデオビットストリームにエンコーディングされ、デコーダに送信することができる。例えば、導出されたクロマＱＰオフセット（複数可）は、ＳＰＳレベル、ＰＰＳレベル、ピクチャレベル、スライスレベル、タイルレベル、ブロックレベルなどでシグナリングすることができる。

本開示の態様によれば、エンコーダは、クロマＱＰオフセット（複数可）を導出するために、上記の方法の１つ（例えば、ヒストグラムベースの方法、複雑度ベースの方法、およびノイズ情報ベースの方法）を使用することができる。エンコーダは、導出したクロマＱＰオフセット（複数可）をシグナリングすることができる。この場合、デコーダは、クロマＱＰオフセット（複数可）を決定するために使用される方法に関係なく、導出したクロマＱＰオフセット（複数可）を使用してデコーディングを実行ですることができる。代替的には、エンコーダは、クロマＱＰオフセット（複数可）を導出するために使用された方法を示す構文要素をシグナリングすることができるため、デコーダはシグナリングされた方法に基づいてクロマＱＰオフセット（複数可）を導出することができる。例えば、エンコーダは構文要素sps_chroma_QP_offset_noise_enabledを「真（true）」として設定することができ、構文要素をデコーダに送信することができる。デコーダは、クロマＱＰオフセット（複数可）を導出するためにノイズ情報ベースの方法を使用することができる。ノイズ情報ベースの方法では、ルマおよびクロマ成分のノイズレベルは、参照ピクチャまたは以前に再構成されたコーディングブロックなどの再構成されたコーディング領域に基づいて導出することができる。

開示の態様によれば、エンコーダは上記の方法（例えば、ヒストグラムベースの方法、複雑度ベースの方法、ノイズ情報ベースの方法）のうち少なくとも２つを比較することができる。比較の後、エンコーダはクロマＱＰオフセット（複数可）を導出する方法の１つを決定することができる。例えば、エンコーダは、上記の各方法に対してそれぞれのクロマＱＰオフセット候補を導出し、クロマ成分のクロマＱＰオフセットとして１つの候補を選択することができる。例えば、他の候補と比較して、選択された候補は、異なる色成分間のコーディング効率（および／またはレート節約）のより良いバランスを提供することができる。エンコーダは、導出したクロマＱＰオフセットをシグナリングすることができる。代替的には、エンコーダは、クロマＱＰオフセットを導出するために使用される決定された方法または上記の方法の少なくとも２つを示す構文要素をシグナリングすることができるため、デコーダは、シグナリングされた方法（複数可）に基づいてクロマＱＰオフセットを導出することができる。

本開示の態様によれば、デコーダは、クロマＱＰオフセット（複数可）または、クロマＱＰオフセット（複数可）を導出する方法（例えば、ヒストグラムベースの方法、複雑度ベースの方法、ノイズ情報ベースの方法のうちの１つ）を示す構文要素を受信することができる。

本開示の態様によれば、デコーダはシグナリングすることなしでクロマＱＰオフセット（複数可）を導出することができる。例えば、デコーダは上記の方法（例えば、ヒストグラムベースの方法、複雑度ベースの方法、ノイズ情報ベースの方法）のうち少なくとも２つを比較することができる。比較の後、エンコーダはクロマＱＰオフセット（複数可）を導出する方法の１つを決定することができる。例えば、デコーダは、上記の各方法それぞれについてのそれぞれのクロマＱＰオフセット候補を導出し、クロマ成分のクロマＱＰオフセットとして１つの候補を選択することができる。上記の方法のうち少なくとも２つは、あらかじめ決定することができるまたはシグナリングすることができる。

本開示の態様によれば、デコーダは、再構成された信号（例えば、再構成されたピクチャ、再構成されたスライス、再構成されたブロック）に基づいて、現在のコーディング領域のクロマＱＰオフセット（複数可）を導出することができる。一実施形態では、再構成された信号は参照ピクチャからのものであることができる。

Ｖ．フローチャート

図１０は、本開示の一実施形態による例示的なプロセス（１０００）の概要を示すフローチャートである。様々な実施形態において、プロセス（１０００）は、端末装置（２１０）、（２２０）、（２３０）、および（２４０）における処理回路、ビデオエンコーダ（３０３）の機能を実行する処理回路、ビデオデコーダ（３１０）の機能を実行する処理回路、ビデオエンコーダ（５０３）の機能を実行する処理回路などの処理回路によって実行される。いくつかの実施形態では、プロセス（１０００）はソフトウェア命令で実装されるため、処理回路がソフトウェア命令を実行するとき、処理回路はプロセス（１０００）を実行する。

プロセス（１０００）は概してステップ（Ｓ１０１０）においてスタートし、プロセス（１０００）は、（ｉ）クロマ成分のピクセル値範囲、（ｉｉ）クロマ成分の複雑度レベル、または（ｉｉｉ）クロマ成分のノイズレベルのうちの１つに基づいて、コーディング領域のクロマ成分の量子化パラメータのオフセットを決定する。次いで、プロセス（１０００）はステップ（Ｓ１０２０）に進む。

ステップ（Ｓ１０２０）において、プロセス（１０００）は、量子化パラメータおよび決定されたオフセットに基づいて、コーディング領域の変換係数に対して量子化プロセスを実行する。次いで、プロセス（１０００）はステップ（Ｓ１０３０）に進む。

ステップ（Ｓ１０３０）において、プロセス（１０００）は、量子化変換係数を含むビデオビットストリームを生成する。

次いで、プロセス（１０００）は終了する。

一実施形態では、プロセス（１０００）は、量子化パラメータのオフセットを含むビデオビットストリームを生成する。

一実施形態では、プロセス（１０００）は、コーディング領域のルマ成分のピクセル値範囲を決定する。プロセス（１０００）は、ルマ成分のピクセル値範囲とクロマ成分のピクセル値範囲との間の範囲比を決定する。プロセス（１０００）は、範囲比と範囲しきい値との間の比較に基づいて量子化パラメータのオフセットを決定する。

一実施形態では、プロセス（１０００）は、コーディング領域のルマ成分の複雑度レベルを決定する。プロセス（１０００）は、ルマ成分の複雑度レベルとクロマ成分の複雑度レベルとの間の複雑度比を決定する。プロセス（１０００）は、複雑度比と複雑度しきい値との間の比較に基づいて量子化パラメータのオフセットを決定する。

一実施形態では、ルマ成分およびクロマ成分のそれぞれについて、それぞれの成分の複雑度レベルは、（ｉ）それぞれの成分のピクセルのピクセル値の分散、（ｉｉ）それぞれの成分の残差の絶対差の和、または（ｉｉｉ）それぞれの成分の残差の絶対変換差の和のうちの１つに基づいている。

一実施形態では、プロセス（１０００）は、クロマ成分のノイズレベルとノイズしきい値との間の比較に基づいて量子化パラメータのオフセットを決定する。

一実施形態では、プロセス（１０００）は、コーディング領域のルマ成分のノイズレベルを決定する。プロセス（１０００）は、ルマ成分のノイズレベルとクロマ成分のノイズレベルとの間のノイズ比を決定する。プロセス（１０００）は、ノイズ比とノイズ比しきい値との間の比較に基づいて量子化パラメータのオフセットを決定する。

ＶＩ．コンピュータシステム

上述の技術は、コンピュータ可読命令を用いてコンピュータソフトウェアとして実装することができ、１つ以上のコンピュータ可読媒体に物理的に格納することができる。例えば、図１１は、開示された主題の特定の実施形態を実施するのに適したコンピュータシステム（１１００）を示す。

コンピュータソフトウェアは、１つまたは複数のコンピュータ中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）などによって、直接的に、または解釈を通じて、マイクロコード実行などを通して実行することができる命令を含むコードを作成するために、アセンブリ、コンパイル、リンク、または同様のメカニズムの対象となり得る任意の適切な機械コードまたはコンピュータ言語を用いてコーディングすることができる。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲームミングデバイス、モノのインターネットデバイス等を含む種々のタイプのコンピュータまたはそのコンポーネント上で実行することができる。

コンピュータシステム（１１００）について図１１に示されるコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実装するコンピュータソフトウェアの使用範囲または機能に関する限定を示唆することを意図するものではない。また、コンポーネントの構成は、コンピュータシステム（１１００）の例示的な実施形態に示されたコンポーネントのいずれか１つまたは組み合わせに関するいかなる従属性または要件を有するものとして解釈されてはならない。

コンピュータシステム（１１００）は、特定のヒューマンインターフェース入力デバイスを含み得る。このようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（キーストローク、スワイプ、データグローブの動きなど）、音声入力（音声、拍手など）、視覚入力（ジェスチャなど）、嗅覚入力（図示せず）を通じて、一人または複数の人間のユーザによる入力に応答し得る。また、ヒューマンインターフェースデバイスは、オーディオ（スピーチ、音楽、周囲の音声など）、画像（スキャンされた画像、静止画カメラから得られる写真画像など）、ビデオ（２次元ビデオ、立体画像を含む３次元ビデオなど）のような、人間による意識的入力に必ずしも直接関係しない特定の媒体をキャプチャするために使用することができる。

入力ヒューマンインターフェースデバイスは、キーボード（１１０１）、マウス（１１０２）、トラックパッド（１１０３）、タッチスクリーン（１１１０）、データグローブ（図示せず）、ジョイスティック（１１０５）、マイクロホン（１１０６）、スキャナ（１１０７）、およびカメラ（１１０８）の１つ以上（それぞれのうちの１つのみ）を含み得る。

コンピュータシステム（１１００）はまた、特定のヒューマンインターフェース出力デバイスを含み得る。このようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音、光、およびにおい／味を通して、１人または複数の人間ユーザの感覚を刺激し得る。このようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（１１１０）、データグローブ（図示せず）、またはジョイスティック（１１０５）による触覚フィードバックであるが、入力デバイスとして機能しない触覚フィードバックデバイスであることもできる）、オーディオ出力デバイス（スピーカー（１１０９）、ヘッドフォン（図示せず）など）、視覚出力デバイス（ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含むスクリーン（１１１０）など、各々がタッチスクリーン入力能力を有していても有していなくてもよく、各々が触覚フィードバック能力を有していても有していなくてもよい－これらのうちのいくつかは、２次元の視覚出力または立体画像出力など手段を介して３次元以上の出力を出力することができ得る；仮想現実メガネ（図示せず）、ホログラフィックディスプレイおよびスモークタンク（図示せず））、およびプリンタ（図示せず）を含み得る。これらの視覚出力デバイス（スクリーン（１１１０）など）は、グラフィックスアダプタ（１１５０）を通じてシステムバス（１１４８）に接続することができる。

コンピュータシステム（１１００）はまた、人間がアクセス可能なストレージデバイス、および、ＣＤ／ＤＶＤまたは類似の媒体（１１２１）を有するＣＤ／ＤＶＤＲＯＭ／ＲＷ（１１２０）を含む光学媒体、サムドライブ（１１２２）、リムーバブルハードドライブまたはソリッドステートドライブ（１１２３）、テープおよびフロッピー（登録商標）ディスク（図示せず）のようなレガシー磁気媒体、セキュリティドングル（図示せず）のような特殊化されたＲＯＭ/ＡＳＩＣ/ＰＬＤベースのデバイスなどの関連媒体を含むことができる。

当業者はまた、現在開示されている主題に関連して使用される用語「コンピュータ可読媒体」は、伝送媒体、搬送波、または他の一時的な信号を包含しないことを理解すべきである。

コンピュータシステム（１１００）はまた、１つ以上の通信ネットワーク（１１５５）へのネットワークインターフェース（１１５４）を含むことができる。１つ以上の通信ネットワーク（１１５５）は、例えば、無線、有線、光であることができる。１つ以上の通信ネットワーク（１１５５）は、さらに、ローカル、広域、メトロポリタン、車両および産業、リアルタイム、遅延耐性などであることができる。１つ以上の通信ネットワーク（１１５５）の例は、イーサネット（登録商標）、無線LAN、GSM、3G、4G、5G、LTEなどを含むセルラーネットワーク、ケーブルTV、衛星TV、および地上放送TVを含むTV有線または無線ワイドエリアデジタルネットワーク、CANバスを含む車両および産業用などを含む。特定のネットワークは、一般に、特定の汎用データポートまたは周辺バス（１１４９）（例えば、コンピュータシステム（１１００）のUSBポートなど）に取り付けられる外部ネットワークインターフェースアダプタを必要とする。他のものは、一般に、以下に説明するようにシステムバスに取り付けることによって、コンピュータシステム（１１００）のコアに組み込まれる（例えば、ＰＣコンピュータシステムへのイーサネットインターフェースまたはスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）。これらのネットワークのいずれかを使用して、コンピュータシステム（１１００）は、他のエンティティと通信することができる。このような通信は、単指向性、受信のみ（例えば、放送テレビ）、単指向性送信専用（例えば、特定のCANバスデバイスへのCANバス）、または、例えば、ローカルまたはワイドエリアデジタルネットワークを使用する他のコンピュータシステムへの双指向性であることができる。特定のプロトコルおよびプロトコルスタックは、上述のように、それらのネットワークおよびネットワークインターフェースの各々で使用することができる。

前述のヒューマンインターフェースデバイス、人間がアクセス可能なストレージデバイス、およびネットワークインターフェースは、コンピュータシステム（１１００）のコア（１１４０）に取り付けることができる。

コア（１１４０）は、１つ以上の中央処理装置（ＣＰＵ）（１１４１）、グラフィックス処理ユニット（ＧＰＵ）（１１４２）、フィールドプログラマブルゲートエリア（ＦＰＧＡ）（１１４３）の形の特殊なプログラマブル処理ユニット、特定のタスクのためのハードウェアアクセラレータ（１１４４）などを含むことができる。これらのデバイスは、読出し専用メモリ（ＲＯＭ）（１１４５）、ランダムアクセスメモリ（１１４６）、内部非ユーザアクセス可能ハードドライブ、SSD等の内部大容量ストレージ（１１４７）と共に、システムバス（１１４８）を介して接続され得る。いくつかのコンピュータシステムでは、システムバス（１１４８）は、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にするために、１つ以上の物理的プラグの形態でアクセス可能であることができる。周辺装置は、コアのシステムバス（１１４８）に直接取り付けるか、または周辺バス（１１４９）を介して取り付けることができる。周辺バスのアーキテクチャは、PCI、USBなどを含む。

ＣＰＵ（１１４１）、ＧＰＵ（１１４２）、ＦＰＧＡ（１１４３）、およびアクセラレータ（１１４４）は、組み合わされて、上述のコンピュータコードを構成することができる特定の命令を実行することができる。そのコンピュータコードは、ＲＯＭ（１１４５）またはＲＡＭ（１１４６）に格納することができる。過渡的なデータはＲＡＭ（１１４６）に格納することもでき、一方、永久データは、例えば、内部大容量ストレージ（１１４７）に格納することができる。メモリデバイスのいずれかへの高速ストレージおよび取得は、キャッシュメモリの使用を通して可能にすることができ、キャッシュメモリは、１つ以上のＣＰＵ（１１４１）、ＧＰＵ（１１４２）、大容量ストレージ（１１４７）、ＲＯＭ（１１４５）、ＲＡＭ（１１４６）などと密接に関連付けることができる。

コンピュータ可読媒体は、種々のコンピュータに実装された動作を実行するためのコンピュータコードをその上に有することができる。媒体およびコンピュータコードは、本開示の目的のために特別に設計および構成されたものであることができる、またはそれらは、コンピュータソフトウェア技術に熟練した者に良く知られかつ入手可能な種類のものであることができる。

一例として、限定するものではなく、アーキテクチャ（１１００）、具体的にはコア（１１４０）を有するコンピュータシステムは、１つ以上の有形のコンピュータ可読媒体に具現化されたソフトウェアを実行するプロセッサ（複数可）（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ等を含む）の結果として機能を提供することができる。そのようなコンピュータ可読媒体は、コア－内部大容量ストレージ（１１４７）又はＲＯＭ（１１４５）のような非一時的な性質のものであるコア（１１４０）の特定のストレージ（１１４０）と同様に、上述のようなユーザがアクセス可能な大容量ストレージに関連する媒体であることができる。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに格納され、コア（１１４０）によって実行されることができる。コンピュータ可読媒体は、特定のニーズに応じて、１つ又は複数のメモリデバイス又はチップを含むことができる。ソフトウェアは、ＲＡＭ（１１４６）に格納されたデータ構造を定義し、ソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を修正することを含む、本明細書に記載された特定のプロセス又は特定のプロセスの特定の部分を、コア（１１４０）、具体的にはその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に実行させることができる。加えて又は代替的に、コンピュータシステムは、回路（例えば、アクセラレータ（１１４４））内に配線された又は他の方法で具現化されたロジックの結果として機能を提供することができ、これは、本明細書に記載される特定のプロセス又は特定のプロセスの特定の部分を実行するためのソフトウェアの代わりに、又はそれと共に動作することができる。ソフトウェアへの言及は、ロジックを含み、また、必要に応じて、その逆も可能である。コンピュータ可読媒体への言及は、実行のためのソフトウェアを格納する回路（集積回路（ＩＣ）など）、実行のためのロジックを具体化する回路、又は適切な場合にはその両方を含むことができる。本開示は、ハードウェア及びソフトウェアの任意の適切な組み合わせを包含する。

本開示はいくつかの例示的な実施形態を説明してきたが、変更、順列、および様々な代替均等物があり、これらは本開示の範囲内にある。したがって、当業者は、ここに明示的に示されているわけでも記述されているわけでもないが、開示の原理を具体化し、したがってその精神と範囲内にある多数のシステムおよび方法を考え出すことができることが認められる。

付録Ａ：頭字語
ＡＬＦ：適応ループフィルタ
ＡＭＶＰ：高度な動きベクトル予測
ＡＰＳ：適応パラメータセット
ＡＳＩＣ：特定用途向け集積回路
ＡＴＭＶＰ：代替／高度な時間動きベクトル予測
ＡＶ１：AOMedia Video 1
ＡＶ２：AOMedia Video 2
ＢＭＳ：ベンチマークセット
ＢＶ：ブロックベクトル
ＣＡＮＢｕｓ：コントローラエリアネットワークバス
ＣＢ：コーディングブロック
ＣＣ－ＡＬＦ：クロスコンポーネント適応ループフィルタ
ＣＤ：コンパクトディスク
ＣＤＥＦ：制約付き方向拡張フィルタ
ＣＰＲ：現在のピクチャ参照
ＣＰＵ：中央処理装置
ＣＲＴ：陰極線管
ＣＴＢ：コーディングツリーブロック
ＣＴＵ：コーディングツリーユニット
ＣＵ：コーディングユニット
ＤＰＢ：デコーダピクチャバッファ
ＤＰＣＭ：差動パルスコード変調
ＤＰＳ：デコーディングパラメータセット
ＤＶＤ：デジタルビデオディスク
ＦＰＧＡ：フィールドプログラマブルゲートエリア
ＪＣＣＲ：ジョイントＣｂＣｒ残差コーディング
ＪＶＥＴ：共同ビデオ探査チーム
ＧＯＰ：ピクチャのグループ
ＧＰＵ：グラフィックス処理装置
ＧＳＭ：モバイル通信のためのグローバルシステム
ＨＤＲ：ハイダイナミックレンジ
ＨＥＶＣ：高効率ビデオコーディング
ＨＲＤ：仮想参照デコーダ
ＩＢＣ：イントラブロックコピー
ＩＣ：集積回路
ＩＳＰ：イントラサブパーティション
ＪＥＭ：共同探査モデル
ＬＡＮ：ローカルエリアネットワーク
ＬＣＤ：液晶ディスプレイ
ＬＲ：ループ復元フィルタ
ＬＲＵ：ループ復元ユニット
ＬＴＥ：ロングタームエボリューション
ＭＰＭ：最確モード
ＭＶ：動きベクトル
ＯＬＥＤ：有機発光ダイオード
ＰＢｓ：予測ブロック
ＰＣＩ：周辺機器相互接続
ＰＤＰＣ：位置依存予測の組み合わせ
ＰＬＤ：プログラマブルロジックデバイス
ＰＰＳ：ピクチャパラメータセット
ＰＵ：予測ユニット
ＲＡＭ：ランダムアクセスメモリ
ＲＯＭ：読み取り専用メモリ
ＳＡＯ：サンプル適応オフセット
ＳＣＣ：スクリーンコンテンツコーディング
ＳＤＲ：標準ダイナミックレンジ
ＳＥＩ：補足強化情報
ＳＮＲ：信号ノイズ比
ＳＰＳ：シーケンスパラメータセット
ＳＳＤ：ソリッドステートドライブ
ＴＵ：変換ユニット
ＵＳＢ：ユニバーサルシリアルバス
ＶＰＳ：ビデオパラメータセット
ＶＵＩ：ビデオユーザビリティ情報
ＶＶＣ：汎用ビデオコーディング
ＷＡＩＰ：広角イントラ予測

Claims

エンコーダにおけるビデオエンコーディングのための方法であって、前記方法は：
コーディング領域のクロマ成分の量子化パラメータのオフセットを（ｉ）前記クロマ成分のピクセル値範囲、（ｉｉ）前記クロマ成分の複雑度レベル、または（ｉｉｉ）前記クロマ成分のノイズレベルのうちの１つに基づいて、決定するステップ；
前記量子化パラメータおよび決定された前記オフセットに基づいて、前記コーディング領域の変換係数に対して量子化処理を実行するステップ；および
量子化された前記変換係数を含むビデオビットストリームを生成するステップ；を含む、
方法。
前記生成するステップは：
前記量子化パラメータの前記オフセットを含む前記ビデオビットストリームを生成するステップを含む、
請求項１に記載の方法。
前記決定するステップは：
前記コーディング領域のルマ成分のピクセル値範囲を決定するステップ；
前記ルマ成分の前記ピクセル値範囲と前記クロマ成分の前記ピクセル値範囲との間の範囲比を決定するステップ；および
前記範囲比と範囲しきい値との間の比較に基づいて、前記量子化パラメータの前記オフセットを決定するステップ；を含む、
請求項１に記載の方法。
前記ルマ成分および前記クロマ成分のそれぞれについて、前記のそれぞれの成分の前記ピクセル値範囲は、前記のそれぞれの成分のピクセルの最大ピクセル値と最小ピクセル値との間の差である、
請求項３に記載の方法。
前記決定するステップは：
前記コーディング領域のルマ成分の複雑度レベルを決定するステップ；
前記ルマ成分の前記複雑度レベルと前記クロマ成分の前記複雑度レベルとの間の複雑度比を決定するステップ；および
前記複雑度比と複雑度しきい値との間の比較に基づいて前記量子化パラメータの前記オフセットを決定するステップ；を含む、
請求項１に記載の方法。
前記ルマ成分および前記クロマ成分のそれぞれについて、前記のそれぞれの成分の前記複雑度レベルは、（ｉ）前記のそれぞれの成分のピクセル値の分散、（ｉｉ）前記のそれぞれの成分の残差の絶対差の和、または（ｉｉｉ）前記のそれぞれの成分の前記残差の絶対変換差の和のうちの１つに基づいている、
請求項５に記載の方法。
前記決定するステップは：
前記クロマ成分の前記ノイズレベルとノイズしきい値との間の比較に基づいて、前記量子化パラメータの前記オフセットを決定するステップ、を含む、
請求項１に記載の方法。
前記決定するステップは：
前記コーディング領域のルマ成分のノイズレベルを決定するステップ；
前記ルマ成分の前記ノイズレベルと前記クロマ成分の前記ノイズレベルとの間のノイズ比を決定するステップ；および
前記ノイズ比とノイズ比しきい値との間の比較に基づいて前記量子化パラメータの前記オフセットを決定するステップ；を含む、
請求項１に記載の方法。
前記ルマ成分および前記クロマ成分のそれぞれについて、前記のそれぞれの成分の前記ノイズレベルは、前記のそれぞれの成分のピクセルに適用されるエッジ検出と、前記エッジ検出の結果に適用されるラプラシアン畳み込みに基づいている、
請求項８に記載の方法。
請求項１乃至９のいずれか１項に記載の方法を実行するように構成された処理回路を有する、装置。
命令を格納する、非一時的コンピュータ可読記憶媒体であって、前記命令は、少なくとも１つのプロセッサで実行されるとき、前記少なくとも１つのプロセッサに、請求項１乃至９のいずれか１項に記載の方法を実行させる、
非一時的コンピュータ可読記憶媒体。
プロセッサによって実行されるとき、前記プロセッサに請求項１乃至９のいずれか１項に記載の方法を実行させる、コンピュータプログラム。