JP2022523925A

JP2022523925A - 映像コンテンツを処理するための方法及びシステム

Info

Publication number: JP2022523925A
Application number: JP2021547465A
Authority: JP
Inventors: イエ，ヤン; チェン，ジエ; リャオ，ルーリン
Original assignee: アリババグループホウルディングリミテッド
Priority date: 2019-03-04
Filing date: 2020-02-28
Publication date: 2022-04-27
Also published as: CN118474354A; WO2020180737A1; US20240155158A1; TW202044834A; US20230105972A1; CN113545064A; EP3935847A1; KR20210134375A; EP3935847A4; US20200288173A1; US11516512B2; CN113545064B; US11902581B2

Abstract

本開示の実施形態は映像コンテンツを処理するためのシステム及び方法を提供する。この方法は、ピクチャに関連するクロマブロック及びルマブロックを受信すること、ルマブロックに関連するルマスケール情報を決定すること、ルマスケール情報に基づいてクロマスケール因子を決定すること、及びクロマスケール因子を使用してクロマブロックを処理することを含む。

Description

関連出願の相互参照
[0001] 本開示は、どちらも参照によりその全体を本明細書に援用する、２０１９年３月４日に出願された米国仮特許出願第６２／８１３，７２８号、及び２０１９年３月１２日に出願された米国仮特許出願第６２／８１７，５４６号の優先権の利益を主張する。

技術分野
[0002] 本開示は一般に映像処理に関し、より詳細にはクロマスケーリングによるインループルママッピングを行うための方法及びシステムに関する。

背景
[0003] 映像コード化システムは、例えば消費される記憶空間を減らすべく又はかかる信号に関連する伝送帯域幅の消費量を減らすべく、デジタル映像信号を圧縮するためにしばしば使用される。オンライン映像ストリーミング、テレビ会議、又は映像監視等の映像圧縮の様々な応用において（例えば１９２０ｘ１０８０ピクセルの解像度を有する）高精細度（ＨＤ）映像の人気が高まるにつれ、映像データの圧縮効率を高めることができる映像コード化ツールを開発することが絶えず求められる。

[0004] 例えば映像監視の応用は多くの応用シナリオ（例えばセキュリティ、交通、環境のモニタリング等）において一層且つ広範に使用されており、監視装置の台数及び解像度が急激に増加している。多くの映像監視の応用シナリオはより多くの情報を捕捉するためにＨＤ映像をユーザに提供することを選び、ＨＤ映像はかかる情報を捕捉するために１フレーム当たりより多くのピクセルを有する。しかしＨＤ映像ビットストリームは、伝送のための高帯域幅及び記憶のための大きい空間を要求する高ビットレートを有し得る。例えば平均的な１９２０ｘ１０８０の解像度を有する監視映像ストリームは、リアルタイム伝送のために４Ｍｂｐｓもの帯域幅を必要とし得る。更に、映像監視は一般に７日間ｘ２４時間、常時監視を行い、そのことは映像データを記憶する場合は記憶システムの能力を著しく試し得る。従って、ＨＤ映像の高帯域幅及び大きい記憶域に対する需要は映像監視におけるＨＤ映像の大規模な展開に対する主な制限になっている。

開示の概要
[0005] 本開示の実施形態は映像コンテンツを処理するための方法を提供する。この方法は、ピクチャに関連するクロマブロック及びルマブロックを受信すること、ルマブロックに関連するルマスケール情報を決定すること、ルマスケール情報に基づいてクロマスケール因子を決定すること、及びクロマスケール因子を使用してクロマブロックを処理することを含み得る。

[0006] 本開示の実施形態は映像コンテンツを処理するための機器を提供する。この機器は、１組の命令を記憶するメモリと、メモリに結合され、ピクチャに関連するクロマブロック及びルマブロックを受信すること、ルマブロックに関連するルマスケール情報を決定すること、ルマスケール情報に基づいてクロマスケール因子を決定すること、及びクロマスケール因子を使用してクロマブロックを処理することを機器に行わせるために、１組の命令を実行するように構成されるプロセッサとを含み得る。

[0007] 本開示の実施形態は、映像コンテンツを処理するための方法を装置に行わせるために、装置の１つ又は複数のプロセッサによって実行可能な１組の命令を記憶する非一時的コンピュータ可読記憶媒体を提供する。その方法は、ピクチャに関連するクロマブロック及びルマブロックを受信すること、ルマブロックに関連するルマスケール情報を決定すること、ルマスケール情報に基づいてクロマスケール因子を決定すること、及びクロマスケール因子を使用してクロマブロックを処理することを含む。

図面の簡単な説明
[0008] 本開示の実施形態及び様々な態様を以下の詳細な説明及び添付図面の中で示す。図中に示す様々な特徴は縮尺通り描かれていない。

[0009]本開示の一部の実施形態による映像シーケンスの一例の構造を示す。 [0010]本開示の一部の実施形態による符号化プロセスの一例の概略図を示す。 [0011]本開示の一部の実施形態による符号化プロセスの別の例の概略図を示す。 [0012]本開示の一部の実施形態による復号プロセスの一例の概略図を示す。 [0013]本開示の一部の実施形態による復号プロセスの別の例の概略図を示す。 [0014]本開示の一部の実施形態による、映像を符号化又は復号するための機器の一例のブロック図を示す。 [0015]本開示の一部の実施形態による、例示的なクロマスケーリングによるルママッピング（ＬＭＣＳ：luma mapping with chroma scaling）プロセスの概略図を示す。 [0016]本開示の一部の実施形態による、ＬＭＣＳ区分線形モデルのためのタイルグループレベルの構文表を示す。 [0017]本開示の一部の実施形態による、ＬＭＣＳ区分線形モデルのための別のタイルグループレベルの構文表を示す。 [0018]本開示の一部の実施形態による、コード化ツリー単位の構文構造の表である。 [0019]本開示の一部の実施形態による、デュアルツリー分割の構文構造の表である。 [0020]本開示の一部の実施形態による、ルマ予測ブロックの平均化を単純化する一例を示す。 [0021]本開示の一部の実施形態による、コード化ツリー単位の構文構造の表である。 [0022]本開示の一部の実施形態による、タイルグループレベルにおけるＬＭＣＳ区分線形モデルの修正されたシグナリングに関する構文要素の表である。 [0023]本開示の一部の実施形態による、映像コンテンツを処理するための方法の流れ図である。 [0024]本開示の一部の実施形態による、映像コンテンツを処理するための方法の流れ図である。 [0025]本開示の一部の実施形態による、映像コンテンツを処理するための別の方法の流れ図である。 [0026]本開示の一部の実施形態による、映像コンテンツを処理するための別の方法の流れ図である。

詳細な説明
[0027] 次に、その例を添付図面に示す例示的実施形態を詳細に参照する。以下の説明は添付図面を参照し、添付図面では他に指示がない限り異なる図中の同じ数字が同じ又は同様の要素を表す。例示的実施形態についての以下の説明の中で記載する実装形態は本発明と合致する全ての実装形態を表すわけではない。むしろ、それらは添付の特許請求の範囲の中で列挙する本発明に関係する態様と合致する機器及び方法の例に過ぎない。別段の定めがない限り、「又は、若しくは（or）」という語は実行不可能な場合を除いてあり得る全ての組み合わせを包含する。例えば或る構成要素がＡ又はＢを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、その構成要素はＡ、若しくはＢ、又はＡ及びＢを含むことができる。第２の例として、或る構成要素がＡ、Ｂ、又はＣを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、その構成要素はＡ、若しくはＢ、若しくはＣ、又はＡ及びＢ、又はＡ及びＣ、又はＢ及びＣ、又はＡ及びＢ及びＣを含むことができる。

[0028] 映像とは、視覚的情報を記憶するために時系列順に配置される１組の静止ピクチャ（又は「フレーム」）である。それらのピクチャを時系列順に捕捉し記憶するために映像捕捉装置（例えばカメラ）を使用することができ、かかるピクチャを時系列順に表示するために映像再生装置（例えばテレビ、コンピュータ、スマートフォン、タブレットコンピュータ、ビデオプレーヤ、又は表示機能を有する任意のエンドユーザ端末）を使用することができる。更に一部の応用では、監視、会議、又は生放送等のために映像捕捉装置が捕捉映像を映像再生装置（例えばモニタを有するコンピュータ）にリアルタイムで伝送することができる。

[0029] かかる応用が必要とする記憶空間及び伝送帯域幅を減らすために、映像を記憶及び伝送前に圧縮し、表示前に解凍することができる。この圧縮及び解凍はプロセッサ（例えば汎用コンピュータのプロセッサ）又は専用ハードウェアによって実行されるソフトウェアによって実装することができる。圧縮用のモジュールを一般に「符号器」と呼び、解凍用のモジュールを一般に「復号器」と呼ぶ。符号器及び復号器はまとめて「コーデック」と呼ぶことができる。符号器及び復号器は様々な適切なハードウェア、ソフトウェア、又はその組み合わせとして実装することができる。例えば符号器及び復号器のハードウェア実装は、１つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、書換可能ゲートアレイ（ＦＰＧＡ）、ディスクリートロジック、又はその任意の組み合わせ等の回路を含み得る。符号器及び復号器のソフトウェア実装は、プログラムコード、コンピュータ実行可能命令、ファームウェア、又はコンピュータ可読媒体内に固定される任意の適切なコンピュータによって実装されるアルゴリズム若しくはプロセスを含み得る。映像の圧縮及び解凍はＭＰＥＧ－１、ＭＰＥＧ－２、ＭＰＥＧ－４、Ｈ．２６ｘシリーズ等の様々なアルゴリズム又は規格によって実装され得る。一部の応用では、コーデックが第１のコード化規格から映像を解凍し、第２のコード化規格を使用して解凍済みの映像を再圧縮することができ、その場合コーデックを「トランスコーダ」と呼ぶことができる。

[0030] 映像符号化プロセスは、ピクチャを再構築するために使用可能な有用な情報を識別し保つことができ、再構築に重要でない情報を無視することができる。無視された重要でない情報を完全に再構築できない場合、かかる符号化プロセスは「非可逆」と呼ぶことができる。さもなければ、かかる符号化プロセスは「可逆」と呼ぶことができる。殆どの符号化プロセスは非可逆であり、これは必要な記憶空間及び伝送帯域幅を減らすためのトレードオフである。

[0031] 符号化されているピクチャ（「現ピクチャ」と呼ぶ）の有用な情報は、参照ピクチャ（例えば過去に符号化され再構築されたピクチャ）に対する変化を含む。かかる変化は、ピクセルの位置変化、光度変化、又は色変化を含むことができ、そのうちの位置変化が最も関係している。オブジェクトを表すピクセル群の位置変化は、参照ピクチャと現ピクチャとの間のオブジェクトの動きを反映し得る。

[0032] 別のピクチャを参照することなしにコード化されるピクチャ（即ちかかるピクチャが自らの参照ピクチャである）を「Ｉピクチャ」と呼ぶ。参照ピクチャとして過去のピクチャを使用してコード化されるピクチャを「Ｐピクチャ」と呼ぶ。参照ピクチャとして過去のピクチャ及び将来のピクチャの両方を使用してコード化される（即ち参照が「双方向」である）ピクチャを「Ｂピクチャ」と呼ぶ。

[0033] 先に述べたように、ＨＤ映像を使用する映像監視は高帯域幅及び大きい記憶域の需要の課題に直面する。この課題に対処するために符号化映像のビットレートを下げることができる。Ｉピクチャ、Ｐピクチャ、及びＢピクチャのうちＩピクチャが最も高いビットレートを有する。殆どの監視映像の背景はほぼ静的なので、符号化映像の全体的なビットレートを下げる１つのやり方は、映像の符号化のためにより少ないＩピクチャを使用することであり得る。

[0034] しかし、符号化映像内でＩピクチャは一般に主要ではないので、Ｉピクチャをより少なく使用する改善策は些細なことであり得る。例えば典型的な映像ビットストリームでは、Ｉピクチャ、Ｂピクチャ、及びＰピクチャの比率が１：２０：９の場合があり、Ｉピクチャが総ビットレートの１０％未満を占めることがある。換言すれば、かかる例では全てのＩピクチャを除去しても低減されるビットレートは１０％に過ぎない可能性がある。

[0035] 本開示は、映像監視のための特性ベースの映像処理のための方法、機器、及びシステムを提供する。本明細書の「特性」は、ピクチャ内の映像コンテンツに関連するコンテンツ特性、ピクチャを符号化すること又は復号することの動き推定に関連する動き特性、又はその両方を指す。例えばコンテンツ特性は映像シーケンスの１つ又は複数の連続ピクチャ内のピクセルとすることができ、ピクセルはピクチャ内のオブジェクト、シーン、又は環境事象の少なくとも１つに関係する。別の例では動き特性が映像のコード化プロセスに関係する情報を含むことができ、その例は後で詳述する。

[0036] 本開示では、映像シーケンスのピクチャを符号化するとき、映像シーケンスのピクチャの１つ又は複数の特性を検出し分類するために特性分類器を使用することができる。特性の様々なクラスを様々な優先レベルに関連付けることができ、かかる優先レベルは符号化のための様々なビットレートに更に関連付けられる。様々な優先レベルは符号化のための様々なパラメータセットに関連付けることができ、それにより異なる符号化品質レベルがもたらされ得る。優先レベルが高ければ高いほど、その関連パラメータセットがもたらし得る映像の質が高くなる。このような特性ベースの映像処理により、著しい情報損失を引き起こすことなしに監視映像についてビットレートを大幅に下げることができる。加えて、本開示の実施形態は様々な応用シナリオ（例えばセキュリティ、交通、環境のモニタリング等）について優先レベルとパラメータセットとの間の対応する関係をカスタマイズし、それにより映像のコード化品質を大幅に改善し、帯域幅及び記憶域のコストを大幅に低減することができる。

[0037] 図１は、本開示の一部の実施形態による映像シーケンス１００の一例の構造を示す。映像シーケンス１００は、生中継映像又は捕捉されアーカイブされている映像とすることができる。映像１００は現実の映像、コンピュータによって生成される映像（例えばコンピュータゲーム映像）、又はその組み合わせ（例えば拡張現実効果を有する現実の映像）であり得る。映像シーケンス１００は、映像捕捉装置（例えばカメラ）、過去に捕捉された映像を含む映像アーカイブ（例えば記憶装置内に記憶される映像ファイル）、又は映像コンテンツプロバイダから映像を受信するための映像フィードインタフェース（例えば映像ブロードキャストトランシーバ）から入力され得る。

[0038] 図１に示すように、映像シーケンス１００は、ピクチャ１０２、１０４、１０６、及び１０８を含むタイムライン沿いに時間的に配置される一連のピクチャを含み得る。ピクチャ１０２～１０６は連続的であり、ピクチャ１０６とピクチャ１０８との間には更に多くのピクチャがある。図１ではピクチャ１０２がＩピクチャであり、その参照ピクチャはピクチャ１０２自体である。ピクチャ１０４はＰピクチャであり、矢印によって示すようにその参照ピクチャはピクチャ１０２である。ピクチャ１０６はＢピクチャであり、矢印によって示すようにその参照ピクチャはピクチャ１０４及び１０８である。一部の実施形態では、ピクチャ（例えばピクチャ１０４）の参照ピクチャはそのピクチャのすぐ前に又はすぐ後になくてもよい。例えばピクチャ１０４の参照ピクチャは、ピクチャ１０２に先行するピクチャであり得る。ピクチャ１０２～１０６の参照ピクチャは例に過ぎず、本開示は参照ピクチャの実施形態を図１に示す例として限定しないことに留意すべきである。

[0039] 典型的には、映像コーデックは全ピクチャを一度に符号化又は復号することはなく、それはかかるタスクが計算的に複雑だからである。むしろ映像コーデックはピクチャを基本セグメントに分割し、ピクチャをセグメントごとに符号化又は復号することができる。本開示ではそのような基本セグメントを基本処理単位（「ＢＰＵ」）と呼ぶ。例えば図１の構造１１０は、映像シーケンス１００のピクチャ（例えばピクチャ１０２～１０８の何れか）の構造の一例を示す。構造１１０ではピクチャが４ｘ４の基本処理単位に分けられており、その境界が破線で示されている。一部の実施形態では、基本処理単位は一部の映像コード化規格（例えばＭＰＥＧファミリ、Ｈ．２６１、Ｈ．２６３、又はＨ．２６４／ＡＶＣ）内の「マクロブロック」と呼ぶことができ、他の一部の映像コード化規格（例えばＨ．２６５／ＨＥＶＣ又はＨ．２６６／ＶＶＣ）内の「コード化ツリー単位」（「ＣＴＵ」）と呼ぶことができる。１２８ｘ１２８、６４ｘ６４、３２ｘ３２、１６ｘ１６、４ｘ８、１６ｘ３２、又はピクセルのあらゆる任意の形状及びサイズ等、基本処理単位はピクチャ内で可変サイズを有することができる。基本処理単位のサイズ及び形状は、コード化の効率及び基本処理単位内で保とうとする詳細度のバランスに基づいてピクチャについて選択することができる。

[0040] 基本処理単位は、コンピュータメモリ内に（例えば映像フレームバッファ内に）記憶される様々な種類の映像データ群を含み得る論理単位であり得る。例えばカラーピクチャの基本処理単位は、無彩色の輝度情報を表すルマ成分（Ｙ）、色情報を表す１つ又は複数のクロマ成分（例えばＣｂ及びＣｒ）、並びにルマ成分及びクロマ成分が同じサイズを有し得る基本処理単位の関連構文要素を含むことができる。一部の映像コード化規格（例えばＨ．２６５／ＨＥＶＣ又はＨ．２６６／ＶＶＣ）では、ルマ成分及びクロマ成分が「コード化ツリーブロック」（「ＣＴＢ」）と呼ばれ得る。基本処理単位に対して行われる如何なる操作も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。

[0041] 映像のコード化は複数の操作段階を有し、その例を図２Ａ～図２Ｂ及び図３Ａ～図３Ｂの中で詳述する。それぞれの段階について、基本処理単位のサイズは依然として処理するのに大き過ぎる場合があり、従って本開示で「基本処理副単位」と呼ぶセグメントに更に分けることができる。一部の実施形態では、基本処理副単位は一部の映像コード化規格（例えばＭＰＥＧファミリ、Ｈ．２６１、Ｈ．２６３、又はＨ．２６４／ＡＶＣ）内の「ブロック」と呼ぶことができ、又は他の一部の映像コード化規格（例えばＨ．２６５／ＨＥＶＣ又はＨ．２６６／ＶＶＣ）内の「コード化単位」（「ＣＵ」）と呼ぶことができる。基本処理副単位は基本処理単位と同じ又はそれよりも小さいサイズを有し得る。基本処理単位と同様に基本処理副単位もコンピュータメモリ内に（例えば映像フレームバッファ内に）記憶される様々な種類の映像データ群（例えばＹ、Ｃｂ、Ｃｒ、及び関連構文要素）を含み得る論理単位である。基本処理副単位に対して行われる如何なる操作も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。処理の必要性に応じて、かかる分割は更なるレベルに対して行われ得ることに留意すべきである。様々な段階が様々な方式を使用して基本処理単位を分割できることにも留意すべきである。

[0042] 例えば（その一例を図２Ｂで詳述する）モード決定段階において、基本処理単位に対してどの予測モード（例えばイントラピクチャ予測又はインタピクチャ予測）を使用するのかを符号器が決定することができ、基本処理単位はかかる決定を下すには大き過ぎる場合がある。符号器は基本処理単位を複数の基本処理副単位（例えばＨ．２６５／ＨＥＶＣ又はＨ．２６６／ＶＶＣにあるＣＵ）に分け、個々の基本処理副単位ごとに予測の種類を決定することができる。

[0043] 別の例では、（その一例を図２Ａに詳述する）予測段階において、符号器は基本処理副単位（例えばＣＵ）のレベルにおいて予測操作を行うことができる。しかし一部の事例では、処理するのに基本処理副単位が依然として大き過ぎる場合がある。符号器は基本処理副単位をより小さいセグメント（例えばＨ．２６５／ＨＥＶＣ又はＨ．２６６／ＶＶＣ内で「予測ブロック」又は「ＰＢ」と呼ばれる）に更に分けることができ、そのレベルにおいて予測操作を行うことができる。

[0044] 別の例では、（その一例を図２Ａに詳述する）変換段階において、符号器が残差基本処理副単位（例えばＣＵ）に対する変換操作を行うことができる。しかし一部の事例では、処理するのに基本処理副単位が依然として大き過ぎる場合がある。符号器は基本処理副単位をより小さいセグメント（例えばＨ．２６５／ＨＥＶＣ又はＨ．２６６／ＶＶＣ内で「変換ブロック」又は「ＴＢ」と呼ばれる）に更に分けることができ、そのレベルにおいて変換操作を行うことができる。同じ基本処理副単位の分割方式は予測段階と変換段階とで異なり得ることに留意すべきである。例えばＨ．２６５／ＨＥＶＣ又はＨ．２６６／ＶＶＣでは、同じＣＵの予測ブロック及び変換ブロックが異なるサイズ及び数を有し得る。

[0045] 図１の構造１１０では、基本処理単位１１２が３ｘ３の基本処理副単位に更に分けられており、その境界が点線で示されている。同じピクチャの異なる基本処理単位を異なる方式で基本処理副単位に分けることができる。

[0046] 一部の実装形態では、映像の符号化及び復号に並列処理及び誤り耐性の機能を与えるために、ピクチャを処理用の領域に分けることができ、それによりピクチャの領域について、符号化又は復号プロセスがピクチャの他の任意の領域の情報に依存しないようにできる。換言すれば、ピクチャの各領域を独立に処理することができる。そうすることでコーデックはピクチャの異なる領域を並列に処理し、従ってコード化の効率を高めることができる。更に、領域のデータが処理内で破損し又はネットワーク伝送内で失われる場合、コーデックは破損し又は失われたデータに依存することなしに、同じピクチャの他の領域を正しく符号化又は復号することができ、従って誤り耐性の機能を提供する。一部の映像コード化規格では、ピクチャを異なる種類の領域に分割することができる。例えばＨ．２６５／ＨＥＶＣ及びＨ．２６６／ＶＶＣは「スライス」及び「タイル」という２種類の領域を提供する。映像シーケンス１００の様々なピクチャが、ピクチャを領域に分けるための様々な分割方式を有し得ることにも留意すべきである。

[0047] 例えば図１では、構造１１０が３つの領域１１４、１１６、及び１１８に分けられており、その境界が構造１１０内の実線として示されている。領域１１４は４個の基本処理単位を含む。領域１１６及び１１８のそれぞれは６個の基本処理単位を含む。図１の構造１１０の基本処理単位、基本処理副単位、及び領域は例に過ぎず、本開示はその実施形態を限定しないことに留意すべきである。

[0048] 図２Ａは、本開示の一部の実施形態による符号化プロセス２００Ａの一例の概略図を示す。符号器は、プロセス２００Ａに従って映像シーケンス２０２を映像ビットストリーム２２８へと符号化することができる。図１の映像シーケンス１００と同様に、映像シーケンス２０２は時系列順に配置される１組のピクチャ（「元のピクチャ」と呼ぶ）を含み得る。図１の構造１１０と同様に、映像シーケンス２０２のそれぞれの元のピクチャは符号器によって基本処理単位、基本処理副単位、又は処理用の領域に分けられ得る。一部の実施形態では、符号器は映像シーケンス２０２のそれぞれの元のピクチャに関する基本処理単位のレベルにおいてプロセス２００Ａを実行することができる。例えば符号器はプロセス２００Ａを反復的なやり方で実行することができ、符号器はプロセス２００Ａの１回の反復の中で基本処理単位を符号化することができる。一部の実施形態では、符号器は映像シーケンス２０２のそれぞれの元のピクチャの領域（例えば領域１１４～１１８）についてプロセス２００Ａを並列に実行することができる。

[0049] 図２Ａでは、符号器は、映像シーケンス２０２の元のピクチャの基本処理単位（「元のＢＰＵ」と呼ぶ）を予測段階２０４にフィードして、予測データ２０６及び予測済みＢＰＵ２０８を生成することができる。符号器は、元のＢＰＵから予測済みＢＰＵ２０８を減算して、残差ＢＰＵ２１０を生成することができる。符号器は、残差ＢＰＵ２１０を変換段階２１２及び量子化段階２１４にフィードして、量子化済み変換係数２１６を生成することができる。符号器は、予測データ２０６及び量子化済み変換係数２１６をバイナリコード化段階２２６にフィードして、映像ビットストリーム２２８を生成することができる。構成要素２０２、２０４、２０６、２０８、２１０、２１２、２１４、２１６、２２６、及び２２８は「順方向経路」と呼ぶことができる。プロセス２００Ａの間、符号器は、量子化段階２１４の後で量子化済み変換係数２１６を逆量子化段階２１８及び逆変換段階２２０にフィードして、再構築済み残差ＢＰＵ２２２を生成することができる。符号器は、再構築済み残差ＢＰＵ２２２を予測済みＢＰＵ２０８に加えて、プロセス２００Ａの次の反復の予測段階２０４に使用される予測基準２２４を生成することができる。プロセス２００Ａの構成要素２１８、２２０、２２２、及び２２４は「再構築経路」と呼ぶことができる。再構築経路は、符号器及び復号器の両方が予測に同じ参照データを使用することを確実にするために使用され得る。

[0050] 符号器はプロセス２００Ａを反復的に実行して、（順方向経路内で）元のピクチャのそれぞれの元のＢＰＵを符号化し、（再構築経路内で）元のピクチャの次の元のＢＰＵを符号化するための予測済み基準２２４を生成することができる。元のピクチャの全ての元のＢＰＵを符号化した後、符号器は映像シーケンス２０２内の次のピクチャの符号化に進むことができる。

[0051] プロセス２００Ａを参照し、符号器は、映像捕捉装置（例えばカメラ）によって生成される映像シーケンス２０２を受信することができる。本明細書で使用する「受信（する）」という用語は、データを入力するために受信すること、入力すること、取得すること、取り出すこと、得ること、読み出すこと、アクセスすること、又は任意のやり方の任意のアクションを指すことができる。

[0052] 現在の反復の予測段階２０４で、符号器は、元のＢＰＵ及び予測基準２２４を受信し、予測操作を行って予測データ２０６及び予測済みＢＰＵ２０８を生成することができる。予測基準２２４は、プロセス２００Ａの前の反復の再構築経路から生成され得る。予測段階２０４の目的は、予測データ２０６及び予測基準２２４から予測済みＢＰＵ２０８として元のＢＰＵを再構築するために使用され得る予測データ２０６を抽出することによって、情報の冗長性を減らすことである。

[0053] 理想的には、予測済みＢＰＵ２０８は元のＢＰＵと同一であり得る。しかし、理想的でない予測及び再構築操作により、予測済みＢＰＵ２０８は概して元のＢＰＵと僅かに異なる。そのような差を記録するために、符号器は、予測済みＢＰＵ２０８を生成した後でそれを元のＢＰＵから減算して、残差ＢＰＵ２１０を生成することができる。例えば符号器は、予測済みＢＰＵ２０８のピクセルの値（例えばグレースケール値又はＲＧＢ値）を元のＢＰＵの対応するピクセルの値から減算することができる。元のＢＰＵの対応するピクセルと予測済みＢＰＵ２０８との間のかかる減算の結果、残差ＢＰＵ２１０の各ピクセルは残差値を有し得る。元のＢＰＵと比較し、予測データ２０６及び残差ＢＰＵ２１０はより少ないビットを有し得るが、品質を著しく損なうことなしに元のＢＰＵを再構築するためにそれらを使用することができる。

[0054] 残差ＢＰＵ２１０を更に圧縮するために、変換段階２１２で、符号器は残差ＢＰＵ２１０を１組の２次元「基底パターン」へと分解することによって、残差ＢＰＵ２１０の空間的冗長性を低減することができ、各基底パターンは「変換係数」に関連する。基底パターンは同じサイズ（例えば残差ＢＰＵ２１０のサイズ）を有することができる。それぞれの基底パターンは残差ＢＰＵ２１０の変動周波数（例えば輝度変動周波数）成分を表すことができる。基底パターンのどれも、他の任意の基底パターンの任意の組み合わせ（例えば線形結合）から再現することはできない。換言すれば、かかる分解により、残差ＢＰＵ２１０の変動を周波数領域内に分解することができる。かかる分解は関数の離散フーリエ変換に類似しており、基底パターンは離散フーリエ変換の基底関数（例えば三角関数）に類似しており、変換係数は基底関数に関連する係数に類似している。

[0055] 様々な変換アルゴリズムが様々な基底パターンを使用することができる。例えば離散コサイン変換、離散サイン変換等、変換段階２１２では様々な変換アルゴリズムを使用することができる。変換段階２１２における変換は可逆的である。つまり符号器は変換の逆操作（「逆変換」と呼ぶ）によって、残差ＢＰＵ２１０を復元することができる。例えば残差ＢＰＵ２１０のピクセルを復元するために、逆変換は、基底パターンの対応するピクセルの値を関連するそれぞれの係数で乗算し、積を加算して加重和をもたらすことであり得る。映像コード化規格では、符号器及び復号器の両方が同じ変換アルゴリズム（従って同じ基底パターン）を使用することができる。従って符号器は、復号器が符号器から基底パターンを受信することなしに、そこから残差ＢＰＵ２１０を再構築することができる変換係数だけを記録することができる。残差ＢＰＵ２１０と比較して変換係数の方が少ないビットを有し得るが、それらの変換係数は、品質を著しく損なうことなしに残差ＢＰＵ２１０を再構築するために使用され得る。従って残差ＢＰＵ２１０が更に圧縮される。

[0056] 符号器は、量子化段階２１４において変換係数を更に圧縮することができる。変換プロセスでは、様々な基底パターンが様々な変動周波数（例えば輝度変動周波数）を表すことができる。人間の目は概して低周波変動を認識するのが得意なので、符号器は復号の際の著しい品質劣化を引き起こすことなしに、高周波変動の情報を無視することができる。例えば量子化段階２１４において、符号器は、各変換係数を整数値（「量子化パラメータ」と呼ぶ）で除算し、商をその最近隣数に丸めることによって、量子化済み変換係数２１６を生成することができる。かかる操作の後、高周波基底パターンの一部の変換係数をゼロに変換することができ、低周波基底パターンの変換係数をより小さい整数に変換することができる。符号器はゼロ値の量子化済み変換係数２１６を無視することができ、それにより変換係数が更に圧縮される。量子化プロセスも可逆的であり、量子化済み変換係数２１６は、量子化の逆操作（「逆量子化」と呼ぶ）で変換係数に再構築することができる。

[0057] 符号器は、丸め操作でかかる除算の剰余を無視するので、量子化段階２１４は非可逆であり得る。典型的には、量子化段階２１４はプロセス２００Ａ内で最大の情報損失に寄与し得る。情報損失が大きければ大きいほど、量子化済み変換係数２１６が必要とし得るビットが少なくなる。情報損失の様々なレベルを得るために、符号器は、量子化パラメータの様々な値又は量子化プロセスの他の任意のパラメータを使用することができる。

[0058] バイナリコード化段階２２６において、符号器は例えばエントロピコード化、可変長コード化、算術コード化、ハフマンコード化、コンテキスト適応バイナリ算術コード化、又は他の任意の可逆若しくは非可逆圧縮アルゴリズム等のバイナリコード化技法を使用し、予測データ２０６及び量子化済み変換係数２１６を符号化することができる。一部の実施形態では、予測データ２０６及び量子化済み変換係数２１６に加えて、符号器は、例えば予測段階２０４で使用される予測モード、予測操作のパラメータ、変換段階２１２の変換の種類、量子化プロセスのパラメータ（例えば量子化パラメータ）、符号器制御パラメータ（例えばビットレート制御パラメータ）等の他の情報をバイナリコード化段階２２６において符号化することができる。符号器は、バイナリコード化段階２２６の出力データを使用して映像ビットストリーム２２８を生成することができる。一部の実施形態では、映像ビットストリーム２２８をネットワーク伝送のために更にパケット化することができる。

[0059] プロセス２００Ａの再構築経路を参照し、逆量子化段階２１８で、符号器は、量子化済み変換係数２１６に対して逆量子化を行って再構築済み変換係数を生成することができる。逆変換段階２２０で、符号器は、再構築済み変換係数に基づいて再構築済み残差ＢＰＵ２２２を生成することができる。符号器は、再構築済み残差ＢＰＵ２２２を予測済みＢＰＵ２０８に加えて、プロセス２００Ａの次の反復内で使用される予測基準２２４を生成することができる。

[0060] 映像シーケンス２０２を符号化するためにプロセス２００Ａの他のバリエーションを使用できることに留意すべきである。一部の実施形態では、符号器がプロセス２００Ａの段階を異なる順序で実行することができる。一部の実施形態では、プロセス２００Ａの１つ又は複数の段階を単一の段階へと組み合わせることができる。一部の実施形態では、プロセス２００Ａの単一の段階を複数の段階に分けることができる。例えば変換段階２１２と量子化段階２１４とを単一の段階へと組み合わせることができる。一部の実施形態では、プロセス２００Ａが追加の段階を含み得る。一部の実施形態では、プロセス２００Ａが図２Ａ内の１つ又は複数の段階を省くことができる。

[0061] 図２Ｂは、本開示の一部の実施形態による符号化プロセスの別の例２００Ｂの概略図を示す。プロセス２００Ｂは、プロセス２００Ａから修正され得る。例えばプロセス２００Ｂは、ハイブリッド映像コード化規格（例えばＨ．２６ｘシリーズ）に準拠する符号器によって使用され得る。プロセス２００Ａと比較し、プロセス２００Ｂの順方向経路はモード決定段階２３０を更に含み、予測段階２０４を空間的予測段階２０４２及び時間的予測段階２０４４に分ける。プロセス２００Ｂの再構築経路は、ループフィルタ段階２３２及びバッファ２３４を追加で含む。

[0062] 概して、予測技法は空間的予測及び時間的予測の２つの種類に分類することができる。空間的予測（例えばイントラピクチャ予測又は「イントラ予測」）は、現ＢＰＵを予測するために、同じピクチャ内の既にコード化された１つ又は複数の隣接ＢＰＵのピクセルを使用することができる。つまり空間的予測における予測基準２２４は、隣接ＢＰＵを含み得る。空間的予測はピクチャの固有の空間的冗長性を減らすことができる。時間的予測（例えばインタピクチャ予測又は「インタ予測」）は、現ＢＰＵを予測するために、既にコード化された１つ又は複数のピクチャの領域を使用することができる。つまり時間的予測における予測基準２２４は、コード化されたピクチャを含み得る。時間的予測はピクチャの固有の時間的冗長性を減らすことができる。

[0063] プロセス２００Ｂを参照し、順方向経路において、符号器は、空間的予測段階２０４２及び時間的予測段階２０４４で予測操作を行う。例えば空間的予測段階２０４２で符号器はイントラ予測を行うことができる。符号化されているピクチャの元のＢＰＵに関して、予測基準２２４は、同じピクチャ内の（順方向経路内で）符号化され（再構築経路内で）再構築されている１つ又は複数の隣接ＢＰＵを含み得る。符号器は、隣接ＢＰＵを外挿することによって、予測済みＢＰＵ２０８を生成することができる。外挿技法は、例えば線形外挿又は線形補間、多項式外挿又は多項式補間等を含み得る。一部の実施形態では、符号器は、予測済みＢＰＵ２０８のピクセルごとに、対応するピクセルの値を外挿することによって等、ピクセルレベルで外挿を行うことができる。外挿に使用される隣接ＢＰＵは、垂直方向（例えば元のＢＰＵの上）、水平方向（例えば元のＢＰＵの左）、対角線方向（例えば元のＢＰＵの左下、右下、左上、又は右上）、又は使用される映像コード化規格内で規定される任意の方向等、様々な方向から元のＢＰＵに対して位置し得る。イントラ予測では、予測データ２０６は、例えば使用される隣接ＢＰＵの位置（例えば座標）、使用される隣接ＢＰＵのサイズ、外挿のパラメータ、元のＢＰＵに対する使用される隣接ＢＰＵの方向等を含み得る。

[0064] 別の例では、符号器は、時間的予測段階２０４４でインタ予測を行うことができる。現ピクチャの元のＢＰＵに関して、予測基準２２４は、（順方向経路内で）符号化され（再構築経路内で）再構築されている１つ又は複数のピクチャ（「参照ピクチャ」と呼ぶ）を含み得る。一部の実施形態では、参照ピクチャがＢＰＵごとに符号化され再構築され得る。例えば符号器は、再構築済み残差ＢＰＵ２２２を予測済みＢＰＵ２０８に加えて再構築済みＢＰＵを生成することができる。同じピクチャの全ての再構築済みＢＰＵが生成されると、符号器は、参照ピクチャとして再構築済みピクチャを生成することができる。符号器は、参照ピクチャの範囲（「探索窓」と呼ぶ）内の一致領域を探すために「動き推定」の操作を行うことができる。参照ピクチャ内の探索窓の位置は、現ピクチャ内の元のＢＰＵの位置に基づいて決定することができる。例えば探索窓は、参照ピクチャ内で、現ピクチャ内の元のＢＰＵと同じ座標を有する位置に中心を置くことができ、所定の距離にわたって広げることができる。符号器が探索窓内で元のＢＰＵと同様の領域を（例えばpel再帰アルゴリズム、ブロックマッチングアルゴリズム等を使用することによって）識別すると、符号器は、その領域を一致領域として決定することができる。一致領域は元のＢＰＵと異なる（例えばそれよりも小さい、等しい、大きい、又は異なる形状の）寸法を有し得る。参照ピクチャ及び現ピクチャは（例えば図１に示すように）タイムライン内で時間的に隔てられているので、時間が経つにつれて一致領域が元のＢＰＵの位置に「移動する」と見なすことができる。符号器はかかる動きの方向及び距離を「動きベクトル」として記録することができる。（例えば図１のピクチャ１０６のような）複数の参照ピクチャが使用される場合、符号器は、参照ピクチャごとに一致領域を探し、その関連する動きベクトルを求めることができる。一部の実施形態では、符号器が個々の一致する参照ピクチャの一致領域のピクセル値に重みを割り当てることができる。

[0065] 動き推定は、例えば平行移動、回転、拡大縮小等の様々な種類の動きを識別するために使用することができる。インタ予測では、予測データ２０６は、例えば一致領域の位置（例えば座標）、一致領域に関連する動きベクトル、参照ピクチャの数、参照ピクチャに関連する重み等を含み得る。

[0066] 予測済みＢＰＵ２０８を生成するために、符号器は「動き補償」の操作を行うことができる。動き補償は、予測データ２０６（例えば動きベクトル）及び予測基準２２４に基づいて予測済みＢＰＵ２０８を再構築するために使用することができる。例えば符号器は、動きベクトルに従って参照ピクチャの一致領域を動かすことができ、その中で符号器は現ピクチャの元のＢＰＵを予測することができる。（例えば図１のピクチャ１０６のような）複数の参照ピクチャが使用される場合、符号器は、個々の動きベクトルに従って参照ピクチャの一致領域を動かし、一致領域のピクセル値を平均することができる。一部の実施形態では、符号器が個々の一致する参照ピクチャの一致領域のピクセル値に重みを割り当てた場合、符号器は、動かした一致領域のピクセル値の加重和を求めることができる。

[0067] 一部の実施形態では、インタ予測は単方向でも双方向でもよい。単方向のインタ予測は、現ピクチャに対して同じ時間的方向にある１つ又は複数の参照ピクチャを使用することができる。例えば図１のピクチャ１０４は、参照ピクチャ（即ちピクチャ１０２）がピクチャ１０４に先行する単方向のインタ予測ピクチャである。双方向のインタ予測は、現ピクチャに対して両方の時間的方向にある１つ又は複数の参照ピクチャを使用することができる。例えば図１のピクチャ１０６は、参照ピクチャ（即ちピクチャ１０４及び１０８）がピクチャ１０４に対して両方の時間的方向にある双方向のインタ予測ピクチャである。

[0068] プロセス２００Ｂの順方向経路を引き続き参照し、空間的予測段階２０４２及び時間的予測段階２０４４の後、モード決定段階２３０において、符号器は、プロセス２００Ｂの現在の反復のための予測モード（例えばイントラ予測又はインタ予測の１つ）を選択することができる。例えば符号器はレート歪み最適化技法を実行することができ、かかる技法では、符号器は、候補予測モードのビットレート及び候補予測モード下の再構築済み参照ピクチャの歪みに応じてコスト関数の値を最小化するための予測モードを選択することができる。選択される予測モードに応じて、符号器は、対応する予測済みＢＰＵ２０８及び予測済みデータ２０６を生成することができる。

[0069] プロセス２００Ｂの再構築経路において、順方向経路内でイントラ予測モードが選択されている場合、予測基準２２４（例えば現ピクチャ内で符号化され再構築されている現ＢＰＵ）を生成した後で、符号器は、後で使用するために（例えば現ピクチャの次のＢＰＵを外挿するために）空間的予測段階２０４２に予測基準２２４を直接フィードすることができる。順方向経路内でインタ予測モードが選択されている場合、予測基準２２４（例えば全てのＢＰＵが符号化され再構築されている現ピクチャ）を生成した後で、符号器は、ループフィルタ段階２３２に予測基準２２４をフィードすることができ、ループフィルタ段階２３２では、符号器は、予測基準２２４にループフィルタを適用してインタ予測によって引き起こされる歪み（例えばブロッキングアーティファクト）を減らし又はなくすことができる。例えばデブロッキング、サンプル適応オフセット、適応ループフィルタ等、符号器は、ループフィルタ段階２３２で様々なループフィルタ技法を適用することができる。ループフィルタ済みの参照ピクチャは、後で使用するために（例えば映像シーケンス２０２の将来のピクチャ用のインタ予測参照ピクチャとして使用するために）バッファ２３４（又は「復号済みピクチャバッファ」）内に記憶することができる。符号器は、時間的予測段階２０４４で使用するために１つ又は複数の参照ピクチャをバッファ２３４内に記憶することができる。一部の実施形態では、符号器は、量子化済み変換係数２１６、予測データ２０６、及び他の情報と共にループフィルタのパラメータ（例えばループフィルタの強度）をバイナリコード化段階２２６で符号化することができる。

[0070] 図３Ａは、本開示の一部の実施形態による復号プロセス３００Ａの一例の概略図を示す。プロセス３００Ａは、図２Ａの圧縮プロセス２００Ａに対応する解凍プロセスであり得る。一部の実施形態では、プロセス３００Ａがプロセス２００Ａの再構築経路と同様であり得る。復号器は、プロセス３００Ａに従って映像ビットストリーム２２８を映像ストリーム３０４へと復号することができる。映像ストリーム３０４は映像シーケンス２０２と非常に似ているものであり得る。しかし、圧縮及び解凍プロセス（例えば図２Ａ～図２Ｂの量子化段階２１４）における情報損失により、概して映像ストリーム３０４は映像シーケンス２０２と同一ではない。図２Ａ～図２Ｂのプロセス２００Ａ及び２００Ｂと同様に、復号器は、映像ビットストリーム２２８内に符号化される各ピクチャについて基本処理単位（ＢＰＵ）のレベルにおいてプロセス３００Ａを実行することができる。例えば復号器はプロセス３００Ａを反復的なやり方で実行することができ、復号器はプロセス３００Ａの１回の反復の中で基本処理単位を復号することができる。一部の実施形態では、復号器は、映像ビットストリーム２２８内に符号化される各ピクチャの領域（例えば領域１１４～１１８）についてプロセス３００Ａを並列に実行することができる。

[0071] 図３Ａでは、復号器は、符号化済みピクチャの基本処理単位（「符号化済みＢＰＵ」と呼ぶ）に関連する映像ビットストリーム２２８の一部をバイナリ復号段階３０２にフィードすることができる。バイナリ復号段階３０２で、復号器は、その部分を予測データ２０６及び量子化済み変換係数２１６へと復号することができる。復号器は、量子化済み変換係数２１６を逆量子化段階２１８及び逆変換段階２２０にフィードして、再構築済み残差ＢＰＵ２２２を生成することができる。復号器は、予測データ２０６を予測段階２０４にフィードして、予測済みＢＰＵ２０８を生成することができる。復号器は、再構築済み残差ＢＰＵ２２２を予測済みＢＰＵ２０８に加えて、予測済み基準２２４を生成することができる。一部の実施形態では、予測済み基準２２４は、バッファ（例えばコンピュータメモリ内の復号済みピクチャバッファ）内に記憶され得る。復号器は、プロセス３００Ａの次の反復内で予測操作を行うための予測済み基準２２４を、予測段階２０４にフィードすることができる。

[0072] 復号器は、プロセス３００Ａを反復的に実行して、符号化済みピクチャの各符号化済みＢＰＵを復号し、符号化済みピクチャの次の符号化済みＢＰＵを符号化するための予測済み基準２２４を生成することができる。符号化済みピクチャの全ての符号化済みＢＰＵを復号した後、復号器は、表示するためにピクチャを映像ストリーム３０４に出力し、映像ビットストリーム２２８内の次の符号化済みピクチャの復号に進むことができる。

[0073] バイナリ復号段階３０２で、復号器は、符号器が使用したバイナリコード化技法（例えばエントロピコード化、可変長コード化、算術コード化、ハフマンコード化、コンテキスト適応バイナリ算術コード化、又は他の任意の可逆圧縮アルゴリズム）の逆操作を行うことができる。一部の実施形態では、予測データ２０６及び量子化済み変換係数２１６に加えて、復号器は、例えば予測モード、予測操作のパラメータ、変換の種類、量子化プロセスのパラメータ（例えば量子化パラメータ）、符号器制御パラメータ（例えばビットレート制御パラメータ）等の他の情報を、バイナリ復号段階３０２において復号することができる。一部の実施形態では、映像ビットストリーム２２８がネットワーク上でパケット単位で伝送される場合、復号器は、バイナリ復号段階３０２にフィードする前に、映像ビットストリーム２２８をパケット化解除することができる。

[0074] 図３Ｂは、本開示の一部の実施形態による復号プロセスの別の例３００Ｂの概略図を示す。プロセス３００Ｂはプロセス３００Ａから修正され得る。例えばプロセス３００Ｂは、ハイブリッド映像コード化規格（例えばＨ．２６ｘシリーズ）に準拠する復号器によって使用され得る。プロセス３００Ａと比較し、プロセス３００Ｂは、予測段階２０４を空間的予測段階２０４２及び時間的予測段階２０４４に更に分け、ループフィルタ段階２３２及びバッファ２３４を追加で含む。

[0075] プロセス３００Ｂでは、復号されている符号化済みピクチャ（「現ピクチャ」と呼ぶ）の符号化済み基本処理単位（「現ＢＰＵ」と呼ぶ）に関して、復号器によってバイナリ復号段階３０２から復号される予測データ２０６は、現ＢＰＵを符号化するためにどの予測モードが符号器によって使用されたのかに応じて様々な種類のデータを含み得る。例えば現ＢＰＵを符号化するためにイントラ予測が符号器によって使用された場合、予測データ２０６は、イントラ予測、イントラ予測操作のパラメータ等を示す予測モードインジケータ（例えばフラグ値）を含み得る。イントラ予測操作のパラメータは、例えば基準として使用される１つ又は複数の隣接ＢＰＵの位置（例えば座標）、隣接ＢＰＵのサイズ、外挿のパラメータ、元のＢＰＵに対する隣接ＢＰＵの方向等を含み得る。別の例では、現ＢＰＵを符号化するためにインタ予測が符号器によって使用された場合、予測データ２０６は、インタ予測、インタ予測操作のパラメータ等を示す予測モードインジケータ（例えばフラグ値）を含み得る。インタ予測操作のパラメータは、例えば現ＢＰＵに関連する参照ピクチャの数、参照ピクチャにそれぞれ関連する重み、それぞれの参照ピクチャ内の１つ又は複数の一致領域の位置（例えば座標）、一致領域にそれぞれ関連する１つ又は複数の動きベクトル等を含み得る。

[0076] 予測モードインジケータに基づき、復号器は、空間的予測段階２０４２で空間的予測（例えばイントラ予測）を行うのか、時間的予測段階２０４４で時間的予測（例えばインタ予測）を行うのかを決めることができる。かかる空間的予測又は時間的予測の実行の詳細は図２Ｂに示しており、以下で繰り返さない。かかる空間的予測又は時間的予測を行った後、復号器は、予測済みＢＰＵ２０８を生成することができる。図３Ａに記載したように、復号器は、予測済みＢＰＵ２０８と再構築済み残差ＢＰＵ２２２とを加えて、予測基準２２４を生成することができる。

[0077] プロセス３００Ｂでは、復号器は、プロセス３００Ｂの次の反復内で予測操作を行うための予測済み基準２２４を、空間的予測段階２０４２又は時間的予測段階２０４４にフィードすることができる。例えば現ＢＰＵが空間的予測段階２０４２においてイントラ予測を使用して復号される場合、予測基準２２４（例えば復号済みの現ＢＰＵ）を生成した後で、復号器は、後で使用するために（例えば現ピクチャの次のＢＰＵを外挿するために）空間的予測段階２０４２に予測基準２２４を直接フィードすることができる。現ＢＰＵが時間的予測段階２０４４においてインタ予測を使用して復号される場合、予測基準２２４（例えば全てのＢＰＵが復号されている参照ピクチャ）を生成した後で、符号器は、ループフィルタ段階２３２に予測基準２２４をフィードして、歪み（例えばブロッキングアーティファクト）を減らし又はなくすことができる。復号器は、図２Ｂに記載したやり方で予測基準２２４にループフィルタを適用することができる。ループフィルタ済みの参照ピクチャは、後で使用するために（例えば映像ビットストリーム２２８の将来の符号化ピクチャ用のインタ予測参照ピクチャとして使用するために）バッファ２３４（例えばコンピュータメモリ内の復号済みピクチャバッファ）内に記憶することができる。復号器は、時間的予測段階２０４４で使用するために１つ又は複数の参照ピクチャをバッファ２３４内に記憶することができる。一部の実施形態では、現ＢＰＵを符号化するためにインタ予測が使用されたことを予測データ２０６の予測モードインジケータが示す場合、予測データはループフィルタのパラメータ（例えばループフィルタの強度）を更に含むことができる。

[0078] 図４は、本開示の一部の実施形態による、映像を符号化又は復号するための機器４００の一例のブロック図である。図４に示すように、機器４００はプロセッサ４０２を含み得る。プロセッサ４０２が本明細書に記載の命令を実行するとき、機器４００は映像を符号化し又は復号するための専用マシンになり得る。プロセッサ４０２は情報を操作し又は処理することができる任意の種類の回路であり得る。例えばプロセッサ４０２は、任意の数の中央処理装置（「ＣＰＵ」）、グラフィックス処理装置（「ＧＰＵ」）、ニューラル処理ユニット（「ＮＰＵ」）、マイクロコントローラユニット（「ＭＣＵ」）、光プロセッサ、プログラム可能論理コントローラ、マイクロコントローラ、マイクロプロセッサ、デジタル信号プロセッサ、ＩＰ（intellectual property）コア、プログラム可能論理アレイ（ＰＬＡ）、プログラム可能アレイ論理（ＰＡＬ）、汎用アレイ論理（ＧＡＬ）、複合プログラム可能論理装置（ＣＰＬＤ）、書換可能ゲートアレイ（ＦＰＧＡ）、システムオンチップ（ＳｏＣ）、特定用途向け集積回路（ＡＳＩＣ）等の任意の組み合わせを含み得る。一部の実施形態では、プロセッサ４０２は単一の論理構成要素としてグループ化される１組のプロセッサとすることもできる。例えば図４に示すように、プロセッサ４０２はプロセッサ４０２ａ、プロセッサ４０２ｂ、及びプロセッサ４０２ｎを含む複数のプロセッサを含み得る。

[0079] 機器４００は、データ（例えば１組の命令、コンピュータコード、中間データ等）を記憶するように構成されるメモリ４０４も含み得る。例えば図４に示すように、記憶データは、プログラム命令（例えばプロセス２００Ａ、２００Ｂ、３００Ａ、又は３００Ｂ内の段階を実装するためのプログラム命令）及び処理用データ（例えば映像シーケンス２０２、映像ビットストリーム２２８、又は映像ストリーム３０４）を含み得る。プロセッサ４０２は、プログラム命令及び処理用データに（例えばバス４１０を介して）アクセスし、プログラム命令を実行して処理用データに対する操作又は処理を行うことができる。メモリ４０４は、高速ランダムアクセス記憶装置又は不揮発性記憶装置を含み得る。一部の実施形態では、メモリ４０４が、任意の数のランダムアクセスメモリ（ＲＡＭ）、読取専用メモリ（ＲＯＭ）、光学ディスク、磁気ディスク、ハードドライブ、ソリッドステートドライブ、フラッシュドライブ、セキュリティデジタル（ＳＤ）カード、メモリスティック、コンパクトフラッシュ（登録商標）（ＣＦ）カード等の任意の組み合わせを含み得る。メモリ４０４は、単一の論理構成要素としてグループ化される（図４には不図示の）メモリ群とすることもできる。

[0080] 内蔵バス（例えばＣＰＵメモリバス）、外部バス（例えばユニバーサルシリアルバスポート、周辺機器コンポーネント相互接続エクスプレスポート）等のバス４１０は、機器４００内の構成要素間でデータを転送する通信装置であり得る。

[0081] 曖昧さを招くことなしに説明を簡単にするために、本開示ではプロセッサ４０２及び他のデータ処理回路をまとめて「データ処理回路」と呼ぶ。データ処理回路は、完全にハードウェアとして、又はソフトウェア、ハードウェア、若しくはファームウェアの組み合わせとして実装することができる。加えてデータ処理回路は、単一の独立したモジュールとすることができ、又は機器４００の他の任意の構成要素内に完全に若しくは部分的に組み合わせることができる。

[0082] 機器４００は、ネットワーク（例えばインターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク等）との有線通信又は無線通信を提供するためのネットワークインタフェース４０６を更に含み得る。一部の実施形態では、ネットワークインタフェース４０６が任意の数のネットワークインタフェースコントローラ（ＮＩＣ）、無線周波数（ＲＦ）モジュール、トランスポンダ、トランシーバ、モデム、ルータ、ゲートウェイ、有線ネットワークアダプタ、無線ネットワークアダプタ、Bluetoothアダプタ、赤外線アダプタ、近距離無線通信（「ＮＦＣ」）アダプタ、セルラネットワークチップ等の任意の組み合わせを含み得る。

[0083] 一部の実施形態では、機器４００は、１つ又は複数の周辺装置への接続を提供するための周辺装置インタフェース４０８を任意選択的に更に含み得る。図４に示すように、周辺装置はこれだけに限定されないが、カーソル制御装置（例えばマウス、タッチパッド、又はタッチスクリーン）、キーボード、ディスプレイ（例えばブラウン管ディスプレイ、液晶ディスプレイ、又は発光ダイオードディスプレイ）、映像入力装置（例えば映像アーカイブに結合されるカメラ又は入力インタフェース）等を含み得る。

[0084] 映像コーデック（例えばプロセス２００Ａ、２００Ｂ、３００Ａ、又は３００Ｂを実行するコーデック）は、機器４００内の任意のソフトウェア又はハードウェアモジュールの任意の組み合わせとして実装できることに留意すべきである。例えばプロセス２００Ａ、２００Ｂ、３００Ａ、又は３００Ｂの一部の又は全ての段階が、メモリ４０４内にロード可能なプログラム命令等の機器４００の１つ又は複数のソフトウェアモジュールとして実装され得る。別の例では、プロセス２００Ａ、２００Ｂ、３００Ａ、又は３００Ｂの一部の又は全ての段階が、専用データ処理回路（例えばＦＰＧＡ、ＡＳＩＣ、ＮＰＵ等）等の機器４００の１つ又は複数のハードウェアモジュールとして実装され得る。

[0085] 図５は、本開示の一部の実施形態による、例示的なクロマスケーリングによるルママッピング（ＬＭＣＳ）プロセス５００の概略図を示す。例えばプロセス５００は、ハイブリッド映像コード化規格（例えばＨ．２６ｘシリーズ）に準拠する復号器によって使用され得る。ＬＭＣＳは、図２Ｂのループフィルタ２３２の前に適用される新たな処理ブロックである。ＬＭＣＳはリシェーパと呼ぶこともできる。

[0086] ＬＭＣＳプロセス５００は、適応区分線形モデルに基づくルマ成分値のインループマッピング及びクロマ成分のルマ依存クロマ残差スケーリングを含み得る。

[0087] 図５に示すように、適応区分線形モデルに基づくルマ成分値のインループマッピングは、順方向マッピング段階５１８及び逆マッピング段階５０８を含み得る。クロマ成分のルマ依存クロマ残差スケーリングは、クロマスケーリング５２０を含み得る。

[0088] マッピング前の又は逆マッピング後のサンプル値は元の領域内のサンプルと呼ぶことができ、マッピング後の及び逆マッピング前のサンプル値はマップ領域内のサンプルと呼ぶことができる。ＬＭＣＳが有効化される場合、プロセス５００内の一部の段階は元の領域ではなくマップ領域内で行うことができる。順方向マッピング段階５１８及び逆マッピング段階５０８は、ＳＰＳフラグを使用してシーケンスレベルで有効化／無効化できることが理解されよう。

[0089] 図５に示すように、Ｑ^－１＆Ｔ^－１段階５０４、再構築５０６、及びイントラ予測５０８はマップ領域内で実行される。例えばＱ^－１＆Ｔ^－１段階５０４は逆量子化及び逆変換を含むことができ、再構築５０６はルマ予測とルマ残差との加算を含むことができ、イントラ予測５０８はルマイントラ予測を含み得る。

[0090] ループフィルタ５１０、動き補償段階５１６及び５３０、イントラ予測段階５２８、再構築段階５２２、並びに復号済みピクチャバッファ（ＤＰＢ）５１２及び５２６は元の（即ち非マップ）領域内で実行される。一部の実施形態では、ループフィルタ５１０がデブロッキング、適応ループフィルタ（ＡＬＦ）、及びサンプル適応オフセット（ＳＡＯ）を含むことができ、再構築段階５２２がクロマ予測とクロマ残差との加算を含むことができ、ＤＰＢ５１２及び５２６が復号済みピクチャを参照ピクチャとして記憶することができる。

[0091] 一部の実施形態では、区分線形モデルによるルママッピングを適用することができる。

[0092] ルマ成分のインループマッピングは、ダイナミックレンジにわたるコード語の再配分によって入力映像の信号統計を調節して圧縮効率を改善することができる。ルママッピングは、順方向マッピング関数「FwdMap」及び対応する逆マッピング関数「InvMap」によって実行することができる。「FwdMap」関数は１６個の等しい区分と共に区分線形モデルを使用してシグナリングされる。「InvMap」関数はシグナリングされる必要がなく、代わりに「FwdMap」関数から導出される。

[0093] 区分線形モデルのシグナリングを図６の表１及び図７の表２に示す。図６の表１は、タイルグループヘッダ構文構造を示す。図６に示すように、現タイルグループ内にルママッピングモデルがあるかどうかを示すためにリシェーパモデルパラメータ存在フラグがシグナリングされる。現タイルグループ内にルママッピングモデルがある場合、図７の表２に示す構文要素を使用し、対応する区分線形モデルパラメータをtile_group_reshaper_model()内でシグナリングすることができる。区分線形モデルは入力信号のダイナミックレンジを１６個の等しい区分に分割する。１６個の等しい区分のそれぞれについて、区分に割り当てられるコード語の数を使用して区分の線形マッピングパラメータが表される。１０ビット入力を例に取る。１６個の区分のそれぞれは、その区分に割り当てられる６４のコード語をデフォルトで有し得る。スケール因子を計算し、その区分についてマッピング関数をしかるべく調節するために、シグナリングされるコード語の数を使用することができる。図７の表２は、コード語の数がシグナリングされる最小インデックス「reshaper_model_min_bin_idx」及び最大インデックス「reshaper_model_max_bin_idx」も包含的に定める。区分インデックスがreshaper_model_min_bin_idxよりも小さい又はreshaper_model_max_bin_idxよりも大きい場合、その区分のためのコード語の数はシグナリングされず、ゼロだと推論される（即ちその区分にコード語が割り当てられず、マッピング／スケーリングが適用されない）。

[0094] tile_group_reshaper_model()がシグナリングされた後、図８に示すＬＭＣＳプロセスが現タイルグループに適用されるかどうかを示すために、タイルグループヘッダレベルで別のリシェーパイネーブルフラグ「tile_group_reshaper_enable_flag」がシグナリングされる。リシェーパが現タイルグループについて有効化され、現タイルグループがデュアルツリー分割を使用しない場合、クロマスケーリングが現タイルグループについて有効化されるかどうかを示すために、更なるクロマスケーリングイネーブルフラグがシグナリングされる。デュアルツリー分割はクロマセパレートツリーとも呼ぶことができる。

[0095] 区分線形モデルは、図７の表２内のシグナリングされる構文要素に基づいて以下のように構築することができる。「FwdMap」区分線形モデルのそれぞれのｉ番目の区分、ｉ＝０，１，．．．，１５は、２つの入力ピボットポイントInputPivot[]及び２つの出力（マップ済み）ピボットポイントMappedPivot[]によって定められる。InputPivot[]及びMappedPivot[]はシグナリングされる構文に基づいて以下のように計算される（一般性を失うことなく入力映像のビット深度を１０ビットだと仮定する）：
１）OrgCW=64
２）i=0:16ではInputPivot[i]=i*OrgCW
３）i=reshaper_model_min_bin_idx: reshaper_model_max_bin_idxではSignaledCW[i]=OrgCW+(1￢2*reshape_model_bin_delta_sign_CW[i])*reshape_model_bin_delta_abs_CW[i];
４）i=0:16ではMappedPivot[i]を以下のように計算する：
MappedPivot[0]=0;
(i=0; i<16; i++)では
MappedPivot[i+1]=MappedPivot[i]+SignaledCW[i]

[0096] 逆マッピング関数「InvMap」もInputPivot[]及びMappedPivot[]によって定めることができる。「FwdMap」と異なり、「InvMap」区分線形モデルでは、各区分の２つの入力ピボットポイントをMappedPivot[]によって定めることができ、２つの出力ピボットポイントをInputPivot[]によって定めることができ、これは「FwdMap」の反対である。このようにして「FwdMap」の入力は等しい区分に分割されるが、「InvMap」の入力が等しい区分に分割されることは保証されない。

[0097] 図５に示すように、インタコード化ブロックでは動き補償予測をマップ領域内で実行することができる。換言すれば、動き補償予測５１６の後、ＤＰＢ内内の参照信号に基づいてY_predを計算し、元の領域内のルマ予測ブロックをマップ領域にマップするために「FwdMap」関数５１８を適用することができる（Y’_pred=FwdMap(Y_pred)）。イントラコード化されたブロックでは、イントラ予測内で使用された参照サンプルがマップ領域内に既にあるので「FwdMap」関数は適用されない。再構築済みブロック５０６の後、Y_rを計算することができる。マップ領域内の再構築済みルマ値を元の領域内の再構築済みルマ値に変換して戻すために「InvMap」関数５０８を適用することができる（

）。「InvMap」関数５０８はイントラコード化されたルマブロック及びインタコード化されたルマブロックの両方に適用することができる。

[0098] ルママッピングプロセス（順方向又は逆マッピング）は、参照表（ＬＵＴ）を使用して又はその場での計算を使用して実装することができる。ＬＵＴが使用される場合、タイルグループレベルでの使用のために「FwdMapLUT[]」及び「InvMapLUT[]」の表を予め計算し、予め記憶しておくことができ、順方向マッピング及び逆マッピングを単純にFwdMap(Y_pred)=FwdMapLUT[Y_pred]、及びInvMap(Y_r)=InvMapLUT[Y_r]としてそれぞれ実装することができる。或いはその場での計算を使用することができる。順方向マッピング関数「FwdMap」を例に取る。ルマサンプルが属する区分を突き止めるために、サンプル値を（１０ビットの映像を仮定して１６個の等しい区分に対応する）６ビット右シフトして区分インデックスを得ることができる。次いでその区分の線形モデルパラメータを取得し、その場で適用してマップ済みルマ値を計算する。FwdMap関数は以下のように評価され：
Y’pred=FwdMap(Y_pred)=((b2-b1)/(a2-a1))*(Y_pred-a1)+b1
但し「i」は区分インデックスであり、a1はInputPivot[i]であり、a2はInputPivot[i+1]であり、b1はMappedPivot[i]であり、b2はMappedPivot[i+1]である。

[0099] 「InvMap」関数は、マップ領域内の区分が等しいサイズであることが保証されないので、サンプル値が属する区分を見出すときに単純な右ビットシフトの代わりに条件付きチェック（conditional check）を適用しなければならないことを除き、同様のやり方でその場で計算することができる。

[0100] 一部の実施形態では、ルマ依存クロマ残差スケーリングを行うことができる。

[0101] クロマ残差スケーリングは、ルマ信号とその対応するクロマ信号との間の相互作用を補償するように設計される。クロマ残差スケーリングが有効化されるかどうかもタイルグループレベルでシグナリングされる。図６の表１に示すように、ルママッピングが有効化される場合、及びデュアルツリー分割が現タイルグループに適用されない場合、ルマ依存クロマ残差スケーリングが有効化されるかどうかを示すために追加のフラグ（例えばtile_group_reshaper_chroma_residual_scale_flag）がシグナリングされる。ルママッピングが使用されない場合又はデュアルツリー分割が現タイルグループ内で使用される場合、ルマ依存クロマ残差スケーリングが自動で無効化される。更に、ルマ依存クロマ残差スケーリングは、その領域が４以下であるクロマブロックについて無効化され得る。

[0102] クロマ残差スケーリングは（イントラコード化されたブロック及びインタコード化されたブロックの両方について）対応するルマ予測ブロックの平均値に依存する。ルマ予測ブロックの平均としてのavgY’は以下のように計算することができる：

[0103] C_ScaleInvの値を以下のステップで計算する：
１）avgY’が属する区分線形モデルのインデックスY_IdxをInvMap関数に基づいて見つける。
２）C_ScaleInv=cScaleInv[Y_Idx]が成立し、但しcScaleInv[]は予め計算された１６個の区分のＬＵＴである。

[0104] ＶＴＭ４における現在のＬＭＣＳの方法では、予め計算されたＬＵＴであるcScaleInv[i]（iは０～１５の範囲内にある）は、６４エントリ静的ＬＵＴChromaResidualScaleLut及びSignaledCW[i]の値に基づいて以下のように導出される：
ChromaResidualScaleLut[64]={16384, 16384, 16384, 16384, 16384, 16384, 16384, 8192, 8192, 8192, 8192, 5461, 5461, 5461, 5461, 4096, 4096, 4096, 4096, 3277, 3277, 3277, 3277, 2731, 2731, 2731, 2731, 2341, 2341, 2341, 2048, 2048, 2048, 1820, 1820, 1820, 1638, 1638, 1638, 1638, 1489, 1489, 1489, 1489, 1365, 1365, 1365, 1365, 1260, 1260, 1260, 1260, 1170, 1170, 1170, 1170, 1092, 1092, 1092, 1092, 1024, 1024, 1024, 1024};
shiftC=11
－(SignaledCW[i]==0)が成立する場合、
cScaleInv[i]=(1<<shiftC)
－さもなければ
cScaleInv[i]=ChromaResidualScaleLut[(SignaledCW[i]>>1)-1]

[0105] 静的テーブルChromaResidualScaleLut[]は６４個のエントリを含み、SignaledCW[]は[0,128]の範囲内にある（入力を１０ビットと仮定する）。従って、クロマスケール因子ＬＵＴのcScaleInv[]を構築するために２による除算（例えば１による右シフト）を使用する。クロマスケール因子ＬＵＴのcScaleInv[]は複数のクロマスケール因子を含むことができる。ＬＵＴのcScaleInv[]はタイルグループレベルで構築される。

[0106] 現ブロックがイントラ、ＣＩＩＰ、又はイントラブロックコピー（ＩＢＣ、現ピクチャ参照又はＣＰＲとしても知られる）モードを使用してコード化される場合、avgY’はイントラ、ＣＩＩＰ、又はＩＢＣ予測ルマ値の平均として計算される。さもなければ、avgY’は順方向マップされるインタ予測ルマ値（つまり図５のY’_pred）の平均として計算される。サンプルに基づいて実行されるルママッピングと異なり、C_ScaleInvは全クロマブロックの定数値である。C_ScaleInvを用いてクロマ残差スケーリングを以下のように復号器側で適用する：

[0107] 但し

は現ブロックの再構築済みクロマ残差である。符号器側で、順方向クロマ残差スケーリング（変換され量子化される前）を次のように行う：C_ResScale=C_Res*C_Scale=C_Res/C_ScaleInv。

[0108] 一部の実施形態ではデュアルツリー分割が行われ得る。

[0109] ＶＶＣのドラフト４では、コード化ツリー方式は、ルマ及びクロマが別個のブロックツリー分割を有する能力をサポートする。これはデュアルツリー分割とも呼ばれる。デュアルツリー分割のシグナリングを図８の表３及び図９の表４に示す。ＳＰＳ内でシグナリングされるシーケンスレベル制御フラグである「qtbtt_dual_tree_intra_flag」がオンにされ、現タイルグループがイントラコード化される場合、ブロック分割情報をまずルマについて、次いでクロマについて別々にシグナリングすることができる。インタコード化されるタイルグループ（Ｐ及びＢタイルグループ）ではデュアルツリー分割が許可されない。別個のブロックツリーモードが適用される場合、図９の表４に示すようにルマコード化ツリーブロック（ＣＴＢ）が或るコード化ツリー構造によってＣＵへと分割され、クロマＣＴＢが別のコード化ツリー構造によってクロマＣＵへと分割される。

[0110] ルマ及びクロマが異なる分割を有することが許可される場合、様々な色成分間の依存性を有するコード化ツールに関して問題が生じ得る。例えばＬＭＣＳの場合、現ブロックに適用されるスケール因子を見出すために、対応するルマブロックの平均値を使用する。デュアルツリーが使用される場合、そのことが全ＣＴＵのレイテンシを招き得る。例えばＣＴＵのルマブロックが垂直に１回分割され、ＣＴＵのクロマブロックが水平に１回分割される場合、ＣＴＵの第１のクロマブロックが復号可能である前にＣＴＵのルマブロックの両方が復号される（それによりクロマスケール因子を計算するのに必要な平均値を計算することができる）。ＶＶＣでは、ＣＴＵがルマサンプルの単位で１２８ｘ１２８もの大きさであり得る。そのような大きいレイテンシはハードウェア復号器のパイプライン設計にとって非常に問題となる可能性がある。従って、ＶＶＣのドラフト４は、デュアルツリー分割とルマ依存クロマスケーリングとの組み合わせを禁止することができる。現タイルグループについてデュアルツリー分割が有効化される場合、クロマスケーリングを強制的にオフにすることができる。ＬＭＣＳのルママッピング部分は、ルマ成分に対してのみ影響し、色成分を横断する依存性の問題を有さないので、デュアルツリーの事例でも引き続き許可されていることに留意されたい。より優れたコード化効率を実現するために色成分間の依存性に依拠するコード化ツールの別の例は、クロスコンポーネント線形モデル（ＣＣＬＭ）と呼ばれる。

[0111] 従って、タイルグループレベルのクロマスケール因子ＬＵＴのcScaleInv[]の導出は容易に拡張することができない。導出プロセスは、６４個のエントリを有する一定のクロマＬＵＴChromaResidualScaleLutに現在は依存する。１６個の区分を有する１０ビットの映像では、２による除算の追加のステップを適用しなければならない。区分の数が変わる場合、例えば１６個の区分の代わりに８個の区分が使用される場合、２による除算ではなく４による除算を適用するように導出プロセスを変更しなければならない。この追加のステップは精度の損失を引き起こすだけでなく、洗練されておらず不要である。

[0112] 更に、クロマスケール因子を得るために使用される現クロマブロックの区分インデックスY_Idxを計算するために、全ルマブロックの平均値を使用することができる。これは望ましくなく大概不要である。１２８ｘ１２８の最大ＣＴＵサイズを検討されたい。この場合、平均ルマ値が１６３８４（１２８ｘ１２８）ルマサンプルに基づいて計算され、かかる計算は複雑である。更に、１２８ｘ１２８のルマブロック分割が符号器によって選択される場合、そのブロックは均質のコンテンツを含む可能性が高い。従って、ルマ平均を計算するのにブロック内のルマサンプルのサブセットで十分であり得る。

[0113] デュアルツリー分割では、ハードウェア復号器の潜在的なパイプラインの問題を回避するためにクロマスケーリングがオフであり得る。しかし、適用されるクロマスケール因子を導出するために対応するルマサンプルを使用する代わりに、適用されるクロマスケール因子を示すための明確なシグナリングを使用する場合は、この依存性を回避することができる。イントラコード化されるタイルグループ内のクロマスケーリングを有効化することはコード化効率を更に改善し得る。

[0114] 区分線形パラメータのシグナリングは更に改善することができる。現在、１６個の区分のそれぞれについてデルタコード語値がシグナリングされる。往々にしてこの１６区分について、限られた数の異なるコード語しか使用されないことが認められている。従ってシグナリングのオーバヘッドを更に減らすことができる。

[0115] 本開示の実施形態は、クロマスケーリングＬＵＴを除去することによって映像コンテンツを処理するための方法を提供する。

[0116] 上記で述べたように、６４エントリのクロマＬＵＴの拡張は困難な場合があり、他の区分線形モデルが使用される場合（例えば８区分、４区分、６４区分等）は問題となり得る。同じコード化効率を実現するために、クロマスケール因子をその対応する区分のルマスケール因子と同じに設定することができるので、かかる拡張は不要でもある。本開示の一部の実施形態では、クロマスケール因子（chroma_scaling）を以下のように現クロマブロックの区分インデックス「Y_Idx」に基づいて決定することができる。
・Y_Idx>reshaper_model_max_bin_idx、Y_Idx<reshaper_model_min_bin_idx又はSignaledCW[Y_Idx]=0が成立する場合、chroma_scalingをデフォルトに設定しchroma_scaling=1.0となる。
・さもなければchroma_scalingをSignaledCW[Y_Idx]/OrgCWに設定する。

[0117] chroma_scaling=1.0である場合スケーリングは適用されない。

[0118] 上記で決定したクロマスケール因子は小数精度を有し得る。ハードウェア／ソフトウェアプラットフォーム上の依存性を回避するために固定小数点近似を適用できることが理解されよう。更に、復号器側で逆クロマスケーリングを行うことができる。従って、乗算とその後に続く右シフトを使用する固定小数点演算によって除算を実装することができる。固定小数点精度における逆クロマスケール因子「inverse_chroma_scaling[]」は、固定小数点近似「CSCALE_FP_PREC」内のビットの数に基づいて以下のように決定することができる。
inverse_chroma_scaling[Y_Idx]=((1<<(luma_bit_depth-log2(TOTAL_NUMBER_PIECES)+CSCALE_FP_PREC))+(SignaledCW[Y_Idx]>>1))/SignaledCW[Y_Idx]
但しluma_bit_depthはルマビット深度であり、TOTAL_NUMBER_PIECESはＶＶＣのドラフト４では１６に設定される区分線形モデル内の総区分数である。「inverse_chroma_scaling[]」の値はタイルグループごとに１回計算するだけでよい場合があり、上記の除算は整数除算演算であることが理解されよう。

[0119] クロマスケール因子及び逆スケール因子を決定するために更なる量子化を適用することができる。例えば「SignaledCW」の全ての偶数（２×ｍ）値について逆クロマスケール因子を計算することができ、「SignaledCW」の奇数（２×ｍ＋１）値は隣接する偶数値のスケール因子のクロマスケール因子を再利用する。換言すれば下記を使用することができる：
for(i=reshaper_model_min_bin_idx; i<=reshaper_model_max_bin_idx; i++)
{
tempCW=SignaledCW[i]>>1)<<1;
inverse_chroma_scaling[i]=((1<<(luma_bit_depth-log2(TOTAL_NUMBER_PIECES)+CSCALE_FP_PREC))+(tempCW>>1))/tempCW;
}

[0120] クロマスケール因子の量子化は更に汎用化することができる。例えば、他の全ての隣接値が同じクロマスケール因子を共有しながら「SignaledCW」のｎ番目の値ごとに逆クロマスケール因子「inverse_chroma_scaling[]」を計算することができる。例えば「ｎ」は４に設定することができる。従って、隣接する４個のコード語値ごとに同じ逆クロマスケール因子値が共有され得る。一部の実施形態では「ｎ」の値を２のべき乗とすることができ、かかる設定は除算を計算するためにシフトを使用することを可能にする。log2(n)の値をLOG2_nとして表し、上記の等式「tempCW=SignaledCW[i]>>1)<<1」は以下のように修正することができる：
tempCW=SignaledCW[i]>>LOG2_n)<<LOG2_n

[0121] 一部の実施形態では、LOG2_nの値は区分線形モデル内で使用される区分数の関数であり得る。より少ない区分が使用される場合、より大きいLOG2_nを使用することが有益であり得る。例えばTOTAL_NUMBER_PIECESが１６以下の場合、LOG2_nは1+(4-log2(TOTAL_NUMBER_PIECES))に設定することができる。TOTAL_NUMBER_PIECESが１６を上回る場合、LOG2_nは０に設定することができる。

[0122] 本開示の実施形態は、ルマ予測ブロックの平均化を単純化することによって映像コンテンツを処理するための方法を提供する。

[0123] 上記で論じたように、現クロマブロックの区分インデックス「Y_Idx」を決定するために、対応するルマブロックの平均値を使用することができる。しかし、大きいブロックのサイズでは平均化プロセスが多数のルマサンプルを含み得る。最悪の場合、１２８ｘ１２８のルマサンプルが平均化プロセスに関与し得る。

[0124] 本開示の実施形態は、最悪の場合を僅かＮｘＮのルマサンプル（Ｎは２のべき乗である）を使用することに低減するための単純化した平均化プロセスを提供する。

[0125] 一部の実施形態では、２次元ルマブロックの両方の寸法が事前設定閾値Ｍ以下である（換言すれば２つの寸法の少なくとも一方がＭを上回る）場合、その寸法内のＭの位置だけを使用するように「ダウンサンプリング」を適用することができる。一般性を失うことなしに横寸法を例に取る。幅がＭを上回る場合、位置ｘ（x=i×(width>>log2(M)), i=0,…M-1）にあるサンプルだけを平均化に使用する。

[0126] 図１０は、１６ｘ８のルマブロックの平均を計算するために、提案した単純化を適用する一例を示す。この例ではＭが４に設定され、ブロック内の１６個のルマサンプル（陰影付きのサンプル）だけが平均化に使用される。事前設定閾値Ｍは４に限定されず、Ｍは２のべき乗である任意の値に設定できることが理解されよう。例えば事前設定閾値Ｍは１、２、４、８等であり得る。

[0127] 一部の実施形態では、ルマブロックの横寸法及び縦寸法が異なる事前設定閾値Ｍを有し得る。換言すれば、平均化演算の最悪の場合はＭ１ｘＭ２のサンプルを使用し得る。

[0128] 一部の実施形態では、寸法を考慮することなしに平均化プロセス内でサンプル数を限定することができる。例えば最大で１６個のサンプルを使用することができ、それらのサンプルは１ｘ１６、１６ｘ１、２ｘ８、８ｘ２、又は４ｘ４形式で横寸法又は縦寸法内に分散することができ、現ブロックの形状に適合する如何なる形式も選択することができる。例えばブロックが縦長の場合は２ｘ８サンプルの行列を使用することができ、ブロックが横長の場合は８ｘ２サンプルの行列を使用することができ、ブロックが正方形の場合は４ｘ４サンプルの行列を使用することができる。

[0129] 大きいブロックのサイズが選択される場合、ブロック内のコンテンツがより均質になる傾向があることが理解されよう。従って上記の単純化は平均値と全ルマブロックの真の平均との間の差異を引き起こし得るが、かかる差異は小さいものであり得る。

[0130] 更に、復号器側動きベクトルリファインメント（ＤＭＶＲ）は、動き補償が適用可能である前に、復号器が動き検出を行って動きベクトルを導出することを要求する。従って、とりわけ復号器にとってＤＭＶＲモードはＶＶＣ規格内で複雑であり得る。双方向オプティカルフロー（ＢＤＯＦ）はルマ予測ブロックを得るためにＤＭＶＲ後に適用しなければならない追加の逐次プロセスなので、ＶＶＣ規格内のＢＤＯＦモードはこの状況を更に複雑にし得る。クロマスケーリングは対応するルマ予測ブロックの平均値を必要とするので、平均値が計算可能である前にＤＭＶＲ及びＢＤＯＦを適用することができる。

[0131] このレイテンシの問題を解決するために、本開示の一部の実施形態ではＤＭＶＲ及びＢＤＯＦの前にルマ予測ブロックを使用して平均ルマ値を計算し、平均ルマ値を使用してクロマスケール因子を得る。このことはＤＭＶＲ及びＢＤＯＦプロセスと並列にクロマスケーリングを適用できるようにし、従ってレイテンシを著しく減らすことができる。

[0132] 本開示と合致して、レイテンシ低減の改変形態を考えることができる。一部の実施形態では、このレイテンシ低減は平均ルマ値を計算するためにルマ予測ブロックの一部しか使用しない上記の単純化した平均化プロセスと組み合わせることもできる。一部の実施形態では、ルマ予測ブロックをＤＭＶＲプロセスの後及びＢＤＯＦプロセスの前に使用して平均ルマ値を計算することができる。次いで、平均ルマ値を使用してクロマスケール因子を得る。この設計は、クロマスケール因子を決定する精度を保ちながら、ＢＤＯＦプロセスと並列にクロマスケーリングを適用できるようにする。ＤＭＶＲプロセスは動きベクトルをリファインする場合があるので、ＤＭＶＲプロセス前の動きベクトルと共に予測サンプルを使用することよりも、ＤＭＶＲプロセス後のリファインされた動きベクトルと共に予測サンプルを使用する方が正確であり得る。

[0133] 更に、ＶＶＣ規格ではＣＵ構文構造「coding_unit()」が、現ＣＵ内に何らかの非ゼロ残差係数があるかどうかを示すための構文要素「cu_cbf」を含む。ＴＵレベルでは、ＴＵ構文構造「transform_unit()」が、現ＴＵ内に何らかの非ゼロクロマ（Ｃｂ又はＣｒ）残差係数があるかどうかを示すための構文要素「tu_cbf_cb」及び「tu_cbf_cr」を含む。従来、ＶＶＣのドラフト４では、タイルグループレベルでクロマスケーリングが有効化される場合は、対応するルマブロックの平均化が常に呼び出される。

[0134] 本開示の実施形態は、ルマ平均化プロセスをバイパスすることによって映像コンテンツを処理するための方法を更に提供する。開示する実施形態と合致して、クロマスケーリングプロセスは残差クロマ係数に適用されるので、非ゼロクロマ係数がない場合はルマ平均化プロセスをバイパスすることができる。これは以下の条件に基づいて決定することができる：
条件１：cu_cbfが０に等しい
条件２：tu_cbf_cr及びtu_cbf_cbがどちらも０に等しい

[0135] 上記で論じたように「cu_cbf」は現ＣＵ内に何らかの非ゼロ残差係数があるかどうかを示すことができ、「tu_cbf_cb」及び「tu_cbf_cr」は現ＴＵ内に何らかの非ゼロクロマ（Ｃｂ又はＣｒ）残差係数があるかどうかを示すことができる。条件１又は条件２が満たされる場合はルマ平均化プロセスをバイパスすることができる。

[0136] 一部の実施形態では、予測ブロックのＮｘＮサンプルだけを使用して平均値を導出し、そのことは平均化プロセスを単純化する。例えばＮが１に等しい場合、予測ブロックの左上サンプルだけが使用される。但し、予測ブロックを使用するこの単純化した平均化プロセスは予測ブロックの生成を依然として必要とし、それによりレイテンシを引き起こす。

[0137] 一部の実施形態では、クロマスケール因子を生成するために参照ルマサンプルを直接使用することができる。このことは復号器がルマ予測プロセスと並列にスケール因子を導出できるようにし、それによりレイテンシを低減する。以下、参照ルマサンプルを用いたイントラ予測及びインタ予測を別々に説明する。

[0138] 例示的なイントラ予測では、予測ブロックを生成するための参照サンプルとして同じピクチャ内の復号済み隣接サンプルを使用することができる。これらの参照サンプルは、例えば現ブロックの上部のサンプル、現ブロックの左側のサンプル、又は現ブロックの左上のサンプルを含み得る。これらの参照サンプルの平均を使用してクロマスケール因子を導出することができる。一部の実施形態では、これらの参照サンプルの一部の平均を使用することができる。例えば現ブロックの左上の位置に最も近いＫ個の参照サンプル（例えばＫ＝３）だけを平均化する。

[0139] 例示的なインタ予測では、予測ブロックを生成するために時間的参照ピクチャからの参照サンプルを使用することができる。これらの参照サンプルは、参照ピクチャインデックス及び動きベクトルによって識別される。動きベクトルが小数精度を有する場合は補間を適用することができる。参照サンプルの平均を決定するために使用する参照サンプルは、補間前又は補間後の参照サンプルを含み得る。補間前の参照サンプルは整数精度にクリッピングされる動きベクトルを含み得る。開示する実施形態と合致して、参照サンプルの全てを使用して平均を計算することができる。或いは参照サンプルの一部だけ（例えば現ブロックの左上の位置に対応する参照サンプル）を使用して平均を計算することができる。

[0140] 図５に示すように、元の領域内でインタ予測を行いながら、リシェープされた領域内でイントラ予測（例えばイントラ予測５１４又は５２８）を行うことができる。従って、インタ予測では予測ブロックに対して順方向マッピングを適用することができ、順方向マッピング後のルマ予測ブロックを使用して平均を計算する。レイテンシを減らすために、平均は順方向マッピング前の予測ブロックを使用して計算することができる。例えば順方向マッピング前のブロック、順方向マッピング前のブロックのＮｘＮ部分、又は順方向マッピング前のブロックの左上サンプルを使用することができる。

[0141] 本開示の実施形態は、デュアルツリー分割のためのクロマスケーリングを伴う映像コンテンツを処理するための方法を更に提供する。

[0142] ルマに対する依存性はハードウェア設計の複雑化を引き起こし得るので、デュアルツリー分割を可能にするイントラコード化されるタイルグループについてクロマスケーリングをオフにすることができる。但し、この制限はコード化効率の損失を引き起こし得る。対応するルマブロックのサンプル値を平均化してavgY’を計算し、区分インデックスY_Idxを決定し、クロマスケール因子inverse_chroma_scaling[Y_Idx]を得る代わりに、デュアルツリー分割の場合にルマに対する依存性を回避するためにクロマスケール因子をビットストリーム内で明示的にシグナリングすることができる。

[0143] クロマスケールインデックスは様々なレベルでシグナリングすることができる。例えば図１１の表５に示すように、クロマスケールインデックスは、クロマ予測モードと共にコード化単位（ＣＵ）レベルでシグナリングすることができる。現クロマブロックのクロマスケール因子を決定するために、構文要素「lmcs_scaling_factor_idx」を使用することができる。「lmcs_scaling_factor_idx」がない場合、現クロマブロックのクロマスケール因子は浮動小数点数精度で１．０に、又は等価に固定小数点精度で（1<<CSCALE_FP_PREC）に等しいと推論することができる。「lmcs_chroma_scaling_idx」の許容値の範囲はタイルグループレベルで決定され、後で解説する。

[0144] 「lmcs_chroma_scaling_idx」の可能な値にもよるが、とりわけ小さいブロックにとってシグナリングのコストが高くなり得る。従って本開示の一部の実施形態では、図１１の表５のシグナリング条件がブロックサイズの条件を追加で含み得る。例えば（イタリック体及び灰色の陰影で強調されている）この構文要素「lmcs_chroma_scaling_idx」は、現ブロックが所与の数のクロマサンプルよりも多く含む場合、又は現ブロックが所与の幅Ｗよりも大きい幅若しくは所与の高さＨよりも大きい高さを有する場合にのみ、シグナリングされ得る。より小さいブロックでは、「lmcs_chroma_scaling_idx」がシグナリングされない場合、復号器側でそのクロマスケール因子を決定することができる。一部の実施形態では、クロマスケール因子は浮動小数点数精度で１．０に設定することができる。一部の実施形態では、タイルグループヘッダレベルでデフォルトの「lmcs_chroma_scaling_idx」値を追加することができる（図６の１参照）。シグナリングされる「lmcs_chroma_scaling_idx」を有さない小さいブロックは、対応するクロマスケール因子を導出するためにこのタイルグループレベルのデフォルトインデックスを使用することができる。一部の実施形態では、小さいブロックのクロマスケール因子は、スケール因子を明示的にシグナリングしたその近傍（例えば上部又は左側の近傍）から継承することができる。

[0145] 構文要素「lmcs_chroma_scaling_idx」をＣＵレベルでシグナリングすることに加えて、この構文要素はＣＴＵレベルでもシグナリングすることができる。しかし、ＶＶＣでの最大ＣＴＵサイズが１２８ｘ１２８であることを所与とし、ＣＴＵレベルで同じスケーリングを行うことは粗過ぎる場合がある。従って本開示の一部の実施形態では、固定された粒度を使用してこの構文要素「lmcs_chroma_scaling_idx」をシグナリングすることができる。例えばＣＴＵ内の１６ｘ１６の領域ごとに１つの「lmcs_chroma_scaling_idx」がシグナリングされ、その１６ｘ１６の領域内の全てのサンプルに適用される。

[0146] 現タイルグループの「lmcs_chroma_scaling_idx」の範囲は、現タイルグループ内で許可されるクロマスケール因子の値の数に依存する。現タイルグループ内で許可されるクロマスケール因子の値の数は、上記で論じたように６４エントリクロマＬＵＴに基づいて決定され得る。或いは現タイルグループ内で許可されるクロマスケール因子の値の数は、上記で論じたクロマスケール因子の計算を使用して決定することができる。

[0147] 例えば「量子化」方法では、LOG2_nの値を２に設定する（即ち「ｎ」を４に設定する）ことができ、現タイルグループの区分線形モデル内の各区分のコード語割り当てを次のように設定することができる：{0, 65, 66, 64, 67, 62, 62, 64, 64, 64, 67, 64, 64, 62, 61, 0}。すると６４～６７までの任意のコード語の値は同じスケール因子の値（小数精度で１．０）を有することができ、６０～６３までの任意のコード語の値は同じスケール因子の値（小数精度で６０／６４＝０．９３７５）を有することができるので、全タイルグループについて可能なスケール因子の値は２つしかない。コード語が一切割り当てられていない２つの末端区分ではクロマスケール因子をデフォルトで１．０に設定する。従ってこの例では、現タイルグループ内のブロックに関して「lmcs_chroma_scaling_idx」をシグナリングするのに１ビットで十分である。

[0148] 区分線形モデルを使用して可能なクロマスケール因子の値を決定する以外に、符号器はタイルグループヘッダにおいて１組のクロマスケール因子の値をシグナリングすることができる。次いでブロックレベルにおいて、その１組のクロマスケール因子の値及びブロックの「lmcs_chroma_scaling_idx」の値を使用してブロックのクロマスケール因子の値を決定することができる。

[0149] 「lmcs_chroma_scaling_idx」をコード化するためにＣＡＢＡＣコード化を適用することができる。ブロックのＣＡＢＡＣコンテキストは、ブロックの隣接ブロックの「lmcs_chroma_scaling_idx」に依存し得る。例えばＣＡＢＡＣコンテキストを形成するために、左側のブロック又は上部のブロックを使用することができる。この「lmcs_chroma_scaling_idx」の構文要素の二値化に関して、「lmcs_chroma_scaling_idx」を二値化するために、ＶＶＣのドラフト４内のref_idx_10及びref_idx_11構文要素に適用される同じトランケーティドライス二値化を使用することができる。

[0150] 「chroma_scaling_idx」をシグナリングする利点は、符号器がレート歪みコストに関して最良の「lmcs_chroma_scaling_idx」を選択できることである。レート歪み最適化を使用して「lmcs_chroma_scaling_idx」を選択することはコード化効率を改善することができ、そのことはシグナリングコストの増加を相殺することを助け得る。

[0151] 本開示の実施形態は、ＬＭＣＳ区分線形モデルのシグナリングを伴う映像コンテンツを処理するための方法を更に提供する。

[0152] ＬＭＣＳの方法は１６個の区分を有する区分線形モデルを使用するが、タイルグループ内の「SignaledCW[i]」の固有値の数は１６よりもはるかに少ない傾向がある。例えば１６個の区分の一部はコード語のデフォルトの数「OrgCW」を使用することができ、１６個の区分の一部は互いと同じコード語の数を有することができる。従ってＬＭＣＳ区分線形モデルをシグナリングする代替的方法は、固有のコード語の数「listUniqueCW[]」をシグナリングし、現区分の「listUniqueCW[]」の要素を示すために区分のそれぞれについてインデックスを送信することを含み得る。

[0153] 図１２の中で修正済みの構文表を示す。図１２の表６では新たな又は修正された構文をイタリック体及び灰色の陰影で強調している。

[0154] 開示するシグナリング方法の意味規則は以下の通りであり、変更箇所に下線を引いてある：
reshaper_model_min_bin_idxは、リシェーパ構築プロセス内で使用される最小ビン（又は区分）インデックスを規定する。reshape_model_min_bin_idxの値は０～MaxBinIdxまでの範囲内にあるものとする。MaxBinIdxの値は１５に等しいものとする。
reshaper_model_delta_max_bin_idxは、最大許容ビン（又は区分）インデックスMaxBinIdx引く、リシェーパ構築プロセス内で使用される最大ビンインデックスを規定する。reshape_model_max_bin_idxの値はMaxBinIdx-reshape_model_delta_max_bin_idxに等しく設定される。
reshaper_model_bin_delta_abs_cw_prec_minus1 plus 1は、構文reshape_model_bin_delta_abs_CW[i]の表現に使用されるビット数を規定する。
reshaper_model_bin_num_unique_cw_minus1 plus 1は、コード語アレイlistUniqueCWのサイズを規定する。
reshaper_model_bin_delta_abs_CW[i]は、ｉ番目のビンの絶対デルタコード語値を規定する。
reshaper_model_bin_delta_sign_CW_flag[i]は、reshape_model_bin_delta_abs_CW[i]の符号を以下のように規定する：
－reshape_model_bin_delta_sign_CW_flag[i]が０に等しい場合、対応する変数RspDeltaCW[i]は正値である。
－さもなければ（reshape_model_bin_delta_sign_CW_flag[i]が０に等しくない）対応する変数RspDeltaCW[i]は負値である。
reshape_model_bin_delta_sign_CW_flag[i]がない場合、対応する変数RspDeltaCW[i]は０に等しいと推論する。
変数RspDeltaCW[i]は、RspDeltaCW[i]=(1-2*reshape_model_bin_delta_sign_CW[i])*reshape_model_bin_delta_abs_CW[i]として導出される。
変数listUniqueCW[0]はOrgCWに等しく設定される。i=1... reshaper_model_bin_num_unique_cw_minus1までの変数listUniqueCW[i]は以下のように導出される：
－変数OrgCWを(1<<BitDepth_Y)/(MaxBinIdx+1)に等しく設定する。
－listUniqueCW[i]=OrgCW+RspDeltaCW[i-1]
reshaper_model_bin_cw_idx[i]は、RspCW[i]を導出するために使用されるアレイlistUniqueCW[]のインデックスを規定する。reshaper_model_bin_cw_idx[i]の値は０～（reshaper_model_bin_num_unique_cw_minus1+1）までの範囲内にあるものとする。
RspCW[i]は以下のように導出される：
－reshaper_model_min_bin_idx < = i <= reshaper_model_max_bin_idxが成立する場合、
RspCW[i]=listUniqueCW[reshaper_model_bin_cw_idx[i]]。
－さもなければRspCW[i]=0。
BitDepth_Yの値が１０に等しい場合、RspCW[i]の値は３２～2*OrgCW-1の範囲内にあり得る。

[0155] 本開示の実施形態は、ブロックレベルにおける条件付きクロマスケーリングを伴う映像コンテンツを処理するための方法を更に提供する。

[0156] 図６の表１に示すように、クロマスケーリングが適用されるかどうかはタイルグループレベルでシグナリングされる「tile_group_reshaper_chroma_residual_scale_flag」によって判定することができる。

[0157] しかし、ブロックレベルでクロマスケーリングを適用するかどうかを判定することが有益であり得る。例えば開示する一部の実施形態では、現ブロックにクロマスケーリングが適用されるかどうかを示すために、ＣＵレベルフラグをシグナリングすることができる。ＣＵレベルフラグの存在は、タイルグループレベルフラグ「tile_group_reshaper_chroma_residual_scale_flag」に基づいて条件付けることができる。つまりＣＵレベルフラグは、クロマスケーリングがタイルグループレベルで許可される場合にのみシグナリングされ得る。符号器は、現ブロックにとってクロマスケーリングが有益かどうかに基づいてクロマスケーリングを使用するかどうかを選ぶことを許可されるが、それは著しいシグナリングオーバヘッドも招き得る。

[0158] 開示する実施形態と合致して、上記のシグナリングオーバヘッドを回避するために、ブロックにクロマスケーリングが適用されるかどうかはブロックの予測モードに基づいて条件付けることができる。例えばブロックがインタ予測される場合、とりわけその参照ピクチャが時間的距離の点で近い場合は、予測信号がよい傾向にある。従って、残差が非常に小さいと予期されるので、クロマスケーリングをバイパスすることができる。例えば、より高い時間的レベル内のピクチャは時間的距離の点で近い参照ピクチャを有する傾向がある。ブロックに関して、近くの参照ピクチャを使用するピクチャ内でクロマスケーリングを無効化することができる。この条件が満たされるかどうかを判定するために、現ピクチャとブロックの参照ピクチャとの間のピクチャ順序カウント（ＰＯＣ）の差を使用することができる。

[0159] 一部の実施形態では、全てのインタコード化されるブロックについてクロマスケーリングを無効化することができる。一部の実施形態では、ＶＶＣ規格内で定められる複合イントラ／インタ予測（ＣＩＩＰ）モードについてクロマスケーリングを無効化することができる。

[0160] ＶＶＣ規格では、ＣＵ構文構造「coding_unit()」が、現ＣＵ内に何らかの非ゼロ残差係数があるかどうかを示すための構文要素「cu_cbf」を含む。ＴＵレベルでは、ＴＵ構文構造「transform_unit()」が、現ＴＵ内に何らかの非ゼロクロマ（Ｃｂ又はＣｒ）残差係数があるかどうかを示すための構文要素「tu_cbf_cb」及び「tu_cbf_cr」を含む。これらのフラグに基づいてクロマスケーリングプロセスを条件付けることができる。上記で説明したように、非ゼロ残差係数がない場合は、対応するルマクロマスケーリングプロセスの平均化を呼び出すことができる。平均化を呼び出すことにより、クロマスケーリングプロセスをバイパスすることができる。

[0161] 図１３は、映像コンテンツを処理するためのコンピュータによって実装される方法１３００の流れ図を示す。一部の実施形態では、方法１３００は、コーデック（例えば図２Ａ～図２Ｂの符号器又は図３Ａ～図３Ｂの復号器）によって実行され得る。例えばコーデックは、映像シーケンスを符号化し又は別のコードに変換するための機器（例えば機器４００）の１つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス（例えば映像シーケンス２０２）又は復号される圧縮映像シーケンス（例えば映像ストリーム３０４）であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ（例えばプロセッサ４０２）に関連する監視装置（例えば図４の映像入力装置）によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは複数のピクチャを含み得る。機器はピクチャのレベルで方法１３００を実行することができる。例えば機器は方法１３００内でピクチャを１つずつ処理することができる。別の例では、機器が方法１３００内で１度に複数のピクチャを処理することができる。方法１３００は以下のようなステップを含み得る。

[0162] ステップ１３０２で、ピクチャに関連するクロマブロック及びルマブロックを受信することができる。ピクチャはクロマ成分及びルマ成分に関連し得ることが理解されよう。従って、ピクチャは、クロマサンプルを含むクロマブロック及びルマサンプルを含むルマブロックに関連することができる。

[0163] ステップ１３０４で、ルマブロックに関連するルマスケール情報を決定することができる。一部の実施形態では、ルマスケール情報は、ピクチャのデータストリーム内でシグナリングされる構文要素、又はピクチャのデータストリーム内でシグナリングされる構文要素に基づいて導出される変数であり得る。例えばルマスケール情報は、上記の等式の中で記載した「reshape_model_bin_delta_sign_CW[i]及びreshape_model_bin_delta_abs_CW[i]」、及び／又は上記の等式の中で記載した「SignaledCW[i]」等を含むことができる。一部の実施形態では、ルマスケール情報は、ルマブロックに基づいて決定される変数を含み得る。例えば平均ルマ値は、ルマブロックに隣接するルマサンプル（ルマブロックの上部のロー内のルマサンプル及びルマブロックの左側のカラム内のルマサンプル等）の平均値を計算することによって決定され得る。

[0164] ステップ１３０６で、ルマスケール情報に基づいてクロマスケール因子を決定することができる。

[0165] 一部の実施形態では、ルマスケール情報に基づいてルマブロックのルマスケール因子を決定することができる。例えば「inverse_chroma_scaling[i]=((1<<(luma_bit_depth-log2(TOTAL_NUMBER_PIECES)+CSCALE_FP_PREC))+(tempCW>>1))/tempCW」の上記の等式によれば、ルマスケール情報（例えば「tempCW」）に基づいてルマスケール因子を決定することができる。次いで、ルマスケール因子の値に基づいてクロマスケール因子を更に決定することができる。例えば、クロマスケール因子はルマスケール因子の値に等しく設定することができる。クロマスケール因子として設定する前に、ルマスケール因子の値に対して更なる計算を適用できることが理解されよう。別の例として、クロマスケール因子は「SignaledCW[Y_Idx]/OrgCW」に等しく設定することができ、ルマブロックに関連する平均ルマ値に基づいて現クロマブロックの区分インデックス「Y_Idx」を決定することができる。

[0166] ステップ１３０８で、クロマスケール因子を使用してクロマブロックを処理することができる。例えばクロマブロックのスケーリングされた残差を生成するために、クロマスケール因子を使用してクロマブロックの残差を処理することができる。クロマブロックはＣｂクロマ成分又はＣｒクロマ成分であり得る。

[0167] 一部の実施形態では、条件が満たされる場合にクロマブロックを処理することができる。例えば条件は、ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又はピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないことを含み得る。標的コード化単位が非ゼロ残差を有さないことは、標的コード化単位の第１のコード化ブロックフラグの値に基づいて判定することができる。標的変換単位が非ゼロクロマ残差を有さないことは、標的変換単位の第１の成分の第２のコード化ブロックフラグの値及び第２の成分の第３のコード化ブロックフラグの値に基づいて判定することができる。例えば第１の成分はＣｂ成分とすることができ、第２の成分はＣｒ成分とすることができる。

[0168] 方法１３００の各ステップは独立した方法として実行できることが理解されよう。例えば、ステップ１３０８に記載したクロマスケール因子を決定するための方法を独立した方法として実行することができる。

[0169] 図１４は、映像コンテンツを処理するためのコンピュータによって実装される方法１４００の流れ図を示す。一部の実施形態では、方法１３００は、コーデック（例えば図２Ａ～図２Ｂの符号器又は図３Ａ～図３Ｂの復号器）によって実行され得る。例えばコーデックは、映像シーケンスを符号化し又は別のコードに変換するための機器（例えば機器４００）の１つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス（例えば映像シーケンス２０２）又は復号される圧縮映像シーケンス（例えば映像ストリーム３０４）であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ（例えばプロセッサ４０２）に関連する監視装置（例えば図４の映像入力装置）によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは複数のピクチャを含み得る。機器はピクチャのレベルで方法１４００を実行することができる。例えば機器は方法１４００内でピクチャを１つずつ処理することができる。別の例では、機器が方法１４００内で１度に複数のピクチャを処理することができる。方法１４００は以下のようなステップを含み得る。

[0170] ステップ１４０２で、ピクチャに関連するクロマブロック及びルマブロックを受信することができる。ピクチャはクロマ成分及びルマ成分に関連し得ることが理解されよう。従って、ピクチャは、クロマサンプルを含むクロマブロック及びルマサンプルを含むルマブロックに関連することができる。一部の実施形態では、ルマブロックがＮｘＭのルマサンプルを含み得る。Ｎはルマブロックの幅とすることができ、Ｍはルマブロックの高さとすることができる。上記で論じたように、ルマブロックのルマサンプルは標的クロマブロックの区分インデックスを決定するために使用することができる。従って映像シーケンスのピクチャに関連するルマブロックが受信され得る。ＮとＭとが同じ値を有し得ることが理解されよう。

[0171] ステップ１４０４で、Ｎ及びＭの少なくとも１つが閾値を上回ることに応じてＮｘＭルマサンプルのサブセットを選択することができる。区分インデックスの決定を加速するために、一定の条件が満たされる場合、ルマブロックを「ダウンサンプリング」することができる。換言すれば、ルマブロック内のルマサンプルのサブセットを使用して区分インデックスを決定することができる。一部の実施形態では、一定の条件とはＮ及びＭの少なくとも一方が閾値を上回ることである。一部の実施形態では、閾値はＮ及びＭの少なくとも一方に基づき得る。閾値は２のべき乗とすることができる。例えば閾値は４、８、１６等とすることができる。４を例に取り、Ｎ又はＭが４を上回る場合、ルマサンプルのサブセットを選択することができる。図１０の例ではルマブロックの幅及び高さの両方が４の閾値を上回り、従って４ｘ４サンプルのサブセットが選択される。２ｘ８、１ｘ１６等のサブセットも処理のために選択できることが理解されよう。

[0172] ステップ１４０６で、ＮｘＭルマサンプルのサブセットの平均値を決定することができる。

[0173] 一部の実施形態では、平均値を決定することが、第２の条件が満たされているかどうかを判定すること、及び第２の条件が満たされているという判定に応じてＮｘＭルマサンプルのサブセットの平均値を決定することを更に含み得る。例えば第２の条件は、ピクチャに関連する標的コード化単位が非ゼロ残差係数を有さないこと又は標的コード化単位が非ゼロクロマ残差係数を有さないことを含み得る。

[0174] ステップ１４０８で、平均値に基づくクロマスケール因子を決定することができる。一部の実施形態では、クロマスケール因子を決定するために、クロマブロックの区分インデックスを平均値に基づいて決定することができ、クロマブロックの区分インデックスが第１の条件を満たすかどうかを判定することができ、クロマブロックの区分インデックスが第１の条件を満たすことに応じてクロマスケール因子をデフォルト値に設定することができる。デフォルト値はクロマスケーリングが適用されないことを示し得る。例えばデフォルト値は小数精度を有する１．０であり得る。デフォルト値に固定小数点近似を適用できることが理解されよう。クロマブロックの区分インデックスが第１の条件を満たさないことに応じて、クロマスケール因子を平均値に基づいて決定することができる。より具体的には、クロマスケール因子をSignaledCW[Y_Idx]/OrgCWに設定することができ、標的クロマブロックの区分インデックス「Y_Idx」は対応するルマブロックの平均値に基づいて決定することができる。

[0175] 一部の実施形態では、第１の条件はクロマブロックの区分インデックスが、シグナリングされるコード語の最大インデックスよりも大きいこと又はシグナリングされるコード語の最小インデックスよりも小さいことを含み得る。シグナリングされるコード語の最大インデックス及び最小インデックスは以下のように決定することができる。

[0176] コード語は入力信号（例えばルマサンプル）に基づいて区分線形モデル（例えばＬＭＣＳ）を使用して生成することができる。上記で論じたように、入力信号のダイナミックレンジは幾つかの区分（例えば１６個の区分）に分割することができ、入力信号の各区分を使用してコード語のビンを出力として生成することができる。従って、コード語の各ビンは入力信号の区分に対応するビンインデックスを有し得る。この例では、ビンインデックスの範囲を０～１５とすることができる。一部の実施形態では、出力（即ちコード語）の値が最小値（例えば０）と最大値（例えば２５５）との間であり、最小値と最大値との間の値を有する複数のコード語がシグナリングされ得る。シグナリングされる複数のコード語のビンインデックスを決定することができる。シグナリングされる複数のコード語のビンインデックスのうち、シグナリングされる複数のコード語のビンの最大ビンインデックス及び最小ビンインデックスを更に決定することができる。

[0177] クロマスケール因子に加えて、方法１４００は、シグナリングされる複数のコード語のビンに基づいてルマスケール因子を更に決定することができる。ルマスケール因子は、逆クロマスケール因子として使用することができる。ルマスケール因子を決定するための等式は上記で記載しており、その説明は本明細書では省略する。一部の実施形態では、シグナリングされる複数個の隣接コード語がルマスケール因子を共有する。例えば２個又は４個のシグナリングされる隣接コード語が同じルマスケール因子を共有することができ、そのことはルマスケール因子を決定する負荷を減らし得る。

[0178] ステップ１４１０で、クロマスケール因子を使用してクロマブロックを処理することができる。図５に関して上記で論じたように、複数のクロマスケール因子がタイルグループレベルにおけるクロマスケール因子ＬＵＴを構築することができ、標的ブロックの再構築済みクロマ残差に対して復号器側で適用することができる。同様に、クロマスケール因子は符号器側でも適用することができる。

[0179] 方法１４００の各ステップは独立した方法として実行できることが理解されよう。例えば、ステップ１３０８に記載したクロマスケール因子を決定するための方法を独立した方法として実行することができる。

[0180] 図１５は、映像コンテンツを処理するためのコンピュータによって実装される方法１５００の流れ図を示す。一部の実施形態では、方法１５００は、コーデック（例えば図２Ａ～図２Ｂの符号器又は図３Ａ～図３Ｂの復号器）によって実行され得る。例えばコーデックは、映像シーケンスを符号化し又は別のコードに変換するための機器（例えば機器４００）の１つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス（例えば映像シーケンス２０２）又は復号される圧縮映像シーケンス（例えば映像ストリーム３０４）であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ（例えばプロセッサ４０２）に関連する監視装置（例えば図４の映像入力装置）によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは複数のピクチャを含み得る。機器はピクチャのレベルで方法１５００を実行することができる。例えば機器は方法１５００内でピクチャを１つずつ処理することができる。別の例では、機器が方法１５００内で１度に複数のピクチャを処理することができる。方法１５００は以下のようなステップを含み得る。

[0181] ステップ１５０２で、受信映像データ内にクロマスケールインデックスがあるかどうかを判定することができる。

[0182] ステップ１５０４で、受信映像データ内にクロマスケールインデックスがないと判定することに応じて、受信映像データにクロマスケーリングが適用されないと判定することができる。

[0183] ステップ１５０６で、受信映像データ内にクロマスケーリングがあると判定することに応じて、クロマスケールインデックスに基づいてクロマスケール因子を決定することができる。

[0184] 図１６は、映像コンテンツを処理するためのコンピュータによって実装される方法１６００の流れ図を示す。一部の実施形態では、方法１６００は、コーデック（例えば図２Ａ～図２Ｂの符号器又は図３Ａ～図３Ｂの復号器）によって実行され得る。例えばコーデックは、映像シーケンスを符号化し又は別のコードに変換するための機器（例えば機器４００）の１つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス（例えば映像シーケンス２０２）又は復号される圧縮映像シーケンス（例えば映像ストリーム３０４）であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ（例えばプロセッサ４０２）に関連する監視装置（例えば図４の映像入力装置）によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは複数のピクチャを含み得る。機器はピクチャのレベルで方法１６００を実行することができる。例えば機器は方法１６００内でピクチャを１つずつ処理することができる。別の例では、機器が方法１６００内で１度に複数のピクチャを処理することができる。方法１６００は以下のようなステップを含み得る。

[0185] ステップ１６０２で、入力映像信号のダイナミックレンジに使用される複数の固有のコード語を受信することができる。

[0186] ステップ１６０４で、インデックスを受信することができる。

[0187] ステップ１６０６で、複数の固有のコード語の少なくとも１つをインデックスに基づいて選択することができる。

[0188] ステップ１６０８で、選択済みの少なくとも１つのコード語に基づいてクロマスケール因子を決定することができる。

[0189] 一部の実施形態では命令を含む非一時的コンピュータ可読記憶媒体も提供され、命令は上記の方法を実行するために装置（開示した符号器及び復号器等）によって実行され得る。一般的な非一時的媒体は、例えばフロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ若しくは他の任意の磁気データ記憶媒体、ＣＤ－ＲＯＭ、他の任意の光学データ記憶媒体、孔のパターンを有する任意の物理媒体、ＲＡＭ、ＰＲＯＭ、ＥＰＲＯＭ、フラッシュＥＰＲＯＭ若しくは他の任意のフラッシュメモリ、ＮＶＲＡＭ、キャッシュ、レジスタ、他の任意のメモリチップ若しくはカートリッジ、及びそれらのもののネットワーク化されたバージョンを含む。装置は、１つ又は複数のプロセッサ（ＣＰＵ）、入力／出力インタフェース、ネットワークインタフェース、及び／又はメモリを含み得る。

[0190] 上記の実施形態はハードウェア、ソフトウェア（プログラムコード）、又はハードウェアとソフトウェアとの組み合わせによって実装できることが理解されよう。ソフトウェアによって実装される場合、そのソフトウェアは上記のコンピュータ可読媒体の中に記憶することができる。プロセッサによって実行されるとき、ソフトウェアは開示した方法を実行することができる。本開示に記載した計算ユニット及び他の機能ユニットは、ハードウェア、又はソフトウェア、又はハードウェアとソフトウェアとの組み合わせによって実装することができる。上記のモジュール／ユニットの複数のものを１つのモジュール／ユニットに組み合わせることができ、上記のモジュール／ユニットのそれぞれを複数のサブモジュール／サブユニットへと更に分けられることも当業者なら理解されよう。

[0191] 実施形態は以下の条項を使用して更に記載することができる：
１．映像コンテンツを処理するためのコンピュータ実施方法であって、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
ルマブロックに関連するルマスケール情報を決定すること、
ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
クロマスケール因子を使用してクロマブロックを処理すること
を含む、方法。
２．ルマスケール情報に基づいてクロマスケール因子を決定することが、
ルマスケール情報に基づいてルマブロックのルマスケール因子を決定すること、
ルマスケール因子の値に基づいてクロマスケール因子を決定すること
を更に含む、条項１に記載の方法。
３．ルマスケール因子の値に基づいてクロマスケール因子を決定することが、
クロマスケール因子をルマスケール因子の値に等しく設定すること
を更に含む、条項２に記載の方法。
４．クロマスケール因子を使用してクロマブロックを処理することが、
第１の条件が満たされているかどうかを判定すること、及び
第１の条件が満たされているという判定に応じてクロマスケール因子を使用してクロマブロックを処理すること、又は
第１の条件が満たされていないという判定に応じてクロマスケール因子を用いたクロマブロックの処理をバイパスすること
の１つを行うこと
を更に含む、条項１～３の何れか１つに記載の方法。
５．第１の条件が、
ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又は
ピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないこと
を含む、条項４に記載の方法。
６．標的コード化単位が非ゼロ残差を有さないことが、標的コード化単位の第１のコード化ブロックフラグの値に基づいて判定され、
標的変換単位が非ゼロクロマ残差を有さないことが、標的変換単位の第１のクロマ成分の第２のコード化ブロックフラグの値及び第２のルマクロマ成分の第３のコード化ブロックフラグの値に基づいて判定される、
条項５に記載の方法。
７．第１のコード化ブロックフラグの値が０であり、
第２のコード化ブロックフラグの値及び第３のコード化ブロックフラグの値が０である、
条項６に記載の方法。
８．クロマスケール因子を使用してクロマブロックを処理することが、
クロマスケール因子を使用してクロマブロックの残差を処理すること
を含む、条項１～７の何れか１つに記載の方法。
９．映像コンテンツを処理するための機器であって、
１組の命令を記憶するメモリと、
メモリに結合され、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
ルマブロックに関連するルマスケール情報を決定すること、
ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
クロマスケール因子を使用してクロマブロックを処理すること
を機器に行わせるための１組の命令を実行するように構成されるプロセッサと
を含む、機器。
１０．ルマスケール情報に基づいてクロマスケール因子を決定する際、
ルマスケール情報に基づいてルマブロックのルマスケール因子を決定すること、
ルマスケール因子の値に基づいてクロマスケール因子を決定すること
を機器に更に行わせるための１組の命令を実行するようにプロセッサが構成される、条項９に記載の機器。
１１．ルマスケール因子の値に基づいてクロマスケール因子を決定する際、
クロマスケール因子をルマスケール因子の値に等しく設定すること
を機器に更に行わせるための１組の命令を実行するようにプロセッサが構成される、条項１０に記載の機器。
１２．クロマスケール因子を使用してクロマブロックを処理する際、
第１の条件が満たされているかどうかを判定すること、及び
第２の条件が満たされているという判定に応じてクロマスケール因子を使用してクロマブロックを処理すること、又は
第２の条件が満たされていないという判定に応じてクロマスケール因子を用いたクロマブロックの処理をバイパスすること
の１つを行うこと
を機器に更に行わせるための１組の命令を実行するようにプロセッサが構成される、条項９～１１の何れか１つに記載の機器。
１３．第１の条件が、
ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又は
ピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないこと
を含む、条項１２に記載の機器。
１４．標的コード化単位が非ゼロ残差を有さないことが、標的コード化単位の第１のコード化ブロックフラグの値に基づいて判定され、
標的変換単位が非ゼロクロマ残差を有さないことが、標的変換単位の第１のクロマ成分の第２のコード化ブロックフラグの値及び第２のクロマ成分の第３のコード化ブロックフラグの値に基づいて判定される、
条項１３に記載の機器。
１５．第１のコード化ブロックフラグの値が０であり、
第２のコード化ブロックフラグの値及び第３のコード化ブロックフラグの値が０である、
条項１４に記載の機器。
１６．クロマスケール因子を使用してクロマブロックを処理する際、
クロマスケール因子を使用してクロマブロックの残差を処理すること
を機器に更に行わせるための１組の命令を実行するようにプロセッサが構成される、条項９～１５の何れか１つに記載の機器。
１７．映像コンテンツを処理するための方法を装置に行わせるための、装置の１つ又は複数のプロセッサによって実行可能な１組の命令を記憶する非一時的コンピュータ可読記憶媒体であって、その方法は、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
ルマブロックに関連するルマスケール情報を決定すること、
ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
クロマスケール因子を使用してクロマブロックを処理すること
を含む、非一時的コンピュータ可読記憶媒体。
１８．映像コンテンツを処理するためのコンピュータ実施方法であって、
ピクチャに関連するクロマブロック及びルマブロックを受信することであって、ルマブロックはＮｘＭのルマサンプルを含む、受信すること、
Ｎ及びＭの少なくとも１つが閾値を上回ることに応じてＮｘＭルマサンプルのサブセットを選択すること、
ＮｘＭルマサンプルのサブセットの平均値を決定すること、
平均値に基づいてクロマスケール因子を決定すること、及び
クロマスケール因子を使用してクロマブロックを処理すること
を含む、方法。
１９．映像コンテンツを処理するためのコンピュータ実施方法であって、
受信映像データ内にクロマスケールインデックスがあるかどうかを判定すること、
受信映像データ内にクロマスケールインデックスがないと判定することに応じて、受信映像データにクロマスケーリングが適用されないと判定すること、及び
受信映像データ内にクロマスケーリングがあると判定することに応じて、クロマスケールインデックスに基づいてクロマスケール因子を決定すること
を含む、方法。
２０．映像コンテンツを処理するためのコンピュータ実施方法であって、
入力映像信号のダイナミックレンジに使用される複数の固有のコード語を受信すること、
インデックスを受信すること、
複数の固有のコード語の少なくとも１つをインデックスに基づいて選択すること、及び
選択済みの少なくとも１つのコード語に基づいてクロマスケール因子を決定すること
を含む、方法。

[0192] コンピュータ可読プログラムコードを使用することによって上記の方法を実装することに加えて、上記の方法は論理ゲート、スイッチ、ＡＳＩＣ、プログラム可能論理コントローラ、及び埋め込みマイクロコントローラの形で実装することもできる。従って、かかるコントローラはハードウェア構成要素と見なすことができ、コントローラ内に含まれ様々な機能を実装するように構成される機器もハードウェア構成要素内の構造と見なすことができる。又は様々な機能を実装するように構成される機器は、方法を実装するように構成されるソフトウェアモジュール及びハードウェア構成要素内の構造の両方と見なすことさえできる。

[0193] 本開示はコンピュータによって実行されるコンピュータ実行可能命令、例えばプログラムモジュールの全般的な脈絡で説明することができる。概してプログラムモジュールは、特定のタスクを実行し又は特定の抽象データ型を実装するために使用されるルーチン、プログラム、オブジェクト、アセンブリ、データ構造、クラス等を含む。本開示の実施形態は分散型計算環境内で実装することもできる。分散型計算環境では、通信ネットワークによって接続される遠隔処理装置を使用することによってタスクが実行される。分散型計算環境では、プログラムモジュールが記憶装置を含む局所及び遠隔コンピュータ記憶媒体内にあり得る。

[0194] 本明細書の「第１の」及び「第２の」等の関係語は或るエンティティ又は操作を別のエンティティ又は操作と区別するために使用するに過ぎず、それらのエンティティ又は操作間の如何なる実際の関係又は順序も必要とせず又は含意しないことに留意すべきである。更に、「comprising（含む）」、「having（有する）」、「containing（含む）」、及び「including（含む）」並びに他の同様の形式の言葉は意味の点で等価であることを意図し、これらの言葉の何れか１つの後に続くアイテムがかかるアイテムの網羅的列挙であることを意図しておらず、又は列挙するアイテムだけに限定されることを意図していない点で非限定的であることを意図する。

[0195] 上記の明細書では、実装形態ごとに変わり得る多数の具体的詳細に関して実施形態を説明してきた。記載した実施形態の一定の適応及び修正を加えることができる。本明細書を検討し、本明細書で明らかにした開示を実践することで他の実施形態が当業者に明らかになり得る。本明細書及び例は専ら例として検討され、本開示の真の範囲及び趣旨は添付の特許請求の範囲によって示すことを意図する。図中に示すステップの順序は例示目的に過ぎず、或る特定のステップの順序に限定されることは意図しない。そのため、それらのステップは同じ方法を実装しながら異なる順序で実行できることを当業者なら理解することができる。

Claims

映像コンテンツを処理するためのコンピュータ実施方法であって、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
前記ルマブロックに関連するルマスケール情報を決定すること、
前記ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
前記クロマスケール因子を使用して前記クロマブロックを処理すること
を含む、方法。
前記ルマスケール情報に基づいて前記クロマスケール因子を決定することが、
前記ルマスケール情報に基づいて前記ルマブロックのルマスケール因子を決定すること、
前記ルマスケール因子の値に基づいて前記クロマスケール因子を決定すること
を更に含む、請求項１に記載の方法。
前記ルマスケール因子の値に基づいて前記クロマスケール因子を決定することが、
前記クロマスケール因子を前記ルマスケール因子の前記値に等しく設定すること
を更に含む、請求項２に記載の方法。
前記クロマスケール因子を使用して前記クロマブロックを処理することが、
第１の条件が満たされているかどうかを判定すること、及び
前記第１の条件が満たされているという前記判定に応じて前記クロマスケール因子を使用して前記クロマブロックを処理すること、又は
前記第１の条件が満たされていないという前記判定に応じて前記クロマスケール因子を用いた前記クロマブロックの前記処理をバイパスすること
の１つを行うこと
を更に含む、請求項１に記載の方法。
前記第１の条件が、
前記ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又は
前記ピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないこと
を含む、請求項４に記載の方法。
前記標的コード化単位が非ゼロ残差を有さないことが、前記標的コード化単位の第１のコード化ブロックフラグの値に基づいて判定され、
前記標的変換単位が非ゼロクロマ残差を有さないことが、前記標的変換単位の第１のクロマ成分の第２のコード化ブロックフラグの値及び第２のルマクロマ成分の第３のコード化ブロックフラグの値に基づいて判定される、
請求項５に記載の方法。
前記第１のコード化ブロックフラグの前記値が０であり、
前記第２のコード化ブロックフラグの前記値及び前記第３のコード化ブロックフラグの前記値が０である、
請求項６に記載の方法。
前記クロマスケール因子を使用して前記クロマブロックを処理することが、
前記クロマスケール因子を使用して前記クロマブロックの残差を処理すること
を含む、請求項１に記載の方法。
映像コンテンツを処理するための機器であって、
１組の命令を記憶するメモリと、
前記メモリに結合され、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
前記ルマブロックに関連するルマスケール情報を決定すること、
前記ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
前記クロマスケール因子を使用して前記クロマブロックを処理すること
を前記機器に行わせるために前記１組の命令を実行するように構成されるプロセッサと
を含む、機器。
前記ルマスケール情報に基づいて前記クロマスケール因子を決定する際、
前記ルマスケール情報に基づいて前記ルマブロックのルマスケール因子を決定すること、
前記ルマスケール因子の値に基づいて前記クロマスケール因子を決定すること
を前記機器に更に行わせるために前記１組の命令を実行するように前記プロセッサが構成される、請求項９に記載の機器。
前記ルマスケール因子の値に基づいて前記クロマスケール因子を決定する際、
前記クロマスケール因子を前記ルマスケール因子の前記値に等しく設定すること
を前記機器に更に行わせるために前記１組の命令を実行するように前記プロセッサが構成される、請求項１０に記載の機器。
前記クロマスケール因子を使用して前記クロマブロックを処理する際、
第１の条件が満たされているかどうかを判定すること、及び
第２の条件が満たされているという前記判定に応じて前記クロマスケール因子を使用して前記クロマブロックを処理すること、又は
前記第２の条件が満たされていないという前記判定に応じて前記クロマスケール因子を用いた前記クロマブロックの前記処理をバイパスすること
の１つを行うこと
を前記機器に更に行わせるために前記１組の命令を実行するように前記プロセッサが構成される、請求項９に記載の機器。
前記第１の条件が、
前記ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又は
前記ピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないこと
を含む、請求項１２に記載の機器。
前記標的コード化単位が非ゼロ残差を有さないことが、前記標的コード化単位の第１のコード化ブロックフラグの値に基づいて判定され、
前記標的変換単位が非ゼロクロマ残差を有さないことが、前記標的変換単位の第１のクロマ成分の第２のコード化ブロックフラグの値及び第２のクロマ成分の第３のコード化ブロックフラグの値に基づいて判定される、
請求項１３に記載の機器。
前記第１のコード化ブロックフラグの前記値が０であり、
前記第２のコード化ブロックフラグの前記値及び前記第３のコード化ブロックフラグの前記値が０である、
請求項１４に記載の機器。
前記クロマスケール因子を使用して前記クロマブロックを処理する際、
前記クロマスケール因子を使用して前記クロマブロックの残差を処理すること
を前記機器に更に行わせるために前記１組の命令を実行するように前記プロセッサが構成される、請求項９に記載の機器。
映像コンテンツを処理するための方法を装置に行わせるために、前記装置の１つ又は複数のプロセッサによって実行可能な１組の命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記方法は、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
前記ルマブロックに関連するルマスケール情報を決定すること、
前記ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
前記クロマスケール因子を使用して前記クロマブロックを処理すること
を含む、非一時的コンピュータ可読記憶媒体。