JP2022523925A - 映像コンテンツを処理するための方法及びシステム - Google Patents

映像コンテンツを処理するための方法及びシステム Download PDF

Info

Publication number
JP2022523925A
JP2022523925A JP2021547465A JP2021547465A JP2022523925A JP 2022523925 A JP2022523925 A JP 2022523925A JP 2021547465 A JP2021547465 A JP 2021547465A JP 2021547465 A JP2021547465 A JP 2021547465A JP 2022523925 A JP2022523925 A JP 2022523925A
Authority
JP
Japan
Prior art keywords
chroma
factor
chromascale
value
lumascale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021547465A
Other languages
English (en)
Other versions
JPWO2020180737A5 (ja
Inventor
イエ,ヤン
チェン,ジエ
リャオ,ルーリン
Original Assignee
アリババ グループ ホウルディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホウルディング リミテッド filed Critical アリババ グループ ホウルディング リミテッド
Publication of JP2022523925A publication Critical patent/JP2022523925A/ja
Publication of JPWO2020180737A5 publication Critical patent/JPWO2020180737A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本開示の実施形態は映像コンテンツを処理するためのシステム及び方法を提供する。この方法は、ピクチャに関連するクロマブロック及びルマブロックを受信すること、ルマブロックに関連するルマスケール情報を決定すること、ルマスケール情報に基づいてクロマスケール因子を決定すること、及びクロマスケール因子を使用してクロマブロックを処理することを含む。

Description

関連出願の相互参照
[0001] 本開示は、どちらも参照によりその全体を本明細書に援用する、2019年3月4日に出願された米国仮特許出願第62/813,728号、及び2019年3月12日に出願された米国仮特許出願第62/817,546号の優先権の利益を主張する。
技術分野
[0002] 本開示は一般に映像処理に関し、より詳細にはクロマスケーリングによるインループルママッピングを行うための方法及びシステムに関する。
背景
[0003] 映像コード化システムは、例えば消費される記憶空間を減らすべく又はかかる信号に関連する伝送帯域幅の消費量を減らすべく、デジタル映像信号を圧縮するためにしばしば使用される。オンライン映像ストリーミング、テレビ会議、又は映像監視等の映像圧縮の様々な応用において(例えば1920x1080ピクセルの解像度を有する)高精細度(HD)映像の人気が高まるにつれ、映像データの圧縮効率を高めることができる映像コード化ツールを開発することが絶えず求められる。
[0004] 例えば映像監視の応用は多くの応用シナリオ(例えばセキュリティ、交通、環境のモニタリング等)において一層且つ広範に使用されており、監視装置の台数及び解像度が急激に増加している。多くの映像監視の応用シナリオはより多くの情報を捕捉するためにHD映像をユーザに提供することを選び、HD映像はかかる情報を捕捉するために1フレーム当たりより多くのピクセルを有する。しかしHD映像ビットストリームは、伝送のための高帯域幅及び記憶のための大きい空間を要求する高ビットレートを有し得る。例えば平均的な1920x1080の解像度を有する監視映像ストリームは、リアルタイム伝送のために4Mbpsもの帯域幅を必要とし得る。更に、映像監視は一般に7日間x24時間、常時監視を行い、そのことは映像データを記憶する場合は記憶システムの能力を著しく試し得る。従って、HD映像の高帯域幅及び大きい記憶域に対する需要は映像監視におけるHD映像の大規模な展開に対する主な制限になっている。
開示の概要
[0005] 本開示の実施形態は映像コンテンツを処理するための方法を提供する。この方法は、ピクチャに関連するクロマブロック及びルマブロックを受信すること、ルマブロックに関連するルマスケール情報を決定すること、ルマスケール情報に基づいてクロマスケール因子を決定すること、及びクロマスケール因子を使用してクロマブロックを処理することを含み得る。
[0006] 本開示の実施形態は映像コンテンツを処理するための機器を提供する。この機器は、1組の命令を記憶するメモリと、メモリに結合され、ピクチャに関連するクロマブロック及びルマブロックを受信すること、ルマブロックに関連するルマスケール情報を決定すること、ルマスケール情報に基づいてクロマスケール因子を決定すること、及びクロマスケール因子を使用してクロマブロックを処理することを機器に行わせるために、1組の命令を実行するように構成されるプロセッサとを含み得る。
[0007] 本開示の実施形態は、映像コンテンツを処理するための方法を装置に行わせるために、装置の1つ又は複数のプロセッサによって実行可能な1組の命令を記憶する非一時的コンピュータ可読記憶媒体を提供する。その方法は、ピクチャに関連するクロマブロック及びルマブロックを受信すること、ルマブロックに関連するルマスケール情報を決定すること、ルマスケール情報に基づいてクロマスケール因子を決定すること、及びクロマスケール因子を使用してクロマブロックを処理することを含む。
図面の簡単な説明
[0008] 本開示の実施形態及び様々な態様を以下の詳細な説明及び添付図面の中で示す。図中に示す様々な特徴は縮尺通り描かれていない。
[0009]本開示の一部の実施形態による映像シーケンスの一例の構造を示す。 [0010]本開示の一部の実施形態による符号化プロセスの一例の概略図を示す。 [0011]本開示の一部の実施形態による符号化プロセスの別の例の概略図を示す。 [0012]本開示の一部の実施形態による復号プロセスの一例の概略図を示す。 [0013]本開示の一部の実施形態による復号プロセスの別の例の概略図を示す。 [0014]本開示の一部の実施形態による、映像を符号化又は復号するための機器の一例のブロック図を示す。 [0015]本開示の一部の実施形態による、例示的なクロマスケーリングによるルママッピング(LMCS:luma mapping with chroma scaling)プロセスの概略図を示す。 [0016]本開示の一部の実施形態による、LMCS区分線形モデルのためのタイルグループレベルの構文表を示す。 [0017]本開示の一部の実施形態による、LMCS区分線形モデルのための別のタイルグループレベルの構文表を示す。 [0018]本開示の一部の実施形態による、コード化ツリー単位の構文構造の表である。 [0019]本開示の一部の実施形態による、デュアルツリー分割の構文構造の表である。 [0020]本開示の一部の実施形態による、ルマ予測ブロックの平均化を単純化する一例を示す。 [0021]本開示の一部の実施形態による、コード化ツリー単位の構文構造の表である。 [0022]本開示の一部の実施形態による、タイルグループレベルにおけるLMCS区分線形モデルの修正されたシグナリングに関する構文要素の表である。 [0023]本開示の一部の実施形態による、映像コンテンツを処理するための方法の流れ図である。 [0024]本開示の一部の実施形態による、映像コンテンツを処理するための方法の流れ図である。 [0025]本開示の一部の実施形態による、映像コンテンツを処理するための別の方法の流れ図である。 [0026]本開示の一部の実施形態による、映像コンテンツを処理するための別の方法の流れ図である。
詳細な説明
[0027] 次に、その例を添付図面に示す例示的実施形態を詳細に参照する。以下の説明は添付図面を参照し、添付図面では他に指示がない限り異なる図中の同じ数字が同じ又は同様の要素を表す。例示的実施形態についての以下の説明の中で記載する実装形態は本発明と合致する全ての実装形態を表すわけではない。むしろ、それらは添付の特許請求の範囲の中で列挙する本発明に関係する態様と合致する機器及び方法の例に過ぎない。別段の定めがない限り、「又は、若しくは(or)」という語は実行不可能な場合を除いてあり得る全ての組み合わせを包含する。例えば或る構成要素がA又はBを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、その構成要素はA、若しくはB、又はA及びBを含むことができる。第2の例として、或る構成要素がA、B、又はCを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、その構成要素はA、若しくはB、若しくはC、又はA及びB、又はA及びC、又はB及びC、又はA及びB及びCを含むことができる。
[0028] 映像とは、視覚的情報を記憶するために時系列順に配置される1組の静止ピクチャ(又は「フレーム」)である。それらのピクチャを時系列順に捕捉し記憶するために映像捕捉装置(例えばカメラ)を使用することができ、かかるピクチャを時系列順に表示するために映像再生装置(例えばテレビ、コンピュータ、スマートフォン、タブレットコンピュータ、ビデオプレーヤ、又は表示機能を有する任意のエンドユーザ端末)を使用することができる。更に一部の応用では、監視、会議、又は生放送等のために映像捕捉装置が捕捉映像を映像再生装置(例えばモニタを有するコンピュータ)にリアルタイムで伝送することができる。
[0029] かかる応用が必要とする記憶空間及び伝送帯域幅を減らすために、映像を記憶及び伝送前に圧縮し、表示前に解凍することができる。この圧縮及び解凍はプロセッサ(例えば汎用コンピュータのプロセッサ)又は専用ハードウェアによって実行されるソフトウェアによって実装することができる。圧縮用のモジュールを一般に「符号器」と呼び、解凍用のモジュールを一般に「復号器」と呼ぶ。符号器及び復号器はまとめて「コーデック」と呼ぶことができる。符号器及び復号器は様々な適切なハードウェア、ソフトウェア、又はその組み合わせとして実装することができる。例えば符号器及び復号器のハードウェア実装は、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、書換可能ゲートアレイ(FPGA)、ディスクリートロジック、又はその任意の組み合わせ等の回路を含み得る。符号器及び復号器のソフトウェア実装は、プログラムコード、コンピュータ実行可能命令、ファームウェア、又はコンピュータ可読媒体内に固定される任意の適切なコンピュータによって実装されるアルゴリズム若しくはプロセスを含み得る。映像の圧縮及び解凍はMPEG-1、MPEG-2、MPEG-4、H.26xシリーズ等の様々なアルゴリズム又は規格によって実装され得る。一部の応用では、コーデックが第1のコード化規格から映像を解凍し、第2のコード化規格を使用して解凍済みの映像を再圧縮することができ、その場合コーデックを「トランスコーダ」と呼ぶことができる。
[0030] 映像符号化プロセスは、ピクチャを再構築するために使用可能な有用な情報を識別し保つことができ、再構築に重要でない情報を無視することができる。無視された重要でない情報を完全に再構築できない場合、かかる符号化プロセスは「非可逆」と呼ぶことができる。さもなければ、かかる符号化プロセスは「可逆」と呼ぶことができる。殆どの符号化プロセスは非可逆であり、これは必要な記憶空間及び伝送帯域幅を減らすためのトレードオフである。
[0031] 符号化されているピクチャ(「現ピクチャ」と呼ぶ)の有用な情報は、参照ピクチャ(例えば過去に符号化され再構築されたピクチャ)に対する変化を含む。かかる変化は、ピクセルの位置変化、光度変化、又は色変化を含むことができ、そのうちの位置変化が最も関係している。オブジェクトを表すピクセル群の位置変化は、参照ピクチャと現ピクチャとの間のオブジェクトの動きを反映し得る。
[0032] 別のピクチャを参照することなしにコード化されるピクチャ(即ちかかるピクチャが自らの参照ピクチャである)を「Iピクチャ」と呼ぶ。参照ピクチャとして過去のピクチャを使用してコード化されるピクチャを「Pピクチャ」と呼ぶ。参照ピクチャとして過去のピクチャ及び将来のピクチャの両方を使用してコード化される(即ち参照が「双方向」である)ピクチャを「Bピクチャ」と呼ぶ。
[0033] 先に述べたように、HD映像を使用する映像監視は高帯域幅及び大きい記憶域の需要の課題に直面する。この課題に対処するために符号化映像のビットレートを下げることができる。Iピクチャ、Pピクチャ、及びBピクチャのうちIピクチャが最も高いビットレートを有する。殆どの監視映像の背景はほぼ静的なので、符号化映像の全体的なビットレートを下げる1つのやり方は、映像の符号化のためにより少ないIピクチャを使用することであり得る。
[0034] しかし、符号化映像内でIピクチャは一般に主要ではないので、Iピクチャをより少なく使用する改善策は些細なことであり得る。例えば典型的な映像ビットストリームでは、Iピクチャ、Bピクチャ、及びPピクチャの比率が1:20:9の場合があり、Iピクチャが総ビットレートの10%未満を占めることがある。換言すれば、かかる例では全てのIピクチャを除去しても低減されるビットレートは10%に過ぎない可能性がある。
[0035] 本開示は、映像監視のための特性ベースの映像処理のための方法、機器、及びシステムを提供する。本明細書の「特性」は、ピクチャ内の映像コンテンツに関連するコンテンツ特性、ピクチャを符号化すること又は復号することの動き推定に関連する動き特性、又はその両方を指す。例えばコンテンツ特性は映像シーケンスの1つ又は複数の連続ピクチャ内のピクセルとすることができ、ピクセルはピクチャ内のオブジェクト、シーン、又は環境事象の少なくとも1つに関係する。別の例では動き特性が映像のコード化プロセスに関係する情報を含むことができ、その例は後で詳述する。
[0036] 本開示では、映像シーケンスのピクチャを符号化するとき、映像シーケンスのピクチャの1つ又は複数の特性を検出し分類するために特性分類器を使用することができる。特性の様々なクラスを様々な優先レベルに関連付けることができ、かかる優先レベルは符号化のための様々なビットレートに更に関連付けられる。様々な優先レベルは符号化のための様々なパラメータセットに関連付けることができ、それにより異なる符号化品質レベルがもたらされ得る。優先レベルが高ければ高いほど、その関連パラメータセットがもたらし得る映像の質が高くなる。このような特性ベースの映像処理により、著しい情報損失を引き起こすことなしに監視映像についてビットレートを大幅に下げることができる。加えて、本開示の実施形態は様々な応用シナリオ(例えばセキュリティ、交通、環境のモニタリング等)について優先レベルとパラメータセットとの間の対応する関係をカスタマイズし、それにより映像のコード化品質を大幅に改善し、帯域幅及び記憶域のコストを大幅に低減することができる。
[0037] 図1は、本開示の一部の実施形態による映像シーケンス100の一例の構造を示す。映像シーケンス100は、生中継映像又は捕捉されアーカイブされている映像とすることができる。映像100は現実の映像、コンピュータによって生成される映像(例えばコンピュータゲーム映像)、又はその組み合わせ(例えば拡張現実効果を有する現実の映像)であり得る。映像シーケンス100は、映像捕捉装置(例えばカメラ)、過去に捕捉された映像を含む映像アーカイブ(例えば記憶装置内に記憶される映像ファイル)、又は映像コンテンツプロバイダから映像を受信するための映像フィードインタフェース(例えば映像ブロードキャストトランシーバ)から入力され得る。
[0038] 図1に示すように、映像シーケンス100は、ピクチャ102、104、106、及び108を含むタイムライン沿いに時間的に配置される一連のピクチャを含み得る。ピクチャ102~106は連続的であり、ピクチャ106とピクチャ108との間には更に多くのピクチャがある。図1ではピクチャ102がIピクチャであり、その参照ピクチャはピクチャ102自体である。ピクチャ104はPピクチャであり、矢印によって示すようにその参照ピクチャはピクチャ102である。ピクチャ106はBピクチャであり、矢印によって示すようにその参照ピクチャはピクチャ104及び108である。一部の実施形態では、ピクチャ(例えばピクチャ104)の参照ピクチャはそのピクチャのすぐ前に又はすぐ後になくてもよい。例えばピクチャ104の参照ピクチャは、ピクチャ102に先行するピクチャであり得る。ピクチャ102~106の参照ピクチャは例に過ぎず、本開示は参照ピクチャの実施形態を図1に示す例として限定しないことに留意すべきである。
[0039] 典型的には、映像コーデックは全ピクチャを一度に符号化又は復号することはなく、それはかかるタスクが計算的に複雑だからである。むしろ映像コーデックはピクチャを基本セグメントに分割し、ピクチャをセグメントごとに符号化又は復号することができる。本開示ではそのような基本セグメントを基本処理単位(「BPU」)と呼ぶ。例えば図1の構造110は、映像シーケンス100のピクチャ(例えばピクチャ102~108の何れか)の構造の一例を示す。構造110ではピクチャが4x4の基本処理単位に分けられており、その境界が破線で示されている。一部の実施形態では、基本処理単位は一部の映像コード化規格(例えばMPEGファミリ、H.261、H.263、又はH.264/AVC)内の「マクロブロック」と呼ぶことができ、他の一部の映像コード化規格(例えばH.265/HEVC又はH.266/VVC)内の「コード化ツリー単位」(「CTU」)と呼ぶことができる。128x128、64x64、32x32、16x16、4x8、16x32、又はピクセルのあらゆる任意の形状及びサイズ等、基本処理単位はピクチャ内で可変サイズを有することができる。基本処理単位のサイズ及び形状は、コード化の効率及び基本処理単位内で保とうとする詳細度のバランスに基づいてピクチャについて選択することができる。
[0040] 基本処理単位は、コンピュータメモリ内に(例えば映像フレームバッファ内に)記憶される様々な種類の映像データ群を含み得る論理単位であり得る。例えばカラーピクチャの基本処理単位は、無彩色の輝度情報を表すルマ成分(Y)、色情報を表す1つ又は複数のクロマ成分(例えばCb及びCr)、並びにルマ成分及びクロマ成分が同じサイズを有し得る基本処理単位の関連構文要素を含むことができる。一部の映像コード化規格(例えばH.265/HEVC又はH.266/VVC)では、ルマ成分及びクロマ成分が「コード化ツリーブロック」(「CTB」)と呼ばれ得る。基本処理単位に対して行われる如何なる操作も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。
[0041] 映像のコード化は複数の操作段階を有し、その例を図2A~図2B及び図3A~図3Bの中で詳述する。それぞれの段階について、基本処理単位のサイズは依然として処理するのに大き過ぎる場合があり、従って本開示で「基本処理副単位」と呼ぶセグメントに更に分けることができる。一部の実施形態では、基本処理副単位は一部の映像コード化規格(例えばMPEGファミリ、H.261、H.263、又はH.264/AVC)内の「ブロック」と呼ぶことができ、又は他の一部の映像コード化規格(例えばH.265/HEVC又はH.266/VVC)内の「コード化単位」(「CU」)と呼ぶことができる。基本処理副単位は基本処理単位と同じ又はそれよりも小さいサイズを有し得る。基本処理単位と同様に基本処理副単位もコンピュータメモリ内に(例えば映像フレームバッファ内に)記憶される様々な種類の映像データ群(例えばY、Cb、Cr、及び関連構文要素)を含み得る論理単位である。基本処理副単位に対して行われる如何なる操作も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。処理の必要性に応じて、かかる分割は更なるレベルに対して行われ得ることに留意すべきである。様々な段階が様々な方式を使用して基本処理単位を分割できることにも留意すべきである。
[0042] 例えば(その一例を図2Bで詳述する)モード決定段階において、基本処理単位に対してどの予測モード(例えばイントラピクチャ予測又はインタピクチャ予測)を使用するのかを符号器が決定することができ、基本処理単位はかかる決定を下すには大き過ぎる場合がある。符号器は基本処理単位を複数の基本処理副単位(例えばH.265/HEVC又はH.266/VVCにあるCU)に分け、個々の基本処理副単位ごとに予測の種類を決定することができる。
[0043] 別の例では、(その一例を図2Aに詳述する)予測段階において、符号器は基本処理副単位(例えばCU)のレベルにおいて予測操作を行うことができる。しかし一部の事例では、処理するのに基本処理副単位が依然として大き過ぎる場合がある。符号器は基本処理副単位をより小さいセグメント(例えばH.265/HEVC又はH.266/VVC内で「予測ブロック」又は「PB」と呼ばれる)に更に分けることができ、そのレベルにおいて予測操作を行うことができる。
[0044] 別の例では、(その一例を図2Aに詳述する)変換段階において、符号器が残差基本処理副単位(例えばCU)に対する変換操作を行うことができる。しかし一部の事例では、処理するのに基本処理副単位が依然として大き過ぎる場合がある。符号器は基本処理副単位をより小さいセグメント(例えばH.265/HEVC又はH.266/VVC内で「変換ブロック」又は「TB」と呼ばれる)に更に分けることができ、そのレベルにおいて変換操作を行うことができる。同じ基本処理副単位の分割方式は予測段階と変換段階とで異なり得ることに留意すべきである。例えばH.265/HEVC又はH.266/VVCでは、同じCUの予測ブロック及び変換ブロックが異なるサイズ及び数を有し得る。
[0045] 図1の構造110では、基本処理単位112が3x3の基本処理副単位に更に分けられており、その境界が点線で示されている。同じピクチャの異なる基本処理単位を異なる方式で基本処理副単位に分けることができる。
[0046] 一部の実装形態では、映像の符号化及び復号に並列処理及び誤り耐性の機能を与えるために、ピクチャを処理用の領域に分けることができ、それによりピクチャの領域について、符号化又は復号プロセスがピクチャの他の任意の領域の情報に依存しないようにできる。換言すれば、ピクチャの各領域を独立に処理することができる。そうすることでコーデックはピクチャの異なる領域を並列に処理し、従ってコード化の効率を高めることができる。更に、領域のデータが処理内で破損し又はネットワーク伝送内で失われる場合、コーデックは破損し又は失われたデータに依存することなしに、同じピクチャの他の領域を正しく符号化又は復号することができ、従って誤り耐性の機能を提供する。一部の映像コード化規格では、ピクチャを異なる種類の領域に分割することができる。例えばH.265/HEVC及びH.266/VVCは「スライス」及び「タイル」という2種類の領域を提供する。映像シーケンス100の様々なピクチャが、ピクチャを領域に分けるための様々な分割方式を有し得ることにも留意すべきである。
[0047] 例えば図1では、構造110が3つの領域114、116、及び118に分けられており、その境界が構造110内の実線として示されている。領域114は4個の基本処理単位を含む。領域116及び118のそれぞれは6個の基本処理単位を含む。図1の構造110の基本処理単位、基本処理副単位、及び領域は例に過ぎず、本開示はその実施形態を限定しないことに留意すべきである。
[0048] 図2Aは、本開示の一部の実施形態による符号化プロセス200Aの一例の概略図を示す。符号器は、プロセス200Aに従って映像シーケンス202を映像ビットストリーム228へと符号化することができる。図1の映像シーケンス100と同様に、映像シーケンス202は時系列順に配置される1組のピクチャ(「元のピクチャ」と呼ぶ)を含み得る。図1の構造110と同様に、映像シーケンス202のそれぞれの元のピクチャは符号器によって基本処理単位、基本処理副単位、又は処理用の領域に分けられ得る。一部の実施形態では、符号器は映像シーケンス202のそれぞれの元のピクチャに関する基本処理単位のレベルにおいてプロセス200Aを実行することができる。例えば符号器はプロセス200Aを反復的なやり方で実行することができ、符号器はプロセス200Aの1回の反復の中で基本処理単位を符号化することができる。一部の実施形態では、符号器は映像シーケンス202のそれぞれの元のピクチャの領域(例えば領域114~118)についてプロセス200Aを並列に実行することができる。
[0049] 図2Aでは、符号器は、映像シーケンス202の元のピクチャの基本処理単位(「元のBPU」と呼ぶ)を予測段階204にフィードして、予測データ206及び予測済みBPU208を生成することができる。符号器は、元のBPUから予測済みBPU208を減算して、残差BPU210を生成することができる。符号器は、残差BPU210を変換段階212及び量子化段階214にフィードして、量子化済み変換係数216を生成することができる。符号器は、予測データ206及び量子化済み変換係数216をバイナリコード化段階226にフィードして、映像ビットストリーム228を生成することができる。構成要素202、204、206、208、210、212、214、216、226、及び228は「順方向経路」と呼ぶことができる。プロセス200Aの間、符号器は、量子化段階214の後で量子化済み変換係数216を逆量子化段階218及び逆変換段階220にフィードして、再構築済み残差BPU222を生成することができる。符号器は、再構築済み残差BPU222を予測済みBPU208に加えて、プロセス200Aの次の反復の予測段階204に使用される予測基準224を生成することができる。プロセス200Aの構成要素218、220、222、及び224は「再構築経路」と呼ぶことができる。再構築経路は、符号器及び復号器の両方が予測に同じ参照データを使用することを確実にするために使用され得る。
[0050] 符号器はプロセス200Aを反復的に実行して、(順方向経路内で)元のピクチャのそれぞれの元のBPUを符号化し、(再構築経路内で)元のピクチャの次の元のBPUを符号化するための予測済み基準224を生成することができる。元のピクチャの全ての元のBPUを符号化した後、符号器は映像シーケンス202内の次のピクチャの符号化に進むことができる。
[0051] プロセス200Aを参照し、符号器は、映像捕捉装置(例えばカメラ)によって生成される映像シーケンス202を受信することができる。本明細書で使用する「受信(する)」という用語は、データを入力するために受信すること、入力すること、取得すること、取り出すこと、得ること、読み出すこと、アクセスすること、又は任意のやり方の任意のアクションを指すことができる。
[0052] 現在の反復の予測段階204で、符号器は、元のBPU及び予測基準224を受信し、予測操作を行って予測データ206及び予測済みBPU208を生成することができる。予測基準224は、プロセス200Aの前の反復の再構築経路から生成され得る。予測段階204の目的は、予測データ206及び予測基準224から予測済みBPU208として元のBPUを再構築するために使用され得る予測データ206を抽出することによって、情報の冗長性を減らすことである。
[0053] 理想的には、予測済みBPU208は元のBPUと同一であり得る。しかし、理想的でない予測及び再構築操作により、予測済みBPU208は概して元のBPUと僅かに異なる。そのような差を記録するために、符号器は、予測済みBPU208を生成した後でそれを元のBPUから減算して、残差BPU210を生成することができる。例えば符号器は、予測済みBPU208のピクセルの値(例えばグレースケール値又はRGB値)を元のBPUの対応するピクセルの値から減算することができる。元のBPUの対応するピクセルと予測済みBPU208との間のかかる減算の結果、残差BPU210の各ピクセルは残差値を有し得る。元のBPUと比較し、予測データ206及び残差BPU210はより少ないビットを有し得るが、品質を著しく損なうことなしに元のBPUを再構築するためにそれらを使用することができる。
[0054] 残差BPU210を更に圧縮するために、変換段階212で、符号器は残差BPU210を1組の2次元「基底パターン」へと分解することによって、残差BPU210の空間的冗長性を低減することができ、各基底パターンは「変換係数」に関連する。基底パターンは同じサイズ(例えば残差BPU210のサイズ)を有することができる。それぞれの基底パターンは残差BPU210の変動周波数(例えば輝度変動周波数)成分を表すことができる。基底パターンのどれも、他の任意の基底パターンの任意の組み合わせ(例えば線形結合)から再現することはできない。換言すれば、かかる分解により、残差BPU210の変動を周波数領域内に分解することができる。かかる分解は関数の離散フーリエ変換に類似しており、基底パターンは離散フーリエ変換の基底関数(例えば三角関数)に類似しており、変換係数は基底関数に関連する係数に類似している。
[0055] 様々な変換アルゴリズムが様々な基底パターンを使用することができる。例えば離散コサイン変換、離散サイン変換等、変換段階212では様々な変換アルゴリズムを使用することができる。変換段階212における変換は可逆的である。つまり符号器は変換の逆操作(「逆変換」と呼ぶ)によって、残差BPU210を復元することができる。例えば残差BPU210のピクセルを復元するために、逆変換は、基底パターンの対応するピクセルの値を関連するそれぞれの係数で乗算し、積を加算して加重和をもたらすことであり得る。映像コード化規格では、符号器及び復号器の両方が同じ変換アルゴリズム(従って同じ基底パターン)を使用することができる。従って符号器は、復号器が符号器から基底パターンを受信することなしに、そこから残差BPU210を再構築することができる変換係数だけを記録することができる。残差BPU210と比較して変換係数の方が少ないビットを有し得るが、それらの変換係数は、品質を著しく損なうことなしに残差BPU210を再構築するために使用され得る。従って残差BPU210が更に圧縮される。
[0056] 符号器は、量子化段階214において変換係数を更に圧縮することができる。変換プロセスでは、様々な基底パターンが様々な変動周波数(例えば輝度変動周波数)を表すことができる。人間の目は概して低周波変動を認識するのが得意なので、符号器は復号の際の著しい品質劣化を引き起こすことなしに、高周波変動の情報を無視することができる。例えば量子化段階214において、符号器は、各変換係数を整数値(「量子化パラメータ」と呼ぶ)で除算し、商をその最近隣数に丸めることによって、量子化済み変換係数216を生成することができる。かかる操作の後、高周波基底パターンの一部の変換係数をゼロに変換することができ、低周波基底パターンの変換係数をより小さい整数に変換することができる。符号器はゼロ値の量子化済み変換係数216を無視することができ、それにより変換係数が更に圧縮される。量子化プロセスも可逆的であり、量子化済み変換係数216は、量子化の逆操作(「逆量子化」と呼ぶ)で変換係数に再構築することができる。
[0057] 符号器は、丸め操作でかかる除算の剰余を無視するので、量子化段階214は非可逆であり得る。典型的には、量子化段階214はプロセス200A内で最大の情報損失に寄与し得る。情報損失が大きければ大きいほど、量子化済み変換係数216が必要とし得るビットが少なくなる。情報損失の様々なレベルを得るために、符号器は、量子化パラメータの様々な値又は量子化プロセスの他の任意のパラメータを使用することができる。
[0058] バイナリコード化段階226において、符号器は例えばエントロピコード化、可変長コード化、算術コード化、ハフマンコード化、コンテキスト適応バイナリ算術コード化、又は他の任意の可逆若しくは非可逆圧縮アルゴリズム等のバイナリコード化技法を使用し、予測データ206及び量子化済み変換係数216を符号化することができる。一部の実施形態では、予測データ206及び量子化済み変換係数216に加えて、符号器は、例えば予測段階204で使用される予測モード、予測操作のパラメータ、変換段階212の変換の種類、量子化プロセスのパラメータ(例えば量子化パラメータ)、符号器制御パラメータ(例えばビットレート制御パラメータ)等の他の情報をバイナリコード化段階226において符号化することができる。符号器は、バイナリコード化段階226の出力データを使用して映像ビットストリーム228を生成することができる。一部の実施形態では、映像ビットストリーム228をネットワーク伝送のために更にパケット化することができる。
[0059] プロセス200Aの再構築経路を参照し、逆量子化段階218で、符号器は、量子化済み変換係数216に対して逆量子化を行って再構築済み変換係数を生成することができる。逆変換段階220で、符号器は、再構築済み変換係数に基づいて再構築済み残差BPU222を生成することができる。符号器は、再構築済み残差BPU222を予測済みBPU208に加えて、プロセス200Aの次の反復内で使用される予測基準224を生成することができる。
[0060] 映像シーケンス202を符号化するためにプロセス200Aの他のバリエーションを使用できることに留意すべきである。一部の実施形態では、符号器がプロセス200Aの段階を異なる順序で実行することができる。一部の実施形態では、プロセス200Aの1つ又は複数の段階を単一の段階へと組み合わせることができる。一部の実施形態では、プロセス200Aの単一の段階を複数の段階に分けることができる。例えば変換段階212と量子化段階214とを単一の段階へと組み合わせることができる。一部の実施形態では、プロセス200Aが追加の段階を含み得る。一部の実施形態では、プロセス200Aが図2A内の1つ又は複数の段階を省くことができる。
[0061] 図2Bは、本開示の一部の実施形態による符号化プロセスの別の例200Bの概略図を示す。プロセス200Bは、プロセス200Aから修正され得る。例えばプロセス200Bは、ハイブリッド映像コード化規格(例えばH.26xシリーズ)に準拠する符号器によって使用され得る。プロセス200Aと比較し、プロセス200Bの順方向経路はモード決定段階230を更に含み、予測段階204を空間的予測段階2042及び時間的予測段階2044に分ける。プロセス200Bの再構築経路は、ループフィルタ段階232及びバッファ234を追加で含む。
[0062] 概して、予測技法は空間的予測及び時間的予測の2つの種類に分類することができる。空間的予測(例えばイントラピクチャ予測又は「イントラ予測」)は、現BPUを予測するために、同じピクチャ内の既にコード化された1つ又は複数の隣接BPUのピクセルを使用することができる。つまり空間的予測における予測基準224は、隣接BPUを含み得る。空間的予測はピクチャの固有の空間的冗長性を減らすことができる。時間的予測(例えばインタピクチャ予測又は「インタ予測」)は、現BPUを予測するために、既にコード化された1つ又は複数のピクチャの領域を使用することができる。つまり時間的予測における予測基準224は、コード化されたピクチャを含み得る。時間的予測はピクチャの固有の時間的冗長性を減らすことができる。
[0063] プロセス200Bを参照し、順方向経路において、符号器は、空間的予測段階2042及び時間的予測段階2044で予測操作を行う。例えば空間的予測段階2042で符号器はイントラ予測を行うことができる。符号化されているピクチャの元のBPUに関して、予測基準224は、同じピクチャ内の(順方向経路内で)符号化され(再構築経路内で)再構築されている1つ又は複数の隣接BPUを含み得る。符号器は、隣接BPUを外挿することによって、予測済みBPU208を生成することができる。外挿技法は、例えば線形外挿又は線形補間、多項式外挿又は多項式補間等を含み得る。一部の実施形態では、符号器は、予測済みBPU208のピクセルごとに、対応するピクセルの値を外挿することによって等、ピクセルレベルで外挿を行うことができる。外挿に使用される隣接BPUは、垂直方向(例えば元のBPUの上)、水平方向(例えば元のBPUの左)、対角線方向(例えば元のBPUの左下、右下、左上、又は右上)、又は使用される映像コード化規格内で規定される任意の方向等、様々な方向から元のBPUに対して位置し得る。イントラ予測では、予測データ206は、例えば使用される隣接BPUの位置(例えば座標)、使用される隣接BPUのサイズ、外挿のパラメータ、元のBPUに対する使用される隣接BPUの方向等を含み得る。
[0064] 別の例では、符号器は、時間的予測段階2044でインタ予測を行うことができる。現ピクチャの元のBPUに関して、予測基準224は、(順方向経路内で)符号化され(再構築経路内で)再構築されている1つ又は複数のピクチャ(「参照ピクチャ」と呼ぶ)を含み得る。一部の実施形態では、参照ピクチャがBPUごとに符号化され再構築され得る。例えば符号器は、再構築済み残差BPU222を予測済みBPU208に加えて再構築済みBPUを生成することができる。同じピクチャの全ての再構築済みBPUが生成されると、符号器は、参照ピクチャとして再構築済みピクチャを生成することができる。符号器は、参照ピクチャの範囲(「探索窓」と呼ぶ)内の一致領域を探すために「動き推定」の操作を行うことができる。参照ピクチャ内の探索窓の位置は、現ピクチャ内の元のBPUの位置に基づいて決定することができる。例えば探索窓は、参照ピクチャ内で、現ピクチャ内の元のBPUと同じ座標を有する位置に中心を置くことができ、所定の距離にわたって広げることができる。符号器が探索窓内で元のBPUと同様の領域を(例えばpel再帰アルゴリズム、ブロックマッチングアルゴリズム等を使用することによって)識別すると、符号器は、その領域を一致領域として決定することができる。一致領域は元のBPUと異なる(例えばそれよりも小さい、等しい、大きい、又は異なる形状の)寸法を有し得る。参照ピクチャ及び現ピクチャは(例えば図1に示すように)タイムライン内で時間的に隔てられているので、時間が経つにつれて一致領域が元のBPUの位置に「移動する」と見なすことができる。符号器はかかる動きの方向及び距離を「動きベクトル」として記録することができる。(例えば図1のピクチャ106のような)複数の参照ピクチャが使用される場合、符号器は、参照ピクチャごとに一致領域を探し、その関連する動きベクトルを求めることができる。一部の実施形態では、符号器が個々の一致する参照ピクチャの一致領域のピクセル値に重みを割り当てることができる。
[0065] 動き推定は、例えば平行移動、回転、拡大縮小等の様々な種類の動きを識別するために使用することができる。インタ予測では、予測データ206は、例えば一致領域の位置(例えば座標)、一致領域に関連する動きベクトル、参照ピクチャの数、参照ピクチャに関連する重み等を含み得る。
[0066] 予測済みBPU208を生成するために、符号器は「動き補償」の操作を行うことができる。動き補償は、予測データ206(例えば動きベクトル)及び予測基準224に基づいて予測済みBPU208を再構築するために使用することができる。例えば符号器は、動きベクトルに従って参照ピクチャの一致領域を動かすことができ、その中で符号器は現ピクチャの元のBPUを予測することができる。(例えば図1のピクチャ106のような)複数の参照ピクチャが使用される場合、符号器は、個々の動きベクトルに従って参照ピクチャの一致領域を動かし、一致領域のピクセル値を平均することができる。一部の実施形態では、符号器が個々の一致する参照ピクチャの一致領域のピクセル値に重みを割り当てた場合、符号器は、動かした一致領域のピクセル値の加重和を求めることができる。
[0067] 一部の実施形態では、インタ予測は単方向でも双方向でもよい。単方向のインタ予測は、現ピクチャに対して同じ時間的方向にある1つ又は複数の参照ピクチャを使用することができる。例えば図1のピクチャ104は、参照ピクチャ(即ちピクチャ102)がピクチャ104に先行する単方向のインタ予測ピクチャである。双方向のインタ予測は、現ピクチャに対して両方の時間的方向にある1つ又は複数の参照ピクチャを使用することができる。例えば図1のピクチャ106は、参照ピクチャ(即ちピクチャ104及び108)がピクチャ104に対して両方の時間的方向にある双方向のインタ予測ピクチャである。
[0068] プロセス200Bの順方向経路を引き続き参照し、空間的予測段階2042及び時間的予測段階2044の後、モード決定段階230において、符号器は、プロセス200Bの現在の反復のための予測モード(例えばイントラ予測又はインタ予測の1つ)を選択することができる。例えば符号器はレート歪み最適化技法を実行することができ、かかる技法では、符号器は、候補予測モードのビットレート及び候補予測モード下の再構築済み参照ピクチャの歪みに応じてコスト関数の値を最小化するための予測モードを選択することができる。選択される予測モードに応じて、符号器は、対応する予測済みBPU208及び予測済みデータ206を生成することができる。
[0069] プロセス200Bの再構築経路において、順方向経路内でイントラ予測モードが選択されている場合、予測基準224(例えば現ピクチャ内で符号化され再構築されている現BPU)を生成した後で、符号器は、後で使用するために(例えば現ピクチャの次のBPUを外挿するために)空間的予測段階2042に予測基準224を直接フィードすることができる。順方向経路内でインタ予測モードが選択されている場合、予測基準224(例えば全てのBPUが符号化され再構築されている現ピクチャ)を生成した後で、符号器は、ループフィルタ段階232に予測基準224をフィードすることができ、ループフィルタ段階232では、符号器は、予測基準224にループフィルタを適用してインタ予測によって引き起こされる歪み(例えばブロッキングアーティファクト)を減らし又はなくすことができる。例えばデブロッキング、サンプル適応オフセット、適応ループフィルタ等、符号器は、ループフィルタ段階232で様々なループフィルタ技法を適用することができる。ループフィルタ済みの参照ピクチャは、後で使用するために(例えば映像シーケンス202の将来のピクチャ用のインタ予測参照ピクチャとして使用するために)バッファ234(又は「復号済みピクチャバッファ」)内に記憶することができる。符号器は、時間的予測段階2044で使用するために1つ又は複数の参照ピクチャをバッファ234内に記憶することができる。一部の実施形態では、符号器は、量子化済み変換係数216、予測データ206、及び他の情報と共にループフィルタのパラメータ(例えばループフィルタの強度)をバイナリコード化段階226で符号化することができる。
[0070] 図3Aは、本開示の一部の実施形態による復号プロセス300Aの一例の概略図を示す。プロセス300Aは、図2Aの圧縮プロセス200Aに対応する解凍プロセスであり得る。一部の実施形態では、プロセス300Aがプロセス200Aの再構築経路と同様であり得る。復号器は、プロセス300Aに従って映像ビットストリーム228を映像ストリーム304へと復号することができる。映像ストリーム304は映像シーケンス202と非常に似ているものであり得る。しかし、圧縮及び解凍プロセス(例えば図2A~図2Bの量子化段階214)における情報損失により、概して映像ストリーム304は映像シーケンス202と同一ではない。図2A~図2Bのプロセス200A及び200Bと同様に、復号器は、映像ビットストリーム228内に符号化される各ピクチャについて基本処理単位(BPU)のレベルにおいてプロセス300Aを実行することができる。例えば復号器はプロセス300Aを反復的なやり方で実行することができ、復号器はプロセス300Aの1回の反復の中で基本処理単位を復号することができる。一部の実施形態では、復号器は、映像ビットストリーム228内に符号化される各ピクチャの領域(例えば領域114~118)についてプロセス300Aを並列に実行することができる。
[0071] 図3Aでは、復号器は、符号化済みピクチャの基本処理単位(「符号化済みBPU」と呼ぶ)に関連する映像ビットストリーム228の一部をバイナリ復号段階302にフィードすることができる。バイナリ復号段階302で、復号器は、その部分を予測データ206及び量子化済み変換係数216へと復号することができる。復号器は、量子化済み変換係数216を逆量子化段階218及び逆変換段階220にフィードして、再構築済み残差BPU222を生成することができる。復号器は、予測データ206を予測段階204にフィードして、予測済みBPU208を生成することができる。復号器は、再構築済み残差BPU222を予測済みBPU208に加えて、予測済み基準224を生成することができる。一部の実施形態では、予測済み基準224は、バッファ(例えばコンピュータメモリ内の復号済みピクチャバッファ)内に記憶され得る。復号器は、プロセス300Aの次の反復内で予測操作を行うための予測済み基準224を、予測段階204にフィードすることができる。
[0072] 復号器は、プロセス300Aを反復的に実行して、符号化済みピクチャの各符号化済みBPUを復号し、符号化済みピクチャの次の符号化済みBPUを符号化するための予測済み基準224を生成することができる。符号化済みピクチャの全ての符号化済みBPUを復号した後、復号器は、表示するためにピクチャを映像ストリーム304に出力し、映像ビットストリーム228内の次の符号化済みピクチャの復号に進むことができる。
[0073] バイナリ復号段階302で、復号器は、符号器が使用したバイナリコード化技法(例えばエントロピコード化、可変長コード化、算術コード化、ハフマンコード化、コンテキスト適応バイナリ算術コード化、又は他の任意の可逆圧縮アルゴリズム)の逆操作を行うことができる。一部の実施形態では、予測データ206及び量子化済み変換係数216に加えて、復号器は、例えば予測モード、予測操作のパラメータ、変換の種類、量子化プロセスのパラメータ(例えば量子化パラメータ)、符号器制御パラメータ(例えばビットレート制御パラメータ)等の他の情報を、バイナリ復号段階302において復号することができる。一部の実施形態では、映像ビットストリーム228がネットワーク上でパケット単位で伝送される場合、復号器は、バイナリ復号段階302にフィードする前に、映像ビットストリーム228をパケット化解除することができる。
[0074] 図3Bは、本開示の一部の実施形態による復号プロセスの別の例300Bの概略図を示す。プロセス300Bはプロセス300Aから修正され得る。例えばプロセス300Bは、ハイブリッド映像コード化規格(例えばH.26xシリーズ)に準拠する復号器によって使用され得る。プロセス300Aと比較し、プロセス300Bは、予測段階204を空間的予測段階2042及び時間的予測段階2044に更に分け、ループフィルタ段階232及びバッファ234を追加で含む。
[0075] プロセス300Bでは、復号されている符号化済みピクチャ(「現ピクチャ」と呼ぶ)の符号化済み基本処理単位(「現BPU」と呼ぶ)に関して、復号器によってバイナリ復号段階302から復号される予測データ206は、現BPUを符号化するためにどの予測モードが符号器によって使用されたのかに応じて様々な種類のデータを含み得る。例えば現BPUを符号化するためにイントラ予測が符号器によって使用された場合、予測データ206は、イントラ予測、イントラ予測操作のパラメータ等を示す予測モードインジケータ(例えばフラグ値)を含み得る。イントラ予測操作のパラメータは、例えば基準として使用される1つ又は複数の隣接BPUの位置(例えば座標)、隣接BPUのサイズ、外挿のパラメータ、元のBPUに対する隣接BPUの方向等を含み得る。別の例では、現BPUを符号化するためにインタ予測が符号器によって使用された場合、予測データ206は、インタ予測、インタ予測操作のパラメータ等を示す予測モードインジケータ(例えばフラグ値)を含み得る。インタ予測操作のパラメータは、例えば現BPUに関連する参照ピクチャの数、参照ピクチャにそれぞれ関連する重み、それぞれの参照ピクチャ内の1つ又は複数の一致領域の位置(例えば座標)、一致領域にそれぞれ関連する1つ又は複数の動きベクトル等を含み得る。
[0076] 予測モードインジケータに基づき、復号器は、空間的予測段階2042で空間的予測(例えばイントラ予測)を行うのか、時間的予測段階2044で時間的予測(例えばインタ予測)を行うのかを決めることができる。かかる空間的予測又は時間的予測の実行の詳細は図2Bに示しており、以下で繰り返さない。かかる空間的予測又は時間的予測を行った後、復号器は、予測済みBPU208を生成することができる。図3Aに記載したように、復号器は、予測済みBPU208と再構築済み残差BPU222とを加えて、予測基準224を生成することができる。
[0077] プロセス300Bでは、復号器は、プロセス300Bの次の反復内で予測操作を行うための予測済み基準224を、空間的予測段階2042又は時間的予測段階2044にフィードすることができる。例えば現BPUが空間的予測段階2042においてイントラ予測を使用して復号される場合、予測基準224(例えば復号済みの現BPU)を生成した後で、復号器は、後で使用するために(例えば現ピクチャの次のBPUを外挿するために)空間的予測段階2042に予測基準224を直接フィードすることができる。現BPUが時間的予測段階2044においてインタ予測を使用して復号される場合、予測基準224(例えば全てのBPUが復号されている参照ピクチャ)を生成した後で、符号器は、ループフィルタ段階232に予測基準224をフィードして、歪み(例えばブロッキングアーティファクト)を減らし又はなくすことができる。復号器は、図2Bに記載したやり方で予測基準224にループフィルタを適用することができる。ループフィルタ済みの参照ピクチャは、後で使用するために(例えば映像ビットストリーム228の将来の符号化ピクチャ用のインタ予測参照ピクチャとして使用するために)バッファ234(例えばコンピュータメモリ内の復号済みピクチャバッファ)内に記憶することができる。復号器は、時間的予測段階2044で使用するために1つ又は複数の参照ピクチャをバッファ234内に記憶することができる。一部の実施形態では、現BPUを符号化するためにインタ予測が使用されたことを予測データ206の予測モードインジケータが示す場合、予測データはループフィルタのパラメータ(例えばループフィルタの強度)を更に含むことができる。
[0078] 図4は、本開示の一部の実施形態による、映像を符号化又は復号するための機器400の一例のブロック図である。図4に示すように、機器400はプロセッサ402を含み得る。プロセッサ402が本明細書に記載の命令を実行するとき、機器400は映像を符号化し又は復号するための専用マシンになり得る。プロセッサ402は情報を操作し又は処理することができる任意の種類の回路であり得る。例えばプロセッサ402は、任意の数の中央処理装置(「CPU」)、グラフィックス処理装置(「GPU」)、ニューラル処理ユニット(「NPU」)、マイクロコントローラユニット(「MCU」)、光プロセッサ、プログラム可能論理コントローラ、マイクロコントローラ、マイクロプロセッサ、デジタル信号プロセッサ、IP(intellectual property)コア、プログラム可能論理アレイ(PLA)、プログラム可能アレイ論理(PAL)、汎用アレイ論理(GAL)、複合プログラム可能論理装置(CPLD)、書換可能ゲートアレイ(FPGA)、システムオンチップ(SoC)、特定用途向け集積回路(ASIC)等の任意の組み合わせを含み得る。一部の実施形態では、プロセッサ402は単一の論理構成要素としてグループ化される1組のプロセッサとすることもできる。例えば図4に示すように、プロセッサ402はプロセッサ402a、プロセッサ402b、及びプロセッサ402nを含む複数のプロセッサを含み得る。
[0079] 機器400は、データ(例えば1組の命令、コンピュータコード、中間データ等)を記憶するように構成されるメモリ404も含み得る。例えば図4に示すように、記憶データは、プログラム命令(例えばプロセス200A、200B、300A、又は300B内の段階を実装するためのプログラム命令)及び処理用データ(例えば映像シーケンス202、映像ビットストリーム228、又は映像ストリーム304)を含み得る。プロセッサ402は、プログラム命令及び処理用データに(例えばバス410を介して)アクセスし、プログラム命令を実行して処理用データに対する操作又は処理を行うことができる。メモリ404は、高速ランダムアクセス記憶装置又は不揮発性記憶装置を含み得る。一部の実施形態では、メモリ404が、任意の数のランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、光学ディスク、磁気ディスク、ハードドライブ、ソリッドステートドライブ、フラッシュドライブ、セキュリティデジタル(SD)カード、メモリスティック、コンパクトフラッシュ(登録商標)(CF)カード等の任意の組み合わせを含み得る。メモリ404は、単一の論理構成要素としてグループ化される(図4には不図示の)メモリ群とすることもできる。
[0080] 内蔵バス(例えばCPUメモリバス)、外部バス(例えばユニバーサルシリアルバスポート、周辺機器コンポーネント相互接続エクスプレスポート)等のバス410は、機器400内の構成要素間でデータを転送する通信装置であり得る。
[0081] 曖昧さを招くことなしに説明を簡単にするために、本開示ではプロセッサ402及び他のデータ処理回路をまとめて「データ処理回路」と呼ぶ。データ処理回路は、完全にハードウェアとして、又はソフトウェア、ハードウェア、若しくはファームウェアの組み合わせとして実装することができる。加えてデータ処理回路は、単一の独立したモジュールとすることができ、又は機器400の他の任意の構成要素内に完全に若しくは部分的に組み合わせることができる。
[0082] 機器400は、ネットワーク(例えばインターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク等)との有線通信又は無線通信を提供するためのネットワークインタフェース406を更に含み得る。一部の実施形態では、ネットワークインタフェース406が任意の数のネットワークインタフェースコントローラ(NIC)、無線周波数(RF)モジュール、トランスポンダ、トランシーバ、モデム、ルータ、ゲートウェイ、有線ネットワークアダプタ、無線ネットワークアダプタ、Bluetoothアダプタ、赤外線アダプタ、近距離無線通信(「NFC」)アダプタ、セルラネットワークチップ等の任意の組み合わせを含み得る。
[0083] 一部の実施形態では、機器400は、1つ又は複数の周辺装置への接続を提供するための周辺装置インタフェース408を任意選択的に更に含み得る。図4に示すように、周辺装置はこれだけに限定されないが、カーソル制御装置(例えばマウス、タッチパッド、又はタッチスクリーン)、キーボード、ディスプレイ(例えばブラウン管ディスプレイ、液晶ディスプレイ、又は発光ダイオードディスプレイ)、映像入力装置(例えば映像アーカイブに結合されるカメラ又は入力インタフェース)等を含み得る。
[0084] 映像コーデック(例えばプロセス200A、200B、300A、又は300Bを実行するコーデック)は、機器400内の任意のソフトウェア又はハードウェアモジュールの任意の組み合わせとして実装できることに留意すべきである。例えばプロセス200A、200B、300A、又は300Bの一部の又は全ての段階が、メモリ404内にロード可能なプログラム命令等の機器400の1つ又は複数のソフトウェアモジュールとして実装され得る。別の例では、プロセス200A、200B、300A、又は300Bの一部の又は全ての段階が、専用データ処理回路(例えばFPGA、ASIC、NPU等)等の機器400の1つ又は複数のハードウェアモジュールとして実装され得る。
[0085] 図5は、本開示の一部の実施形態による、例示的なクロマスケーリングによるルママッピング(LMCS)プロセス500の概略図を示す。例えばプロセス500は、ハイブリッド映像コード化規格(例えばH.26xシリーズ)に準拠する復号器によって使用され得る。LMCSは、図2Bのループフィルタ232の前に適用される新たな処理ブロックである。LMCSはリシェーパと呼ぶこともできる。
[0086] LMCSプロセス500は、適応区分線形モデルに基づくルマ成分値のインループマッピング及びクロマ成分のルマ依存クロマ残差スケーリングを含み得る。
[0087] 図5に示すように、適応区分線形モデルに基づくルマ成分値のインループマッピングは、順方向マッピング段階518及び逆マッピング段階508を含み得る。クロマ成分のルマ依存クロマ残差スケーリングは、クロマスケーリング520を含み得る。
[0088] マッピング前の又は逆マッピング後のサンプル値は元の領域内のサンプルと呼ぶことができ、マッピング後の及び逆マッピング前のサンプル値はマップ領域内のサンプルと呼ぶことができる。LMCSが有効化される場合、プロセス500内の一部の段階は元の領域ではなくマップ領域内で行うことができる。順方向マッピング段階518及び逆マッピング段階508は、SPSフラグを使用してシーケンスレベルで有効化/無効化できることが理解されよう。
[0089] 図5に示すように、Q-1&T-1段階504、再構築506、及びイントラ予測508はマップ領域内で実行される。例えばQ-1&T-1段階504は逆量子化及び逆変換を含むことができ、再構築506はルマ予測とルマ残差との加算を含むことができ、イントラ予測508はルマイントラ予測を含み得る。
[0090] ループフィルタ510、動き補償段階516及び530、イントラ予測段階528、再構築段階522、並びに復号済みピクチャバッファ(DPB)512及び526は元の(即ち非マップ)領域内で実行される。一部の実施形態では、ループフィルタ510がデブロッキング、適応ループフィルタ(ALF)、及びサンプル適応オフセット(SAO)を含むことができ、再構築段階522がクロマ予測とクロマ残差との加算を含むことができ、DPB512及び526が復号済みピクチャを参照ピクチャとして記憶することができる。
[0091] 一部の実施形態では、区分線形モデルによるルママッピングを適用することができる。
[0092] ルマ成分のインループマッピングは、ダイナミックレンジにわたるコード語の再配分によって入力映像の信号統計を調節して圧縮効率を改善することができる。ルママッピングは、順方向マッピング関数「FwdMap」及び対応する逆マッピング関数「InvMap」によって実行することができる。「FwdMap」関数は16個の等しい区分と共に区分線形モデルを使用してシグナリングされる。「InvMap」関数はシグナリングされる必要がなく、代わりに「FwdMap」関数から導出される。
[0093] 区分線形モデルのシグナリングを図6の表1及び図7の表2に示す。図6の表1は、タイルグループヘッダ構文構造を示す。図6に示すように、現タイルグループ内にルママッピングモデルがあるかどうかを示すためにリシェーパモデルパラメータ存在フラグがシグナリングされる。現タイルグループ内にルママッピングモデルがある場合、図7の表2に示す構文要素を使用し、対応する区分線形モデルパラメータをtile_group_reshaper_model()内でシグナリングすることができる。区分線形モデルは入力信号のダイナミックレンジを16個の等しい区分に分割する。16個の等しい区分のそれぞれについて、区分に割り当てられるコード語の数を使用して区分の線形マッピングパラメータが表される。10ビット入力を例に取る。16個の区分のそれぞれは、その区分に割り当てられる64のコード語をデフォルトで有し得る。スケール因子を計算し、その区分についてマッピング関数をしかるべく調節するために、シグナリングされるコード語の数を使用することができる。図7の表2は、コード語の数がシグナリングされる最小インデックス「reshaper_model_min_bin_idx」及び最大インデックス「reshaper_model_max_bin_idx」も包含的に定める。区分インデックスがreshaper_model_min_bin_idxよりも小さい又はreshaper_model_max_bin_idxよりも大きい場合、その区分のためのコード語の数はシグナリングされず、ゼロだと推論される(即ちその区分にコード語が割り当てられず、マッピング/スケーリングが適用されない)。
[0094] tile_group_reshaper_model()がシグナリングされた後、図8に示すLMCSプロセスが現タイルグループに適用されるかどうかを示すために、タイルグループヘッダレベルで別のリシェーパイネーブルフラグ「tile_group_reshaper_enable_flag」がシグナリングされる。リシェーパが現タイルグループについて有効化され、現タイルグループがデュアルツリー分割を使用しない場合、クロマスケーリングが現タイルグループについて有効化されるかどうかを示すために、更なるクロマスケーリングイネーブルフラグがシグナリングされる。デュアルツリー分割はクロマセパレートツリーとも呼ぶことができる。
[0095] 区分線形モデルは、図7の表2内のシグナリングされる構文要素に基づいて以下のように構築することができる。「FwdMap」区分線形モデルのそれぞれのi番目の区分、i=0,1,...,15は、2つの入力ピボットポイントInputPivot[]及び2つの出力(マップ済み)ピボットポイントMappedPivot[]によって定められる。InputPivot[]及びMappedPivot[]はシグナリングされる構文に基づいて以下のように計算される(一般性を失うことなく入力映像のビット深度を10ビットだと仮定する):
1)OrgCW=64
2)i=0:16ではInputPivot[i]=i*OrgCW
3)i=reshaper_model_min_bin_idx: reshaper_model_max_bin_idxではSignaledCW[i]=OrgCW+(1¬2*reshape_model_bin_delta_sign_CW[i])*reshape_model_bin_delta_abs_CW[i];
4)i=0:16ではMappedPivot[i]を以下のように計算する:
MappedPivot[0]=0;
(i=0; i<16; i++)では
MappedPivot[i+1]=MappedPivot[i]+SignaledCW[i]
[0096] 逆マッピング関数「InvMap」もInputPivot[]及びMappedPivot[]によって定めることができる。「FwdMap」と異なり、「InvMap」区分線形モデルでは、各区分の2つの入力ピボットポイントをMappedPivot[]によって定めることができ、2つの出力ピボットポイントをInputPivot[]によって定めることができ、これは「FwdMap」の反対である。このようにして「FwdMap」の入力は等しい区分に分割されるが、「InvMap」の入力が等しい区分に分割されることは保証されない。
[0097] 図5に示すように、インタコード化ブロックでは動き補償予測をマップ領域内で実行することができる。換言すれば、動き補償予測516の後、DPB内内の参照信号に基づいてYpredを計算し、元の領域内のルマ予測ブロックをマップ領域にマップするために「FwdMap」関数518を適用することができる(Y’pred=FwdMap(Ypred))。イントラコード化されたブロックでは、イントラ予測内で使用された参照サンプルがマップ領域内に既にあるので「FwdMap」関数は適用されない。再構築済みブロック506の後、Yrを計算することができる。マップ領域内の再構築済みルマ値を元の領域内の再構築済みルマ値に変換して戻すために「InvMap」関数508を適用することができる(
Figure 2022523925000002

)。「InvMap」関数508はイントラコード化されたルマブロック及びインタコード化されたルマブロックの両方に適用することができる。
[0098] ルママッピングプロセス(順方向又は逆マッピング)は、参照表(LUT)を使用して又はその場での計算を使用して実装することができる。LUTが使用される場合、タイルグループレベルでの使用のために「FwdMapLUT[]」及び「InvMapLUT[]」の表を予め計算し、予め記憶しておくことができ、順方向マッピング及び逆マッピングを単純にFwdMap(Ypred)=FwdMapLUT[Ypred]、及びInvMap(Yr)=InvMapLUT[Yr]としてそれぞれ実装することができる。或いはその場での計算を使用することができる。順方向マッピング関数「FwdMap」を例に取る。ルマサンプルが属する区分を突き止めるために、サンプル値を(10ビットの映像を仮定して16個の等しい区分に対応する)6ビット右シフトして区分インデックスを得ることができる。次いでその区分の線形モデルパラメータを取得し、その場で適用してマップ済みルマ値を計算する。FwdMap関数は以下のように評価され:
Y’pred=FwdMap(Ypred)=((b2-b1)/(a2-a1))*(Ypred-a1)+b1
但し「i」は区分インデックスであり、a1はInputPivot[i]であり、a2はInputPivot[i+1]であり、b1はMappedPivot[i]であり、b2はMappedPivot[i+1]である。
[0099] 「InvMap」関数は、マップ領域内の区分が等しいサイズであることが保証されないので、サンプル値が属する区分を見出すときに単純な右ビットシフトの代わりに条件付きチェック(conditional check)を適用しなければならないことを除き、同様のやり方でその場で計算することができる。
[0100] 一部の実施形態では、ルマ依存クロマ残差スケーリングを行うことができる。
[0101] クロマ残差スケーリングは、ルマ信号とその対応するクロマ信号との間の相互作用を補償するように設計される。クロマ残差スケーリングが有効化されるかどうかもタイルグループレベルでシグナリングされる。図6の表1に示すように、ルママッピングが有効化される場合、及びデュアルツリー分割が現タイルグループに適用されない場合、ルマ依存クロマ残差スケーリングが有効化されるかどうかを示すために追加のフラグ(例えばtile_group_reshaper_chroma_residual_scale_flag)がシグナリングされる。ルママッピングが使用されない場合又はデュアルツリー分割が現タイルグループ内で使用される場合、ルマ依存クロマ残差スケーリングが自動で無効化される。更に、ルマ依存クロマ残差スケーリングは、その領域が4以下であるクロマブロックについて無効化され得る。
[0102] クロマ残差スケーリングは(イントラコード化されたブロック及びインタコード化されたブロックの両方について)対応するルマ予測ブロックの平均値に依存する。ルマ予測ブロックの平均としてのavgY’は以下のように計算することができる:
Figure 2022523925000003
[0103] CScaleInvの値を以下のステップで計算する:
1)avgY’が属する区分線形モデルのインデックスYIdxをInvMap関数に基づいて見つける。
2)CScaleInv=cScaleInv[YIdx]が成立し、但しcScaleInv[]は予め計算された16個の区分のLUTである。
[0104] VTM4における現在のLMCSの方法では、予め計算されたLUTであるcScaleInv[i](iは0~15の範囲内にある)は、64エントリ静的LUTChromaResidualScaleLut及びSignaledCW[i]の値に基づいて以下のように導出される:
ChromaResidualScaleLut[64]={16384, 16384, 16384, 16384, 16384, 16384, 16384, 8192, 8192, 8192, 8192, 5461, 5461, 5461, 5461, 4096, 4096, 4096, 4096, 3277, 3277, 3277, 3277, 2731, 2731, 2731, 2731, 2341, 2341, 2341, 2048, 2048, 2048, 1820, 1820, 1820, 1638, 1638, 1638, 1638, 1489, 1489, 1489, 1489, 1365, 1365, 1365, 1365, 1260, 1260, 1260, 1260, 1170, 1170, 1170, 1170, 1092, 1092, 1092, 1092, 1024, 1024, 1024, 1024};
shiftC=11
-(SignaledCW[i]==0)が成立する場合、
cScaleInv[i]=(1<<shiftC)
-さもなければ
cScaleInv[i]=ChromaResidualScaleLut[(SignaledCW[i]>>1)-1]
[0105] 静的テーブルChromaResidualScaleLut[]は64個のエントリを含み、SignaledCW[]は[0,128]の範囲内にある(入力を10ビットと仮定する)。従って、クロマスケール因子LUTのcScaleInv[]を構築するために2による除算(例えば1による右シフト)を使用する。クロマスケール因子LUTのcScaleInv[]は複数のクロマスケール因子を含むことができる。LUTのcScaleInv[]はタイルグループレベルで構築される。
[0106] 現ブロックがイントラ、CIIP、又はイントラブロックコピー(IBC、現ピクチャ参照又はCPRとしても知られる)モードを使用してコード化される場合、avgY’はイントラ、CIIP、又はIBC予測ルマ値の平均として計算される。さもなければ、avgY’は順方向マップされるインタ予測ルマ値(つまり図5のY’pred)の平均として計算される。サンプルに基づいて実行されるルママッピングと異なり、CScaleInvは全クロマブロックの定数値である。CScaleInvを用いてクロマ残差スケーリングを以下のように復号器側で適用する:
Figure 2022523925000004
[0107] 但し
Figure 2022523925000005

は現ブロックの再構築済みクロマ残差である。符号器側で、順方向クロマ残差スケーリング(変換され量子化される前)を次のように行う:CResScale=CRes*CScale=CRes/CScaleInv
[0108] 一部の実施形態ではデュアルツリー分割が行われ得る。
[0109] VVCのドラフト4では、コード化ツリー方式は、ルマ及びクロマが別個のブロックツリー分割を有する能力をサポートする。これはデュアルツリー分割とも呼ばれる。デュアルツリー分割のシグナリングを図8の表3及び図9の表4に示す。SPS内でシグナリングされるシーケンスレベル制御フラグである「qtbtt_dual_tree_intra_flag」がオンにされ、現タイルグループがイントラコード化される場合、ブロック分割情報をまずルマについて、次いでクロマについて別々にシグナリングすることができる。インタコード化されるタイルグループ(P及びBタイルグループ)ではデュアルツリー分割が許可されない。別個のブロックツリーモードが適用される場合、図9の表4に示すようにルマコード化ツリーブロック(CTB)が或るコード化ツリー構造によってCUへと分割され、クロマCTBが別のコード化ツリー構造によってクロマCUへと分割される。
[0110] ルマ及びクロマが異なる分割を有することが許可される場合、様々な色成分間の依存性を有するコード化ツールに関して問題が生じ得る。例えばLMCSの場合、現ブロックに適用されるスケール因子を見出すために、対応するルマブロックの平均値を使用する。デュアルツリーが使用される場合、そのことが全CTUのレイテンシを招き得る。例えばCTUのルマブロックが垂直に1回分割され、CTUのクロマブロックが水平に1回分割される場合、CTUの第1のクロマブロックが復号可能である前にCTUのルマブロックの両方が復号される(それによりクロマスケール因子を計算するのに必要な平均値を計算することができる)。VVCでは、CTUがルマサンプルの単位で128x128もの大きさであり得る。そのような大きいレイテンシはハードウェア復号器のパイプライン設計にとって非常に問題となる可能性がある。従って、VVCのドラフト4は、デュアルツリー分割とルマ依存クロマスケーリングとの組み合わせを禁止することができる。現タイルグループについてデュアルツリー分割が有効化される場合、クロマスケーリングを強制的にオフにすることができる。LMCSのルママッピング部分は、ルマ成分に対してのみ影響し、色成分を横断する依存性の問題を有さないので、デュアルツリーの事例でも引き続き許可されていることに留意されたい。より優れたコード化効率を実現するために色成分間の依存性に依拠するコード化ツールの別の例は、クロスコンポーネント線形モデル(CCLM)と呼ばれる。
[0111] 従って、タイルグループレベルのクロマスケール因子LUTのcScaleInv[]の導出は容易に拡張することができない。導出プロセスは、64個のエントリを有する一定のクロマLUTChromaResidualScaleLutに現在は依存する。16個の区分を有する10ビットの映像では、2による除算の追加のステップを適用しなければならない。区分の数が変わる場合、例えば16個の区分の代わりに8個の区分が使用される場合、2による除算ではなく4による除算を適用するように導出プロセスを変更しなければならない。この追加のステップは精度の損失を引き起こすだけでなく、洗練されておらず不要である。
[0112] 更に、クロマスケール因子を得るために使用される現クロマブロックの区分インデックスYIdxを計算するために、全ルマブロックの平均値を使用することができる。これは望ましくなく大概不要である。128x128の最大CTUサイズを検討されたい。この場合、平均ルマ値が16384(128x128)ルマサンプルに基づいて計算され、かかる計算は複雑である。更に、128x128のルマブロック分割が符号器によって選択される場合、そのブロックは均質のコンテンツを含む可能性が高い。従って、ルマ平均を計算するのにブロック内のルマサンプルのサブセットで十分であり得る。
[0113] デュアルツリー分割では、ハードウェア復号器の潜在的なパイプラインの問題を回避するためにクロマスケーリングがオフであり得る。しかし、適用されるクロマスケール因子を導出するために対応するルマサンプルを使用する代わりに、適用されるクロマスケール因子を示すための明確なシグナリングを使用する場合は、この依存性を回避することができる。イントラコード化されるタイルグループ内のクロマスケーリングを有効化することはコード化効率を更に改善し得る。
[0114] 区分線形パラメータのシグナリングは更に改善することができる。現在、16個の区分のそれぞれについてデルタコード語値がシグナリングされる。往々にしてこの16区分について、限られた数の異なるコード語しか使用されないことが認められている。従ってシグナリングのオーバヘッドを更に減らすことができる。
[0115] 本開示の実施形態は、クロマスケーリングLUTを除去することによって映像コンテンツを処理するための方法を提供する。
[0116] 上記で述べたように、64エントリのクロマLUTの拡張は困難な場合があり、他の区分線形モデルが使用される場合(例えば8区分、4区分、64区分等)は問題となり得る。同じコード化効率を実現するために、クロマスケール因子をその対応する区分のルマスケール因子と同じに設定することができるので、かかる拡張は不要でもある。本開示の一部の実施形態では、クロマスケール因子(chroma_scaling)を以下のように現クロマブロックの区分インデックス「YIdx」に基づいて決定することができる。
・YIdx>reshaper_model_max_bin_idx、YIdx<reshaper_model_min_bin_idx又はSignaledCW[YIdx]=0が成立する場合、chroma_scalingをデフォルトに設定しchroma_scaling=1.0となる。
・さもなければchroma_scalingをSignaledCW[YIdx]/OrgCWに設定する。
[0117] chroma_scaling=1.0である場合スケーリングは適用されない。
[0118] 上記で決定したクロマスケール因子は小数精度を有し得る。ハードウェア/ソフトウェアプラットフォーム上の依存性を回避するために固定小数点近似を適用できることが理解されよう。更に、復号器側で逆クロマスケーリングを行うことができる。従って、乗算とその後に続く右シフトを使用する固定小数点演算によって除算を実装することができる。固定小数点精度における逆クロマスケール因子「inverse_chroma_scaling[]」は、固定小数点近似「CSCALE_FP_PREC」内のビットの数に基づいて以下のように決定することができる。
inverse_chroma_scaling[YIdx]=((1<<(luma_bit_depth-log2(TOTAL_NUMBER_PIECES)+CSCALE_FP_PREC))+(SignaledCW[YIdx]>>1))/SignaledCW[YIdx]
但しluma_bit_depthはルマビット深度であり、TOTAL_NUMBER_PIECESはVVCのドラフト4では16に設定される区分線形モデル内の総区分数である。「inverse_chroma_scaling[]」の値はタイルグループごとに1回計算するだけでよい場合があり、上記の除算は整数除算演算であることが理解されよう。
[0119] クロマスケール因子及び逆スケール因子を決定するために更なる量子化を適用することができる。例えば「SignaledCW」の全ての偶数(2×m)値について逆クロマスケール因子を計算することができ、「SignaledCW」の奇数(2×m+1)値は隣接する偶数値のスケール因子のクロマスケール因子を再利用する。換言すれば下記を使用することができる:
for(i=reshaper_model_min_bin_idx; i<=reshaper_model_max_bin_idx; i++)
{
tempCW=SignaledCW[i]>>1)<<1;
inverse_chroma_scaling[i]=((1<<(luma_bit_depth-log2(TOTAL_NUMBER_PIECES)+CSCALE_FP_PREC))+(tempCW>>1))/tempCW;
}
[0120] クロマスケール因子の量子化は更に汎用化することができる。例えば、他の全ての隣接値が同じクロマスケール因子を共有しながら「SignaledCW」のn番目の値ごとに逆クロマスケール因子「inverse_chroma_scaling[]」を計算することができる。例えば「n」は4に設定することができる。従って、隣接する4個のコード語値ごとに同じ逆クロマスケール因子値が共有され得る。一部の実施形態では「n」の値を2のべき乗とすることができ、かかる設定は除算を計算するためにシフトを使用することを可能にする。log2(n)の値をLOG2_nとして表し、上記の等式「tempCW=SignaledCW[i]>>1)<<1」は以下のように修正することができる:
tempCW=SignaledCW[i]>>LOG2_n)<<LOG2_n
[0121] 一部の実施形態では、LOG2_nの値は区分線形モデル内で使用される区分数の関数であり得る。より少ない区分が使用される場合、より大きいLOG2_nを使用することが有益であり得る。例えばTOTAL_NUMBER_PIECESが16以下の場合、LOG2_nは1+(4-log2(TOTAL_NUMBER_PIECES))に設定することができる。TOTAL_NUMBER_PIECESが16を上回る場合、LOG2_nは0に設定することができる。
[0122] 本開示の実施形態は、ルマ予測ブロックの平均化を単純化することによって映像コンテンツを処理するための方法を提供する。
[0123] 上記で論じたように、現クロマブロックの区分インデックス「YIdx」を決定するために、対応するルマブロックの平均値を使用することができる。しかし、大きいブロックのサイズでは平均化プロセスが多数のルマサンプルを含み得る。最悪の場合、128x128のルマサンプルが平均化プロセスに関与し得る。
[0124] 本開示の実施形態は、最悪の場合を僅かNxNのルマサンプル(Nは2のべき乗である)を使用することに低減するための単純化した平均化プロセスを提供する。
[0125] 一部の実施形態では、2次元ルマブロックの両方の寸法が事前設定閾値M以下である(換言すれば2つの寸法の少なくとも一方がMを上回る)場合、その寸法内のMの位置だけを使用するように「ダウンサンプリング」を適用することができる。一般性を失うことなしに横寸法を例に取る。幅がMを上回る場合、位置x(x=i×(width>>log2(M)), i=0,…M-1)にあるサンプルだけを平均化に使用する。
[0126] 図10は、16x8のルマブロックの平均を計算するために、提案した単純化を適用する一例を示す。この例ではMが4に設定され、ブロック内の16個のルマサンプル(陰影付きのサンプル)だけが平均化に使用される。事前設定閾値Mは4に限定されず、Mは2のべき乗である任意の値に設定できることが理解されよう。例えば事前設定閾値Mは1、2、4、8等であり得る。
[0127] 一部の実施形態では、ルマブロックの横寸法及び縦寸法が異なる事前設定閾値Mを有し得る。換言すれば、平均化演算の最悪の場合はM1xM2のサンプルを使用し得る。
[0128] 一部の実施形態では、寸法を考慮することなしに平均化プロセス内でサンプル数を限定することができる。例えば最大で16個のサンプルを使用することができ、それらのサンプルは1x16、16x1、2x8、8x2、又は4x4形式で横寸法又は縦寸法内に分散することができ、現ブロックの形状に適合する如何なる形式も選択することができる。例えばブロックが縦長の場合は2x8サンプルの行列を使用することができ、ブロックが横長の場合は8x2サンプルの行列を使用することができ、ブロックが正方形の場合は4x4サンプルの行列を使用することができる。
[0129] 大きいブロックのサイズが選択される場合、ブロック内のコンテンツがより均質になる傾向があることが理解されよう。従って上記の単純化は平均値と全ルマブロックの真の平均との間の差異を引き起こし得るが、かかる差異は小さいものであり得る。
[0130] 更に、復号器側動きベクトルリファインメント(DMVR)は、動き補償が適用可能である前に、復号器が動き検出を行って動きベクトルを導出することを要求する。従って、とりわけ復号器にとってDMVRモードはVVC規格内で複雑であり得る。双方向オプティカルフロー(BDOF)はルマ予測ブロックを得るためにDMVR後に適用しなければならない追加の逐次プロセスなので、VVC規格内のBDOFモードはこの状況を更に複雑にし得る。クロマスケーリングは対応するルマ予測ブロックの平均値を必要とするので、平均値が計算可能である前にDMVR及びBDOFを適用することができる。
[0131] このレイテンシの問題を解決するために、本開示の一部の実施形態ではDMVR及びBDOFの前にルマ予測ブロックを使用して平均ルマ値を計算し、平均ルマ値を使用してクロマスケール因子を得る。このことはDMVR及びBDOFプロセスと並列にクロマスケーリングを適用できるようにし、従ってレイテンシを著しく減らすことができる。
[0132] 本開示と合致して、レイテンシ低減の改変形態を考えることができる。一部の実施形態では、このレイテンシ低減は平均ルマ値を計算するためにルマ予測ブロックの一部しか使用しない上記の単純化した平均化プロセスと組み合わせることもできる。一部の実施形態では、ルマ予測ブロックをDMVRプロセスの後及びBDOFプロセスの前に使用して平均ルマ値を計算することができる。次いで、平均ルマ値を使用してクロマスケール因子を得る。この設計は、クロマスケール因子を決定する精度を保ちながら、BDOFプロセスと並列にクロマスケーリングを適用できるようにする。DMVRプロセスは動きベクトルをリファインする場合があるので、DMVRプロセス前の動きベクトルと共に予測サンプルを使用することよりも、DMVRプロセス後のリファインされた動きベクトルと共に予測サンプルを使用する方が正確であり得る。
[0133] 更に、VVC規格ではCU構文構造「coding_unit()」が、現CU内に何らかの非ゼロ残差係数があるかどうかを示すための構文要素「cu_cbf」を含む。TUレベルでは、TU構文構造「transform_unit()」が、現TU内に何らかの非ゼロクロマ(Cb又はCr)残差係数があるかどうかを示すための構文要素「tu_cbf_cb」及び「tu_cbf_cr」を含む。従来、VVCのドラフト4では、タイルグループレベルでクロマスケーリングが有効化される場合は、対応するルマブロックの平均化が常に呼び出される。
[0134] 本開示の実施形態は、ルマ平均化プロセスをバイパスすることによって映像コンテンツを処理するための方法を更に提供する。開示する実施形態と合致して、クロマスケーリングプロセスは残差クロマ係数に適用されるので、非ゼロクロマ係数がない場合はルマ平均化プロセスをバイパスすることができる。これは以下の条件に基づいて決定することができる:
条件1:cu_cbfが0に等しい
条件2:tu_cbf_cr及びtu_cbf_cbがどちらも0に等しい
[0135] 上記で論じたように「cu_cbf」は現CU内に何らかの非ゼロ残差係数があるかどうかを示すことができ、「tu_cbf_cb」及び「tu_cbf_cr」は現TU内に何らかの非ゼロクロマ(Cb又はCr)残差係数があるかどうかを示すことができる。条件1又は条件2が満たされる場合はルマ平均化プロセスをバイパスすることができる。
[0136] 一部の実施形態では、予測ブロックのNxNサンプルだけを使用して平均値を導出し、そのことは平均化プロセスを単純化する。例えばNが1に等しい場合、予測ブロックの左上サンプルだけが使用される。但し、予測ブロックを使用するこの単純化した平均化プロセスは予測ブロックの生成を依然として必要とし、それによりレイテンシを引き起こす。
[0137] 一部の実施形態では、クロマスケール因子を生成するために参照ルマサンプルを直接使用することができる。このことは復号器がルマ予測プロセスと並列にスケール因子を導出できるようにし、それによりレイテンシを低減する。以下、参照ルマサンプルを用いたイントラ予測及びインタ予測を別々に説明する。
[0138] 例示的なイントラ予測では、予測ブロックを生成するための参照サンプルとして同じピクチャ内の復号済み隣接サンプルを使用することができる。これらの参照サンプルは、例えば現ブロックの上部のサンプル、現ブロックの左側のサンプル、又は現ブロックの左上のサンプルを含み得る。これらの参照サンプルの平均を使用してクロマスケール因子を導出することができる。一部の実施形態では、これらの参照サンプルの一部の平均を使用することができる。例えば現ブロックの左上の位置に最も近いK個の参照サンプル(例えばK=3)だけを平均化する。
[0139] 例示的なインタ予測では、予測ブロックを生成するために時間的参照ピクチャからの参照サンプルを使用することができる。これらの参照サンプルは、参照ピクチャインデックス及び動きベクトルによって識別される。動きベクトルが小数精度を有する場合は補間を適用することができる。参照サンプルの平均を決定するために使用する参照サンプルは、補間前又は補間後の参照サンプルを含み得る。補間前の参照サンプルは整数精度にクリッピングされる動きベクトルを含み得る。開示する実施形態と合致して、参照サンプルの全てを使用して平均を計算することができる。或いは参照サンプルの一部だけ(例えば現ブロックの左上の位置に対応する参照サンプル)を使用して平均を計算することができる。
[0140] 図5に示すように、元の領域内でインタ予測を行いながら、リシェープされた領域内でイントラ予測(例えばイントラ予測514又は528)を行うことができる。従って、インタ予測では予測ブロックに対して順方向マッピングを適用することができ、順方向マッピング後のルマ予測ブロックを使用して平均を計算する。レイテンシを減らすために、平均は順方向マッピング前の予測ブロックを使用して計算することができる。例えば順方向マッピング前のブロック、順方向マッピング前のブロックのNxN部分、又は順方向マッピング前のブロックの左上サンプルを使用することができる。
[0141] 本開示の実施形態は、デュアルツリー分割のためのクロマスケーリングを伴う映像コンテンツを処理するための方法を更に提供する。
[0142] ルマに対する依存性はハードウェア設計の複雑化を引き起こし得るので、デュアルツリー分割を可能にするイントラコード化されるタイルグループについてクロマスケーリングをオフにすることができる。但し、この制限はコード化効率の損失を引き起こし得る。対応するルマブロックのサンプル値を平均化してavgY’を計算し、区分インデックスYIdxを決定し、クロマスケール因子inverse_chroma_scaling[YIdx]を得る代わりに、デュアルツリー分割の場合にルマに対する依存性を回避するためにクロマスケール因子をビットストリーム内で明示的にシグナリングすることができる。
[0143] クロマスケールインデックスは様々なレベルでシグナリングすることができる。例えば図11の表5に示すように、クロマスケールインデックスは、クロマ予測モードと共にコード化単位(CU)レベルでシグナリングすることができる。現クロマブロックのクロマスケール因子を決定するために、構文要素「lmcs_scaling_factor_idx」を使用することができる。「lmcs_scaling_factor_idx」がない場合、現クロマブロックのクロマスケール因子は浮動小数点数精度で1.0に、又は等価に固定小数点精度で(1<<CSCALE_FP_PREC)に等しいと推論することができる。「lmcs_chroma_scaling_idx」の許容値の範囲はタイルグループレベルで決定され、後で解説する。
[0144] 「lmcs_chroma_scaling_idx」の可能な値にもよるが、とりわけ小さいブロックにとってシグナリングのコストが高くなり得る。従って本開示の一部の実施形態では、図11の表5のシグナリング条件がブロックサイズの条件を追加で含み得る。例えば(イタリック体及び灰色の陰影で強調されている)この構文要素「lmcs_chroma_scaling_idx」は、現ブロックが所与の数のクロマサンプルよりも多く含む場合、又は現ブロックが所与の幅Wよりも大きい幅若しくは所与の高さHよりも大きい高さを有する場合にのみ、シグナリングされ得る。より小さいブロックでは、「lmcs_chroma_scaling_idx」がシグナリングされない場合、復号器側でそのクロマスケール因子を決定することができる。一部の実施形態では、クロマスケール因子は浮動小数点数精度で1.0に設定することができる。一部の実施形態では、タイルグループヘッダレベルでデフォルトの「lmcs_chroma_scaling_idx」値を追加することができる(図6の1参照)。シグナリングされる「lmcs_chroma_scaling_idx」を有さない小さいブロックは、対応するクロマスケール因子を導出するためにこのタイルグループレベルのデフォルトインデックスを使用することができる。一部の実施形態では、小さいブロックのクロマスケール因子は、スケール因子を明示的にシグナリングしたその近傍(例えば上部又は左側の近傍)から継承することができる。
[0145] 構文要素「lmcs_chroma_scaling_idx」をCUレベルでシグナリングすることに加えて、この構文要素はCTUレベルでもシグナリングすることができる。しかし、VVCでの最大CTUサイズが128x128であることを所与とし、CTUレベルで同じスケーリングを行うことは粗過ぎる場合がある。従って本開示の一部の実施形態では、固定された粒度を使用してこの構文要素「lmcs_chroma_scaling_idx」をシグナリングすることができる。例えばCTU内の16x16の領域ごとに1つの「lmcs_chroma_scaling_idx」がシグナリングされ、その16x16の領域内の全てのサンプルに適用される。
[0146] 現タイルグループの「lmcs_chroma_scaling_idx」の範囲は、現タイルグループ内で許可されるクロマスケール因子の値の数に依存する。現タイルグループ内で許可されるクロマスケール因子の値の数は、上記で論じたように64エントリクロマLUTに基づいて決定され得る。或いは現タイルグループ内で許可されるクロマスケール因子の値の数は、上記で論じたクロマスケール因子の計算を使用して決定することができる。
[0147] 例えば「量子化」方法では、LOG2_nの値を2に設定する(即ち「n」を4に設定する)ことができ、現タイルグループの区分線形モデル内の各区分のコード語割り当てを次のように設定することができる:{0, 65, 66, 64, 67, 62, 62, 64, 64, 64, 67, 64, 64, 62, 61, 0}。すると64~67までの任意のコード語の値は同じスケール因子の値(小数精度で1.0)を有することができ、60~63までの任意のコード語の値は同じスケール因子の値(小数精度で60/64=0.9375)を有することができるので、全タイルグループについて可能なスケール因子の値は2つしかない。コード語が一切割り当てられていない2つの末端区分ではクロマスケール因子をデフォルトで1.0に設定する。従ってこの例では、現タイルグループ内のブロックに関して「lmcs_chroma_scaling_idx」をシグナリングするのに1ビットで十分である。
[0148] 区分線形モデルを使用して可能なクロマスケール因子の値を決定する以外に、符号器はタイルグループヘッダにおいて1組のクロマスケール因子の値をシグナリングすることができる。次いでブロックレベルにおいて、その1組のクロマスケール因子の値及びブロックの「lmcs_chroma_scaling_idx」の値を使用してブロックのクロマスケール因子の値を決定することができる。
[0149] 「lmcs_chroma_scaling_idx」をコード化するためにCABACコード化を適用することができる。ブロックのCABACコンテキストは、ブロックの隣接ブロックの「lmcs_chroma_scaling_idx」に依存し得る。例えばCABACコンテキストを形成するために、左側のブロック又は上部のブロックを使用することができる。この「lmcs_chroma_scaling_idx」の構文要素の二値化に関して、「lmcs_chroma_scaling_idx」を二値化するために、VVCのドラフト4内のref_idx_10及びref_idx_11構文要素に適用される同じトランケーティドライス二値化を使用することができる。
[0150] 「chroma_scaling_idx」をシグナリングする利点は、符号器がレート歪みコストに関して最良の「lmcs_chroma_scaling_idx」を選択できることである。レート歪み最適化を使用して「lmcs_chroma_scaling_idx」を選択することはコード化効率を改善することができ、そのことはシグナリングコストの増加を相殺することを助け得る。
[0151] 本開示の実施形態は、LMCS区分線形モデルのシグナリングを伴う映像コンテンツを処理するための方法を更に提供する。
[0152] LMCSの方法は16個の区分を有する区分線形モデルを使用するが、タイルグループ内の「SignaledCW[i]」の固有値の数は16よりもはるかに少ない傾向がある。例えば16個の区分の一部はコード語のデフォルトの数「OrgCW」を使用することができ、16個の区分の一部は互いと同じコード語の数を有することができる。従ってLMCS区分線形モデルをシグナリングする代替的方法は、固有のコード語の数「listUniqueCW[]」をシグナリングし、現区分の「listUniqueCW[]」の要素を示すために区分のそれぞれについてインデックスを送信することを含み得る。
[0153] 図12の中で修正済みの構文表を示す。図12の表6では新たな又は修正された構文をイタリック体及び灰色の陰影で強調している。
[0154] 開示するシグナリング方法の意味規則は以下の通りであり、変更箇所に下線を引いてある:
reshaper_model_min_bin_idxは、リシェーパ構築プロセス内で使用される最小ビン(又は区分)インデックスを規定する。reshape_model_min_bin_idxの値は0~MaxBinIdxまでの範囲内にあるものとする。MaxBinIdxの値は15に等しいものとする。
reshaper_model_delta_max_bin_idxは、最大許容ビン(又は区分)インデックスMaxBinIdx引く、リシェーパ構築プロセス内で使用される最大ビンインデックスを規定する。reshape_model_max_bin_idxの値はMaxBinIdx-reshape_model_delta_max_bin_idxに等しく設定される。
reshaper_model_bin_delta_abs_cw_prec_minus1 plus 1は、構文reshape_model_bin_delta_abs_CW[i]の表現に使用されるビット数を規定する。
reshaper_model_bin_num_unique_cw_minus1 plus 1は、コード語アレイlistUniqueCWのサイズを規定する。
reshaper_model_bin_delta_abs_CW[i]は、i番目のビンの絶対デルタコード語値を規定する。
reshaper_model_bin_delta_sign_CW_flag[i]は、reshape_model_bin_delta_abs_CW[i]の符号を以下のように規定する:
-reshape_model_bin_delta_sign_CW_flag[i]が0に等しい場合、対応する変数RspDeltaCW[i]は正値である。
-さもなければ(reshape_model_bin_delta_sign_CW_flag[i]が0に等しくない)対応する変数RspDeltaCW[i]は負値である。
reshape_model_bin_delta_sign_CW_flag[i]がない場合、対応する変数RspDeltaCW[i]は0に等しいと推論する。
変数RspDeltaCW[i]は、RspDeltaCW[i]=(1-2*reshape_model_bin_delta_sign_CW[i])*reshape_model_bin_delta_abs_CW[i]として導出される。
変数listUniqueCW[0]はOrgCWに等しく設定される。i=1... reshaper_model_bin_num_unique_cw_minus1までの変数listUniqueCW[i]は以下のように導出される:
-変数OrgCWを(1<<BitDepthY)/(MaxBinIdx+1)に等しく設定する。
listUniqueCW[i]=OrgCW+RspDeltaCW[i-1]
reshaper_model_bin_cw_idx[i]は、RspCW[i]を導出するために使用されるアレイlistUniqueCW[]のインデックスを規定する。reshaper_model_bin_cw_idx[i]の値は0~(reshaper_model_bin_num_unique_cw_minus1+1)までの範囲内にあるものとする。
RspCW[i]は以下のように導出される:
-reshaper_model_min_bin_idx < = i <= reshaper_model_max_bin_idxが成立する場合、
RspCW[i]=listUniqueCW[reshaper_model_bin_cw_idx[i]]。
-さもなければRspCW[i]=0。
BitDepthYの値が10に等しい場合、RspCW[i]の値は32~2*OrgCW-1の範囲内にあり得る。
[0155] 本開示の実施形態は、ブロックレベルにおける条件付きクロマスケーリングを伴う映像コンテンツを処理するための方法を更に提供する。
[0156] 図6の表1に示すように、クロマスケーリングが適用されるかどうかはタイルグループレベルでシグナリングされる「tile_group_reshaper_chroma_residual_scale_flag」によって判定することができる。
[0157] しかし、ブロックレベルでクロマスケーリングを適用するかどうかを判定することが有益であり得る。例えば開示する一部の実施形態では、現ブロックにクロマスケーリングが適用されるかどうかを示すために、CUレベルフラグをシグナリングすることができる。CUレベルフラグの存在は、タイルグループレベルフラグ「tile_group_reshaper_chroma_residual_scale_flag」に基づいて条件付けることができる。つまりCUレベルフラグは、クロマスケーリングがタイルグループレベルで許可される場合にのみシグナリングされ得る。符号器は、現ブロックにとってクロマスケーリングが有益かどうかに基づいてクロマスケーリングを使用するかどうかを選ぶことを許可されるが、それは著しいシグナリングオーバヘッドも招き得る。
[0158] 開示する実施形態と合致して、上記のシグナリングオーバヘッドを回避するために、ブロックにクロマスケーリングが適用されるかどうかはブロックの予測モードに基づいて条件付けることができる。例えばブロックがインタ予測される場合、とりわけその参照ピクチャが時間的距離の点で近い場合は、予測信号がよい傾向にある。従って、残差が非常に小さいと予期されるので、クロマスケーリングをバイパスすることができる。例えば、より高い時間的レベル内のピクチャは時間的距離の点で近い参照ピクチャを有する傾向がある。ブロックに関して、近くの参照ピクチャを使用するピクチャ内でクロマスケーリングを無効化することができる。この条件が満たされるかどうかを判定するために、現ピクチャとブロックの参照ピクチャとの間のピクチャ順序カウント(POC)の差を使用することができる。
[0159] 一部の実施形態では、全てのインタコード化されるブロックについてクロマスケーリングを無効化することができる。一部の実施形態では、VVC規格内で定められる複合イントラ/インタ予測(CIIP)モードについてクロマスケーリングを無効化することができる。
[0160] VVC規格では、CU構文構造「coding_unit()」が、現CU内に何らかの非ゼロ残差係数があるかどうかを示すための構文要素「cu_cbf」を含む。TUレベルでは、TU構文構造「transform_unit()」が、現TU内に何らかの非ゼロクロマ(Cb又はCr)残差係数があるかどうかを示すための構文要素「tu_cbf_cb」及び「tu_cbf_cr」を含む。これらのフラグに基づいてクロマスケーリングプロセスを条件付けることができる。上記で説明したように、非ゼロ残差係数がない場合は、対応するルマクロマスケーリングプロセスの平均化を呼び出すことができる。平均化を呼び出すことにより、クロマスケーリングプロセスをバイパスすることができる。
[0161] 図13は、映像コンテンツを処理するためのコンピュータによって実装される方法1300の流れ図を示す。一部の実施形態では、方法1300は、コーデック(例えば図2A~図2Bの符号器又は図3A~図3Bの復号器)によって実行され得る。例えばコーデックは、映像シーケンスを符号化し又は別のコードに変換するための機器(例えば機器400)の1つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス(例えば映像シーケンス202)又は復号される圧縮映像シーケンス(例えば映像ストリーム304)であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ(例えばプロセッサ402)に関連する監視装置(例えば図4の映像入力装置)によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは複数のピクチャを含み得る。機器はピクチャのレベルで方法1300を実行することができる。例えば機器は方法1300内でピクチャを1つずつ処理することができる。別の例では、機器が方法1300内で1度に複数のピクチャを処理することができる。方法1300は以下のようなステップを含み得る。
[0162] ステップ1302で、ピクチャに関連するクロマブロック及びルマブロックを受信することができる。ピクチャはクロマ成分及びルマ成分に関連し得ることが理解されよう。従って、ピクチャは、クロマサンプルを含むクロマブロック及びルマサンプルを含むルマブロックに関連することができる。
[0163] ステップ1304で、ルマブロックに関連するルマスケール情報を決定することができる。一部の実施形態では、ルマスケール情報は、ピクチャのデータストリーム内でシグナリングされる構文要素、又はピクチャのデータストリーム内でシグナリングされる構文要素に基づいて導出される変数であり得る。例えばルマスケール情報は、上記の等式の中で記載した「reshape_model_bin_delta_sign_CW[i]及びreshape_model_bin_delta_abs_CW[i]」、及び/又は上記の等式の中で記載した「SignaledCW[i]」等を含むことができる。一部の実施形態では、ルマスケール情報は、ルマブロックに基づいて決定される変数を含み得る。例えば平均ルマ値は、ルマブロックに隣接するルマサンプル(ルマブロックの上部のロー内のルマサンプル及びルマブロックの左側のカラム内のルマサンプル等)の平均値を計算することによって決定され得る。
[0164] ステップ1306で、ルマスケール情報に基づいてクロマスケール因子を決定することができる。
[0165] 一部の実施形態では、ルマスケール情報に基づいてルマブロックのルマスケール因子を決定することができる。例えば「inverse_chroma_scaling[i]=((1<<(luma_bit_depth-log2(TOTAL_NUMBER_PIECES)+CSCALE_FP_PREC))+(tempCW>>1))/tempCW」の上記の等式によれば、ルマスケール情報(例えば「tempCW」)に基づいてルマスケール因子を決定することができる。次いで、ルマスケール因子の値に基づいてクロマスケール因子を更に決定することができる。例えば、クロマスケール因子はルマスケール因子の値に等しく設定することができる。クロマスケール因子として設定する前に、ルマスケール因子の値に対して更なる計算を適用できることが理解されよう。別の例として、クロマスケール因子は「SignaledCW[YIdx]/OrgCW」に等しく設定することができ、ルマブロックに関連する平均ルマ値に基づいて現クロマブロックの区分インデックス「YIdx」を決定することができる。
[0166] ステップ1308で、クロマスケール因子を使用してクロマブロックを処理することができる。例えばクロマブロックのスケーリングされた残差を生成するために、クロマスケール因子を使用してクロマブロックの残差を処理することができる。クロマブロックはCbクロマ成分又はCrクロマ成分であり得る。
[0167] 一部の実施形態では、条件が満たされる場合にクロマブロックを処理することができる。例えば条件は、ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又はピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないことを含み得る。標的コード化単位が非ゼロ残差を有さないことは、標的コード化単位の第1のコード化ブロックフラグの値に基づいて判定することができる。標的変換単位が非ゼロクロマ残差を有さないことは、標的変換単位の第1の成分の第2のコード化ブロックフラグの値及び第2の成分の第3のコード化ブロックフラグの値に基づいて判定することができる。例えば第1の成分はCb成分とすることができ、第2の成分はCr成分とすることができる。
[0168] 方法1300の各ステップは独立した方法として実行できることが理解されよう。例えば、ステップ1308に記載したクロマスケール因子を決定するための方法を独立した方法として実行することができる。
[0169] 図14は、映像コンテンツを処理するためのコンピュータによって実装される方法1400の流れ図を示す。一部の実施形態では、方法1300は、コーデック(例えば図2A~図2Bの符号器又は図3A~図3Bの復号器)によって実行され得る。例えばコーデックは、映像シーケンスを符号化し又は別のコードに変換するための機器(例えば機器400)の1つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス(例えば映像シーケンス202)又は復号される圧縮映像シーケンス(例えば映像ストリーム304)であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ(例えばプロセッサ402)に関連する監視装置(例えば図4の映像入力装置)によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは複数のピクチャを含み得る。機器はピクチャのレベルで方法1400を実行することができる。例えば機器は方法1400内でピクチャを1つずつ処理することができる。別の例では、機器が方法1400内で1度に複数のピクチャを処理することができる。方法1400は以下のようなステップを含み得る。
[0170] ステップ1402で、ピクチャに関連するクロマブロック及びルマブロックを受信することができる。ピクチャはクロマ成分及びルマ成分に関連し得ることが理解されよう。従って、ピクチャは、クロマサンプルを含むクロマブロック及びルマサンプルを含むルマブロックに関連することができる。一部の実施形態では、ルマブロックがNxMのルマサンプルを含み得る。Nはルマブロックの幅とすることができ、Mはルマブロックの高さとすることができる。上記で論じたように、ルマブロックのルマサンプルは標的クロマブロックの区分インデックスを決定するために使用することができる。従って映像シーケンスのピクチャに関連するルマブロックが受信され得る。NとMとが同じ値を有し得ることが理解されよう。
[0171] ステップ1404で、N及びMの少なくとも1つが閾値を上回ることに応じてNxMルマサンプルのサブセットを選択することができる。区分インデックスの決定を加速するために、一定の条件が満たされる場合、ルマブロックを「ダウンサンプリング」することができる。換言すれば、ルマブロック内のルマサンプルのサブセットを使用して区分インデックスを決定することができる。一部の実施形態では、一定の条件とはN及びMの少なくとも一方が閾値を上回ることである。一部の実施形態では、閾値はN及びMの少なくとも一方に基づき得る。閾値は2のべき乗とすることができる。例えば閾値は4、8、16等とすることができる。4を例に取り、N又はMが4を上回る場合、ルマサンプルのサブセットを選択することができる。図10の例ではルマブロックの幅及び高さの両方が4の閾値を上回り、従って4x4サンプルのサブセットが選択される。2x8、1x16等のサブセットも処理のために選択できることが理解されよう。
[0172] ステップ1406で、NxMルマサンプルのサブセットの平均値を決定することができる。
[0173] 一部の実施形態では、平均値を決定することが、第2の条件が満たされているかどうかを判定すること、及び第2の条件が満たされているという判定に応じてNxMルマサンプルのサブセットの平均値を決定することを更に含み得る。例えば第2の条件は、ピクチャに関連する標的コード化単位が非ゼロ残差係数を有さないこと又は標的コード化単位が非ゼロクロマ残差係数を有さないことを含み得る。
[0174] ステップ1408で、平均値に基づくクロマスケール因子を決定することができる。一部の実施形態では、クロマスケール因子を決定するために、クロマブロックの区分インデックスを平均値に基づいて決定することができ、クロマブロックの区分インデックスが第1の条件を満たすかどうかを判定することができ、クロマブロックの区分インデックスが第1の条件を満たすことに応じてクロマスケール因子をデフォルト値に設定することができる。デフォルト値はクロマスケーリングが適用されないことを示し得る。例えばデフォルト値は小数精度を有する1.0であり得る。デフォルト値に固定小数点近似を適用できることが理解されよう。クロマブロックの区分インデックスが第1の条件を満たさないことに応じて、クロマスケール因子を平均値に基づいて決定することができる。より具体的には、クロマスケール因子をSignaledCW[YIdx]/OrgCWに設定することができ、標的クロマブロックの区分インデックス「YIdx」は対応するルマブロックの平均値に基づいて決定することができる。
[0175] 一部の実施形態では、第1の条件はクロマブロックの区分インデックスが、シグナリングされるコード語の最大インデックスよりも大きいこと又はシグナリングされるコード語の最小インデックスよりも小さいことを含み得る。シグナリングされるコード語の最大インデックス及び最小インデックスは以下のように決定することができる。
[0176] コード語は入力信号(例えばルマサンプル)に基づいて区分線形モデル(例えばLMCS)を使用して生成することができる。上記で論じたように、入力信号のダイナミックレンジは幾つかの区分(例えば16個の区分)に分割することができ、入力信号の各区分を使用してコード語のビンを出力として生成することができる。従って、コード語の各ビンは入力信号の区分に対応するビンインデックスを有し得る。この例では、ビンインデックスの範囲を0~15とすることができる。一部の実施形態では、出力(即ちコード語)の値が最小値(例えば0)と最大値(例えば255)との間であり、最小値と最大値との間の値を有する複数のコード語がシグナリングされ得る。シグナリングされる複数のコード語のビンインデックスを決定することができる。シグナリングされる複数のコード語のビンインデックスのうち、シグナリングされる複数のコード語のビンの最大ビンインデックス及び最小ビンインデックスを更に決定することができる。
[0177] クロマスケール因子に加えて、方法1400は、シグナリングされる複数のコード語のビンに基づいてルマスケール因子を更に決定することができる。ルマスケール因子は、逆クロマスケール因子として使用することができる。ルマスケール因子を決定するための等式は上記で記載しており、その説明は本明細書では省略する。一部の実施形態では、シグナリングされる複数個の隣接コード語がルマスケール因子を共有する。例えば2個又は4個のシグナリングされる隣接コード語が同じルマスケール因子を共有することができ、そのことはルマスケール因子を決定する負荷を減らし得る。
[0178] ステップ1410で、クロマスケール因子を使用してクロマブロックを処理することができる。図5に関して上記で論じたように、複数のクロマスケール因子がタイルグループレベルにおけるクロマスケール因子LUTを構築することができ、標的ブロックの再構築済みクロマ残差に対して復号器側で適用することができる。同様に、クロマスケール因子は符号器側でも適用することができる。
[0179] 方法1400の各ステップは独立した方法として実行できることが理解されよう。例えば、ステップ1308に記載したクロマスケール因子を決定するための方法を独立した方法として実行することができる。
[0180] 図15は、映像コンテンツを処理するためのコンピュータによって実装される方法1500の流れ図を示す。一部の実施形態では、方法1500は、コーデック(例えば図2A~図2Bの符号器又は図3A~図3Bの復号器)によって実行され得る。例えばコーデックは、映像シーケンスを符号化し又は別のコードに変換するための機器(例えば機器400)の1つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス(例えば映像シーケンス202)又は復号される圧縮映像シーケンス(例えば映像ストリーム304)であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ(例えばプロセッサ402)に関連する監視装置(例えば図4の映像入力装置)によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは複数のピクチャを含み得る。機器はピクチャのレベルで方法1500を実行することができる。例えば機器は方法1500内でピクチャを1つずつ処理することができる。別の例では、機器が方法1500内で1度に複数のピクチャを処理することができる。方法1500は以下のようなステップを含み得る。
[0181] ステップ1502で、受信映像データ内にクロマスケールインデックスがあるかどうかを判定することができる。
[0182] ステップ1504で、受信映像データ内にクロマスケールインデックスがないと判定することに応じて、受信映像データにクロマスケーリングが適用されないと判定することができる。
[0183] ステップ1506で、受信映像データ内にクロマスケーリングがあると判定することに応じて、クロマスケールインデックスに基づいてクロマスケール因子を決定することができる。
[0184] 図16は、映像コンテンツを処理するためのコンピュータによって実装される方法1600の流れ図を示す。一部の実施形態では、方法1600は、コーデック(例えば図2A~図2Bの符号器又は図3A~図3Bの復号器)によって実行され得る。例えばコーデックは、映像シーケンスを符号化し又は別のコードに変換するための機器(例えば機器400)の1つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス(例えば映像シーケンス202)又は復号される圧縮映像シーケンス(例えば映像ストリーム304)であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ(例えばプロセッサ402)に関連する監視装置(例えば図4の映像入力装置)によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは複数のピクチャを含み得る。機器はピクチャのレベルで方法1600を実行することができる。例えば機器は方法1600内でピクチャを1つずつ処理することができる。別の例では、機器が方法1600内で1度に複数のピクチャを処理することができる。方法1600は以下のようなステップを含み得る。
[0185] ステップ1602で、入力映像信号のダイナミックレンジに使用される複数の固有のコード語を受信することができる。
[0186] ステップ1604で、インデックスを受信することができる。
[0187] ステップ1606で、複数の固有のコード語の少なくとも1つをインデックスに基づいて選択することができる。
[0188] ステップ1608で、選択済みの少なくとも1つのコード語に基づいてクロマスケール因子を決定することができる。
[0189] 一部の実施形態では命令を含む非一時的コンピュータ可読記憶媒体も提供され、命令は上記の方法を実行するために装置(開示した符号器及び復号器等)によって実行され得る。一般的な非一時的媒体は、例えばフロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ若しくは他の任意の磁気データ記憶媒体、CD-ROM、他の任意の光学データ記憶媒体、孔のパターンを有する任意の物理媒体、RAM、PROM、EPROM、フラッシュEPROM若しくは他の任意のフラッシュメモリ、NVRAM、キャッシュ、レジスタ、他の任意のメモリチップ若しくはカートリッジ、及びそれらのもののネットワーク化されたバージョンを含む。装置は、1つ又は複数のプロセッサ(CPU)、入力/出力インタフェース、ネットワークインタフェース、及び/又はメモリを含み得る。
[0190] 上記の実施形態はハードウェア、ソフトウェア(プログラムコード)、又はハードウェアとソフトウェアとの組み合わせによって実装できることが理解されよう。ソフトウェアによって実装される場合、そのソフトウェアは上記のコンピュータ可読媒体の中に記憶することができる。プロセッサによって実行されるとき、ソフトウェアは開示した方法を実行することができる。本開示に記載した計算ユニット及び他の機能ユニットは、ハードウェア、又はソフトウェア、又はハードウェアとソフトウェアとの組み合わせによって実装することができる。上記のモジュール/ユニットの複数のものを1つのモジュール/ユニットに組み合わせることができ、上記のモジュール/ユニットのそれぞれを複数のサブモジュール/サブユニットへと更に分けられることも当業者なら理解されよう。
[0191] 実施形態は以下の条項を使用して更に記載することができる:
1.映像コンテンツを処理するためのコンピュータ実施方法であって、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
ルマブロックに関連するルマスケール情報を決定すること、
ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
クロマスケール因子を使用してクロマブロックを処理すること
を含む、方法。
2.ルマスケール情報に基づいてクロマスケール因子を決定することが、
ルマスケール情報に基づいてルマブロックのルマスケール因子を決定すること、
ルマスケール因子の値に基づいてクロマスケール因子を決定すること
を更に含む、条項1に記載の方法。
3.ルマスケール因子の値に基づいてクロマスケール因子を決定することが、
クロマスケール因子をルマスケール因子の値に等しく設定すること
を更に含む、条項2に記載の方法。
4.クロマスケール因子を使用してクロマブロックを処理することが、
第1の条件が満たされているかどうかを判定すること、及び
第1の条件が満たされているという判定に応じてクロマスケール因子を使用してクロマブロックを処理すること、又は
第1の条件が満たされていないという判定に応じてクロマスケール因子を用いたクロマブロックの処理をバイパスすること
の1つを行うこと
を更に含む、条項1~3の何れか1つに記載の方法。
5.第1の条件が、
ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又は
ピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないこと
を含む、条項4に記載の方法。
6.標的コード化単位が非ゼロ残差を有さないことが、標的コード化単位の第1のコード化ブロックフラグの値に基づいて判定され、
標的変換単位が非ゼロクロマ残差を有さないことが、標的変換単位の第1のクロマ成分の第2のコード化ブロックフラグの値及び第2のルマクロマ成分の第3のコード化ブロックフラグの値に基づいて判定される、
条項5に記載の方法。
7.第1のコード化ブロックフラグの値が0であり、
第2のコード化ブロックフラグの値及び第3のコード化ブロックフラグの値が0である、
条項6に記載の方法。
8.クロマスケール因子を使用してクロマブロックを処理することが、
クロマスケール因子を使用してクロマブロックの残差を処理すること
を含む、条項1~7の何れか1つに記載の方法。
9.映像コンテンツを処理するための機器であって、
1組の命令を記憶するメモリと、
メモリに結合され、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
ルマブロックに関連するルマスケール情報を決定すること、
ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
クロマスケール因子を使用してクロマブロックを処理すること
を機器に行わせるための1組の命令を実行するように構成されるプロセッサと
を含む、機器。
10.ルマスケール情報に基づいてクロマスケール因子を決定する際、
ルマスケール情報に基づいてルマブロックのルマスケール因子を決定すること、
ルマスケール因子の値に基づいてクロマスケール因子を決定すること
を機器に更に行わせるための1組の命令を実行するようにプロセッサが構成される、条項9に記載の機器。
11.ルマスケール因子の値に基づいてクロマスケール因子を決定する際、
クロマスケール因子をルマスケール因子の値に等しく設定すること
を機器に更に行わせるための1組の命令を実行するようにプロセッサが構成される、条項10に記載の機器。
12.クロマスケール因子を使用してクロマブロックを処理する際、
第1の条件が満たされているかどうかを判定すること、及び
第2の条件が満たされているという判定に応じてクロマスケール因子を使用してクロマブロックを処理すること、又は
第2の条件が満たされていないという判定に応じてクロマスケール因子を用いたクロマブロックの処理をバイパスすること
の1つを行うこと
を機器に更に行わせるための1組の命令を実行するようにプロセッサが構成される、条項9~11の何れか1つに記載の機器。
13.第1の条件が、
ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又は
ピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないこと
を含む、条項12に記載の機器。
14.標的コード化単位が非ゼロ残差を有さないことが、標的コード化単位の第1のコード化ブロックフラグの値に基づいて判定され、
標的変換単位が非ゼロクロマ残差を有さないことが、標的変換単位の第1のクロマ成分の第2のコード化ブロックフラグの値及び第2のクロマ成分の第3のコード化ブロックフラグの値に基づいて判定される、
条項13に記載の機器。
15.第1のコード化ブロックフラグの値が0であり、
第2のコード化ブロックフラグの値及び第3のコード化ブロックフラグの値が0である、
条項14に記載の機器。
16.クロマスケール因子を使用してクロマブロックを処理する際、
クロマスケール因子を使用してクロマブロックの残差を処理すること
を機器に更に行わせるための1組の命令を実行するようにプロセッサが構成される、条項9~15の何れか1つに記載の機器。
17.映像コンテンツを処理するための方法を装置に行わせるための、装置の1つ又は複数のプロセッサによって実行可能な1組の命令を記憶する非一時的コンピュータ可読記憶媒体であって、その方法は、
ピクチャに関連するクロマブロック及びルマブロックを受信すること、
ルマブロックに関連するルマスケール情報を決定すること、
ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
クロマスケール因子を使用してクロマブロックを処理すること
を含む、非一時的コンピュータ可読記憶媒体。
18.映像コンテンツを処理するためのコンピュータ実施方法であって、
ピクチャに関連するクロマブロック及びルマブロックを受信することであって、ルマブロックはNxMのルマサンプルを含む、受信すること、
N及びMの少なくとも1つが閾値を上回ることに応じてNxMルマサンプルのサブセットを選択すること、
NxMルマサンプルのサブセットの平均値を決定すること、
平均値に基づいてクロマスケール因子を決定すること、及び
クロマスケール因子を使用してクロマブロックを処理すること
を含む、方法。
19.映像コンテンツを処理するためのコンピュータ実施方法であって、
受信映像データ内にクロマスケールインデックスがあるかどうかを判定すること、
受信映像データ内にクロマスケールインデックスがないと判定することに応じて、受信映像データにクロマスケーリングが適用されないと判定すること、及び
受信映像データ内にクロマスケーリングがあると判定することに応じて、クロマスケールインデックスに基づいてクロマスケール因子を決定すること
を含む、方法。
20.映像コンテンツを処理するためのコンピュータ実施方法であって、
入力映像信号のダイナミックレンジに使用される複数の固有のコード語を受信すること、
インデックスを受信すること、
複数の固有のコード語の少なくとも1つをインデックスに基づいて選択すること、及び
選択済みの少なくとも1つのコード語に基づいてクロマスケール因子を決定すること
を含む、方法。
[0192] コンピュータ可読プログラムコードを使用することによって上記の方法を実装することに加えて、上記の方法は論理ゲート、スイッチ、ASIC、プログラム可能論理コントローラ、及び埋め込みマイクロコントローラの形で実装することもできる。従って、かかるコントローラはハードウェア構成要素と見なすことができ、コントローラ内に含まれ様々な機能を実装するように構成される機器もハードウェア構成要素内の構造と見なすことができる。又は様々な機能を実装するように構成される機器は、方法を実装するように構成されるソフトウェアモジュール及びハードウェア構成要素内の構造の両方と見なすことさえできる。
[0193] 本開示はコンピュータによって実行されるコンピュータ実行可能命令、例えばプログラムモジュールの全般的な脈絡で説明することができる。概してプログラムモジュールは、特定のタスクを実行し又は特定の抽象データ型を実装するために使用されるルーチン、プログラム、オブジェクト、アセンブリ、データ構造、クラス等を含む。本開示の実施形態は分散型計算環境内で実装することもできる。分散型計算環境では、通信ネットワークによって接続される遠隔処理装置を使用することによってタスクが実行される。分散型計算環境では、プログラムモジュールが記憶装置を含む局所及び遠隔コンピュータ記憶媒体内にあり得る。
[0194] 本明細書の「第1の」及び「第2の」等の関係語は或るエンティティ又は操作を別のエンティティ又は操作と区別するために使用するに過ぎず、それらのエンティティ又は操作間の如何なる実際の関係又は順序も必要とせず又は含意しないことに留意すべきである。更に、「comprising(含む)」、「having(有する)」、「containing(含む)」、及び「including(含む)」並びに他の同様の形式の言葉は意味の点で等価であることを意図し、これらの言葉の何れか1つの後に続くアイテムがかかるアイテムの網羅的列挙であることを意図しておらず、又は列挙するアイテムだけに限定されることを意図していない点で非限定的であることを意図する。
[0195] 上記の明細書では、実装形態ごとに変わり得る多数の具体的詳細に関して実施形態を説明してきた。記載した実施形態の一定の適応及び修正を加えることができる。本明細書を検討し、本明細書で明らかにした開示を実践することで他の実施形態が当業者に明らかになり得る。本明細書及び例は専ら例として検討され、本開示の真の範囲及び趣旨は添付の特許請求の範囲によって示すことを意図する。図中に示すステップの順序は例示目的に過ぎず、或る特定のステップの順序に限定されることは意図しない。そのため、それらのステップは同じ方法を実装しながら異なる順序で実行できることを当業者なら理解することができる。

Claims (17)

  1. 映像コンテンツを処理するためのコンピュータ実施方法であって、
    ピクチャに関連するクロマブロック及びルマブロックを受信すること、
    前記ルマブロックに関連するルマスケール情報を決定すること、
    前記ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
    前記クロマスケール因子を使用して前記クロマブロックを処理すること
    を含む、方法。
  2. 前記ルマスケール情報に基づいて前記クロマスケール因子を決定することが、
    前記ルマスケール情報に基づいて前記ルマブロックのルマスケール因子を決定すること、
    前記ルマスケール因子の値に基づいて前記クロマスケール因子を決定すること
    を更に含む、請求項1に記載の方法。
  3. 前記ルマスケール因子の値に基づいて前記クロマスケール因子を決定することが、
    前記クロマスケール因子を前記ルマスケール因子の前記値に等しく設定すること
    を更に含む、請求項2に記載の方法。
  4. 前記クロマスケール因子を使用して前記クロマブロックを処理することが、
    第1の条件が満たされているかどうかを判定すること、及び
    前記第1の条件が満たされているという前記判定に応じて前記クロマスケール因子を使用して前記クロマブロックを処理すること、又は
    前記第1の条件が満たされていないという前記判定に応じて前記クロマスケール因子を用いた前記クロマブロックの前記処理をバイパスすること
    の1つを行うこと
    を更に含む、請求項1に記載の方法。
  5. 前記第1の条件が、
    前記ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又は
    前記ピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないこと
    を含む、請求項4に記載の方法。
  6. 前記標的コード化単位が非ゼロ残差を有さないことが、前記標的コード化単位の第1のコード化ブロックフラグの値に基づいて判定され、
    前記標的変換単位が非ゼロクロマ残差を有さないことが、前記標的変換単位の第1のクロマ成分の第2のコード化ブロックフラグの値及び第2のルマクロマ成分の第3のコード化ブロックフラグの値に基づいて判定される、
    請求項5に記載の方法。
  7. 前記第1のコード化ブロックフラグの前記値が0であり、
    前記第2のコード化ブロックフラグの前記値及び前記第3のコード化ブロックフラグの前記値が0である、
    請求項6に記載の方法。
  8. 前記クロマスケール因子を使用して前記クロマブロックを処理することが、
    前記クロマスケール因子を使用して前記クロマブロックの残差を処理すること
    を含む、請求項1に記載の方法。
  9. 映像コンテンツを処理するための機器であって、
    1組の命令を記憶するメモリと、
    前記メモリに結合され、
    ピクチャに関連するクロマブロック及びルマブロックを受信すること、
    前記ルマブロックに関連するルマスケール情報を決定すること、
    前記ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
    前記クロマスケール因子を使用して前記クロマブロックを処理すること
    を前記機器に行わせるために前記1組の命令を実行するように構成されるプロセッサと
    を含む、機器。
  10. 前記ルマスケール情報に基づいて前記クロマスケール因子を決定する際、
    前記ルマスケール情報に基づいて前記ルマブロックのルマスケール因子を決定すること、
    前記ルマスケール因子の値に基づいて前記クロマスケール因子を決定すること
    を前記機器に更に行わせるために前記1組の命令を実行するように前記プロセッサが構成される、請求項9に記載の機器。
  11. 前記ルマスケール因子の値に基づいて前記クロマスケール因子を決定する際、
    前記クロマスケール因子を前記ルマスケール因子の前記値に等しく設定すること
    を前記機器に更に行わせるために前記1組の命令を実行するように前記プロセッサが構成される、請求項10に記載の機器。
  12. 前記クロマスケール因子を使用して前記クロマブロックを処理する際、
    第1の条件が満たされているかどうかを判定すること、及び
    第2の条件が満たされているという前記判定に応じて前記クロマスケール因子を使用して前記クロマブロックを処理すること、又は
    前記第2の条件が満たされていないという前記判定に応じて前記クロマスケール因子を用いた前記クロマブロックの前記処理をバイパスすること
    の1つを行うこと
    を前記機器に更に行わせるために前記1組の命令を実行するように前記プロセッサが構成される、請求項9に記載の機器。
  13. 前記第1の条件が、
    前記ピクチャに関連する標的コード化単位が非ゼロ残差を有さないこと、又は
    前記ピクチャに関連する標的変換単位が非ゼロクロマ残差を有さないこと
    を含む、請求項12に記載の機器。
  14. 前記標的コード化単位が非ゼロ残差を有さないことが、前記標的コード化単位の第1のコード化ブロックフラグの値に基づいて判定され、
    前記標的変換単位が非ゼロクロマ残差を有さないことが、前記標的変換単位の第1のクロマ成分の第2のコード化ブロックフラグの値及び第2のクロマ成分の第3のコード化ブロックフラグの値に基づいて判定される、
    請求項13に記載の機器。
  15. 前記第1のコード化ブロックフラグの前記値が0であり、
    前記第2のコード化ブロックフラグの前記値及び前記第3のコード化ブロックフラグの前記値が0である、
    請求項14に記載の機器。
  16. 前記クロマスケール因子を使用して前記クロマブロックを処理する際、
    前記クロマスケール因子を使用して前記クロマブロックの残差を処理すること
    を前記機器に更に行わせるために前記1組の命令を実行するように前記プロセッサが構成される、請求項9に記載の機器。
  17. 映像コンテンツを処理するための方法を装置に行わせるために、前記装置の1つ又は複数のプロセッサによって実行可能な1組の命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記方法は、
    ピクチャに関連するクロマブロック及びルマブロックを受信すること、
    前記ルマブロックに関連するルマスケール情報を決定すること、
    前記ルマスケール情報に基づいてクロマスケール因子を決定すること、及び
    前記クロマスケール因子を使用して前記クロマブロックを処理すること
    を含む、非一時的コンピュータ可読記憶媒体。
JP2021547465A 2019-03-04 2020-02-28 映像コンテンツを処理するための方法及びシステム Pending JP2022523925A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962813728P 2019-03-04 2019-03-04
US62/813,728 2019-03-04
US201962817546P 2019-03-12 2019-03-12
US62/817,546 2019-03-12
PCT/US2020/020513 WO2020180737A1 (en) 2019-03-04 2020-02-28 Method and system for processing video content

Publications (2)

Publication Number Publication Date
JP2022523925A true JP2022523925A (ja) 2022-04-27
JPWO2020180737A5 JPWO2020180737A5 (ja) 2023-03-22

Family

ID=72336795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021547465A Pending JP2022523925A (ja) 2019-03-04 2020-02-28 映像コンテンツを処理するための方法及びシステム

Country Status (6)

Country Link
US (3) US11516512B2 (ja)
EP (1) EP3935847A4 (ja)
JP (1) JP2022523925A (ja)
KR (1) KR20210134375A (ja)
CN (2) CN118474354A (ja)
WO (1) WO2020180737A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3906681A4 (en) 2019-02-01 2022-06-01 Beijing Bytedance Network Technology Co., Ltd. INTERACTIONS BETWEEN IN-LOOP TRANSFORMING AND INTERMEDIATE ENCODING TOOLS
WO2020156526A1 (en) 2019-02-01 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Interactions between in-loop reshaping and inter coding tools
KR102464910B1 (ko) * 2019-02-28 2022-11-09 삼성전자주식회사 크로마 성분을 예측하는 비디오 부호화 및 복호화 방법, 및 크로마 성분을 예측하는 비디오 부호화 및 복호화 장치
CN113519157B (zh) 2019-03-04 2023-12-26 北京字节跳动网络技术有限公司 视频处理中滤波信息的两级信令
CA3131286C (en) * 2019-03-08 2024-06-18 Beijing Bytedance Network Technology Co., Ltd. Constraints on model-based reshaping in video processing
KR20210139336A (ko) * 2019-03-12 2021-11-22 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 이미지 및 비디오 코딩을 위한 선택적 인터-컴포넌트 변환
CN117499644A (zh) 2019-03-14 2024-02-02 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
CN118118658A (zh) * 2019-03-22 2024-05-31 罗斯德尔动力有限责任公司 基于dmvr和bdof的帧间预测方法及其设备
EP3925216A4 (en) 2019-03-23 2022-06-15 Beijing Bytedance Network Technology Co., Ltd. RESTRICTIONS ON ADAPTIVE LOOP FILTER PARAMETER SETS
US11451826B2 (en) * 2019-04-15 2022-09-20 Tencent America LLC Lossless coding mode and switchable residual coding
BR112021019679A2 (pt) * 2019-04-18 2021-12-07 Beijing Bytedance Network Tech Co Ltd Método para processamento de mídia visual, aparelho codificador de vídeo, aparelho decodificador de vídeo, e, mídia legível por computador
EP3935855A4 (en) 2019-04-23 2022-09-21 Beijing Bytedance Network Technology Co., Ltd. METHOD OF CROSS-COMPONENT DEPENDENCE REDUCTION
EP3949395A4 (en) 2019-05-08 2022-06-29 Beijing Bytedance Network Technology Co., Ltd. Conditions for applicability of cross-component coding
KR20220024006A (ko) * 2019-06-22 2022-03-03 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 잔차 스케일링을 위한 신택스 요소
CN117395396A (zh) * 2019-07-07 2024-01-12 北京字节跳动网络技术有限公司 色度残差缩放的信令通知
WO2021039992A1 (ja) * 2019-08-28 2021-03-04 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
WO2021052493A1 (en) * 2019-09-20 2021-03-25 Beijing Bytedance Network Technology Co., Ltd. Scaling process for coding block
US11601657B2 (en) * 2020-04-02 2023-03-07 Qualcomm Incorporated LUMA mapping with chroma scaling (LMCS) in video coding
JP7367237B2 (ja) * 2020-06-24 2023-10-23 ベイジン ダジア インターネット インフォメーション テクノロジー カンパニー リミテッド ビデオ符号化用の予測依存残差スケーリングのための方法およびデバイス
EP4222968A1 (en) * 2020-10-01 2023-08-09 Beijing Dajia Internet Information Technology Co., Ltd. Video coding with neural network based in-loop filtering
MX2022003464A (es) * 2020-12-17 2022-10-21 Japan Broadcasting Corp Dispositivo decodificador, programa y método de decodificación.

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101213205B1 (ko) * 2006-11-23 2012-12-17 삼성전자주식회사 컬러 재현 시스템 및 방법
NO328906B1 (no) * 2007-12-19 2010-06-14 Tandberg Telecom As Fremgangsmate for forbedring av farveskarphet i video- og stillbilder
US8294822B2 (en) 2010-08-17 2012-10-23 Broadcom Corporation Method and system for key aware scaling
US9848197B2 (en) * 2011-03-10 2017-12-19 Qualcomm Incorporated Transforms in video coding
ES2770320T3 (es) 2011-06-28 2020-07-01 Samsung Electronics Co Ltd Interpolación de imágenes usando un filtro asimétrico de interpolación
CN104471940B (zh) * 2012-04-16 2017-12-15 联发科技(新加坡)私人有限公司 色度帧内预测方法及装置
WO2014007520A1 (ko) * 2012-07-02 2014-01-09 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
US10334253B2 (en) * 2013-04-08 2019-06-25 Qualcomm Incorporated Sample adaptive offset scaling based on bit-depth
US8810727B1 (en) * 2013-05-07 2014-08-19 Qualcomm Technologies, Inc. Method for scaling channel of an image
US9648330B2 (en) * 2013-07-15 2017-05-09 Qualcomm Incorporated Inter-color component residual prediction
US9648332B2 (en) * 2013-10-28 2017-05-09 Qualcomm Incorporated Adaptive inter-color component residual prediction
US10397607B2 (en) * 2013-11-01 2019-08-27 Qualcomm Incorporated Color residual prediction for video coding
EP3192261A1 (en) * 2014-09-12 2017-07-19 VID SCALE, Inc. Inter-component de-correlation for video coding
EP3198874A4 (en) * 2014-10-28 2018-04-04 MediaTek Singapore Pte Ltd. Method of guided cross-component prediction for video coding
JP6559337B2 (ja) 2015-09-23 2019-08-14 ノキア テクノロジーズ オーユー 360度パノラマビデオの符号化方法、符号化装置、及びコンピュータプログラム
US20170105014A1 (en) * 2015-10-08 2017-04-13 Qualcomm Incorporated Luma-driven chroma scaling for high dynamic range and wide color gamut contents
US10944976B2 (en) * 2016-07-22 2021-03-09 Sharp Kabushiki Kaisha Systems and methods for coding video data using adaptive component scaling
US10477240B2 (en) * 2016-12-19 2019-11-12 Qualcomm Incorporated Linear model prediction mode with sample accessing for video coding
US10778978B2 (en) * 2017-08-21 2020-09-15 Qualcomm Incorporated System and method of cross-component dynamic range adjustment (CC-DRA) in video coding
RU2020109859A (ru) * 2017-09-15 2021-09-07 Сони Корпорейшн Устройство и способ обработки изображения
US10681358B2 (en) * 2017-12-19 2020-06-09 Qualcomm Incorporated Quantization parameter control for video coding with joined pixel/transform based quantization
US11303912B2 (en) * 2018-04-18 2022-04-12 Qualcomm Incorporated Decoded picture buffer management and dynamic range adjustment
CN115334303A (zh) * 2018-10-05 2022-11-11 华为技术有限公司 帧内预测方法及设备
JP2022506283A (ja) * 2018-11-06 2022-01-17 北京字節跳動網絡技術有限公司 イントラ予測のためのパラメータ導出における複雑性低減
US11197005B2 (en) * 2018-11-08 2021-12-07 Qualcomm Incorporated Cross-component prediction for video coding
BR112021013611A2 (pt) * 2019-02-28 2021-09-14 Interdigital Vc Holdings, Inc. Método e dispositivo para codificação e decodificação de imagens

Also Published As

Publication number Publication date
CN118474354A (zh) 2024-08-09
WO2020180737A1 (en) 2020-09-10
US20240155158A1 (en) 2024-05-09
TW202044834A (zh) 2020-12-01
US20230105972A1 (en) 2023-04-06
CN113545064A (zh) 2021-10-22
EP3935847A1 (en) 2022-01-12
KR20210134375A (ko) 2021-11-09
EP3935847A4 (en) 2022-12-07
US20200288173A1 (en) 2020-09-10
US11516512B2 (en) 2022-11-29
CN113545064B (zh) 2024-05-10
US11902581B2 (en) 2024-02-13

Similar Documents

Publication Publication Date Title
US11902581B2 (en) Method and system for processing video content
US11381842B2 (en) Methods for coding or decoding video parameter set or sequence parameter set
US20230353793A1 (en) Quantization parameter signaling in video processing
JP7343669B2 (ja) Vvcにおける色変換のための方法及び機器
US12047578B2 (en) Lossless coding of video data
JP2022538747A (ja) ルマ及びクロマ信号を処理するための方法及びシステム
US11889091B2 (en) Methods for processing chroma signals
KR20220160019A (ko) 루프 필터의 높은 레벨 신택스 제어
JP2023509838A (ja) サブピクチャ分割情報をシグナリングするための方法及び機器
US11638019B2 (en) Methods and systems for prediction from multiple cross-components
CN114788284B (zh) 用于在调色板模式下对视频数据进行编码的方法和装置
KR20220158002A (ko) 비디오 레코딩의 부호 데이터 은닉
KR20220057620A (ko) 변환-스킵 모드에서 비디오 데이터를 코딩하기 위한 방법 및 장치
JP2023515321A (ja) 最大変換サイズ及び残差符号化方法のシグナリング
US11606577B2 (en) Method for processing adaptive color transform and low-frequency non-separable transform in video coding
US20210084293A1 (en) Method and apparatus for coding video data

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230227

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240229

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240229

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240730