JP2024505900A - 空間局所照明補償 - Google Patents

空間局所照明補償 Download PDF

Info

Publication number
JP2024505900A
JP2024505900A JP2023545821A JP2023545821A JP2024505900A JP 2024505900 A JP2024505900 A JP 2024505900A JP 2023545821 A JP2023545821 A JP 2023545821A JP 2023545821 A JP2023545821 A JP 2023545821A JP 2024505900 A JP2024505900 A JP 2024505900A
Authority
JP
Japan
Prior art keywords
block
spatial
lic
current block
reconstructed samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023545821A
Other languages
English (en)
Inventor
チェン,ヤ
ボルデ,フィリップ
リアネック,ファブリス ル
ロバート,アントワーヌ
Original Assignee
インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ filed Critical インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
Publication of JP2024505900A publication Critical patent/JP2024505900A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Liquid Crystal (AREA)

Abstract

ビデオを効率的に符号化又は復号するための少なくとも方法及び装置が提示される。例えば、ピクチャ内の符号化/復号されている現在のブロックの局所照明補償LICのためのパラメータは、少なくとも1つの空間参照ブロックの空間的に隣接する再構成されたサンプル及び対応する空間的に隣接する再構成されたサンプルに基づいて決定され、少なくとも1つの空間参照ブロックは、ピクチャ内の現在のブロックの空間的隣接ブロックである。例えば、フラグは、現在のブロックのための空間LICを有効/無効にする。例えば、空間LICは、インター/イントラ/IBC予測のいずれかに適用される。例えば、複数の空間参照ブロックが、空間LICパラメータを決定する際に使用される。例えば、空間/時間LICパラメータを決定する際に、複数のラインの空間的に隣接する再構成されたサンプルが使用される。【選択図】図6

Description

本実施形態のうちの少なくとも1つは、概して、ビデオ符号化若しくは復号化のための方法又は装置に関し、より具体的には、空間局所照明補償を適用することを含む方法又は装置に関する。
高い圧縮効率を実現するために、画像及びビデオのコーディングスキームは、通常、動きベクトル予測を含む予測、並びにビデオコンテンツの空間的冗長性及び時間的冗長性を活用するための変換を採用している。一般に、フレーム内又はフレーム間の相関を活かすためにイントラ予測又はインター予測が使用され、それにより、しばしば予測誤差又は予測残差を意味する原画像と予測画像との差分が、変換され、量子化され、エントロピコード化される。ビデオを再構成するには、エントロピコーディング、量子化、変換、及び予測に対応する逆プロセスによって、圧縮データを復号化する。
ビデオ圧縮技術への最近の追加は、JVET(共同ビデオ探索チーム)グループによって開発されているJEM(共同探索モデル)及び後のVTM(多用途ビデオコーディング(VVC)テストモデル)など、様々な産業規格、参照ソフトウェアのバージョン、及び/又はドキュメントを含む。その目的は、既存のHEVC(高効率映像符号化)規格を更に改善することである。
符号化及び復号化のための既存の方法は、同じスライス/ピクチャ内の異なる領域/ブロック間の照明不一致を補償する際にいくつかの制限を示す。この問題は、インター/イントラ/IBC予測において空間照明変動が漸進的に伝搬するいくつかのサンプル値を含むコンテンツに対して特に顕著である。したがって、この最先端技術を改善する必要がある。
従来技術の欠点及び不利な点は、本明細書に記載される汎用態様によって解決され、対処される。
第1の態様によれば、方法が提供される。本方法は、ピクチャ内で復号されている現在のブロックについて、空間的に隣接する再構成されたサンプルと、少なくとも1つの空間参照ブロックの対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することによってビデオ復号化することと、決定されたパラメータに基づいて局所照明補償を使用して現在のブロックを復号することと、を含む。有利には、少なくとも1つの空間参照ブロックは、ピクチャ内の現在のブロックの空間的隣接ブロックである。
別の態様により、第2の方法を提供する。本方法は、ピクチャ内で符号化されている現在のブロックについて、現在のブロックの空間的に隣接する再構成されたサンプルと、少なくとも1つの空間参照ブロックの対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することによってビデオ符号化することと、決定されたパラメータに基づく局所照明補償を使用して現在のブロックを符号化することと、を含み、有利には、少なくとも1つの空間参照ブロックは、ピクチャ内の現在のブロックの空間的隣接ブロックである。
別の態様により、装置を提供する。装置は、1つ以上のプロセッサを備え、1つ以上のプロセッサは、その変形形態のいずれかによるビデオ復号化のための方法を実装するように構成される。別の態様によれば、ビデオ復号化のための装置は、ピクチャ内の復号されている現在のブロックについて、少なくとも1つの空間参照ブロックの空間的に隣接する再構成されたサンプルと、対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定するための手段と、決定されたパラメータに基づく局所照明補償を使用して現在のブロックを復号するための手段と、を備える。有利には、少なくとも1つの空間参照ブロックは、ピクチャ内の現在のブロックの空間的隣接ブロックである。
別の態様によれば、別の装置が提供される。装置は、1つ以上のプロセッサを備え、1つ以上のプロセッサは、その変形形態のいずれかによるビデオ符号化のための方法を実装するように構成される。別の態様によれば、ビデオ符号化のための装置は、ピクチャ内で符号化されている現在のブロックについて、少なくとも1つの空間参照ブロックの空間的に隣接する再構成されたサンプル及び対応する空間的に隣接する再構成されたサンプルに基づいて、局所照明補償のためのパラメータを決定するための手段と、決定されたパラメータに基づいて局所照明補償を使用して現在のブロックを符号化するための手段と、を備える。有利には、少なくとも1つの空間参照ブロックは、ピクチャ内の現在のブロックの空間的隣接ブロックである。
少なくとも1つの実施形態の別の汎用態様によれば、空間局所照明補償が現在のブロックに適用されるか否かを示すシンタックス要素が決定される。
少なくとも1つの実施形態の別の汎用態様によれば、現在のブロックは、インター予測、イントラ予測、IBC予測のいずれかで符号化される。
少なくとも1つの実施形態の別の汎用態様によれば、少なくとも1つの空間参照ブロックは、上隣接ブロック及び左隣接ブロックのいずれかである。
少なくとも1つの実施形態の別の汎用態様によれば、少なくとも1つの空間参照ブロックは、上隣接ブロック(B0)、左隣接ブロック(A0)、右上隣接ブロック(B1)、左下隣接ブロック(A1)、及び左上隣接ブロック(B2)のいずれかである。
少なくとも1つの実施形態の別の汎用態様によれば、局所照明補償のパラメータを決定する際にどの空間参照ブロックが使用されるかを示すシンタックス要素が決定される。
少なくとも1つの実施形態の別の汎用態様によれば、少なくとも1つの空間参照ブロックは、インター予測において動きベクトル予測子MVP候補として選択された隣接ブロックである。
少なくとも1つの実施形態の別の汎用態様によれば、少なくとも1つの空間参照ブロックは、現在のブロックを符号化するために使用されるイントラ予測モードに応答する。
少なくとも1つの実施形態の別の汎用態様によれば、少なくとも1つの空間参照ブロックは、イントラブロックコピー参照ブロックとして選択された隣接ブロックを備える。
少なくとも1つの実施形態の別の汎用態様によれば、隣接する再構成されたサンプルは、現在のブロック及び少なくとも1つの空間参照ブロックの左及び上の境界に位置する。
少なくとも1つの実施形態の別の汎用態様によれば、隣接する再構成されたサンプルは、現在のブロック及び少なくとも1つの空間参照ブロックの複数の左及び上の参照ライン内に位置する。少なくとも1つの実施形態の別の汎用態様によれば、隣接する再構成されたサンプルは、現在のブロック及び少なくとも1つの空間参照ブロックの再構成されたブロック全体に位置する。少なくとも1つの実施形態の別の一般的な態様によれば、少なくとも1つの空間参照ブロックは、第1の空間参照ブロック及び第2の空間参照ブロックを備え、第1の空間参照ブロックの空間的に隣接する再構成されたサンプル及び第2の空間参照ブロックの空間的に隣接する再構成されたサンプルは、局所照明補償のパラメータを決定するために平均化される。
別の態様により、第3の方法を提供する。本方法は、ピクチャ内で復号されている現在のブロックについて、空間的に隣接する再構成されたサンプルと、少なくとも1つの参照ブロックの対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することによってビデオ復号化することと、決定されたパラメータに基づく局所照明補償を使用して現在のブロックを復号することと、を含み、隣接する再構成されたサンプルは、現在のブロック及び少なくとも1つの参照ブロックの複数の左及び上の参照ライン内に位置する。少なくとも1つの実施形態の別の汎用態様によれば、隣接する再構成されたサンプルは、現在のブロック及び少なくとも1つの空間参照ブロックの再構成されたブロック全体に位置する。
別の態様により、第4の方法を提供する。本方法は、ピクチャ内で符号化されている現在のブロックについて、空間的に隣接する再構成されたサンプルと、少なくとも1つの参照ブロックの対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することによってビデオ符号化することと、決定されたパラメータに基づいて局所照明補償を使用して現在のブロックを符号化することと、を含み、隣接する再構成されたサンプルは、現在のブロック及び少なくとも1つの参照ブロックの複数の左及び上の参照ライン内に位置する。少なくとも1つの実施形態の別の汎用態様によれば、隣接する再構成されたサンプルは、現在のブロック及び少なくとも1つの空間参照ブロックの再構成されたブロック全体に位置する。
少なくとも1つの実施形態の別の汎用態様によれば、復号する実施形態のいずれかによる装置と、(i)信号を受信するように構成されたアンテナであって、信号がビデオブロックを含む、アンテナ、(ii)受信された信号を、ビデオブロックを含む周波数帯域に制限するように構成されたバンドリミッタ、又は(iii)ビデオブロックを表す出力を表示するように構成されたディスプレイ、のうちの少なくとも1つと、を備えるデバイス、が提供される。
少なくとも1つの実施形態の別の汎用態様により、記載される復号する実施形態又は変形形態のうちのいずれかに従って生成されるデータコンテンツを含む非一時的コンピュータ可読媒体を提供する。
少なくとも1つの実施形態の別の汎用態様によれば、説明した符号化実施形態又は変形形態のいずれかに従って生成されたビデオデータを含む信号が提供される。
少なくとも1つの実施形態の別の汎用態様によれば、記載される復号する実施形態又は変形形態のうちのいずれかに従って生成されるデータコンテンツを含むようにビットストリームをフォーマットする。
少なくとも1つの実施形態の別の汎用態様によれば、コンピュータによって実行されるとき、記載される符号化/復号化する実施形態又は変形形態のうちのいずれかをコンピュータに行わせる命令を含む、コンピュータプログラム製品を提供する。
汎用態様の上記及び他の態様、特徴、及び利点は、例示的な実施形態の以下の詳細な説明を添付の図面を参照しながら読み進めることによって明らかになるであろう。
図面において、いくつかの実施形態の例が例示される。
圧縮VVCピクチャを表すためのコーディングツリーユニット(CTU)及びコーディングユニット(CU)の概念を示す。 少なくとも1つの実施形態による、対応するテンプレートを用いた局所照明補償LICパラメータプロセスの導出を示す。 同じピクチャ内に漸進的な照明変動を生成する光源を有する例示的なビデオゲームピクチャを示す。 少なくとも1つの実施形態の汎用態様による一般的な符号化方法を示す。 少なくとも1つの実施形態の汎用態様による一般的な復号化方法を示す。 少なくとも1つの実施形態による、インター予測のための上/左隣接ブロックの参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。 空間LICがインターブロックの復号中に適用される第1の実施形態による復号方法を示す。 少なくとも1つの実施形態による、インター予測のための上及び左隣接ブロックの平均参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。 インターブロックについての空間MVP候補の位置を示す。 少なくとも1つの実施形態による、インター予測のための右上隣接ブロックの参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。 MVP候補に基づいてインターブロックの復号中に空間LICが適用される第2の実施形態による復号方法を示す。 VVCにおけるイントラ予測方向を示す。 少なくとも1つの実施形態による、イントラ予測のための上/左/右上/左下/左上隣接ブロックの参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。 VVCにおける行列重み付けイントラ予測プロセスを示す。 イントラブロックの復号中に空間LICが適用される第3の実施形態による復号方法を示す。 少なくとも1つの実施形態による、イントラ予測のための左隣接ブロックの左境界を含む参照テンプレートと、イントラ予測のための上隣接ブロックの上境界を含む参照テンプレートとを用いた空間LICパラメータの導出プロセスを示す。 少なくとも1つの実施形態による、空間的隣接ブロックの複数のライン参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。 少なくとも1つの実施形態による、空間的隣接ブロックの複数のライン参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。 少なくとも1つの実施形態による、空間的隣接ブロックを含む参照テンプレートを用いた空間LICパラメータの導出プロセスを示す。 VVCにおけるIBC予測を示す。 少なくとも1つの実施形態による、IBC予測のためのブロックベクトルによって示される参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。 IBCブロックの復号中に空間LICが適用される第4の実施形態による復号方法を示す。 実施形態の様々な態様が実装され得る、ビデオエンコーダの一実施形態のブロック図を示す。 実施形態の様々な態様が実装され得る、ビデオデコーダの一実施形態のブロック図を示す。 実施形態の様々な態様が実装され得る、例示的な装置のブロック図を示す。
図面及び説明は、本原理の明確な理解に関連する要素を例解するために簡略化されており、明確化の目的で、典型的な符号化及び/又は復号化デバイス内に見られる多くの他の要素を除外することを理解されたい。本明細書では、第1及び第2などの用語が様々な要素を説明するために使用され得るが、これらの要素はこれらの用語によって限定されるべきではないことが理解されよう。これらの用語は、ある要素を別の要素と区別するためにのみ使用される。
様々な実施形態が、画像の符号化/復号化に関して説明される。それらは、スライス若しくはタイル、タイルグループ、又は画像のシーケンス全体など、画像の一部を符号化/復号化するために適用され得る。
様々な方法が上で説明されており、本方法の各々は、説明された方法を達成するための1つ以上のステップ又はアクションを含む。ステップ又はアクションの特定の順序が方法の適切な動作のために必要とされない限り、特定のステップ及び/又はアクションの順序及び/又は使用は、修正又は組み合わされ得る。
少なくともいくつかの実施形態は、ビデオを符号化又は復号化するための方法に関し、空間LICは、同じピクチャ内の漸進的な照明を補償することを可能にする。
図1は、圧縮VVCピクチャを表すためのコーディングツリーユニット(CTU)及びコーディングユニット(CU)の概念を示す。VVCでは、ピクチャは、いわゆるコーディングツリーユニット(CTU)に分割され、各CTUは、1つ以上のコーディングユニット(CU)によって表される。CUごとに、空間予測(又は「イントラ予測」)及び/又は時間予測(「インター予測」又は「動き補償予測」とも呼ばれる)が実行される。空間予測は、現在のビデオブロックを予測するために、同じビデオピクチャ/スライス内のすでに符号化された隣接ブロック(参照サンプルと呼ばれる)のサンプルからのピクセルを使用する。空間予測は、ビデオ信号に固有の空間冗長性を低減する。時間予測は、現在のビデオブロックを予測するために、すでに符号化されたビデオピクチャからの再構成されたピクセルを使用する。時間予測は、ビデオ信号に固有の時間的冗長性を低減する。所与のビデオブロックの時間予測信号は通常、現在のブロックとその参照ブロックとの間の動きの量及び方向を示す1つ以上の動きベクトルによってシグナリングされる。又、複数の参照ピクチャがサポートされている場合、各ビデオブロックについて、その参照ピクチャインデックスが更に送信される、参照インデックスは、参照ピクチャ内のどの参照ピクチャから時間予測信号が到来するか識別するために使用される。空間及び/又は時間予測の後に、エンコーダ内のモード決定ブロックは、例えばレート歪み最適化方法に基づいて、最良の予測モードを選択する。参照を容易にするために、本文全体を通して「CU」及び「ブロック」という用語を交換可能に使用する。
図2は少なくとも1つの実施形態による、対応するテンプレートを用いた局所照明補償(LIC)パラメータプロセスの導出を示す。時間予測プロセスでは、局所照明補償(LIC)は、時間近傍ピクチャ間に存在し得る局所照明変動の問題に対処するために使用される符号化ツールである。LICツールは線形モデルに基づいており、ここでスケーリング係数α及びオフセットβの少なくとも1つは、現在のブロックの予測サンプルを取得するために参照サンプルに適用される。具体的には、LICツールは、以下の式によって数学的にモデル化される。
P(x,y)=α・P(x+v,y+v)+β (1)
式中P(x,y)は座標(x,y)おける現在のブロックの予測信号であり、P(x+v,y+v)は、動きベクトル(v,v)によって指し示される参照ブロックであり、α及びβは、参照ブロックに適用される対応するスケーリング係数及びオフセットである。
図2において、LICがブロックに適用される場合、最小平均二乗誤差(LMSE)法を用いて、図2に示すように、現在のブロック(すなわち、図2のテンプレートT)の隣接サンプルと、時間参照ピクチャL0参照ピクチャ及びL1参照ピクチャ内のそれらの対応する参照サンプル(T又はT)との間の差を最小化することによって、LICパラメータ(すなわち、α及びβ)の値を導出する。
式中、Nは、LICパラメータを導出するために使用されるテンプレートサンプルの数を表し、T(x,y)は、座標(x,y)における現在のブロックのテンプレートサンプルであり、
は、現在のブロックの動きベクトル
に基づくテンプレートサンプルの対応する参照サンプルである。(L0又はL1のいずれか)更に、計算複雑性を低減するために、テンプレートサンプルと参照テンプレートサンプルの両方をサブサンプリング(2:1サブサンプリング)してLICパラメータを導出する、すなわち、図2の網掛けサンプルのみを使用してα及びβを導出する。
更に、LICが双方向ブロックに適用される(すなわち、2つの時間予測ブロックによって予測される)とき、LICパラメータは、各予測方向、すなわち、L0及びL1について別々に導出され、適用される。図2に示すように、2つの動きベクトルMV0及びMV1に基づいて、2つの参照テンプレートT0及びT1を得ることができる。T0とTとの間、及びT1とTとの間の歪みを別々に最小化することによって、2つの方向におけるLICパラメータの対応するペアを、式(2)及び(3)に従って導出することができる。その後、現在のブロックの最終的な双方向予測信号は、以下のように示されるように、2つのLIC単予測ブロックを組み合わせることによって生成される。
式中α及びβ並びにα及びβは、現在のブロックの動きベクトルL0及びL1にそれぞれ関連付けられたLICパラメータであり(すなわち
はそれぞれ、リストL0及びL1からの現在のブロックの対応する時間参照ブロックである。
インターブロックがマージモードで予測されるとき、LICフラグは、MV及び参照インデックスに加えて動き情報の一部として含まれる。マージ候補リストが構成されるとき、LICフラグはマージ候補のための隣接ブロックから継承される。そうでない場合、LICフラグは、単一のコンテキストを用いてコンテキスト符号化され、LICツールが適用可能でないとき、LICフラグはシグナリングされない。
しかしながら、同じピクチャ内にいくらかの漸進的な照明変動を含むいくつかのビデオコンテンツの符号化効率を高めることが望ましい。そのような状況は、典型的には、何らかの照明源がピクチャ内の何らかの場所に位置し、光がピクチャにわたって漸進的に伝搬する、何らかのゲームビデオコンテンツ又はコンピュータグラフィック画像において起こり得る。図3は、ピクチャ内に漸進的な照明変動を生成する光源を有する例示的なビデオゲームピクチャを示す。そのような場合、符号化すべきブロックは、空間ロケーションに従って漸進的に発展するルーマ値をもついくつかのバックグラウンドコンテンツと、フォアグラウンド情報と見なされ得るいくつかの局所特定テクスチャ要素とを含み得る。同じピクチャ内のそのような漸進的照明変動は、自然画像においても起こり得、本原理は、任意のタイプのビデオコンテンツと互換性がある。
上述したように、LICは、動き補償段階における異なるピクチャ間の照明変動に対処することによって、通常の動き補償予測の1つの拡張と見なすことができる。従来技術のLICは、異なるピクチャ間の照明不一致を補償することができるが、同じピクチャ内の異なるブロック間の照明補償に適用も適合もされていない。
これは、本明細書で説明される汎用態様によって解決及び対処され、これらの態様は、ピクチャ内で復号されている又は復号されている現在のブロックについて、空間的に隣接する再構成されたサンプル及び少なくとも1つの空間参照ブロックの対応する空間的に隣接する再構成されたサンプルに基づいて局所照明補償のためのパラメータを決定することを対象とし、少なくとも1つの空間参照ブロックは、ピクチャ内の現在のブロックの空間的隣接ブロックである。したがって、ピクチャ内の1つの符号化ブロック及びその空間的隣接ブロックが伝搬照明変動を有すると仮定すると、ブロックの予測信号を生成した後、本原理は、予測を強化するために空間LICを適用することを提案する。参照ブロックは時間参照ピクチャ内に位置せず、代わりに同じピクチャ内に配置されるので、参照ブロック探索と空間LICパラメータ推定に使用されるテンプレートの両方が調整される。更に、空間LICの使用を示す空間LICフラグの決定も定義することができる。更に、異なるブロックが同じピクチャ内で漸進的に伝搬する空間照明変動を有する、インター/イントラ/IBC予測のための空間局所照明補償(空間LIC)の様々な実施形態が開示される。更に、局所照明補償(空間/時間LIC)において使用されるテンプレートの形状の様々な実施形態も開示される。
図4は、少なくとも1つの実施形態の汎用態様による一般的な符号化方法(100)を示す。図4のブロック図は、例えば、図23の例示的エンコーダにおいて実装される、エンコーダ又は符号化方法のモジュールを部分的に表す。
一般的な実施形態によれば、符号化方法100が開示される。本方法は、ピクチャ内で符号化されている現在のブロックについて、空間的に隣接する再構成されたサンプルと、少なくとも1つの空間参照ブロックの対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定するステップ11を含む。有利には、空間参照ブロックは、以下の様々な実施形態で説明されるように、ピクチャ内の現在のブロックの空間的隣接ブロックである。したがって、局所照明補償のために決定されたパラメータは、空間LICを実行することを可能にする。空間LICは、ピクチャ内の漸進的照明を補償するために現在のブロックの予測に適用され、ブロックの補償された予測をもたらす。異なる実施形態によれば、予測は、インター予測、イントラ予測又はイントラブロックコピー(IBC)予測のうちの1つである。別の実施形態によれば、空間局所照明補償が現在のブロックに適用されるか否かを示すシンタックス要素が決定される。現在のブロックの予測の空間的補償の後、残差は、例えば、現在のブロックから補償された予測を減算することによって通常の方法で計算され、次いで、残りの処理(変換、量子化、CABAC符号化など)が、一般的な符号化ステップ12において、最先端の符号化方法におけるように実行される。
図5は、少なくとも1つの実施形態の汎用態様による一般的な復号化方法(200)を示す。図5のブロック図は、例えば、図24の例示的なデコーダにおいて実装されるデコーダ又は復号方法のモジュールを部分的に表す。
一般的な実施形態によれば、復号化方法200が開示される。本方法は、ピクチャ内で復号されている現在のブロックについて、空間的に隣接する再構成されたサンプルと、少なくとも1つの空間参照ブロックの対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定するステップ21を含む。符号化に関して、空間参照ブロックは、以下の様々な実施形態で説明されるように、ピクチャ内の現在のブロックの空間的隣接ブロックである。異なる実施形態によれば、空間LICは、専用フラグを使用して現在のブロックに対して有効/無効にされ、空間LICは、現在のブロックのインター予測、イントラ予測、又はIBC予測のうちの1つに適用される。次いで、復号化22は、例えば、CABAC復号化、変換係数の逆量子化、次いで復号化された係数の逆変換を実行することによって残差値を復号化することと、そのように復号化された残差値を補償された予測に加算して現在のブロックを復号化することとを更に含む。
符号化方法又は復号方法において使用される一般的な空間LICの様々な実施形態が、以下で説明される。様々な実施形態によれば、ブロック(又はCU)レベル空間LICフラグは、空間LICがブロックに適用されるか否かを示すために、インター/イントラ/IBCブロックに対して定義される。空間LICがインター/イントラ/IBCブロックに適用される場合、別の特定の実施形態によれば、空間照明変動の線形モデルは、スケーリング係数を使用して定義されるα及びオフセットβを使用して定義される。空間LICパラメータの推定は、現在のブロック(現在のテンプレート)の隣接する再構成されたサンプルと、同じピクチャ内の空間参照ブロック(参照テンプレート)の対応する隣接する再構成されたサンプルとの間の差を最小化することによって導出される。以下で説明される様々な実施形態は、CUレベル空間LICフラグの導出に関する。-空間LICパラメータ推定のための参照ブロックとして使用される空間的隣接ブロックの選択、隣接する再構成されたサンプルによって構成され、空間LICパラメータ推定のために使用されるテンプレートの生成。
以下では、インター予測における空間LICについて、その空間LIC導出、参照ブロック決定、及び空間LICパラメータ推定に使用されるテンプレートの生成が説明される。次に、イントラ予測における空間LICに関して、参照ブロック決定及びテンプレート生成、特にインター予測における空間LICと比較した差異についても説明する。その後、IBC予測における空間LICについて、参照ブロック決定も説明される。最後に、インター/インター予測のための空間参照ブロック探索が提案される。
第1の実施形態によれば、空間LICは、インターブロックの符号化/復号中に適用される。図6は、少なくとも1つの実施形態による、インター予測のための上/左隣接ブロックの参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。
上記で説明した従来技術のLICツールによれば、LICは、インター予測における異なるフレーム間の時間的照明変動を補償するために適用され、以下では時間LICと呼ばれる。同じフレーム内のいくつかの空間ブロック間にいくらかの伝搬照明変動が存在し得る場合、空間LICは、インター予測において同じフレーム内の空間照明変動を更に補償するために提案される。
変形実施形態によれば、空間LICフラグspatial_lic_flagは、空間LICが適用されるか否かを示すように定義される。インターブロックがマージモードで符号化されるとき、空間LICフラグは、マージモードにおける動き情報コピーと同様の方法で、隣接ブロックからコピーされ、そうでない場合、空間LICフラグは、ブロックについてシグナリングされる。
別の変形形態によれば、空間LICがCUに適用されるとき、それは又、スケーリング係数を使用して、空間照明変動の線形モデルに基づくα及びオフセットβを使用して定義される。空間LICパラメータの推定は、現在のブロック(すなわち、図6のテンプレートT)の隣接する再構成されたサンプルと、同じピクチャ内の空間参照ブロックの対応する隣接する再構成されたサンプルとの間の差を最小化することによって導出される。
図6では、現在のブロックの上/左空間的隣接ブロックが参照ブロックとして使用され、上/左ブロックの隣接する再構成されたサンプル(すなわち、図6のT又はTのいずれか)が、空間LICパラメータを推定するために使用される。現在のブロックの上記空間的隣接ブロックが利用可能である場合、上記空間LICパラメータ(α及びβ)は、以下のようにLMSEベースのLIC導出を用いて推定される。
式中、Nは、空間LICパラメータを導出するために使用されるテンプレートサンプルの数を表し、T(x,y)は、座標(x,y)における現在のブロックのテンプレートサンプルであり、T(x,y-h)は、現在のブロックの上隣接ブロックに基づくテンプレートサンプルの対応する再構成されたサンプルでh(上のブロックの高さ)である。更に、計算複雑性を低減するために、図6の網掛けサンプルのみが、α及びβを導出するために使用される。
左空間LICパラメータ(α及びβ)についての同様の推定プロセスは、現在のブロックの左空間的隣接ブロックが利用可能である場合、以下のように導出される。
式中、T(x-w,y)は、現在のブロックの左隣接ブロック(wは左ブロックの幅)に基づくテンプレートサンプルの対応する再構成されたサンプルである。図6の網掛けサンプルのみを使用して、α及びβを導出し、計算複雑性を低減する。
上又は左空間的隣接ブロックのみが利用可能である場合、上の空間LICパラメータα及びβ)、又は左のLICパラメータ(α及びβ)が通常の動き補償予測サンプルに適用されて、現在のブロックの最終予測サンプルが取得される。
P(x,y)=αA/L・P(x+v,y+v)+βA/L.(9)
上及び左空間的隣接ブロックの両方が利用可能である場合、上及び左空間LICパラメータは、T及びT及びT及びT間の歪みを別々に最小化することによって導出され、その後、現在のブロックの最終予測サンプルは、最終空間LICパラメータを適用することによって生成され、最終空間LICパラメータは、以下に示されるように、上及び左空間LICパラメータを平均化することによって取得される。
図7は、第1の実施形態による復号方法を示し、空間LICは、例えば、上/左隣接ブロックを使用して、インターブロックの復号中に適用される。アルゴリズムへの入力は、現在のインターピクチャにおいて復号すべき現在のCUである。現在の空間的隣接ブロックの上又は左空間的隣接ブロックが利用可能である場合(ステップ1040)、それは、現在のCUにおける提案された空間LICプロセスの使用を示す空間LICフラグspatial_lic_flagを解析することにある。マージモードの場合、マージモードにおける従来技術のLICと同様の方法で、spatial_lic_flagが隣接ブロックから推測される(ステップ1051)。AMVPモードの場合、spatial_lic_flagがビットストリームから復号される(ステップ1052)。
spatial_lic_flagが偽である場合、例えば、VVC復号プロセスによって指定されるような通常の動き補償復号プロセスのみが関与する。spatial_lic_flagが真である場合、次のステップ1070は、利用可能な上/左空間的隣接ブロックを用いた空間LICパラメータの推定からなる。上及び左空間的隣接ブロックの両方が利用可能である場合(ステップ1080)、ステップ1090において、上及び左の空間LICパラメータを平均化することによって、最終的な空間LICパラメータが取得される。その後、ステップ1100に示すように、通常の動き補償予測サンプルに空間LICパラメータを適用することによって、現在のブロックの最終予測サンプルが生成される。
この実施形態の変形によれば、現在のブロックの最終予測サンプルを取得するために、通常の動き補償予測サンプルに対して上又は左の空間LICパラメータのみが適用され、どの空間参照ブロックを使用するかの決定は、例えば、レート歪み(RD)又は差分絶対値和(SAD)チェックを介して行われる。どの空間参照ブロック及び対応する空間LICパラメータセットが適用されるかを示すためのフラグlic_refblk_flagが、ビットストリームにシグナリングされる。lic_refblk_flagが0に等しいとき、左空間LICパラメータが適用される。そうでない場合、上記の空間LICパラメータが適用される。
前述のように、上及び左空間的隣接ブロックの両方が利用可能であるとき、上及び左空間LICパラメータは、別々に導出される。次いで、上及び左空間LICパラメータは、最終空間LICパラメータを生成するために平均化され、現在のブロックの最終予測サンプルを取得するために適用される。そのような方法がLMSEベースの空間LIC導出を2回実行する必要があるとすると、それは、エンコーダ及びデコーダの両方において無視できない複雑性の増加をもたらす。
この実施形態の別の変形によれば、提案される空間LIC導出の複雑性を低減するために、1つの改善された空間LICアルゴリズムが、上及び左空間的隣接ブロックの両方が利用可能である場合に対して提案される。図8は、少なくとも1つの実施形態による、インター予測のための上及び左隣接ブロックの平均参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。具体的には、上及び左の空間LICパラメータを別々に導出する代わりに、参照テンプレートTaveは最初に、上のブロックT及び左のブロックT内の2つのテンプレートの再構成されたサンプルを平均化することによって生成される。
その後、LMSEベースの導出が、スケーリングファクタの値を計算するために使用されるα及びオフセットβ参照テンプレートTaveと現在のブロックのテンプレートTとの間の差を最小化することによって空間LICのために使用される。
最後に、導出された空間LICパラメータは、図8に示される線形モデルに基づいて現在のブロックの最終予測サンプルを取得するために、通常の動き補償予測サンプルに適用される。
したがって、この変形形態では、現在のブロックの最終予測サンプルを形成するために、1つの空間LICパラメータ推定のみが実行される必要がある。
第2の実施形態によれば、動きベクトル予測(MVP)候補は、インター予測における参照ブロックとして使用される。図9は、VVCにおける空間MVP候補の位置を示す。インター予測の場合、MVは、マージモード又はAMVPモードのいずれかでシグナリングされ得る。両方のシグナリング機構は、基本的に、現在符号化されているブロックの空間的又は時間的隣接ブロックから利用可能な動き情報から構築された動きベクトル予測(MVP)リストを利用する。空間MVP候補の位置が図9に示されている。導出の順序は、B0(上)、A0(左)、B1(右上)、A1(左下)及びB2(左上)である。前に説明したように、参照ブロックとして現在のブロックの上(B0)及び左(A0)空間的隣接ブロックのみを使用するのではなく、MVPリスト構成のための他の空間的隣接ブロックも、空間LICのための参照ブロック候補と見なされる。空間LICが現在のブロックに適用される場合、5つの空間候補のうちの1つが最良のMVP候補として選択されると、空間LICパラメータは、対応する選択された空間的隣接ブロックを用いて自動的に導出される。
図10は、少なくとも1つの実施形態による、インター予測のための右上(B1)隣接ブロックの参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。現在のブロックの右上(B1)空間的隣接ブロックが選択される場合、それは、図10に示されるように、空間LICのための参照ブロックとして使用される。右上ブロックの隣接する再構成されたサンプル(TAR(図10)は、空間LICパラメータを推定するために使用される。右上の空間LICパラメータ(αAR及びβAR)は、以下のようにLMSEベースのLIC導出を用いて推定される。
式中TAR(x+wAR,y-hAR)は、右上隣接ブロックに基づくテンプレートサンプルの対応する再構成されたサンプルである(hAR及びwARは右上ブロックの高さと幅)。同様の空間LICパラメータ導出プロセスは、左下(A1)及び左上(B2)空間的隣接ブロックについて、それらが選択された場合に実行され得る。
図11は、MVP候補に基づいてインターブロックの復号中に空間LICが適用される第2の実施形態による復号方法を示す。MVPが5つの空間MVP候補のうちの1つである場合(ステップ2050)、本方法は、現在のCUにおける提案された空間LICプロセスの使用を示す空間LICフラグspatial_lic_flagを解析することを含む。マージモードの場合、マージモードにおける従来技術のLICと同様の方法で、spatial_lic_flagが隣接ブロックから推測される(ステップ2061)。AMVPモードの場合、spatial_lic_flagがビットストリームから復号される(ステップ2062)。
spatial_lic_flagが偽である場合、通常の動き補償復号化プロセスのみが含まれる。spatial_lic_flagが真である場合、次のステップ2080は、対応する選択された空間的隣接ブロックを用いて空間LICパラメータを推定することを含む。その後、ステップ2090に示すように、通常の動き補償予測サンプルに空間LICパラメータを適用することによって、現在のブロックの最終予測サンプルが生成される。
この実施形態の更に別の変形形態によれば、空間LICが現在のブロックに適用される場合、5つの空間候補のうちの1つのみが最良のMVP候補として選択されるのではなく、これらの5つの空間的隣接ブロックからの空間LICパラメータが、現在のブロックの最終予測サンプルを取得するために適用される。どの空間参照ブロックセットを使用するかの決定は、レート歪み(RD)又は差分絶対値和(SAD)チェックを介して行われ得る。どの空間参照ブロック及び対応する空間LICパラメータセットが適用されるかを示すインデックスlic_refblk_indexが、ビットストリームにシグナリングされる。
第3の実施形態によれば、空間LICは、イントラブロックの符号化/復号中に適用される。インター予測について上述したように、空間LICは、同じフレーム内の空間照明変動を補償するために提案される。照明変動は、イントラ符号化フレームにわたって漸進的に伝搬することができるが、符号化/復号化するイントラブロックは、これらの漸進的に伝搬する空間照明変動を含むこともできる。
VVCによって指定されるように、平面予測モード及びDCイントラ予測モードは、平滑領域及び漸進的に変化する領域を予測するために使用され、角度予測モードは、異なる方向構造を捕捉するために使用される。しかしながら、DC及び平面イントラ予測モードであっても、滑らかで漸進的に変化するコンテンツを対象としており、指向性があり漸進的に伝搬する照明変動を有するいくつかのコンテンツを適切に扱うことができず、他の方向性イントラ予測モードに対する同様の制限がある。したがって、第3の実施形態は、イントラ予測のための空間照明変動を補償するために空間LICを適用することを提案する。
インターブロックについて前に説明したように、空間LICフラグspatial_lic_flagが定義され、空間LICが適用されるか否かを示すためにイントラブロックについてシグナリングされる。空間LICが適用されるとき、それは又、スケーリング係数を使用して、空間照明変動の線形モデルに基づくα及びオフセットβ。空間LICパラメータの推定は又、現在のブロックの隣接する再構成されたサンプルと、ピクチャ内の空間参照ブロックの対応する隣接する再構成されたサンプルとの間の差を最小化することによって導出される。
可能な空間参照ブロックを選択することに関して、インター予測のための空間LICとイントラ予測のための空間LICとの間にいくつかの違いがある。例えば、空間LICパラメータを推定するために使用される空間的隣接ブロックは、イントラ予測モードに基づいて決定される。更に、上境界及び左境界の両方を考慮するのではなく、テンプレートを構成するために上境界又は左境界のみが使用され、次いで、テンプレートは、空間LICパラメータを推定するために使用される。その上、更に別の変形形態によれば、テンプレートは、隣接する第1の上/左のライン中の再構成されたサンプルだけでなく、例えば、第2の/第3の上/左のライン中の再構成されたサンプル、若しくはそれ以上の上/左のライン中の再構成されたサンプル、又は再構成された隣接ブロック全体によって生成される。別の変形形態によれば、イントラ予測のための提案された空間LICは、いくつかのイントラ予測モード(すなわち、DC及び平面モード)に対してのみアクティブ化される。
第3の実施形態の変形形態によれば、空間LICは、イントラ予測モードに基づいてイントラブロックの符号化/復号中に適用される。イントラ予測のための空間LICパラメータは、最も近い再構成された空間的隣接ブロック(すなわち、図9における上/左/右上/左下/左上)の隣接する再構成されたサンプルを使用して、LMSEベースのLIC導出を用いて推定される。非限定的な例によれば、どの空間的隣接ブロックを使用するかの決定は、レート歪み(RD)チェック又は差分絶対値和(SAD)チェックを介して行われる。どの空間参照ブロック及び対応する空間LICパラメータセットが適用されるかを示すためのインデックスlic_refblk_indexが、ビットストリーム中にシグナリングされる。
図12は、VVCにおけるイントラ予測方向を示す。VVCは、-14~-1及び2~80にインデックス付けされた95個の方向予測モードをサポートする。正方形CUの場合、予測モード2~66のみが使用される。これらの予測モードは、時計方向に45度~-135度の異なる予測方向に対応する。矩形ブロックの場合、広角モード(-14から-1又は67から80)を適用することができる。いくつかの平坦なブロック(W>H)及び背の高いブロック(W<H)について、それらは、広角モードを使用して、反対方向の等しい数の規則的な角度モードを置換する。変形形態によれば、どの空間的隣接ブロックが追加シンタックス要素と共に適用されるかを示すのではなく、イントラ予測のための空間LICにおける参照ブロックは、イントラ予測モード(IPM)に基づいて決定され得る。図13は、第3の実施形態によるイントラ予測のための上/左/右上/左下/左上隣接ブロックの参照テンプレートを用いた空間LICパラメータプロセスの導出を示し、空間参照ブロックは、現在のブロックを符号化するために使用されるイントラ予測モードに応答する。したがって、
-非角度モードに対して、平面(IPMが0に等しい)及びDC(IPMが1に等しい)、上及び左ブロックの隣接する再構成されたサンプルT及びT図13における)は、空間LICパラメータを推定するために使用される。
-水平モード(IPMが18である)及び他の30個のモードが水平方向に属する場合(IPM 3~33)、左ブロックのみが参照ブロック及びその隣接する再構成されたサンプルとして使用されるT図13においては、空間LICパラメータ推定のために使用される。一方、垂直モードIPMが50である)及び他の30個のモードが垂直方向に属する(IPM 35~65)場合、図13の上のブロックTの隣接する再構成されたサンプルのみが、空間LICパラメータ推定に使用される。
-45度の倍数である角度を表す対角モードについて、
○45°モード(IPMは2である)、左下のブロックの隣接する再構成されたサンプル(図13のTBL)は、空間LICパラメータ推定に使用される。
○-45°モード(IPMは34である)、左上ブロックの隣接する再構成されたサンプル(図13のTAL)が使用される。
○-135°モード(IPMは66である)、右上ブロックの隣接する再構成されたサンプル(図13のT_AR)が使用される。
-左下方向を超える広角モード(IPM-1からIPM-14)の場合、左下ブロックが参照ブロックとして使用され、その隣接する再構成されたサンプルが使用されるTBL図13参照は空間LICパラメータ推定に使用される。一方、右上方向を超える広角モードについてはIPM 67~80)、右上ブロック(図13におけるT_AR)の隣接する再構成されたサンプルが、空間LICパラメータ推定のために使用される。
空間LICパラメータを推定するために使用されるテンプレートは、表1に示されるようにイントラ予測モードIPMに関する。
第3の実施形態の別の変形形態によれば、イントラ予測モードは、行列重み付けイントラ予測である。図14は、VVCにおける行列重み付けイントラ予測プロセスを示す。従来のイントラ予測に加えて、行列重み付けイントラ予測(MIP)方法は、VVCに新たに追加されたイントラ予測技術である。幅W及び高さHの矩形ブロックのサンプルを予測するために、MIPは、ブロックの左のH個の再構成された隣接境界サンプルの1つのラインと、ブロックの上のW個の再構成された隣接境界サンプルの1つのラインとを、これらの再構成されたサンプルが利用可能である場合に入力として取る。予測信号の生成は、図14に示すように、平均化、行列ベクトル乗算、及び線形補間の3つのステップに基づく。イントラモードの各CUに対して、MIPモードが適用されるか否かを示すフラグmip_flagが送信される。
空間LICが、MIPを伴うこのイントラ符号化されたCUに適用される場合、空間LICパラメータを推定するために使用されるテンプレートは、非角度モードを伴うCUと同じであり、上及び左のブロック(図13のT及びT)の両方の隣接する再構成されたサンプルが使用される。
図15は、イントラブロックの復号中に空間LICが適用される第3の実施形態による復号方法を示す。インター予測のための空間LICと同様に、それは、ビットストリームから復号される空間LICフラグspatial_lic_flagを解析することを含む(ステップ3303/3313)。spatial_lic_flagが偽である場合、通常のイントラ予測復号プロセスのみが関与する。spatial_lic_flagが真である場合、提案される空間LICプロセスは、以下のステップを用いて、現在のCUの復号されたイントラ予測に対して実行される。
このブロックがMIPを用いてイントラ予測される場合(ステップ3300)、空間上及び左隣接ブロックを用いた空間LICパラメータの推定が実行される(ステップ3314)。このブロックが従来のイントラ予測でイントラ予測される場合、空間LICパラメータに対するテンプレート決定は、イントラ予測モードIPMに基づく(ステップ3304)。次いで、次のステップ3305は、対応する選択されたテンプレートを用いた空間LICパラメータの推定からなる。
その後、ステップ3306/3315に示すように、空間LICパラメータを正規イントラ予測サンプルに適用することによって、現在のブロックの最終予測サンプルが生成される。
この実施形態の変形形態によれば、DCモード及び平面モードの場合、現在のブロックの上及び左空間的隣接ブロックのみを参照ブロックとして使用するのではなく、左下、左上、及び右上からの他の3つのテンプレートも、空間LICパラメータのために一緒に使用することができる。
この実施形態の別の変形形態によれば、イントラ予測モードが水平/垂直方向に属するとき、5つの空間テンプレートのうちの1つのみが空間LICパラメータを推定するためのテンプレートとして選択されるのではなく、2つ又は3つのテンプレートが、空間LICパラメータを計算するために一緒に使用され得る。例えば、水平方向に属するモード(IPM 3~33)については、左、左下、及び左上のブロックを参照ブロックとして使用することができ、その隣接する再構成されたサンプル(T,TBL及びTAL図13において)が空間LICパラメータ推定のために使用される。垂直方向に属するモード(IPM 35~65)に関しては、空間LICパラメータ推定のための参照テンプレートとして、上、右上、及び左上のテンプレート(図13のT,TAR及びTAL)を使用することができる。これらのテンプレートは、DCモード及び平面モードのための左テンプレート及び上テンプレートと同様の挙動で協働している。
第3の実施形態の更なる変形によれば、空間LICパラメータを推定するために使用されるテンプレートのためのいくつかの形状が開示される。前述のように、空間LICパラメータを推定するために使用されるテンプレートは、現在/参照ブロックの周囲で常にL字形であり、それは、現在/参照ブロックの左境界及び上境界に位置する隣接する再構成されたサンプルによって構成される。この固定されたL字型テンプレートを使用するのではなく、いくつかのより柔軟なテンプレート生成がこのセクションで提案される。
第1の変形形態によれば、空間参照ブロックの左又は上の境界のみがテンプレートとして使用される。第3の実施形態の前の変形形態によれば、参照テンプレートの選択は、いくつかの状況下で左及び上の参照サンプルからの照明変動の異なる影響を強化するためにイントラ予測モードIPMから導出される。
水平方向に属するモード(IPM 3~33)については、空間LICパラメータ推定のために左参照テンプレートT図13参照が使用される。垂直方向に属するモードIPM 35~65)に関しては、図13の参照テンプレートTの上が考慮される。左又は上のいずれかの参照テンプレートに対して、それは左及び上の境界に位置する両方の再構成されたサンプルを含む。照明変動の伝搬をより良好に捕捉するために、又、空間LICパラメータ推定の計算複雑性を低減するために、1つの境界に位置する再構成されたサンプルのみが、テンプレートを構成するために使用される。
図16は、少なくとも1つの実施形態による、イントラ予測のための左隣接ブロックの左境界を含む参照テンプレートと、イントラ予測のための上隣接ブロックの上境界を含む参照テンプレートとを用いた空間LICパラメータプロセスの導出を示す。例えば、水平指向性モード(IPM 3~33)の場合、左境界に位置する再構成されたサンプルのみを使用して、現在のブロックのテンプレートT図16の左及び参照ブロックのテンプレートT’図16の左)を生成する。垂直方向モード(IPM 35~65)に関しては、上の境界のみを考慮して、現在のブロックのテンプレート(図16の右側のT)及び参照ブロックのテンプレート)と(図16の右のT’)を生成する。
第2の変形形態によれば、空間参照ブロックの複数の参照ラインがテンプレートとして使用される。図17は、少なくとも1つの実施形態による、空間的隣接ブロックの複数のライン参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。これまで、提案された空間LICのためのテンプレートは、最も近い参照ライン(上/左境界)に位置する再構成されたサンプルのみを使用する。より良好な捕捉及び照明不一致の補償のために、テンプレートを構成するために複数の参照ラインが使用される。図17に示されているように、2つの参照ラインの例が示されており、1つの追加の左上のラインに位置する隣接する再構成されたサンプルが、現在のブロックのテンプレート(図17のT)及び参照ブロックのテンプレート(図17のT’)を生成するために使用される。計算複雑性を低減するために、2つの参照ライン内のテンプレートサンプルは、両方ともサブサンプリングされる(2:1サブサンプリング)。それは、両方の参照ラインについて同じ位置で(図17の上の例において)、又はインターレース位置で(図17の下の例において)、サブサンプリングされ得る。
別の変形形態によれば、左境界テンプレートが水平方向モードに適用され、上境界テンプレートが垂直方向モードに使用される。計算複雑性は、テンプレート内のサンプルが少ないほど低減されるが、照明変動の推定精度も影響を受ける可能性がある。したがって、この実施形態の別の変形形態によれば、左側/上側のみからの複数の参照ラインが水平/垂直方向モードに適用される。図18少なくとも1つの実施形態による、イントラ予測のための空間的隣接ブロックの複数のライン参照テンプレートを用いた空間LICパラメータプロセスの別の導出を示す。ただ1つの空間参照ブロックの同じ側からの2つの参照ラインの例が図18に示されている。イントラ予測モードの場合、左のラインは水平方向モード(図18の上の例)に使用され、右のラインは垂直方向モード(図18の下の例)に使用される。
別の変形形態によれば、テンプレートを構成するために複数の参照ラインが適用されるかどうかを示すフラグlic_mrl_flagが、ビットストリームにシグナリングされる。lic_mrl_flagが偽である場合、従来の最も近い参照ライン(上/左境界)のみが、テンプレートを生成するために適用される。
別の変形形態によれば、複数の参照ラインを有するテンプレートは、インター予測のための空間LICパラメータ推定において適用される。実際に、複数ライン参照テンプレートの異なる態様が、イントラ予測において適用される空間LICについて説明される。しかしながら、これは、説明を明確にすることを目的としており、それらの態様の適用又は範囲をイントラ予測にも空間LICにも限定するものではない。実際に、インター予測のための空間LICパラメータ推定において適用される複数の参照ラインを有するテンプレートを提供するために、異なる態様のいずれかが組み合わされ、交換されることが可能であり、又は、複数の参照ラインを有するテンプレートが、インター予測のための従来技術のLICパラメータ推定において適用される。
別の変形形態によれば、テンプレートは、再構成された隣接ブロック全体を含む。図19少なくとも1つの実施形態による、空間的隣接ブロックを含む参照テンプレートを用いた空間LICパラメータプロセスの導出を示す。照明変動の推定精度を更に改善するために、計算複雑性も考慮することなく、テンプレートは、利用可能であるので、隣接ブロックの全ての再構成されたサンプルを使用することによって生成される。一例として、現在のブロックの再構成された左及び上隣接ブロックのうちのいずれかが、現在のブロックのテンプレートを生成するために使用される(図19のT)又は、参照ブロックの再構成された左及び上の隣接ブロックのいずれかは、リフェンスブロックのテンプレートを構成する(図19のT’)。
変形形態によれば、小さいブロック(ブロックサイズ≦8×8)についてのみ、テンプレートは、再構成された隣接ブロックを使用して生成される。有利には、この特徴は、図19の変形形態の複雑性を低減することを可能にする。
別の変形形態によれば、再構成された隣接ブロックをテンプレートとして使用することは、インター予測のための空間LICパラメータ推定において、又はインター予測のための従来技術のLICパラメータ推定において適用される。
第4の実施形態によれば、空間LICは、IBCブロックの符号化/復号中に適用される。図20は、VVCにおけるIBC予測を示す。イントラブロックコピー(IBC)は、VVCにおいて実装されるスクリーンコンテンツコーディング(SCC)ツールである。IBC予測の場合、(図20に示すように)各CUについて最適なブロックベクトル(又は動きベクトル)を見つけるために、エンコーダにおいてブロックマッチング(BM)が実行される。ここで、ブロックベクトルは、現在のブロックから、現在のピクチャ内ですでに再構成されている参照ブロックへの変位を示すために使用される。IBC符号化されたCUは、イントラ予測モード又はインター予測モード以外の第3の予測モードとして扱われる。IBCは、スクリーンコンテンツ素材(ゲームビデオコンテンツを含む)の符号化効率を著しく改善することがよく知られている。したがって、第4の実施形態は、IBC予測のための空間照明変動を補償するために空間LICを適用することに関する。
上記で説明したインター/イントラ予測のための空間LICと比較して、IBC予測のための空間LIC推定のために使用される空間参照ブロックは、イントラコピー(すなわち、図21のテンプレートTIBC)のために使用されるものと同じ参照ブロックである。この場合、IBC(αIBC及びβIBC)に対する空間LICパラメータの推定プロセスは、以下のように導出される。
式中TIBC(x-bv,y-bv)は、現在のブロックのブロックベクトルに基づくテンプレートサンプルの対応する参照サンプルである(bv,bv)。
図22は、IBCブロックの復号中に空間LICが適用される第4の基本的な実施形態による復号プロセスを示す。アルゴリズムへの入力は、現在のイントラピクチャにおいて復号すべき現在のIBC CUである。それは、現在のCUにおける提案された空間LICプロセスの使用を示す空間LICフラグspatial_lic_flagを解析することにある(ステップ4030)。spatial_lic_flagが偽である場合、通常のIBC予測復号プロセスのみが関与する。spatial_lic_flagが真である場合、現在のブロックのブロックベクトル(bv,bv)で示す空間参照ブロックが、空間LICパラメータの推定のために使用される(ステップ4050)。その後、ステップ4060に示すように、IBC予測サンプルに空間LICパラメータを適用することによって、現在のブロックの最終予測サンプルが生成される。
第5の実施形態によれば、空間参照ブロックは、イントラ予測及びインター予測のために空間LICにおいて探索される。前述のように、イントラ/インター予測のための空間LICパラメータは、最も近い再構成された空間的隣接ブロック(例示的な図13に示されるように、上/左/右上/左下/左上)を使用して推定される。更に別の変形形態によれば、事前定義された探索領域内にある間のいくつかの非最近傍空間的隣接ブロックは、イントラ/インター予測のための空間LICパラメータ推定のための参照ブロックと見なされる。この場合、現在のブロックから空間参照ブロックへの変位を示すための空間LIC探索ベクトルが、ビットストリーム中にシグナリングされる。
更なる実施形態及び情報
本出願では、ツール、特徴、実施形態、モデル、手法などを含む様々な態様について説明している。これらの態様のうちの多くは、具体的に説明され、少なくとも個々の特性を示すために、しばしば限定的に聞こえ得るように説明される。しかしながら、これは、説明を明確にすることを目的としており、それらの態様の適用又は範囲を限定するものではない。実際には、異なる態様の全てを組み合わせ、かつ置き換えて、更なる態様を提供することができる。更に、これらの態様は又同様に、以前の出願に記載の態様と組み合わせ、かつ置き換えすることができる。
本出願において説明され、企図される態様は、多くの異なる形態で実装することができる。以下の図23、図24、及び図25は、いくつかの実施形態を提供するが、他の実施形態も企図されており、図23、図24、及び図25の説明は、実装形態の範囲を制限しない。態様のうちの少なくとも1つは、概して、ビデオ符号化及び復号に関し、少なくとも1つの他の態様は、概して、生成又は符号化されたビットストリームを送信することに関する。これら及び別の態様は、方法、装置、説明した方法のいずれかに従ってビデオデータを符号化又は復号するための命令を自体に記憶したコンピュータ可読記憶媒体、及び/又は、説明した方法のいずれかに従って生成されたビットストリームを自体に記憶したコンピュータ可読記憶媒体、として実装することができる。
本出願では、「再構成された(reconstructed)」及び「復号された(decoded)」という用語は、交換可能に使用され得、「ピクセル(pixel)」及び「サンプル(sample)」という用語は、交換可能に使用され得、「画像(image)」、「ピクチャ(picture)」、及び「フレーム(frame)」という用語は、交換可能に使用され得る。
様々な方法が本明細書に説明されており、本方法の各々は、説明された方法を達成するための1つ以上のステップ又はアクションを含む。ステップ又はアクションの特定の順序が方法の適切な動作のために必要とされない限り、特定のステップ及び/又はアクションの順序及び/又は使用は、修正又は組み合わされ得る。加えて、「第1の(first)」、「第2の(second)」などの用語は、様々な実施形態において、例えば、「第1の復号化(first decoding)」及び「第2の復号化(second decoding)」などの要素、コンポーネント、ステップ、動作などを修正するために使用され得る。かかる用語の使用は、具体的に必要とされない限り、修正された動作に対する順序付けを意味するものではない。そのため、この実施例では、第1の復号化は、第2の復号化の前に実行される必要はなく、例えば、第2の復号化の前、第2の復号化の間、又は第2の復号化と重複する時間中に発生し得る。
本出願に説明されている様々な方法及び他の態様を使用して、図23及び図24に示されるようなビデオエンコーダ100及びビデオデコーダ200のモジュール、例えば、イントラ予測モジュール及び/又はインター予測モジュール、エントロピコーディングモジュール、及び/又は復号モジュール(160、170、260、275)を修正することができる。更に、本開示の態様は、VVC又はHEVCに限定されず、例えば、既存のものであれ将来進展するものであれ、他の規格及び勧告、又このようないかなる規格及び勧告(VVC及びHEVCを含む)の拡張にも適用することができる。特に断りのない限り、又は技術上除外されない限り、本出願に記載の態様は、個々に、又は組み合わせて使用することができる。
本出願では、様々な数値、例えば、変換の数、変換レベルの数、変換のインデックスが使用される。具体的な値は、例示目的のためであり、記載の態様は、これらの具体的な値に限定されない。
図23は、エンコーダ100を例示している。このエンコーダ100の変形形態も企図されるが、以下では、分かりやすいように、予想される全ての変形形態を説明せずに、エンコーダ100について説明される。
符号化される前に、ビデオシーケンスは、符号化前処理(101)、例えば、カラー変換を入力カラーピクチャに適用すること(例えば、RGB4:4:4からYCbCr4:2:0への変換)、又は圧縮に対してより弾力的な信号分布を得るために入力ピクチャ成分の再マッピングを実行する(例えば、色成分のうちの1つのヒストグラム等化を使用して)ことを経ることができる。メタデータは、前処理に関連付けられ、ビットストリームに添付され得る。
エンコーダ100では、以下に記載のように、ピクチャは、エンコーダ要素によって符号化される。符号化されるピクチャは、例えば、CUという単位に分割され(102)、処理される。各ユニットは、例えば、イントラモード又はインターモードのいずれかを使用して符号化される。ユニットがイントラモードで符号化されるとき、そのユニットは、イントラ予測(160)を実行する。インターモードでは、動き推定(175)及び動き補償(170)が実行される。エンコーダは、ユニットを符号化するためにイントラモード又はインターモードのうちのどちらを使用すべきかを決定し(105)、例えば、予測モードフラグによってイントラ/インターの決定を示す。予測残差は、例えば、原画像ブロックから予測されたブロックを減算することによって(110)計算される。
その予測残差は、次いで、変換され(125)、量子化される(130)。量子化された変換係数、並びに動きベクトル及び他のシンタックス要素は、ビットストリームを出力するためにエントロピコード化される(145)。エンコーダは、変換をスキップし、量子化を非変換残差信号に直接適用することができる。エンコーダは、変換及び量子化の両方をバイパスすることができ、すなわち、残差は、変換プロセス又は量子化プロセスを適用することなく直接符号化される。
エンコーダは、符号化されたブロックを復号化して、更なる予測のための参照を提供する。量子化された変換係数は、予測残差を復号化するために逆量子化され(140)、逆変換される(150)。復号化された予測残差と予測ブロックとを組み合わせて(155)、画像ブロックが再構成される。ループ内フィルタ(165)は、例えば、符号化アーチファクトを低減するための非ブロック化/サンプル適応オフセット(Sample Adaptive Offset、SAO)フィルタリングを実行するために、再構成されたピクチャに適用される。フィルタリングされた画像は、参照ピクチャバッファ(180)に記憶される。
図24は、ビデオデコーダ200のブロック図を示している。デコーダ200では、以下に説明する通り、ビットストリームが、デコーダ要素によって復号化される。ビデオデコーダ200は、概して、図24に説明したような符号化パスとは逆向きの復号パスを実行する。エンコーダ100も又、概して、ビデオデータを符号化することの一部としてビデオ復号化を実行する。
特に、デコーダの入力は、ビデオビットストリームを含み、これは、ビデオエンコーダ100によって生成され得る。ビットストリームは、最初に、変換係数、動きベクトル、及び他の符号化情報を取得するために、エントロピ復号化される(230)。ピクチャ分割情報は、ピクチャがどのように分割されているかを示す。デコーダは、したがって、復号化されたピクチャ分割情報に従ってピクチャを分割し得る(235)。変換係数は、予測残差を復号化するために、逆量子化され(240)、逆変換される(250)。復号化された予測残差と予測ブロックとを組み合わせて(255)、画像ブロックが再構成される。イントラ予測(260)又は動き補償予測(すなわち、インター予測)(275)から、予測ブロックを得ることができる(270)。ループ内フィルタ(265)は、再構成された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
復号化されたピクチャは、復号化後処理(285)、例えば、逆カラー変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)、又は符号化前処理(101)において実行された再マッピングプロセスの逆を実行する逆再マッピングを更に経ることができる。復号化後処理は、符号化前処理において導出され、ビットストリームにおいてシグナリングされたメタデータを使用することができる。
図25は、様々な態様及び実施形態が実装されているシステムの一例のブロック図を示す。システム5000は、以下に記載の様々なコンポーネントを含むデバイスとして具体化することができ、本明細書に記載の態様のうちの1つ以上を実行するように構成されている。かかるデバイスの実施例としては、これらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオ記録システム、コネクテッド家電、及びサーバなどの様々な電子デバイスが挙げられる。システム5000の要素は、単独で又は組み合わせて、単一の集積回路(integrated circuit、IC)、複数のIC、及び/又は別個のコンポーネントに具現化することができる。例えば、少なくとも1つの実施形態では、システム5000の処理要素及びエンコーダ要素/デコーダ要素は、複数のIC及び/又は個別のコンポーネントにわたって分散している。様々な実施形態では、システム5000は、例えば、通信バスを介して、又は専用の入力ポート及び/若しくは出力ポートを通して、1つ以上の他のシステム又は他の電子デバイスに通信可能に結合される。様々な実施形態では、システム5000は、本明細書に記載される態様のうちの1つ以上を実装するように構成されている。
システム5000は、例えば、本明細書に記載される様々な態様を実装するために、内部にロードされた命令を実行するように構成された少なくとも1つのプロセッサ5010を含む。プロセッサ5010は、埋め込みメモリ、入出力インターフェース、及び当該技術分野において知られている様々な他の回路を含むことができる。システム5000は、少なくとも1つのメモリ5020(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム5000は、記憶デバイス5040を含み、これは、不揮発性メモリ及び/又は揮発性メモリを含むことができ、これらのメモリとしては、電気的消去可能なプログラマブル読み出し専用メモリ(Electrically Erasable Programmable Read-Only Memory、EEPROM)、読み出し専用メモリ(ROM)、プログラマブル読み出し専用メモリ(Programmable Read-Only Memory、PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(Dynamic Random Access Memory、DRAM)、スタティックランダムアクセスメモリ(Static Random Access Memory、SRAM)、フラッシュ、磁気ディスクドライブ、及び/又は光ディスクドライブが挙げられるが、これらに限定されない。記憶デバイス5040は、非限定的な例として、内部記憶デバイス、添付された記憶デバイス(取り外し可能及び取り外し不可能な記憶デバイスを含む)、及び/又はネットワークアクセス可能な記憶デバイスを含むことができる。
システム5000は、例えば、符号化されたビデオ又は復号されたビデオを提供するためにデータを処理するように構成されたエンコーダ/デコーダモジュール5030を含み、エンコーダ/デコーダモジュール5030は、それ自体のプロセッサ及びメモリを含むことができる。エンコーダ/デコーダモジュール5030は、符号化機能及び/又は復号機能を果たすデバイスに含めることができるモジュールを表す。既知であるように、デバイスは、符号化モジュール及び復号モジュールのうちの一方又は両方を含むことができる。更に、エンコーダ/デコーダモジュール5030は、システム5000の別個の要素として実装することができるか、又は当業者には既知であるように、ハードウェアとソフトウェアとの組み合わせとしてプロセッサ5010内に組み込むことができる。
本明細書に記載の様々な態様を行うためにプロセッサ5010又はエンコーダ/デコーダ5030に読み込まれるプログラムコードは、記憶デバイス5040に格納することができ、続いて、プロセッサ5010による実行のためにメモリ5020に読み込むことができる。様々な実施形態によれば、プロセッサ5010、メモリ5020、記憶デバイス5040、及びエンコーダ/デコーダモジュール5030のうちの1つ以上は、本明細書に記憶のプロセスの実行中に様々なアイテムのうちの1つ以上を記憶することができる。かかる記憶されたアイテムは、これらに限定されないが、入力ビデオ、復号されたビデオ、又は復号されたビデオの一部分、ビットストリーム、マトリクス、変数、並びに、方程式、式、動作、及び動作論理の処理からの中間結果又は最終結果を含むことができる。
いくつかの実施形態では、プロセッサ5010及び/又はエンコーダ/デコーダモジュール5030の内部のメモリは、命令を記憶し、かつ符号化中又は復号中に必要とされる処理のための作業メモリを提供するために使用される。しかし、他の実施形態では、処理デバイス(例えば、処理デバイスは、プロセッサ5010又はエンコーダ/デコーダモジュール5030であり得る)の外部のメモリが、これらの機能のうちの1つ以上に使用される。外部メモリは、メモリ5020及び/又は記憶デバイス5040、例えば、動的揮発性メモリ及び/又は不揮発性フラッシュメモリとすることができる。いくつかの実施形態では、外部不揮発性フラッシュメモリを使用して、例えば、テレビのオペレーティングシステムを記憶する。少なくとも1つの実施形態では、RAMなどの高速な外部の動的揮発性メモリは、MPEG-2(MPEGはMoving Picture Experts Groupと称され、MPEG-2はISO/IEC13818とも称され、13818-1はH.222としても既知であり、13818-2はH.262としても既知である)、HEVC(HEVCは高効率映像符号化と称され、H.265及びMPEG-H Part2としても既知である)、又はVVC(JVETによって開発中の新しい標準である多用途ビデオコーディング)などのビデオの符号化動作及び復号動作のための作業メモリとして使用される。
システム5000の要素への入力は、ブロック5005に示される様々な入力デバイスを通して、提供することができる。このような入力デバイスには、(i)例えば、放送事業者による放送全体にわたり送信されるRF信号を受信する無線周波数(Radio Frequency、RF)部分、(ii)コンポーネント(Component、COMP)入力端子(又はCOMP入力端子セット)、(iii)ユニバーサルシリアルバス(Universal Serial Bus、USB)入力端子、及び/又は(iv)高解像度マルチメディアインターフェース(High Definition Multimedia Interface、HDMI)入力端子が含まれるが、これらに限定されない。図25には示されていないが、他の例としては、コンポジットビデオが挙げられる。
様々な実施形態では、ブロック5005の入力デバイスは、当該技術分野で知られているように、関連するそれぞれの入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択すること(信号を選択すること、又は信号をある帯域の周波数に帯域制限することとも称される)と、(ii)選択された信号をダウンコンバートすることと、(iii)(例えば)特定の実施形態でチャネルと称され得る信号周波数帯域を選択するために、より狭い帯域の周波数に再び帯域制限することと、(iv)ダウンコンバートされ、帯域制限された信号を復調することと、(v)エラー訂正を実行することと、(vi)所望のデータパケットのストリームを選択するために逆多重化することと、に好適な要素と関連付けられ得る。様々な実施形態のRF部分は、これらの機能を実行する1つ以上の要素、例えば、周波数セレクタ、信号セレクタ、バンドリミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、エラー訂正器、及びデマルチプレクサを含む。RF部分は、様々なこれらの機能を実行するチューナを含むことができ、例えば、受信した信号をより低い周波数(例えば、中間周波数又は近ベースバンド周波数)に又はベースバンドにダウンコンバートすることを含む。セットトップボックスの一実施形態では、RF部分及びその関連する入力処理要素は、有線(例えば、ケーブル)媒体を介して送信されるRF信号を受信し、所望の周波数バンドにフィルタリング、ダウンコンバート、及び再フィルタリングすることによって周波数選択を実行する。様々な実施形態では、上で説明される(及び他の)要素の順序を並べ替える、これらの要素の一部を削除する、並びに/又は、類似若しくは異なる機能を実行する他の要素を追加する。要素を追加することは、例えば、増幅器及びアナログ-デジタル変換器を挿入するなど、既存の要素間に要素を挿入することを含み得る。様々な実施形態において、RF部分は、アンテナを含む。
加えて、USB端子及び/又はHDMI端子は、システム5000をUSB接続及び/又はHDMI接続を介して他の電子デバイスに接続するためのそれぞれのインターフェースプロセッサを含むことができる。入力処理の様々な態様、例えば、リード-ソロモンエラー訂正は、例えば、必要に応じて、別個の入力処理IC内で実装する、又はプロセッサ5010内で実装することができることを理解されたい。同様に、USB又はHDMIインターフェース処理の態様は、必要に応じて、別個のインターフェースIC内で、又はプロセッサ5010内で実装することができる。復調され、エラー訂正され、逆多重化されたストリームは、例えば、プロセッサ5010、及び出力デバイス上に提示するために必要に応じてデータストリームを処理するためにメモリ及び記憶要素と組み合わせて動作するエンコーダ/デコーダ5030を含む、様々な処理要素に提供される。
システム5000の様々な要素を統合ハウジング内に設けることができ、統合ハウジング内では、様々な要素は、好適な接続装置5015、例えば、Inter-IC(I2C)バス、配線、及びプリント回路基板を含む、当該技術分野で既知である内部バスを使用して相互接続され、それらの間でデータを送信することができる。
システム5000は、通信チャネル5090を介して他のデバイスとの通信を可能にする通信インターフェース5050を含む。通信インターフェース5050は、通信チャネル5090介してデータを送信及び受信するように構成されたトランシーバを含むことができるが、これに限定されない。通信インターフェース5050は、モデム又はネットワークカードを含むことができるが、これらに限定されず、通信チャネル5090は、例えば、有線媒体及び/又は無線媒体内で実装することができる。
データは、様々な実施形態では、Wi-Fiネットワーク、例えば、IEEE802.11(IEEEは、米国電気電子技術者協会(Institute of Electrical and Electronics Engineers)を指す)などの無線ネットワークを使用して、システム5000にストリーミングされるか、又は別様に提供される。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適合している通信チャネル5090及び通信インターフェース5050上で受信される。これらの実施形態の通信チャネル5090は、典型的に、ストリーミングアプリケーション及び他のオーバザトップ通信を可能にするために、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。他の実施形態では、入力ブロック5005のHDMI接続を介してデータを配信するセットトップボックスを使用して、システム5000にストリーミングデータを提供する。更に他の実施形態では、入力ブロック5005のRF接続を使用して、システム5000にストリーミングデータを提供する。上で示されるように、様々な実施形態は、データを非ストリーミングの様式で提供する。追加的に、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラネットワーク又はBluetoothネットワークを使用する。
システム5000は、ディスプレイ5065、スピーカ5075、及び他の周辺デバイス5085を含む様々な出力デバイスに出力信号を提供することができる。様々な実施形態のディスプレイ5065は、例えば、タッチスクリーンディスプレイ、有機発光ダイオード(organic light-emitting diode、OLED)ディスプレイ、湾曲ディスプレイ、及び/又は折り畳み可能なディスプレイのうちの1つ以上を含む。ディスプレイ5065は、テレビジョン、タブレット、ラップトップ、携帯電話(移動電話)、又は他のデバイス用であり得る。ディスプレイ5065は又、他のコンポーネントと統合され得るか(例えば、スマートフォンのように)、又は別個に(例えば、ラップトップのための外部モニタ)され得る。他の周辺デバイス5085としては、実施形態の様々な実施例において、スタンドアロンデジタルビデオディスク(又はデジタル多用途ディスク)(両方の用語について、digital versatile disc、DVR)、ディスクプレーヤ、ステレオシステム、及び/又は照明システム、のうちの1つ以上が挙げられる。様々な実施形態は、システム5000の出力に基づいて機能を提供する1つ以上の周辺デバイス5085を使用する。例えば、ディスクプレーヤは、システム5000の出力を再生する機能を実行する。
様々な実施形態では、制御信号が、システム5000と、ディスプレイ5065、スピーカ5075、又は他の周辺デバイス5085との間で、AV.Link、家庭用電子制御(Consumer Electronics Control、CEC)、又はユーザ介入の有無にかかわらずデバイス間の制御を可能にする他の通信プロトコルなどのシグナリングを使用して通信される。出力デバイスは、それぞれのインターフェース5065、5075、及び5085を通した専用接続を介してシステム5000に通信可能に結合することができる。代替的に、出力デバイスは、通信インターフェース5050を介して、通信チャネル5090を使用してシステム5000に接続することができる。ディスプレイ5065及びスピーカ5075は、例えば、テレビなどの電子デバイスにおいてシステム5000の他のコンポーネントと単一のユニットに一体化され得る。様々な実施形態において、ディスプレイインターフェース5065は、例えば、タイミングコントローラ(timing controller、T Con)チップなどのディスプレイドライバを含む。
例えば、入力5005のRF部分が別個のセットトップボックスの一部である場合、ディスプレイ5065及びスピーカ5075は、代替的に、他のコンポーネントのうちの1つ以上とは別個とすることができる。ディスプレイ5065及びスピーカ5075が外部コンポーネントである様々な実施形態では、例えば、HDMIポート、USBポート、又はCOMP出力を含む専用の出力接続を介して出力信号を提供することができる。
実施形態は、プロセッサ5010によって、又はハードウェアによって、又はハードウェアとソフトウェアとの組み合わせによって、実装されるコンピュータソフトウェアによって行うことができる。非限定的な例として、1つ以上の集積回路によって実施形態を実装することができる。メモリ5020は、技術環境に適切な任意のタイプのものとすることができ、非限定的な例として、光メモリデバイス、磁気メモリデバイス、半導体ベースのメモリデバイス、固定メモリ、及びリブ-バブルメモリなどの相応しいいかなるデータストレージ技術を使用しても実装することができる。プロセッサ5010は、技術環境に適切な任意のタイプのものとすることができ、非限定的な例として、マイクロプロセッサ、汎用コンピュータ、特殊目的コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ以上を包含することができる。
様々な実装形態は、復号化することを含む。本出願で使用する際、「復号」は、例えば、ディスプレイに好適な最終出力をもたらすために、受信した符号化されたシーケンスに対して行われるプロセスの全て又は一部を包含することができる。様々な実施形態において、このようなプロセスには、例えば、エントロピ復号化、逆量子化、逆変換、及び差動復号化など、通常、デコーダによって行われるプロセスのうちの1つ以上が含まれる。様々な実施形態では、そのようなプロセスは更に、又は代替的に、例えば、空間LICのパラメータを導出することと、空間LICをインター予測、イントラ予測、又はIBC予測のいずれかに適用することとを備える、本出願で説明される様々な実装形態のデコーダによって実行されるプロセスを含む。
更なる例として、一実施形態では、「復号」とは、エントロピ復号のみを指し、別の実施形態では、「復号」とは、差動復号のみを指し、別の実施形態では、「復号」とは、エントロピ復号と差動復号との組み合わせを指す。「符号化プロセス」という句が、具体的に作業部分集合を指すことを目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
様々な実装形態は、符号化を伴う。「復号化(decoding)」に関する上記の考察と同様に、本出願で使用される「符号化(encoding)」は、例えば、符号化されたビットストリームを作り出すために入力ビデオシーケンスに対して実行されるプロセスの全て又は一部を包含することができる。様々な実施形態において、このようなプロセスは、例えば、分割、差動符号化、変換、量子化、及びエントロピ符号化など、エンコーダによって典型的に実行されるプロセスのうちの1つ以上を含む。様々な実施形態では、そのようなプロセスは、更に、又は代替的に、例えば、空間LICのパラメータを導出し、空間LICをインター予測、イントラ予測、又はIBC予測のいずれかに適用する、本出願で説明する様々な実装形態のエンコーダによって実行されるプロセスを含む。
更なる例として、一実施形態では、「符号化」とは、エントロピ符号化のみを指し、別の実施形態では、「符号化」とは、差動符号化のみを指し、別の実施形態では、「符号化」とは、差動符号化とエントロピ符号化との組み合わせを指す。「符号化プロセス」という句が、具体的に作業部分集合を指すこと目的とするものであるか、又は全体としてより広範な符号化プロセスを指すことを目的とするものであるかは、具体的な説明の背景に基づいて明らかになり、当業者によって十分に理解されると考えられる。
本明細書で使用されるシンタックス要素、例えば、spatial_lic_flag、lic_refblk_index、lic_mrl_flagは記述用語であることに留意されたい。したがって、これらは他のシンタックス要素名の使用を排除するものではない。
図がフローチャートとして提示されている場合、その図は対応する装置のブロック図も提供するものと理解されたい。同様に、図がブロック図として提示されている場合、その図は対応する方法/プロセスのフローチャートも提供するものと理解されたい。
様々な実施形態は、速度歪み最適化を指す。具体的には、符号化プロセス中に、レートと歪みとの間のバランス又はトレードオフは、通常、多くの場合、計算複雑性の制約を与えるものと考えられる。レート歪み最適化は、通常、レートと歪みの加重和であるレート歪み関数を最小化するように定式化される。レート歪み最適化問題を解くには、異なるアプローチがある。例えば、これらのアプローチは、全ての考慮されるモード又は符号化パラメータ値を含む全ての符号化オプションの広範なテストに基づき得、それらの符号化コスト、並びに符号化及び復号後の再構成された信号の関連する歪みの完全な評価を伴う。符号化複雑性を抑えるために、特に、再構成された信号ではなく、予測又は予測残差信号に基づく近似歪みの計算と共に、より素早い手法を使用することもできる。考えられる符号化選択肢の一部のみに対して近似歪みを使用し、他の符号化選択肢に対しては完全な歪みを使用することなどによって、これらの2つの手法の混合を使用することもできる。他の手法では、考えられる符号化選択肢部分集合のみを評価する。より一般的には、多くのアプローチは、最適化を実行するために様々な技術のいずれかを採用するが、最適化は、必ずしもコーディングコスト及び関連する歪みの両方の完全な評価ではない。
本明細書に記載の実装形態及び態様は、例えば、方法若しくはプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装することができる。たとえ単一の形態の実装形態の文脈でのみ考察される場合でも(例えば、方法としてのみ考察される)、考察された特徴の実装形態は、他の形態(例えば、装置又はプログラム)でも実装することができる。例えば、適切なハードウェア、ソフトウェア、及びファームウェアにおいて装置を実装することができる。この方法は、例えば、コンピュータ、マイクロプロセッサ、集積回路、又はプログラマブル論理デバイスを含む、一般に処理デバイスを指すプロセッサで実装され得る。プロセッサには、例えば、エンドユーザ間の情報の通信を容易にする、コンピュータ、携帯電話、ポータブル/携帯情報端末(「Personal Digital Assistant、PDA」)などのデバイスなどの通信デバイスも含まれる。
「一実施形態」若しくは「ある実施形態」又は「一実装形態」若しくは「ある実装形態」、又それらの他の変形形態への言及は、その実施形態に関連して説明する特定の特徴、構造、特性などが、少なくとも1つの実施形態に含まれることを意味する。したがって、本出願全体を通して様々な場所に現れる「一実施形態では」若しくは「ある実施形態では」又は「一実装形態では」若しくは「ある実装形態では」、又他の変形形態という句が現れるとき、必ずしも全てが同じ実施形態を指しているのではない。
加えて、本出願は、様々な情報を「判定する」ことに言及し得る。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから取り出すことのうちの1つ以上を含むことができる。
更に、本出願は、様々な情報に「アクセスすること」に言及する場合がある。情報にアクセスすることは、例えば、情報を受信すること、(例えば、メモリから)情報を取得すること、情報を記憶すること、情報を移動すること、情報をコピーすること、情報を計算すること、情報を判定すること、情報を予測すること、又は情報を推定することのうちの1つ以上を含むことができる。
加えて、本出願は、様々な情報を「受信すること」に言及する場合がある。受信することは、「アクセスすること」と同様に、広義の用語であることを意図している。情報を受信することは、例えば、情報にアクセスすること、又は(例えば、メモリから)情報を取得することのうちの1つ以上を含むことができる。更に、「受信すること」は、一般には、例えば、情報を記憶する、情報を処理する、情報を送信する、情報を移動する、情報をコピーする、情報を消去する、情報を計算する、情報を判定する、情報を予測する、又は情報を推定するなどの操作時に、何らかの形で関与する。
例えば、「A/B」、「A及び/又はB(A and/or B)」及び「A及びBのうちの少なくとも1つ(at least one of A and B)」の場合、次の「/」、「及び/又は(and/or)」、及び「のうちの少なくとも1つ(at least one of)」のいずれかの使用は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含することが意図されていることを理解されるべきである。更なる実施例として、「A、B、及び/又はC(A, B, and/or C)」及び「A、B、及びCのうちの少なくとも1つ(at least one of A, B, and C)」の場合、かかる表現は、第1のリストされた選択肢(A)のみの選択、又は第2のリストされた選択肢(B)のみの選択、又は第3のリストされた選択肢(C)のみの選択、又は第1及び第2のリストされた選択肢(A及びB)のみの選択、又は第1及び第3のリストされた選択肢(A及びC)のみの選択、又は第2及び第3のリストされた選択肢のみの選択(B及びC)のみ、又は3つ全ての選択肢の選択(A及びB及びC)を包含することが意図される。このことは、当該技術分野及び関連技術分野の当業者に明らかであるように、リストされたアイテムの数だけ拡張され得る。
又、本明細書で使用されるとき、「シグナリングする」という語は、特に、対応するデコーダに対して何かを示すことを意味する。例えば、特定の実施形態では、エンコーダは、変換のために複数のパラメータのうちの特定の1つをシグナリングする。このように、ある実施形態では、同じパラメータが、エンコーダ側でもデコーダ側でも使用される。したがって、例えば、エンコーダは、デコーダが同じ特定のパラメータを使用することができるように、特定のパラメータをデコーダに送信することができる(明確なシグナリング)。これに対し、デコーダがすでにその特定のパラメータと共に他のパラメータも有する場合は、単にデコーダがその特定のパラメータを知ること、及びそれを選択することを可能にするように、送信を行わないシグナリング(暗黙的なシグナリング)を使用することができる。いかなる実際の機能の送信も回避することにより、様々な実施形態において、ビットの節約が実現される。シグナリングは、様々な方法で達成することができることが理解されよう。例えば、1つ以上のシンタックス要素、フラグなどが、様々な実施形態において、対応するデコーダに情報をシグナリングするために使用される。上記は、「信号」という語の動詞形に関連し、「信号」という語は、本明細書では名詞としても使用されることがある。
本開示は、例えば、送信又は記憶することができる構文などの様々な情報を説明してきた。この情報は、様々な様式でパッケージ化又は配置することができ、例えば、情報をSPS、PPS、NALユニット、ヘッダ(例えば、NALユニットヘッダ、又はスライスヘッダ)、又はSEIメッセージに入れるなど、ビデオ規格において一般的な様式を含む。他の様式も利用可能であり、例えば、情報を以下のうちの1つ以上に入れるなどのシステムレベル又はアプリケーションレベルの規格において一般的な様式を含む。
●SDP(session description protocol)は、例えば、RFCに記載され、RTP(Real-time Transport Protocol)送信と共に使用される、セッション告知及びセッション招待の目的のためのマルチメディア通信セッションを記述するためのフォーマットである。
●例えば、DASHで使用され、HTTPを介して送信されるような、DASH MPD(メディアプレゼンテーション記述、(Media Presentation Description))記述子、記述子は、コンテンツ表現に追加の特性を提供するために、表現又は表現の集合に関連付けられる。
●例えば、RTPストリーミング中に使用されるような、RTPヘッダ拡張子、及び/又は、
●例えば、OMAFで使用され、いくつかの仕様では、「原子」としても既知である一意のタイプ識別子及び長さによって画定されるオブジェクト配向構成ブロックであるボックスを使用するような、ISOベースメディアファイルフォーマット(ISO Base Media File Format)。
当業者には明白であるように、実装形態は、例えば、格納され得る、又は送信され得る情報を搬送するようにフォーマットされた様々な信号をもたらすことができる。情報は、例えば、方法を実行するための命令、又は説明されている実装形態の1つによって生成されるデータを含むことができる。例えば、記載の実施形態のビットストリームを搬送するように、信号をフォーマットすることができる。例えば、電磁波として(例えば、スペクトルの無線周波数部分を使用して)、又はベースバンド信号として、このような信号をフォーマットすることができる。フォーマットすることは、例えば、データストリームを符号化することと、符号化されたデータストリームで搬送波を変調することと、を含むことができる。信号が搬送する情報は、例えば、アナログ情報又はデジタル情報とすることができる。既知であるように、様々な異なる有線リンク又は無線リンク上で信号を送信することができる。信号は、プロセッサ可読媒体に格納することができる。
いくつかの実施形態について述べる。これらの実施形態の特徴は、様々な特許請求の範疇及びタイプにわたって単独でも、いかなる組み合わせでも提供され得る。更に、実施形態は、様々な特許請求の範疇及びタイプにわたって、以下の特徴、デバイス、又は態様のうちの1つ以上を、単独で、又は任意の組み合わせにおいて、含むことができる。
●同じピクチャ内の異なるブロック間の照明不一致を補償するために、デコーダ及び/又はエンコーダにおいてインター/イントラ/IBC予測のために空間局所照明補償を適用する。
○CUレベル空間LICフラグspatial_lic_flagは、空間LICがブロックに適用されるか否かを示すために、インター/イントラ/IBCブロックに対して定義される。
○空間LICが適用されるとき(spatial_lic_flag(true)インター/イントラ/IBCブロックの場合、スケーリング係数α及びオフセットβを使用して、空間照明変動の線形モデルを使用する。
○-空間LICパラメータの推定は、現在のブロック(現在のテンプレート)の隣接する再構成されたサンプルと、同じピクチャ内の空間参照ブロック(参照テンプレート)の対応する隣接する再構成されたサンプルとの間の差を最小化することによって導出される。
○最終予測サンプルを取得するために、インター/イントラ/IBC予測サンプルに空間LICパラメータを適用する。
●デコーダ及び/又はエンコーダにおいてCUレベルの空間LICフラグspatial_lic_flagを導出する。
○インターブロックについて、空間LICフラグは、マージモードで符号化される場合、マージモードにおける動き情報コピーと同様の方法で、隣接ブロックからコピーされ、そうでない場合、空間LICフラグがシグナリングされ、
○イントラ/IBCブロックに対して、空間LICフラグがシグナリングされ、
○イントラブロックの場合、空間LICフラグは、いくつかのイントラ予測モード(すなわち、DCモード及び平面モード)に対してのみ提示される。
●デコーダ及び/又はエンコーダにおける空間LICパラメータ推定のための参照ブロックとして使用される空間的隣接ブロックを選択する。
○インター/イントラブロックの場合、最も近い再構成された空間的隣接ブロックが参照ブロックとして選択され、
○利用可能な2つの最も近い空間的隣接ブロック上及び左)のみを考慮し、
○-上及び左空間的隣接ブロックの両方が利用可能である場合、それらは両方とも参照ブロックとして適用され得、
○上及び左空間的隣接ブロックの両方が利用可能であり、1つの参照ブロックのみが適用される場合、どちらが適用されるかを示すためにフラグlic_refblk_flagを追加し、
○利用可能な5つの最も近い空間的隣接ブロックのみを考慮し(上/左/右上/左下/左上)、
○これらの5つ空間的隣接ブロックが全て利用可能であり、1つの参照ブロックのみが適用される場合、フラグlic_refblk_indexを追加して、どの参照ブロックが適用されるかを示し、
○インターブロックの場合、5つの空間候補のうちの1つが最良MVP候補として選択されると、選択された空間MVP候補が位置するブロックが参照ブロックとして選択され、
○イントラブロックの場合、参照ブロック選択はイントラ予測モードに基づき、
○事前定義された探索領域内にある間に、いくつかの非最近傍空間的隣接ブロックを考慮して、現在のブロックから空間参照ブロックへの変位を示すための空間LIC探索ベクトルが、ビットストリーム中にシグナリングされ、
○IBCブロックの場合、イントラコピーに使用される参照ブロックが参照ブロックとして選択される。
●デコーダ及び/又はエンコーダにおける空間LICパラメータ推定のために、隣接する再構成されたサンプルによって構成されるテンプレートを生成し、
○インター/イントラ/IBCブロックの場合、テンプレートは、現在/参照ブロックの左境界及び上境界に位置する隣接する再構成されたサンプルによって構成され、
○インター/イントラ/IBCブロックの場合、テンプレートは、現在/参照ブロックの複数の左及び上の参照ライン内に位置する隣接する再構成されたサンプルによって構成され、
○インター/イントラ/IBCブロックの場合、テンプレートは、現在/参照ブロックの複数の左及び上の参照ライン内に位置する隣接する再構成されたサンプルによって構成され、
○イントラブロックの場合、テンプレートは、現在/参照ブロックの隣接する再構成されたブロック全体によって構成される。
●デコーダにおいて適用する空間LICプロセスに関する情報をシグナリングする。
●適用すべき空間LICプロセスに関する情報をテンプレートから導出し、導出はデコーダ及び/又はエンコーダにおいて適用される。
●変換インデックスなど、使用する空間LICプロセスをデコーダが識別することを可能にするシンタックス要素をシグナリングに挿入する。
●これらのシンタックス要素に基づいて、デコーダにおいて適用する少なくとも1つの空間LICプロセスを選択する。
●デコーダにおいて少なくとも1つの予測を導出するために修正された空間LICを適用する。
●記載されるシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号。
●記載される実施形態のうちのいずれかに従って生成される情報を運ぶシンタックスを含むビットストリーム又は信号。
●エンコーダによって使用される方法に対応する方法で空間LICプロセスをデコーダが適用することを可能にするシンタックス要素をシグナリングに挿入する。
●記載されるシンタックス要素、又はその変形形態のうちの1つ以上を含むビットストリーム又は信号を作り出しかつ/又は送信しかつ/又受信しかつ/又は復号する。
●記載される実施形態のいずれかにより、作り出しかつ/又は送信しかつ/又は受信しかつ/又は復号する。
●記載される実施形態のいずれかによる、方法、プロセス、装置、命令を格納する媒体、データを記憶する媒体、又は信号。
●記載された実施形態のいずれかによる予測を修正するように適合された空間LICプロセスを実行するTV、セットトップボックス、携帯電話、タブレット、又は他の電子デバイス。
●TV、セットトップボックス、携帯電話、タブレット、又は記載された実施形態のいずれかによる予測を修正するように適合された空間LICプロセスを実行し、結果として得られる画像を表示する(例えば、モニタ、スクリーン、又は他の種類のディスプレイを使用して、)他の電子デバイス。
●TV、セットトップボックス、携帯電話、タブレット、又は符号化画像を含む信号を受信するためのチャネルを選択し(例えば、チューナを使用する。)、記載された実施形態のいずれかによる予測を修正するように適合された空間LICプロセスを実行する他の電子デバイス。
●TV、セットトップボックス、携帯電話、タブレット、又は符号化画像を含む信号を無線で受信(例えば、アンテナを使用する。)し、記載された実施形態のいずれかによる予測を修正するように適合された空間LICプロセスを実行する他の電子デバイス。

Claims (26)

  1. ビデオ復号化のための方法であって、
    ピクチャ内で復号されている現在のブロックについて、少なくとも1つの空間参照ブロックの空間的に隣接する再構成されたサンプルと、対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することと、
    前記決定されたパラメータに基づく局所照明補償を使用して前記現在のブロックを復号することと、を含み、
    前記少なくとも1つの空間参照ブロックは、前記ピクチャ内の前記現在のブロックの空間的隣接ブロックである、方法。
  2. 1つ以上のプロセッサ及び少なくとも1つのメモリを備える、ビデオ復号化のための装置であって、前記1つ以上のプロセッサが、
    ピクチャ内で復号されている現在のブロックについて、少なくとも1つの空間参照ブロックの空間的に隣接する再構成されたサンプルと、対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することと、
    前記決定されたパラメータに基づく局所照明補償を使用して前記現在のブロックを復号することと、を行うように構成され、
    前記少なくとも1つの空間参照ブロックは、前記ピクチャ内の前記現在のブロックの空間的隣接ブロックである、装置。
  3. ビデオ符号化のための方法であって、
    ピクチャ内で符号化されている現在のブロックについて、前記現在のブロックの空間的に隣接する再構成されたサンプルと、少なくとも1つの空間参照ブロックの対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することと、
    前記決定されたパラメータに基づいて局所照明補償を使用して前記現在のブロックを符号化することと、を含み、
    前記少なくとも1つの空間参照ブロックは、前記ピクチャ内の前記現在のブロックの空間的隣接ブロックである、方法。
  4. 1つ以上のプロセッサ及び少なくとも1つのメモリを備える、ビデオ符号化のための装置であって、前記1つ以上のプロセッサが、
    ピクチャ内で符号化されている現在のブロックについて、少なくとも1つの空間参照ブロックの空間的に隣接する再構成されたサンプルと、対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することと、
    前記決定されたパラメータに基づく局所照明補償を使用して前記現在のブロックを符号化することと、を行うように構成され、
    前記少なくとも1つの空間参照ブロックは、前記ピクチャ内の前記現在のブロックの空間的隣接ブロックである、装置。
  5. 前記局所照明補償が前記現在のブロックに適用されるか否かを示すシンタックス要素を決定することを更に含む、請求項1又は3に記載の方法又は請求項2若しくは4に記載の装置。
  6. 前記現在のブロックが、インター予測において符号化される、請求項1、3若しくは5のいずれかに記載の方法又は請求項2、4、又は5のいずれかに記載の装置。
  7. 前記少なくとも1つの空間参照ブロックが、上隣接ブロック及び左隣接ブロックのいずれかである、請求項6に記載の方法又は請求項6に記載の装置。
  8. 前記少なくとも1つの空間参照ブロックは、上隣接ブロック(B0)、左隣接ブロック(A0)、右上隣接ブロック(B1)、左下隣接ブロック(A1)、及び左上隣接ブロック(B2)のいずれかである、請求項6に記載の方法又は請求項6に記載の装置。
  9. 前記少なくとも1つの空間参照ブロックが、動きベクトル予測子MVP候補として選択された隣接ブロックである、請求項6に記載の方法又は請求項6に記載の装置。
  10. 前記現在のブロックは、イントラ予測において符号化される、請求項1、3又は5のいずれかに記載の方法又は請求項2、4、又は5のいずれかに記載の装置。
  11. 前記少なくとも1つの空間参照ブロックが、上隣接ブロック及び左隣接ブロックのいずれかである、請求項10に記載の方法又は請求項10に記載の装置。
  12. 前記少なくとも1つの空間参照ブロックは、上隣接ブロック、左隣接ブロック、右上隣接ブロック、左下隣接ブロック、及び左上隣接ブロックのうちのいずれかである、請求項10に記載の方法又は請求項10に記載の装置。
  13. 前記少なくとも1つの空間参照ブロックは、前記現在のブロックを符号化するために使用されるイントラ予測モードに応答する、請求項11又は12のいずれかに記載の方法又は請求項11又は12のいずれかに記載の装置。
  14. 前記現在のブロックは、イントラブロックコピー予測において符号化される、請求項1、3又は5のいずれかに記載の方法又は請求項2、4、又は5のいずれかに記載の装置。
  15. 前記少なくとも1つの空間参照ブロックが、イントラブロックコピー参照ブロックとして選択された前記隣接ブロックを備える、請求項14に記載の方法又は請求項14に記載の装置。
  16. 前記隣接する再構成されたサンプルは、前記現在のブロック及び少なくとも1つの空間参照ブロックの左及び上の境界に位置する、請求項1、3、6、10又は14のいずれかに記載の方法又は請求項2、4、6、10又は14のいずれかに記載の装置。
  17. 前記隣接する再構成されたサンプルは、前記現在のブロック及び少なくとも1つの参照ブロックの複数の左及び上の参照ライン内に位置する、請求項1、3、6、10又は14のいずれかに記載の方法又は請求項2、4、6、10又は14のいずれかに記載の装置。
  18. 前記隣接する再構成されたサンプルは、前記現在のブロック及び少なくとも1つの参照ブロックの前記再構成されたブロック全体に位置する、請求項1、3、6、10又は14のいずれかに記載の方法又は請求項2、4、6、10又は14のいずれかに記載の装置。
  19. 前記少なくとも1つの空間参照ブロックは、第1の空間参照ブロック及び第2の空間参照ブロックを備え、前記第1の空間参照ブロックの前記空間的に隣接する再構成されたサンプル及び前記第2の空間参照ブロックの前記空間的に隣接する再構成されたサンプルは、前記局所照明補償の前記パラメータを決定するために平均化される、請求項1、3、6、又は10のいずれかに記載の方法又は請求項2、4、6、又は10のいずれかに記載の装置。
  20. 前記局所照明補償の前記パラメータを決定する際にどの空間参照ブロックが使用されるかを示すシンタックス要素を決定することを更に備える、請求項1、3、7、8、11又は12のいずれかに記載の方法、又は請求項2、4、7、8、11又は12のいずれかに記載の装置。
  21. 請求項1、2、5から10のいずれか一項に記載の方法に従って生成された画像ブロックを表す符号化データを有する、非一時的プログラム記憶デバイス。
  22. 請求項6、8~9のいずれか一項に記載の方法を実行するためにコンピュータによって実行可能な命令のプログラムを有形に実施する、コンピュータによって読み取り可能な非一時的プログラム記憶デバイス。
  23. ビデオ復号化のための方法であって、
    ピクチャ内で復号されている現在のブロックについて、少なくとも1つの参照ブロックの空間的に隣接する再構成されたサンプルと、対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することと、
    前記決定されたパラメータに基づく局所照明補償を使用して前記現在のブロックを復号することと、を含み、
    前記隣接する再構成されたサンプルは、前記現在のブロック及び少なくとも1つの参照ブロックの前記複数の左及び上の参照ライン内に位置する、方法。
  24. 1つ以上のプロセッサ及び少なくとも1つのメモリを備える、ビデオ復号化のための装置であって、前記1つ以上のプロセッサが、
    ピクチャ内で復号されている現在のブロックについて、少なくとも1つの参照ブロックの空間的に隣接する再構成されたサンプルと、対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することと、
    前記決定されたパラメータに基づく局所照明補償を使用して前記現在のブロックを復号することと、を行うように構成され、
    前記隣接する再構成されたサンプルは、前記現在のブロック及び少なくとも1つの参照ブロックの前記複数の左及び上の参照ライン内に位置する、装置。
  25. ビデオ符号化のための方法であって、
    ピクチャ内で符号化されている現在のブロックについて、前記現在のブロックの空間的に隣接する再構成されたサンプルと、少なくとも1つの参照ブロックの対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することと、
    前記決定されたパラメータに基づいて局所照明補償を使用して前記現在のブロックを符号化することと、を含み、
    前記隣接する再構成されたサンプルは、前記現在のブロック及び少なくとも1つの参照ブロックの前記複数の左及び上の参照ライン内に位置する、方法。
  26. 1つ以上のプロセッサ及び少なくとも1つのメモリを備える、ビデオ符号化のための装置であって、前記1つ以上のプロセッサが、
    ピクチャ内で符号化されている現在のブロックについて、少なくとも1つの参照ブロックの空間的に隣接する再構成されたサンプルと、対応する空間的に隣接する再構成されたサンプルとに基づいて、局所照明補償のためのパラメータを決定することと、
    前記決定されたパラメータに基づく局所照明補償を使用して前記現在のブロックを符号化することと、を行うように構成され、
    前記隣接する再構成されたサンプルは、前記現在のブロック及び少なくとも1つの参照ブロックの前記複数の左及び上の参照ライン内に位置する、装置。
JP2023545821A 2021-02-08 2022-01-27 空間局所照明補償 Pending JP2024505900A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21305170 2021-02-08
EP21305170.9 2021-02-08
PCT/EP2022/051924 WO2022167322A1 (en) 2021-02-08 2022-01-27 Spatial local illumination compensation

Publications (1)

Publication Number Publication Date
JP2024505900A true JP2024505900A (ja) 2024-02-08

Family

ID=74701440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023545821A Pending JP2024505900A (ja) 2021-02-08 2022-01-27 空間局所照明補償

Country Status (7)

Country Link
EP (1) EP4289141A1 (ja)
JP (1) JP2024505900A (ja)
KR (1) KR20230145097A (ja)
CN (1) CN117597933A (ja)
AU (1) AU2022216783A1 (ja)
MX (1) MX2023008942A (ja)
WO (1) WO2022167322A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024104420A1 (en) * 2022-11-16 2024-05-23 Douyin Vision Co., Ltd. Improvements for illumination compensation in video coding
CA3220450A1 (en) * 2022-11-18 2024-05-18 Comcast Cable Communications, Llc Improved prediction with local illumination compensation
WO2024120356A1 (en) * 2022-12-05 2024-06-13 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009089032A2 (en) * 2008-01-10 2009-07-16 Thomson Licensing Methods and apparatus for illumination compensation of intra-predicted video
EP3741115A1 (en) * 2018-01-16 2020-11-25 Vid Scale, Inc. Motion compensated bi-prediction based on local illumination compensation
US10419754B1 (en) * 2018-04-02 2019-09-17 Tencent America LLC Method and apparatus for video decoding using multiple line intra prediction
WO2020084509A1 (en) * 2018-10-23 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Harmonized local illumination compensation and modified inter coding tools

Also Published As

Publication number Publication date
AU2022216783A1 (en) 2023-08-17
CN117597933A (zh) 2024-02-23
WO2022167322A1 (en) 2022-08-11
KR20230145097A (ko) 2023-10-17
MX2023008942A (es) 2023-09-18
EP4289141A1 (en) 2023-12-13

Similar Documents

Publication Publication Date Title
JP7299221B2 (ja) 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置
US20220159277A1 (en) Method and apparatus for video encoding and decoding with subblock based local illumination compensation
US11558611B2 (en) Method and apparatus for deblocking an image
US20220078405A1 (en) Simplifications of coding modes based on neighboring samples dependent parametric models
JP2024505900A (ja) 空間局所照明補償
KR20210089747A (ko) 비디오 인코딩 및 디코딩을 위한 가상 파이프라인
CN113678438A (zh) 采用子分区的宽角度帧内预测
US20220038681A1 (en) Video encoding or decoding using block extension for overlapped block motion compensation
US20240031560A1 (en) Intra prediction with geometric partition
US20230254507A1 (en) Deep intra predictor generating side information
KR20210058846A (ko) 인트라 변환 코딩 및 광각 인트라 예측의 조화
EP3815373A1 (en) Virtual temporal affine candidates
CN112335240A (zh) 使用可变权重的多参考帧内预测
EP3641311A1 (en) Encoding and decoding methods and apparatus
JP2024513873A (ja) 切り替え可能な補間フィルタを用いる幾何学的分割
US20240214553A1 (en) Spatial local illumination compensation
WO2024083500A1 (en) Methods and apparatuses for padding reference samples
KR20240099324A (ko) 기준 픽처 리샘플링을 사용한 비디오 인코딩 및 디코딩
EP3991428A1 (en) Hmvc for affine and sbtmvp motion vector prediction modes
WO2022214244A1 (en) Intra block copy with template matching for video encoding and decoding
JP2024513657A (ja) ビデオエンコード及びデコードのためのテンプレートマッチング予測
WO2023186752A1 (en) Methods and apparatuses for encoding/decoding a video
JP2022537222A (ja) 局所照明補正フラグインヘリタンス
KR20240056576A (ko) 템플릿 매칭에 기초한 비디오 인코딩 및 디코딩을 위한 크로마 예측
WO2024033116A1 (en) Geometric partition mode boundary prediction

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230810