JP2021511698A - 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置 - Google Patents

隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置 Download PDF

Info

Publication number
JP2021511698A
JP2021511698A JP2020534494A JP2020534494A JP2021511698A JP 2021511698 A JP2021511698 A JP 2021511698A JP 2020534494 A JP2020534494 A JP 2020534494A JP 2020534494 A JP2020534494 A JP 2020534494A JP 2021511698 A JP2021511698 A JP 2021511698A
Authority
JP
Japan
Prior art keywords
block
sample
template
linear model
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020534494A
Other languages
English (en)
Other versions
JP7299221B2 (ja
Inventor
ボルデ,フィリップ
ギャルピン,フランク
ポワリエ,タンギ
ルリアネック,ファブリス
ラケイプ,ファビアン
Original Assignee
インターデジタル ヴイシー ホールディングス, インコーポレイテッド
インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP18305073.1A external-priority patent/EP3518537A1/en
Application filed by インターデジタル ヴイシー ホールディングス, インコーポレイテッド, インターデジタル ヴイシー ホールディングス, インコーポレイテッド filed Critical インターデジタル ヴイシー ホールディングス, インコーポレイテッド
Publication of JP2021511698A publication Critical patent/JP2021511698A/ja
Priority to JP2023098170A priority Critical patent/JP2023130359A/ja
Application granted granted Critical
Publication of JP7299221B2 publication Critical patent/JP7299221B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

各種の実装例が記載され、特に、隣接サンプルに応じた線形モデルに基づく映像符号化及び復号の実装例が提示されている。したがって、あるピクチャの中の符号化又は復号対象のブロックについて、少なくとも1つの空間的隣接テンプレートが特定され、その少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて少なくとも1つの線形モデルパラメータが特定される。第一の実施形態において、再構成サンプルの数NはN=2kに対応し、kはnがブロック幅とブロック高さの合計より小さい最大整数となるように選択される。第二の実施形態において、テンプレート内の第一のサンプルの、そのブロックの左、又は上隣接ラインのサンプル間での相対位置に関するオフセットが特定される。第三の実施形態において、再構成サンプルの数は、ブロックのより大きい寸法においてより大きい数に設定される。

Description

技術分野
本願の実施形態の少なくとも1つは一般に、例えば映像符号化又は復号のための方法又は装置に関し、より詳しくは、符号化又は復号対象のブロックについて、少なくとも1つの線形モデルパラメータを少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて特定するための方法又は装置に関する。
背景
1つ又は複数の実装例のドメイン技術分野は、一般に、映像圧縮に関する。少なくとも幾つかの実施形態は、HEVC(HEVCは、High Efficiency Video Codingのことであり、「ITU-T H.265 Telecommunication standardization sector of ITU (10/2014), Series H: Audiovisual and multimedia systems, infrastructure of audiovisual services - coding of moving video, High efficiency video coding, Recommendation ITU-T H.265」に記載されている、通称H.265及びMPEG−H Part 2)等の既存の映像圧縮システムと比較した、又はVVC(Versatile Video Coding、JVET(Joint Video Experts Team)により開発されている新規格)等の現在開発中の映像圧縮システムと比較した、圧縮効率の向上に関する。
高い圧縮効率を実現するために、画像及び映像コード化方式は通常、動きベクトル予測等の予測を利用し、変換して、映像コンテンツ内の空間的及び時間的冗長性を活用する。一般に、イントラ又はインター予測が使用されてフレーム内又はフレーム間相関が利用され、後に、原画像と予測画像との、多くの場合に予測エラー又は予測残差と呼ばれる差分が変換され、量子化され、エントロピ符号化される。映像を再構成するために、圧縮データは、エントロピ符号化、量子化、変換、及び予測に対応する逆プロセスにより復号される。
高圧縮技術に最近加わったものには、処理対象のブロックの隣接領域に応じた線形モデリングに基づく予測モデルが含まれる。特に、幾つかの予測パラメータが復号プロセス中に処理対象のブロックの空間的隣接領域内にあるサンプルに基づいて計算される。このような空間的隣接領域はすでに再構成されたピクチャサンプルを含み、以下、これをテンプレートと呼ぶ。非限定的な例によれば、空間的隣接領域に基づいて特定された予測パラメータを有するこのような予測モデルには、Cross-component linear model(CCLM)、Local Illumination Compensation(LIC)、又はBi-directional Optical flow(BIO)が含まれる。復号プロセスでは、幾つかの予測パラメータが、処理対象のブロックの左及び/又は上に局在する幾つかの再構成されたピクチャサンプルに基づいて特定される。それゆえ、符号化又は復号対象のブロックについて、正確な線形モデルを提供するために少なくとも1つの線形モデルパラメータがそれについて特定される、少なくとも1つの空間的隣接テンプレートの特定を最適化することが望ましい。
概要
本発明の目的は、先行技術の欠点の少なくとも1つを克服することである。この目的のために、少なくとも1つの実施形態の一般的態様によれば、映像符号化方法が提供され、これには、あるピクチャの中の符号化対象のブロックについて、少なくとも1つの空間的隣接テンプレートを特定することと、符号化対象のブロックについて、少なくとも1つの線形モデルパラメータを少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて特定することと、特定された少なくとも1つの線形モデルパラメータに基づく線形モデルを使ってブロックを符号化することと、を含み、少なくとも1つの空間的隣接テンプレートを特定することは、少なくとも1つの空間的隣接テンプレート内の再構成サンプルの数nを特定することを含み、これはn=2に対応し、kはnがブロック幅とブロック高さの合計より小さい最大整数となるように選択される。
少なくとも1つの実施形態の他の一般的態様によれば、映像復号方法が提示され、これは、復号対象のブロックについて、少なくとも1つの空間的隣接テンプレートを特定することと、復号対象のブロックについて、少なくとも1つの線形モデルパラメータを少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて特定することと、特定された少なくとも1つの線形モデルパラメータに基づく線形モデルを使ってブロックを復号することと、を含み、少なくとも1つの空間的隣接テンプレートを特定することは、少なくとも1つの空間的隣接テンプレート内の再構成サンプルの数nを特定することを含み、これはn=2に対応し、kはnがブロック幅とブロック高さの合計より小さい最大整数となるように選択される。
少なくとも1つの実施形態の他の一般的態様によれば、映像符号化装置が提示され、これは符号化方法の実施形態の何れか1つを実施するための手段を含む。
少なくとも1つの実施形態の他の一般的態様によれば、映像復号装置が提示され、これは復号方法の実施形態の何れか1つを実施するための手段を含む。
少なくとも1つの実施形態の他の一般的態様によれば、映像符号化装置が提供され、これは1つ又は複数のプロセッサと、少なくとも1つのメモリを含む。1つ又は複数のプロセッサは、符号化方法の実施形態の何れか1つを実行するように構成される。
少なくとも1つの実施形態の他の一般的態様によれば、映像復号装置が提供され、これは1つ又は複数のプロセッサと、少なくとも1つのメモリを含む。1つ又は複数のプロセッサは、復号方法の実施形態の何れか1つを実行するように構成される。
少なくとも1つの実施形態の他の一般的態様によれば、オフセットは、符号化若しくは復号対象のブロックの左隣接ライン(列)のサンプル内の第一のサンプルの相対位置に関して特定されるか、又はオフセットは、符号化若しくは復号対象のブロックの上隣接ライン(行)のサンプルの中の第一のサンプルの相対位置について特定される。
左隣接列の場合、「第一のサンプルの相対位置」は、走査方向の選択に応じて、その列内の参照サンプル間で、その列内の上側/最上位置にあるサンプルに対応するか、又はその列内の参照サンプルの間で、その列内の下側/最下位置にあるサンプルに対応する。同様に、上隣接行の場合、「第一のサンプルの相対位置」は、走査方向の選択に応じて、その行内の参照サンプル間で、その行内の最も左の位置にあるサンプルに対応するか、又はその行内の参照サンプル間で、その行内の最も右の位置にあるサンプルに対応する。
少なくとも1つの実施形態の他の一般的態様によれば、少なくとも1つの空間的隣接テンプレートの再構成サンプルの数は、符号化又は復号対象のブロックの、より大きい寸法においてはより大きいサンプル数に設定される。
少なくとも1つの実施形態の他の一般的態様によれば、少なくとも1つの空間的隣接テンプレートは、符号化若しくは復号対象のブロックの上隣接ラインのサンプルの中の、又は符号化若しくは復号対象のブロックの左隣接ラインのサンプルの中のサンプルを含む。好ましくは、上隣接ラインのサンプル又は左隣接ラインのサンプルがサブサンプリングされる。変形型において、上隣接ラインのサンプル又は左隣接ラインのサンプルは、オフセットから始めてサブサンプリングされる。
変形型によれば、テンプレートのうち、1つの特定のコード化モード(例えば、イントラモード、イントラ/インター複合モード、イントラブロック複製モード、IPCM等)を使用するか、又は1つの特定のコード化パラメータ(例えば、動きベクトル値、フラッグ等)を使って再構成されたサンプルは考慮されず、及び/又はそのテンプレートから除外される。
少なくとも1つの実施形態の他の一般的態様によれば、左隣接ラインの再構成サンプルが利用できない場合、符号化又は復号において線形モデルは暗黙的に無効化され、上隣接ラインの再構成サンプルは利用できない。変形型において、ブロック幅及びブロック高さがある値より低い場合、符号化又は復号において線形モデルは暗黙的に無効化される。
変形型によれば、テンプレートのすべてのサンプルが1つの特定のコード化モードを使って、又は1つの特定のコード化パラメータを使って再構成された場合、線形モデルは暗黙的に無効化される。他の変形型において、テンプレートのサンプルの、1つの特定のコード化モードを使って、又は1つの特定のコード化パラメータを使って再構成された数が閾値を上回った場合、線形モデルは暗黙的に無効化される。
少なくとも1つの実施形態の他の一般的態様によれば、前記ブロック幅及びブロック高さの少なくとも一方は2の冪と等しくない。
少なくとも1つの実施形態の他の一般的態様によれば、前記ブロック幅及びブロック高さは等しくない。
少なくとも1つの実施形態の他の一般的態様によれば、線形モデルは、cross-component linear mode、block based illumination compensation linear model、及びbi-directional optical flowを含む群に属する。
少なくとも1つの実施形態の他の一般的態様によれば、少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づく少なくとも1つの線形モデルパラメータは、符号化又は復号対象のブロックの空間的隣接テンプレートのサンプルと符号化又は復号対象のブロックの参照ブロックの空間的隣接テンプレートのサンプルとの間の歪を最小化することによって得られる。
少なくとも1つの実施形態の他の一般的態様によれば、非一時的コンピュータ可読媒体が提示され、これは、上述の説明の何れかの方法又は装置により生成されるデータコンテンツを含む。
少なくとも1つの実施形態の他の一般的態様によれば、上述の説明の何れかの方法又は装置により生成される映像データを含む信号が提供される。
本願の実施形態の1つ又は複数はまた、上述の方法の何れかにより映像データを符号化又は復号する命令がその上に記憶されたコンピュータ可読記憶媒体を提供する。本願の実施形態はまた、上述の方法により生成されたビットストリームがその上に記憶されたコンピュータ可読記憶媒体を提供する。本願の実施形態はまた、上述の方法により生成されるビットストリームを送信するための方法及び装置を提供する。本願の実施形態はまた、上述の方法の何れかを実行するための命令を含むコンピュータプログラム製品を提供する。
図面の簡単な説明
少なくとも1つの実施形態の一般的態様による線形モデルパラメータ導出で使用される隣接テンプレートの特定を含む例示的な符号化又は復号方法を示す。 先行技術における正方形及び長方形のブロックに関する、隣接の再構成サンプルと動きベクトルで並進移動された対応する参照サンプルからのLICパラメータの導出を示す。 先行技術における長方形CUに関する左側及び上側参照サンプルの位置の例を示す。 先行技術における長方形CUに関する左側及び上側参照サンプルの位置の例を示す。 先行技術における非長方形の分割(上)及び関連するOBMC対角重み付け(下)の例を示す。 先行技術における2つの三角形のCU分割(左)及び関連する予測ユニットペア(右)の例を示す。 先行技術におけるインター及びイントラ予測モードの組合せの場合の多仮説予測の例を示す。 少なくとも1つの実施形態の一般的態様による線形モデルパラメータ導出において使用されるサンプルの最適化された選択を含む例示的な符号化又は復号方法を示す。 少なくとも1つの実施形態の一般的態様によるオフセットを有する長方形CUのための左側及び上側参照サンプルの位置の例を示す。 少なくとも1つの実施形態の一般的態様による少なくとも1つの空間的隣接テンプレートの再構成サンプルの数を示す絵による例である。 少なくとも1つの実施形態の一般的態様による少なくとも1つの空間的隣接テンプレートの再構成サンプルの数を示す絵による例である。 少なくとも1つの実施形態の一般的態様による少なくとも1つの空間的隣接テンプレートの再構成サンプルの数を示す絵による例である。 少なくとも1つの実施形態の一般的態様による少なくとも1つの空間的隣接テンプレートの再構成サンプルの数を示す絵による例である。 少なくとも1つの実施形態の一般的態様による例示的符号化方法を示す。 少なくとも1つの実施形態の一般的態様による復号方法の例を示す。 少なくとも1つの実施形態の一般的態様による再構成サンプル方法の数の特定の例を示す。 少なくとも1つの実施形態の一般的態様による再構成サンプル方法の数の特定の例を示す。 少なくとも1つの実施形態の一般的態様による再構成サンプル方法の数の特定の例を示す。 少なくとも1つの実施形態の一般的態様による再構成サンプル方法の数の特定の例を示す。 実施形態の各種の態様が実装されてよい映像エンコーダのある実施形態のブロック図を示す。 実施形態の各種の態様が実装されてよい映像エンコーダのある実施形態のブロック図を示す。 実施形態の各種の態様が実装されてよい例示的な装置のブロック図を示す。
詳細な説明
図面と説明文は、本願の原理を明瞭に理解するために関係のある要素を示しながら、明瞭にするために典型的な符号化及び/又は復号装置に見られる他の多くの要素は排除されていると理解されたい。第一の、及び第二の、という用語は、本明細書において、各種の要素を説明するために使用され得るが、これらの要素はこれらの用語により限定されるべきではないと理解されたい。これらの用語は、1つの要素を他の要素から区別するためのみに使用されている。
各種の実施形態は、1つのピクチャの符号化/復号に関して説明されている。これらは、ピクチャの一部、例えばスライス若しくはタイル、又はピクチャシーケンス全体の符号化/復号にも応用されてよい。
各種の方法が上述され、方法の各々は記載された方法を実現するための1つ又は複数のステップ又は行為を含む。ステップ又は行為の具体的な順序がその方法の適正な動作に必要でないかぎり、特定のステップ及び/又は行為の順序及び/又は使用は変更又は組み合わせられてよい。
少なくとも幾つかの実施形態は、例えばLocal Illumination Compensationの中で使用される線形モデルを導出するための隣接テンプレートのサンプルの特定を新規なコード化(予測)モデルに適応させることに関する。本願の説明は主として線形モデルとしてLICに基づいているが、当業者であれば、本願の原理をCCLM等のその他の線形モデルに容易に応用するであろう。さらに、本願の説明は平均二乗誤差の差(MSE)に基づく歪を最小化する線形モデルに基づくが、本願の原理の少なくとも幾つかの実施形態は、予測サンプルと参照サンプルとの間の差分の集合の中の最小値及び/又は最大値に基づく歪又は予測サンプルと参照サンプルとの間の差分の中央値に基づく歪を最小化する線形モデルにも応用される。
新規のコード化(予測)モードにより、当業者は、予測サンプルが非正方形又は非長方形ブロック(例えば、三角形)の組合せ及び/又は空間的に可変的な重み付け(例えば、多仮説)を使って構築されるコード化モードを考慮する。それゆえ、LICのための上側及び左側サンプルの選択をこのようなコード化モードに適応して、正確なLICモデルを提供することが望ましい。
第1項では、線形モデルパラメータを導出するために使用される参照サンプルの選択に関する幾つかの制限が開示される。
第2項では、LICパラメータを導出するために使用される参照サンプルを特定するための改良された方法の幾つかの実施形態が開示される。これらは、CCLM及びBIOの参照サンプルの特定にも応用できる。
第3項では、追加の情報及び包括的実施形態が開示される。
1. 線形モデルパラメータを導出するために使用される参照サンプルの選択に関する制限
1.1 LICパラメータを導出するために使用される参照サンプルの選択に関する制限
第一の非限定的な例によれば、線形モデルに基づくLocal Illumination Compensation(LIC)を使って、符号化対象のピクチャとその参照ピクチャとの間の輝度変化を、正規化係数a及びオフセットbを用いて補償するために使用される。インターモードでコード化されるcoding unit(CU)の各々に適応させて有効化又は無効化される。LICがあるCUに適用される場合、平均二乗誤差(MSE)方式が利用されて、対象CUの隣接サンプルとそれらに対応する参照サンプルを使ってパラメータa及びbを導出する。より具体的には、参照ピクチャの中のCU(図2のcurrent blk)の隣接サンプルと対応するサンプル(対象CU若しくはsub−CU又は図2のref blkの動き情報MVにより特定される)が使用される。ICパラメータは、各予測方向について別々に導出され、適用される。LICパラメータは、対象CUの上隣接及び左隣接再構成サンプルrec_cur(r)(図2の右側の隣接再構成サンプルにアクセス)とインター予測により特定される、それらに対応する参照サンプルの上隣接及び左隣接再構成サンプルrec_ref(s)(図2の左側の追加の参照サンプルにアクセス)との間の平均二乗誤差の差(MSE)を最小化し、s=r+MVであり、MVはインター予測:
dist=Σr∈Vcur,s∈Vref(rec_cur(r)−a.rec_ref(s)−b) (式1)
からの動きベクトルである。
(a,b)の値は、最小二乗最小化(式2)により得られる:
Figure 2021511698
対象CUについてLICパラメータがエンコーダ又はデコーダにより得られると、対象CUの予測pred(current_block)は以下にある(一方向予測の場合):
pred(current_block)=a×ref_block+b(式3)
式中、current_blockは予測される対象ブロック、pred(current_block)は対象ブロックの予測であり、そしてref_blockは通常の動き補償(MV)プロセスにより構築されて、対象ブロックの一時的な予測に使用される参照ブロックである。
導出で使用される参照サンプルの数であるNの値は、式2中の和項がとり得る最大整数記憶数(maximum integer storage number)未満のままである(例えば、N<216)ようにするか、又は長方形ブロックに対処するために調整される(漸進的に減少される)。したがって、最新技術によるアプローチでは、図3に示されるように、参照サンプルは(サブサンプリングのステップstepH又はstepVで水平及び/又は垂直に)サブサンプリングされてから、LICパラメータ(a,b)の導出に使用される。
隣接再構成サンプルのセットと参照サンプルのセット(図3のグレーのサンプルを参照のこと)は同じ数と同じパターンを有する。以下において、「左側サンプル」とは対象ブロックの左側にある隣接再構成のセット(又は参照サンプルのセット)を指し、「上側サンプル」とは、対象ブロックの上側にある隣接再構成のセット(又は参照サンプルのセット)を指す。「サンプルセット」とは、「左側サンプル」及び「上側サンプル」セットの一方を指す。好ましくは、「サンプルセット」はブロックの左隣接又は上隣接ラインに属する。
LICパラメータの導出に使用される左側及び上側サンプルの選択(図3のグレーのサンプルを参照のこと)において幾つかの制約が適用される。
R1)左側及び上側サンプル数の合計は2の冪として、右へのシフトを用いて分割が行われるようにすべきである。
R2)左側(N)及び上側(N)サンプルの数は同じであり、Ns(N=2.Ns)と等しい:
n=min(cuHeight,cuWidth)
x=log2(n)
Ns=2 (式4)
R3)左側(ステップV)又は上側(stepH)サンプル間のステップは以下と等しい:
stepV=cuHeight>>log2(Ns) (式5)
stepH=cuWidth>>log2(Ns)
したがって、発明者らは、LICパラメータを導出するために使用される参照サンプルの選択に関して、上述の最新技術における幾つかの制限を認めた。これらの制限は以下のとおりである:
a)薄い長方形の場合、サンプルセットは最適下限である(R3):
「左側サンプル」及び「上側サンプル」セットは、図3に示されるようなバランスのとれていない寸法の長方形のCU(幅が高さよりはるかに大きいか、その逆)の場合、最適下限であってよい。これが最適下限であるのは、上側で使用される「上側サンプル」セットの数は「左側サンプル」セットと比較して非常にスパースであるが、「左側サンプル」は平均して「上側サンプル」よりも対象CUのサンプルに対してより遠く(farer)、その結果、局所的輝度変化を推定するのに、演繹的に、より適さないからである。
b)少なくとも1つのサンプルセットが利用できない長方形CUの場合、サンプルセットは最適下限である:
制約R2は、1つ(又は2つ)の参照サンプル境界が利用できないケースを考慮しない。これは、図3の右下の例に示されているように、対象CU(図2−右側)又は参照CU(図2−左側)が上又は左側のピクチャ(又はスライス若しくはタイル)の境界上にある場合に当てはまり得る。この例では、Nsの選択はcuHeight=4から行われ、左側サンプルは利用できない。よりよい選択は、例えばNs=16であろう。
左上の境界上にあるCUの場合、「左側サンプル」及び「上側サンプル」セットはどちらも利用できない。幾つかのコーデックにおいては、再構成サンプルは(1<<−bit−depth−1))と推測され、参照サンプルはパディングにより推測される。
c)2の冪ではないCUサイズの場合、サンプル数は最適下限であり得る:
R1要件はR2を通じて得られるが、それによって不必要な制約が加わる。これはNが、N=2.Ns及びNs=exp(log2(n))=2であるため、4で割れるからである。
長方形の12×4のCUの左側及び上側参照サンプルの位置の例を示す図4の例では、このルールによりNs=4及びN=8となるが、参照サンプルのスパース性を回避するために、N=16のよりよい選択ができるはずである。
d)左上及び右上サンプルの位置は最適下限である:
上方左(above-left)(x=0;y=−1)及び上側左(upper-left)(x=−1;y=0)のサンプルの位置は、サブサンプリング値(stepV及びstepH)にかかわらず、近い。
最終上方右(last above-right)又は最終下側左(last bottom-left)のサンプルの位置は、対象CUの終端右上方(vary last right above)サンプル(x=cuWidth−1;y=−1)(又は対応する終端下側左(very last bottom-left)(x=−1;y=cuHeight−1))サンプルの位置に対して比較的遠くてよいが。
e)非長方形PUの場合、サンプルセットは最適下限である:
非長方形予測の場合、CU予測は図5の例に示されているように、2つの非長方形予測(PU)で構成される。
三角形の分割に関して、図6に示されているように、対象CUのサンプルセットのデフォルト位置は関連するPUに適していない場合があり、これはサンプルセットがPUサンプルに対して遠く、連続していないことがあるからである。
f)MHの場合、サンプルセットは最適下限である:
多仮説予測の場合、2つの正規予測が加重平均を通じて組み合わせられる。一方がイントラ予測モードで他方がインター予測モードの場合、イントラ予測モードは信号化される(古典的予測モードのサブセット(例えば、4)であり得る)。変形型において、対象ブロックは4つの等しい面積の領域に分割される。領域がイントラ参照サンプルから離れるにつれて重みは漸減する。各重みセットは、イントラ垂直方向予測に関する図7の例に示されているように、(w0=w_intra,w1=w_inter,)で表され、iは1〜4であり、(w_intra,w_inter)=(6,2)、(w_intra,w_inter)=(5,3)、(w_intra,w_inter)=(3,5)、及び(w_intra,w_inter)=(2,6)であり、対応する領域に適用される。他の変形型では、重みはCU全体にわたり均一であるが、イントラ及びインターについて異なり得る(w_intra≠w_inter)。DC又はPlanarモードが選択されるか、CU幅又は高さが4より小さい場合、均一な重みが適用される。
これらの場合、重み(w_inter)が低い領域は、その他の領域と比較して、最終的な予測サンプル値にとっての重要性が低い。その結果、これらの第一の領域の隣接参照サンプルを使って、インター予測がより高い重みを有する他の領域について使用されることになるLICパラメータを導出するのは非効率的であるかもしれない。
均一な重みの場合、w_interが閾値を下回ると、LICを無効化できる。
1.2 LMパラメータの導出に使用される参照サンプルの選択に関する制限
第二の非限定的な例によれば、コンポーネント間冗長を低減させるために、cross-component linear model(CCLM)予測モードがJEMで使用され、それについて、以下の線形モデルを使って同じCUの再構成された輝度サンプルに基づいて色差サンプルが予測される:
pred(i,j)=α・rec’(i,j)+β (式6)
式中、pred(i,j)はCU内の予測色差サンプルを表し、rec(i,j)は同じCUの低解像度処理された再構成輝度サンプルを表す。パラメータα及びβは、対象ブロックの周囲の隣接する再構成輝度サンプルと色差サンプルとの間の回帰誤差(平均二乗誤差)を以下のように最小化することによって導出される:
Error=Σn∈N(C(n)−α.L(n)−β) (式7)
これは:
Figure 2021511698
によって解決され、式中、L(n)は低解像度処理された上隣接及び左隣接再構成輝度サンプルを表し、C(n)は上隣接及び左隣接再構成色差サンプルを表し、Nの値は対象の色差コード化ブロックの幅と高さの最小値の2倍と等しい。正方形のコード化ブロックの場合、上記の2つの式は直接適用される。したがって、LICについて説明した制限はLMにも当てはまる。
1.3 インター予測の精度向上のために使用される参照サンプルの選択に関する制限
JEMバージョンに記載されている隣接テンプレートに基づく線形モデルを用いたまた別の非限定的例は、Bi-directional Optical flow(BIO)であり、これは双方向予測のためのブロックごとの動き補償の上に実行されるサンプルごとの動き予測精度向上を提供する。
したがって、少なくとも1つの実施形態は、線形モデル(LIC、LM、BIO)パラメータの導出に使用される参照サンプルのよりよい選択(数、サブサンプリングステップ、位置)を通じて線形モデルプロセスを改善する。これは、次項で詳細に述べるように、対象CUの形状、コード化モード、及びサイズに応じてこれらのサンプルの選択を行うことによって実現される。
2.LICパラメータを導出するために使用される参照サンプルを特定する方法の少なくとも1つの実施形態
第1項に記載の制限に対処するために、少なくとも1つの実施形態の一般的態様は、線形モデルを導出するために使用される空間的隣接部の再構成サンプルの中の改良されたテンプレートを特定することによって、線形モデルの精度を改善することを目指す。当業者であれば、符号化又は復号対象のブロックには、(例えば、画像の第一のブロックについて)利用可能なテンプレートがゼロすなわち無しであるか、1つの利用可能なテンプレート(左又は上画像隣接)、又は再構成画素の2つの利用可能な隣接テンプレート(上及び左側テンプレート)があることがわかるであろう。空間的隣接テンプレートは、処理対象のブロックの上隣接サンプルのラインの中のサンプル又は、処理対象のブロックの左隣接サンプルのラインの中のサンプルを含む。第一の実施形態において、少なくとも1つの空間的隣接テンプレート(すなわち、左側テンプレートと上側テンプレートの両方が利用可能であれば、それらの両方のうち)の再構成サンプルの総数Nは、N=2に対応し、kは、Nがブロック幅及びブロック高さの合計より小さい最大整数であるように選択される。第二の実施形態において、テンプレートのうち、処理対象ブロックの左(又は上)隣接ラインのサンプルの中の第一のサンプルの相対位置に関するオフセットが特定される。第三の実施形態において、少なくとも1つの空間隣接テンプレートの再構成サンプルの数は、処理対象のブロックの大きい方の寸法において、より多いサンプル数に設定される。
これら3つの実施形態と他の幾つかの実施形態は、LICパラメータの非限定的例について2.1〜2.7項で説明され、実施形態は各種の実施形態の何れかの組合せによって一体に配置されてよい。特に、上及び左隣接サンプルの重みに関する、又はサンプルオフセットに関する実施形態は、最大、(例えば、CCLMの実施形態又はLICの他の最新技術の代替的実施形態等のように)最小、又は中央値を最小化することに基づいて、線形モデルに十分に適応される。それゆえ、隣接部重み付けに関する実施形態は、テンプレート内のサンプル数に関する実施形態がなくても実装できる。そのほかに、オフセットに関する実施形態は、テンプレート内のサンプル数に関する実施形態がなくても実装できる。
図1は、少なくとも1つの実施形態の一般的態様による線形モデルパラメータ導出において使用される隣接テンプレートを特定することを含む例示的な符号化又は復号方法を示す。
符号化又は復号方法301は、少なくとも1つの線形モデルパラメータを、符号化又は復号対象のブロックの少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて特定する。この線形モデルはその後、符号化又は復号方法で使用される。このような線形モデルパラメータは、例えば式3又は6で定義されるモデルのアフィン変換係数を含む。それゆえ、線形モデルは、cross-component linear model、block-based illumination compensation linear model、bi-directional optical flowを含む集合に属する。
まず、ステップ302で、方法は、あるピクチャの中の処理対象のブロックについて、後述の実施形態の何れかによる少なくとも1つの空間的隣接テンプレートを特定する。
ステップ303で、方法は、処理対象のブロックについて、少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて少なくとも1つの線形モデルパラメータを特定する。少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づく線形モデルパラメータは、ブロックの空間的隣接テンプレートのサンプルと、例えば式1又は7において定義されるブロックに関する参照ブロックの空間的隣接テンプレートのサンプルとの間の歪を最小化することによって得られる。歪は、MSE又は他の何れかの方法により推測される。
最後に、ステップ304で、方法は、例えばCCLM又はLICに関して開示され、特定されたテンプレートに応答する、特定された少なくとも1つの線形モデルパラメータに基づく線形モデルを適用してブロックを符号化/復号する。
図8は、特定の実施形態による線形モデルパラメータの導出で使用されるサンプルの最適化された選択を含む他の例示的な符号化又は復号方法を示す。
ステップ302で、方法は、あるピクチャの中の符号化又は復号対象のブロックについて、少なくとも1つの空間的隣接テンプレートを特定する。図8の実施形態は、上述の各種の実施形態を含む。テンプレートを特定するためのサブステップ300〜370の実施形態の何れも任意選択によるものであり、方法301から単独で除外することも、又は何れの順番で処理することもできる。次の可変数が定義される:cuHeightは処理対象のブロックの高さを表し、cuWidthは処理対象のブロックの幅を表し、テンプレート内のサンプル総数NはN=2=N+Nであり、式中、NとNはそれぞれ左及び上側テンプレート内のサンプル数を表し、OffX及びOffYはそれぞれ上及び左隣接内の上及び左側テンプレート内の第一のサンプルの相対的オフセットを表し、サブサンプリングステップstepV、stepHは「左側サンプル」セット及び「上側サンプル」セット内の最後のサンプルについて定義される。
サブステップ300において、左側サンプルの利用可能性が2.4項で説明するようにテストされる。左側サンプルが利用できない場合、cuHeightの値はゼロと等しく、すなわちcuHeight=0に設定される。すると、次のサブステップで、Nの値は2と等しく設定され、k=ceil(log2(cuWidth))、そしてN=N、N=0である。サブステップ310で、上側サンプルの利用可能性は、2.4項で説明するようにテストされる。上側サンプルが利用できない場合、cuWidthの値はゼロと等しく、すなわちcuWidth=0に設定される。すると、次のサブステップで、Nの値は2と等しく設定され、k=ceil(log2(cuHeight))、そしてN=0、N=Nである。サブステップ320では、上側及び左側サンプルの何れの利用可能性も、2.5項で説明するようにテストされない。上及び左側サンプルの両方が利用可能とはかぎらない(又は隣接部において十分なサンプルが利用できない)場合、395で、線形モデルを使用する予測を有効化又は無効化する線形モデルフラッグが暗黙的に導出され、これはそのブロックについてはfalseに設定され、そのブロックについて方法は終了する。少なくとも1つのテンプレートが利用可能である場合、サブステップ330、340、350で、それらのテンプレート内のサンプル数Nは、2.1項に詳細に記したように特定される。したがって、サブステップ330において、値kはk=ceil(log2(cuWidth+cuHeight))として特定され、ceilは天井関数であり、ceiling(x)はx以上の最小整数を返す。サブステップ340で、サブサンプリング値「sub」(同じ方向への2つのサンプル間の距離)は1と等しい。ステップ350で、Nの値は2と等しく設定される。すると、サブステップ360で、隣接サンプルの中の第一のサンプルに関するオフセット(高さOffY及び/又は幅OffX)が、2.2項において詳細に記されている変形型の何れかにより特定される。サブステップ370で、左側及び上側テンプレート内のサンプル数を表すN、Nは、2.3項において説明されているように、より大きい寸法においてより多くのサンプルが選択されるように調整される(及びサブサンプリングステップsub)。それゆえ、この実施形態によれば、改良されたテンプレートがステップ302内の線形モデル導出のために特定される。
ステップ303で、方法は、符号化又は復号対象のブロックに関して、少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて少なくとも1つの線形モデルパラメータを特定する。最後に、ステップ304で、方法は、特定されたテンプレートに応答して特定された少なくとも1つの線形モデルパラメータに基づいて線形モデルを適用してブロックを符号化/復号する。
2.1 第一の実施形態:サンプル総数Nは2の冪であるが、N又はNは必ずしも2の冪ではない
第一の実施形態は、LICで使用されるサンプル数NをN=2となるように調整することを含み、ここでkは、ブロック幅とブロック高さの合計より小さい最大整数となるように選択される。
有利な点として、この実施形態では、薄い長方形(ケースa)の場合又はサンプルサイズ又はCUサイズが2の冪でない場合(ケースc)のサンプルセットを最適化できる。
したがって、ステップ330で、値kは:
k=ceil(log2(cuWidth+cuHeight))
として特定され、式中、ceilは天井関数であり、ceiling(x)はx以上の最小整数を返す。
ステップ340で、サブサンプリング値「sub」(同じ方向への2つのサンプル間の距離)は1と等しい。ステップ350で、Nの値は2kと等しく設定される。実施形態は、前述の制限と両立し、例えば、kの値はさらに調整されてよく(漸進的に減少する)及び「sub」の値は相応に増加し340、それによって前述のように、式2の和項は最大整数記憶数(maximum integer storage number)より低く保たれる。
2.2 第二の実施形態:第一の上又は左側サンプルは(x=0;y=−1)及び(x=−1;y=0)ではない
第二の実施形態は、「上側サンプル」セットの第一のサンプルの相対位置のためのオフセットを特定すること及び/又は「左側サンプル」セットの第一のサンプルの相対位置のためのオフセットを特定することを含む。
有利な点として、この実施形態では、上−左及び上−右サンプルの位置を最適化できる(ケースd)。
したがって、ステップ360で、「上側サンプル」セットの第一のサンプルの位置と「左側サンプル」セットの第一のサンプルの位置はゼロではなく、図9の左側に示されているように、オフセット(それぞれoffX及びoffY)により移動される。
変形型において、図9の右側に示されているように、「上側サンプル」セットの終端サンプルの位置は(x=cuWidth−1;y=1)であり、終端「左側サンプル」セットの位置は(x=−1;y=cuHeight−1)である。
他の変形型において、「上側サンプル」セットの第一のサンプルの位置及び「左側サンプル」セットの第一のサンプルの位置に関するオフセットと「上側サンプル」セットの最終サンプルの位置及び「左側サンプル」セットの最終サンプルの位置に関するオフセットが画定される。すると、サブサンプリングステップ(stepV,stepH)が、「上側サンプル」セットの第一のサンプルと「上側サンプル」セットの最終サンプルとの間の幅及び「左側サンプル」セットの第一のサンプルと「左側サンプルセット」の最終サンプルとの間の高さに応じて画定される。
他の変形型において、「offX」(又は「offY」)の値は「stepH/2」(又は「stepV/2」)と等しく設定される。
他の変形型において、「offX,offY」の値は、LICパラメータ導出に使用される、より近い参照サンプルまでの対象CUの画素の距離の和を最小化する値である:
Figure 2021511698
式中、pはCUのサンプルであり、mindistref(p)はより近い参照サンプルまでの「p」の距離である。
有利な点として、値(offX,offY)は、考え得るCUサイズ(cuWidth;cuHeight)のセットについて、演繹的に特定し、表にすることができる。
2.3 第三の実施形態:より大きい寸法にはより多くのサンプル
第三の実施形態は、ブロックのより大きい寸法においてより多数のサンプルを選択することを含む。
有利な点として、この実施形態では、長方形のCUの場合に、最大寸法についてより大きいサンプル重みを導入することにより、サンプルセットを最適化できる。
したがって、ステップ370で、あるサブサンプリング「sub」の値について、Aがより大きいCU寸法(A=Left、N=N又はA=Top、N=N)であり、Bがその他の寸法である場合、Nは:
=cuSizeA>>(sub−1)
=N−N (式11)
と計算される。
式中、A=Topであれば、cuSizeA=cuWidth、A=Leftであれば、cuSizeA=cuHeightである。
2.4 第四の実施形態:1つのサンプルセットが利用できない
第四の実施形態は、左側サンプルが利用できない場合に、LICで使用されるサンプルの数N(N=2、kはNがブロック幅より小さい最大整数となるように選択される)を適応させることを含む。第四の実施形態は、上側サンプルが利用できない場合に、LICで使用されるサンプルの数N(N=2、kはNがブロック高さより小さい最大整数となるように選択される)を適応させることを含む。
各種の変形型によれば、「利用できないサンプル」は以下の場合を含むことができる:
−対象CUがピクチャ又はスライスの境界上にある。
−対象CUが事前に画定されたVPDU(Video Processing Data Unit)又はCTUの境界上にある。VPDUは事前に画定された最大ハードウェア処理ユニットサイズである場合。
有利な点として、この実施形態では、長方形のCUの場合に、少なくとも1つのサンプルセットが利用できないときにサンプルセットを最適化できる(ケースd)。
したがって、図8の方法において、少なくとも1つの追加のテストが300及び310に導入され、そこでサンプルの利用可能性がチェックされる。左(300)又は上(310)側サンプルが利用できない場合、Nの値は2と等しく設定され、それぞれk=ceil(log2(cuWidth))又はk=ceil(log2(cuHeight))であり、また、それぞれ(N=N;N=0)又は(N=N;N=0)である。
2.5 第五の実施形態:2つのサンプルセットが利用できない
第四の実施形態は、左側サンプルが利用できず、上側サンプルが利用できない場合に、符号化又は復号時にfalseに設定されたIC−フラッグを導出することを含む。第四の実施形態の変形型は、ブロック幅が第一の値より小さい場合及びブロック高さが第二の値より低い場合に、符号化又は復号時にfalseに設定されたIC−フラッグを導出すること含む。第四の実施形態の他の変形型は、ブロック幅が第一の値より大きい場合及びブロック高さが第二の値より大きい場合に、符号化又は復号時にfalseに設定されたIC−フラッグを導出することを含む。
有利な点として、この実施形態では、ICフラッグが推定され、ビットストリームの中でコード化されないため、圧縮効率が改善される。
ある変形型において、「左側サンプル」及び「上側サンプル」のどちらも利用できない場合、ステップ320でIC−フラッグがfalseと推定され、ビットストリームの中でコード化されない。
ある変形型において、1つのサンプルセット(上又は左)が利用できず、他方(それぞれ左又は上)の寸法サイズが閾値より低い(又は高い)場合、IC−フラッグはfalseと推定され、ビットストリームの中でコード化されない。
IC導出の変形型によれば、エントロピ符号化及びエントロピ復号もまた、LICを使用しないCUについてはLICパラメータフラッグがコード化されないように改良される。
2.6 非長方形の場合に適応された第六の実施形態
第六の実施形態は、三角形予測の場合にLICパラメータを導出するためにPU三角形に空間的に連続するサンプルを選択することを含む。第六の実施形態のある変形型は、三角形の分割方向に応じてLICパラメータを導出するためにPU三角形に空間的に連続するサンプルを選択することを含む。
第六の実施形態の変形型は、三角形予測の場合にブロックの各寸法につき1つである2つのICフラッグをコード化/復号することを含む。
有利な点として、この実施形態では、三角形CUの場合に、空間的に閉じたサンプルを選択することによってサンプルセットを最適化できる。
三角形の予測ユニットの場合(図6参照)、サンプルセットは以下のように変更される:
−PU三角形に空間的に連続するサンプルのみを使ってLICパラメータを導出する。例えば、図6(上−左)の三角形の構成の場合、三角形「a」(N=N)について「上側サンプル」セットのみ、及び三角形「b」(N=N)について「左側サンプル」セットのみを使用する。図6(下−左)の三角形の構成の場合、三角形「c」について「上側サンプル」と「左側サンプル」の両方を使用し、三角形「d」についてIC−フラッグはfalseと推定される。
−ある変形型において、各PUにつき1つである2つのIC−フラッグがコード化される。三角形「d」の場合、IC−フラッグはコード化されない。
同じ方策が図5上−右の4つの非長方形分割にも当てはめられてよく、この場合、PUサイズとCUサイズが同じである寸法に関するサンプルのみが保持される。これは、非長方形のPU分割3及び5が1のPU三角形と同じサンプルセットを有し、非長方形のPU分割4及び6は2のPU三角形と同じサンプルセットを有することを意味する。
ある変形型において、2つのサンプルセットは、非長方形のPUのみに連続するサンプルで構成される。
2つのICフラッグの変形型によれば、エントロピ符号化及びエントロピ復号もまた、2つのフラックを使用しないCUについて、LICパラメータフラッグがコード化されるように変更される。
2.7 多仮説の場合に適応される第七の実施形態
第七の実施形態は、多仮説予測の場合、LICパラメータの導出のための値より大きいか、それと等しいブレンディング重みを有する領域に空間的に連続するサンプルを選択することを含む。
有利な点として、この実施形態では、多仮説予測CUの場合に、より重い重みを有する参照サンプルを選択することにより、サンプルセットを最適化できる。
サンプルセットは、閾値より高いか、それと等しいw_interの値を有する領域に連続するサンプルで構成される。閾値はゼロであってよい。
図7には、イントラ予測方向が垂直であり、「閾値」の値が0.5である例を示しており、これはLICパラメータを導出するために下−左参照サンプルのサブセットを使用する中で判明する。イントラ予測方向が水平である同じ例を導出でき、上−右参照サンプルのサブセットを使ってLICパラメータを導出する。
ある変形型において、イントラモードがDCである場合、LICはMHについて常に無効化される。ある変形型において、イントラモードがPlanarである場合、LICはMHについて常に無効化される。ある変形型において、LICはMHで常に無効化される。
2.8 QTBT分割に適応される第八の実施形態
図11は、少なくとも1つの実施形態の一般的態様による例示的な符号化方法500を示す。cross-component linear model(CCLM)予測モード又はLocal Illumination Compensation(LIC)としての例示的実施形態について説明したように、方法500は、符号化対象のブロックの少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて少なくとも1つの線形モデルパラメータを特定する。このような線形モデルパラメータは、例えば、式3又は6で定義されるモデルのアフィン変換係数を含む。それゆえ、線形モデルは、cross-component linear model、block-based illumination compensation linear model、bi-directional optical flowを含む群に属する。図11の実施形態は、符号化方法に関する図1の実施形態の具体的な実装例である。
この実施形態において、以下の可変数が定義される:H(cuHeight)は処理対象のブロックの高さを表し、W(cuWidth)は処理対象のブロックの幅を表し、テンプレート内のサンプル総数NはN=2=NumY+NumXで、NumY、NumX(N)はそれぞれ左及び上テンプレート内のサンプル数を表し、Ystep及びXstepはそれぞれ、左及び上隣接部内のサブサンプリングステップを表す。
まず、510で、方法500は、あるピクチャ内の符号化対象のブロックについて、少なくとも1つの空間的隣接テンプレートを特定する。図10A〜10Dに示されているように、各種のブロック分割により、空間的隣接テンプレート401、402は様々な大きさである。図10Aは、符号化対象のブロック400が正方形のブロックであり、幅Wと高さHが2の冪であり、例えばW=H=32である場合を示している。幅W及び高さHのユニットは画像サンプルである。それゆえ、再構成サンプルの2つの隣接テンプレート401、402がブロック400について特定される。上隣接テンプレート401の大きさは32×1サンプルであり、左隣接テンプレートのサイズは1×32サンプルである。当業者であれば、画像内のブロックの位置及び復号における走査順序に応じて、符号化又は復号対象のブロックは、再構成ピクセルの隣接プレートを(画像の第一のブロックについて)ゼロ、(左又は上隣接テンプレートでは)1つ、又は2つ有することがわかるであろう。そのほかに、当業者であれば、空間的隣接テンプレート401、402は、上隣接サンプルのライン401の中及び、左隣接サンプルのライン402の中の処理対象ブロックの各隣接サンプルを含むことに気付くであろう。上及び左テンプレートを有する一般的ケースについて開示された各種の実施形態は、上又は左の1つの隣接テンプレートのみである場合に容易に適応される。520で、方法500は、符号化対象のブロックについて、符号化の対象のブロックの幅と高さに基づいて、少なくとも1つの空間的隣接テンプレートのうちの2の冪に対応する再構成サンプルの数を特定する。それゆえ、図10Aの例示的ケースでは、上隣接テンプレートの再構成サンプルの数NumXと左隣接テンプレートの再構成サンプルの数NumYは32=2^5に設定される。530で、方法500は、符号化対象のブロックについて、少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて少なくとも1つの線形モデルパラメータを特定する。実際、方法は、隣接するサンプルから特定された数NumX及びNumYのサンプルを選択して、処理を行い、線形モデルを導く。例えば、線形モデルパラメータは、隣接テンプレート内のNumx及びNumYの再構成サンプルの値に応答して式3又は6で定義されるアフィン変換係数である。少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づく線形モデルパラメータは、符号化又は復号対象のブロックの空間的隣接テンプレートのサンプルと符号化又は復号対象のブロックに関する参照ブロックの空間的隣接テンプレートのサンプルとの間の歪を最小化することによって得られる。最小化を解く式において2^5により割ることは、右側へのシフトにより容易に実行できる。最後に、540で、方法500は、CCLM又はLICについて開示したような特定された少なくとも1つの線形モデルパラメータに基づく線形モデルを使ってブロックを符号化する。
図10Aは、ブロックの大きさ、及びそれゆえ線形モデル計算で使用される再構成サンプルの数が元々2の冪であり、左及び上隣接領域について等しい例を示している。それゆえ、既知の線形モデルパラメータの特定はこの分割にもよく適応する。しかしながら、図10B、10C、及び10Dは、線形モデルパラメータの特定では計算が不正確となる、したがって最適下限となる例を示す。
図10Bは、符号化対象のブロック400が長方形ブロックで、高さHが3×2^N、すなわちH=24、W=32である場合を示している。図13で開示される1つの実施形態によれば、上隣接テンプレートの再構成サンプルの数NumXと左隣接テンプレートの再構成サンプルの数NumYは8=2^3に設定される。2単語で、左側テンプレートのサンプルはサブサンプリングされて3つのサンプルのうちの1つが保持され、すなわち24/3=8であり、上側テンプレートのサンプルはサブサンプリングされて4つのうち1つが保持され、それによって、線形モデルの計算に使用される上隣接テンプレートの再構成サンプルの数NumXと左隣接テンプレートの再構成サンプルの数NumYは等しく、8に設定される。
図10Cは、符号化対象のブロック400が長方形ブロックで、高さHが3×2^N、すなわちH=24及びW=32である場合の他の実施形態を示す。図14で開示される1つの実施形態によれば、上隣接テンプレートの再構成サンプルの数NumXと左隣接テンプレートの再構成サンプルの数NumYは16=2^4に設定される。2単語で、左側テンプレートのサンプルはサブサンプリングされて3つのサンプルのうち2つが保持され、すなわち242/3=16であり、上側テンプレートのサンプルはすると、サブサンプリングされて2つのうちの1つが保持され、それによって線形モデルの計算で使用される上隣接テンプレートの再構成サンプルの数NumXと左隣接テンプレートの再構成サンプルの数NumYは等しく、16に設定される。
図10Dは、符号化対象のブロック400が長方形のブロックであり、一方の寸法が他方の寸法よりはるかに小さい、すなわちH=8及びW=32の場合を示している。図9で開示される1つの実施形態によれば、上隣接テンプレートの再構成サンプルの数NumXと左隣接テンプレートの再構成サンプルの数NumYの合計は、32=2^8に設定される。2単語で、最小である左側テンプレートのサンプルは計算の中で保持され、その数NumY=8が上側テンプレートのサンプルの数から除外されて、上側テンプレートではNumX=32−8=24のサンプルが保持され、それによって、線形モデルの計算に使用される上隣接テンプレートの再構成サンプルの数NumX=24と左隣接テンプレートの再構成サンプルの数NumY=8の合計は等しく、32に設定される。
図12は、少なくとも1つの実施形態の一般的態様による復号方法の例を示す。当業者であれば、同じ原理が復号方法500及び復号方法700にも当てはまることがわかるであろう。図12の実施形態はまた、図1の実施形態の具体的な実装例である。したがって、方法600は復号対象のブロックの少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて少なくとも1つの線形モデルパラメータを特定する。このような線形モデルパラメータは、例えば、式3又は6で定義されるモデルのアフィン変換係数である。まず、610で、方法600は、あるピクチャ中の復号対象ブロックについて、図10A〜10Dの例示的実施形態に示されているように、少なくとも1つの空間的隣接テンプレートを特定する。それゆえ、再構成サンプルの2つの隣接テンプレート401、402がブロック400について特定される。上隣接テンプレート401の大きさはW×1サンプルであり、左隣接テンプレートの大きさは1×Hサンプルである。620で、方法600は、復号対象のブロックについて、少なくとも1つの空間的隣接テンプレートのうち2の冪に対応する再構成サンプルの数を復号対象のブロックの幅と高さに基づいて特定する。それゆえ、図10Aの例示的な場合について、上隣接テンプレートの再構成サンプルの数NumXと左隣接テンプレートの再構成サンプルの数NumYは、32=2^5に設定される。当然、上隣接テンプレートの再構成サンプルの数NumXと左隣接テンプレートの再構成サンプルの数NumYもまた、図10B〜10Dで示された各種の実施形態にしたがって特定される。630で、方法600は、復号対象のブロックについて、少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて少なくとも1つの線形モデルパラメータを特定する。例えば、式3又は6で定義されるアフィン変換係数は、隣接テンプレートのNumX及びNumYの再構成サンプルの値に基づいて計算される。式中の図10Aの例示的例の2^5により割ることは、右側へのシフトによって容易に実行できる。最後に、640で、方法600は、CCLM又はLICについて開示したもののように、特定された少なくとも1つの線形モデルパラメータに基づいて、線形モデルを使用するブロックを復号する。
図13は、特に隣接ブロックが少なくとも3×2^Nの寸法を有する場合に適用される少なくとも1つの実施形態の態様による復号方法500又は復号方法600の再構成サンプルの数の特定520、620の例示的な詳細を示す。当業者であれば、このケースがQTBT内の、幅W又は高さH又はW、Hの両方のサイズが3×2^Nである非対象Coding Unitを考慮すると発生することがわかる。この実施形態によれば、テンプレートのサンプルは、連続的にサブサンプリングされて、3つのうち1つのサンプルが保持され(NumiX,NumiY)、両方のテンプレート内で同じ数(NumX、NumY)が保持される。それゆえ、710で、幅Wがテストされて、それが3の倍数であるかどうかチェックされ、すなわちW%3=0?、%はモジュロ演算子を表す。符号化又は復号対象のブロックの幅が3の倍数である(分岐Y)、すなわちW=3×2^Nである場合、730で、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumiXは3により割られる。換言すれば、再構成サンプルの数NumiXは3で割った処理対象のブロックの幅に対応し、すなわちNumiX=W/3である。ある変形型によれば、再構成サンプルの数NumiXを特定する代わりに、サブサンプリングステップXstepiが特定され、Xstepi=3である。処理対象のブロックの幅が3の倍数ではない場合(分岐N)、考慮中のブロック分割に応じて、処理対象ブロックの幅は2の冪であり(W=2^N)、740で、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumiXは変化せず、すなわちWに設定される。サブサンプリングの変形型によれば、サブサンプリングステップXstepiは1に設定され、すなわちXstepi=1である。
同じプロセスが、720、750、及び760においてブロックの高さHにもそれぞれ適用される。720で、高さHがテストされ、それが3の倍数か否かチェックされる。処理対象のブロックの高さが3の倍数である(分岐Y)、すなわちH=3×2^Nである場合、750で、左側の空間的隣接テンプレートの再構成サンプルの特定された数NumiYは3により割られる。処理対象のブロックの高さHが3の倍数ではない場合(分岐N)、760で、左側の空間的隣接テンプレートの再構成サンプルの特定された数NumiYは変化せず、すなわちHに設定される。もちろん、図7に示されていない予備ステップにおいて、上側空間的隣接テンプレートと左側空間的隣接テンプレートの存在がチェックされ、方法は、例えば原因となるブロックが存在しなければ、W又はHの値を0に設定することにより、存在する空間的隣接テンプレートに容易に適応されてよい。
次に770で、左側の空間的隣接テンプレートのサンプルの数NumYと上側の空間的隣接テンプレートのサンプルの数NumXが正規化されて、両方のテンプレートで同じ数が保持される。処理対象のブロックの幅が処理対象のブロックの高さと等しくない場合、上側の空間的隣接テンプレートの再構成サンプルの特定された数と左側の空間的隣接テンプレートの再構成サンプルの特定された数は、処理対象のブロックの最小寸法に対応する2の冪である同じ値に設定される。この実施形態で実装されているように、770で中間数NumiX及びNumiYがテストされて、線形モデルパラメータを計算するために同じ数のサンプルを上及び左隣接テンプレートで使用できるか否かがチェックされる。上側空間的隣接テンプレートの再構成サンプルの特定された数NumXは、中間数NumiX及びNumiYの最小値に設定される。サブサンプリングの変形型によれば、中間サブサンプリングステップXstepiにNumiX/min(NumiX,NumiY)の比が乗じられ、それゆえ、Xstep=Xstepi×NumiX/min(NumiX,NumiY)となる。そのほかに、左側の空間的隣接テンプレートの再構成サンプルの特定された数NumYは中間数NumiXとNumiYの最小値に設定される。サブサンプリングの変形型によれば、中間サブサンプリングステップYstepiにNumiY/min(NumiX,NumiY)の比が乗じられ、それゆえYstep=Ystepi×NumiX/min(NumiX,NumiY)となる。サブサンプリングステップは、符号化方法のステップ530又は復号方法のステップ630で、上側テンプレートに関するXstepサンプルのうちの1サンプルか又は左側テンプレートに関するYstepサンプルのうちの1サンプルがそれぞれ線形モデルパラメータを特定する計算で使用されることを特定するために使用される。選択されたサンプルは、テンプレートに沿って規則的に分散させることができ、又は最初のものだけが保持される。サンプルの数の何れの選択も、本願の原理と両立する。当業者であれば、StepとNumの値は冗長的であり、本実施形態においては、2つの値のうちの一方だけが特定されてよいことがわかるであろう。
それゆえ、図13の実施形態は2つの特徴、すなわち大きさ3×2^Nのブロックの正規化と両方の空間的隣接テンプレート内で同じ数を持つための正規化を組み合わせている。このような実施形態の例が図10Bに示されている。W=32及びH=24で、ステップ740及び750の後にNumiX=32(Xstepi=1)及びNumiY=8(Ystepi=3)、最後にステップ770の後にNumX=8(Xstep=4)及びNumY=8(Ystep=3)。
したがって、本発明者らは、既存のJEMコーデックのブロック分割の何れかを用いる、サンプル数を2の冪に特定することによって線形モデルパラメータの計算を改善する幾つかの方法に利点の可能性を認めた。
図14は、隣接ブロックが少なくとも3×2^Nの寸法を有する場合に適応された他の実施形態による符号化方法500の、又は復号方法600の再構成サンプルの数の特定520、620の例示的な詳細を示す。この実施形態によれば、テンプレートのサンプルはサブサンプリングされて3つのうち2つのサンプルが保持され(NumiX,NumiY)、両方のテンプレートで同じ数が保持される(NumX,NumY)。それゆえ、810で、幅Wがテストされて、それが3の倍数であるかチェックされ、すなわちW%3=0?、%はモジュロ演算子を表す。符号化又は復号対象のブロックの幅が3の倍数である(分岐Y)、すなわちW=3×2^Nである場合、830で、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumiXに2/3が乗じられる。換言すれば、再構成サンプルの数NumiXは処理対象のブロックの幅に2/3を乗じたものに対応し、すなわちNumiX=2×W/3である。サブサンプリングの変形型によれば、サブサンプリングステップXstepiは3/2に設定される。処理対象のブロックの幅が3の倍数でない場合(分岐N)、考慮されているブロック分割によれば、処理対象のブロックの幅は2の冪であり(W=2^N)、840で、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumiXは変化せず、すなわちWに設定される。サブサンプリングの変形型によれば、サブサンプリングステップXstepiは1に設定される。
同じプロセスは、820、850、及び860でブロックの高さHにそれぞれ適用される。820で、高さHがテストされ、それが3の倍数であるかチェックされる。処理対象のブロックの高さが3の倍数である(分岐Y)、すなわちH=3×2^Nである場合、850で、左側の空間的隣接テンプレートの再構成サンプルの特定された数NumiYに2/3が乗じられる。処理対象のブロックの高さHが3の倍数ではない場合(分岐N)、左側の空間的隣接テンプレートの再構成サンプルの特定された数NumiYは変化せず、すなわち、860でHに設定される。次に、870で、左側の空間的隣接テンプレートのサンプルの数NumYと上側の空間的隣接テンプレートのサンプルの数NumXは、図7について説明したように、正規化されて両方のテンプレートで同じ数が保持される。処理対象のブロックの幅が処理対象のブロックの高さと等しくない場合、上側の空間的隣接テンプレートの再構成サンプルの特定された数と左側の空間的隣接テンプレートの再構成サンプルの特定された数は、処理対象のブロックの最小寸法に対応する2の冪である同じ値に設定される。この実施形態で実装されているように、870で中間数NumiX及びNumiYがテストされて、線形モデルパラメータを計算するために同じ数のサンプルを上及び左隣接で使用できるか否かがチェックされる。上側空間的隣接テンプレートの再構成サンプルの特定された数NumX、対応する左側空間的隣接テンプレートのNumYは、中間数NumiX及びNumiYの最小値に設定される。
それゆえ、図14の実施形態は、2つの特徴、すなわち大きさ3×2^Nのブロックの2/3による正規化と両方の空間的隣接テンプレート内で同じ数を持つための正規化を組み合わせている。このような実施形態の例が図4Cに示されている。W=32及びH=24で、ステップ840及び850の後にNumiX=32(Xstepi=1)及びNumiY=16(Ystepi=3/2)、最後にステップ870の後にNumX=16(Xstep=2)及びNumY=16(Ystep=3/2)。
したがって、このような実施形態では、前述の実施形態と比較して、線形モデルパラメータの計算で使用されるサンプルの数が増えており、それゆえモデルの精度が向上する。
図15は、隣接ブロックが少なくとも非正方形の寸法を有する場合、特に一方の寸法が他方よりはるかに大きい場合に適応された他の実施形態による符号化方法500又は復号方法600の再構成サンプルの数の特定520、620の例示的な詳細を示す。しかしながら、この実施形態はまた、1つの寸法(最小寸法)が2の冪と等しくないブロックにより生じる問題も解決する。この実施形態は、大きさ3×2^Nのブロックに関する正規化の特徴を持たずに提示されているが、もちろん、図16に示されるようにどちらの特徴も両立する。
それゆえ、970で、左側の空間的隣接テンプレートのサンプルの数NumYと上側の空間的隣接テンプレートNumXがテストされて、両方のテンプレートにおいて同じ数であるか否かがチェックされる。処理対象のブロックの幅が処理対象のブロックの高さと等しい場合(分岐Y)、ブロックは正方形であり、980で、上側の空間的隣接テンプレートの再構成サンプルの特定された数と左側の空間的隣接テンプレートの再構成サンプルの特定された数は、高さと幅に対応する2の冪である同じ値に設定される。サブサンプリングは不要であり、Xstep、Ystepは1に設定される。処理対象のブロックの幅が処理対象のブロックの高さと等しくない場合(分岐N)、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumXと左側の空間的隣接テンプレートの再構成サンプルの特定された数NumYの和は、符号化又は復号対象のブロックの最大寸法に対応する2の冪に設定される。そのために、975で最大値がテストされる。ブロック幅がブロック高さより大きい場合(分岐Y)、990で、左側の空間的隣接テンプレートの再構成サンプルの特定された数NumYはそのブロックの最小寸法であるHに設定され、上側の空間的隣接テンプレートの再構成サンプルの数NumXはW−Hに設定され、それによってNumX+NumYの和は符号化又は復号対象のブロックの最大寸法に対応する2の冪と等しい。したがって、サブサンプリングの変形型の場合、XstepはW/W−H(WのサンプルのうちW−Hが使用される)に設定され、Ystepは1に設定される(全サンプルが使用され、すなわち1のうち1)。ブロック幅がブロック高さより小さい(分岐N)もう一方の場合(分岐N)、985で、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumXはそのブロックの最小寸法であるWに設定され、左側の空間的隣接テンプレートの再構成サンプルの数NumYはH−Wに設定される。したがって、サブサンプリングの変形型では、Xstepは1に設定され、YstepはH/H−Wに設定される。
それゆえ、図16の実施形態では、特に幅と高さが大きく異なる場合に、線形モデルの計算におけるサンプルの数が最大化される。図10Dの例により示されるように。W=32且つH=8のとき、ステップ970の後、NumX=32−8=8、NumY=8であるが、図13の実施形態では、使用されるサンプルの数はNumX=NumY=8となり、その結果、本実施形態では合計32ではなく16のサンプルが使用される。そのほかに、特筆すべき点として、本実施形態では、より大きい寸法の隣接テンプレート、例えば2.3項で説明したようにNumY=8と比較してNumX=24に、より重要な相対重みが付与される。それゆえ、このような実施形態では、線形モデルの計算においてより大きいテンプレートの重みが増すため、モデルの精度が向上する。
図16は、少なくとも1つの実施形態の一般的態様による再構成サンプル方法の数の特定の例を示す。図16の実施形態は、2つの特徴、すなわち大きさ3×2^Nのブロックの正規化と、両方の空間的隣接テンプレート内の数の和が2の冪となるようにするための正規化を組み合わせている。
830及び850で、テンプレートのサンプルがサブサンプリングされて3つのうちの2つのサンプルが保持される(NumiX、NumiY)。それゆえ、810で、幅Wがテストされ、それが3の倍数か否かチェックされる、すなわち、W%3=0?。符号化又は復号対象のブロックの幅が3の倍数である(分岐Y)、すなわちW=3×2^Nの場合、830で、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumiXに2/3が乗じられる。サブサンプリングの変形型によれば、サブサンプリングステップXstepiは3/2に設定される。処理対象のブロックの幅が3の倍数でない場合(分岐N)、考慮されるブロック分岐に応じて、処理対象のブロックの幅は2の冪であり(W=2^N)、1040で、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumiXは変化せず、Wに設定される。サブサンプリングの変形型によれば、サブサンプリングステップXstepiは1に設定される。同じプロセスがそれぞれ、820、850、及び860でブロックの高さHに適用される。
次に、970で、結果として得られたサンプルの数がテストされ、より大きい寸法があるかチェックされる、すなわちNumXi=NumYi?。第一の正則化の後のサンプルの数NumXiとNumYiが等しい場合(分岐Y)、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumXと左側の空間的隣接テンプレートの再構成サンプルの特定された数NumYは等しく、980で2の冪に設定される。第一の正則化の後のサンプルの数NumXiとNumYiが等しくない場合(分岐N)、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumXと左側の空間的隣接テンプレートの再構成サンプルの特定された数NumYの和は、第一の正則化の後のテンプレートの最大寸法に対応する2の冪に設定される。そのために、975で最大値がテストされる。上側の空間的隣接の再構成サンプルの特定された数NumiXが左側の空間的隣接tの再構成サンプルの特定された数NumiYより大きい場合(分岐Y)、990で、左側の空間的隣接テンプレートの再構成サンプルの特定された数NumYはNumiYに設定され、上側の空間的隣接テンプレートの再構成サンプルの数NumXはNumiX−NumiYに設定され、それによって、和NumX+NumYは、第一のサブサンプリングの後のテンプレートの最大寸法に対応する2の冪と等しい。もう一方の場合(分岐N)、985で、上側の空間的隣接テンプレートの再構成サンプルの特定された数NumXはNumiXに設定され、左側の空間的隣接テンプレートの再構成サンプルの数NumYはNumiY−NumiXに設定される。
3.その他の実施形態及び情報
本願では様々な態様を説明しており、これにはツール、特徴、実施形態、モデル、アプローチ等が含まれる。これらの態様の多くは具体的に説明され、少なくとも個々の特性を示すために、限定的に聞こえるかもしれない方法で説明されていることも多い。しかしながら、これは説明を明瞭にするためであり、本願又はこれらの態様の範囲を限定するものではない。実際に、各種の態様のすべてを組み合わせ、置換して、別の態様を提供することもできる。さらに、これらの態様を本願より以前の出願において述べられている態様と組み合わせ、置換することもできる。
本願で説明され、企図される態様は、様々な形態で実装できる。以下の図17、18、及び19は幾つかの実施形態を提供しているが、その他の実施形態も想定され、図17、18、及び19の議論は実装の幅を限定していない。一般に、態様の少なくとも1つは一般に映像符号化及び復号に関し、少なくとも1つのその他の態様は一般に、生成されるか又は符号化されたビットストリームの送信に関する。これら及びその他の態様は、方法、装置、本願に記載の方法の何れかにより映像データを符号化又は復号する命令をその上に記憶したコンピュータ可読記憶媒体、及び/又は本願に記載の方法の何れかにより生成されたビットストリームがその上に記憶されたコンピュータ可読記憶媒体として実装できる。
本願において、「再構成(された)」及び「復号(された)」という用語は互換的に使用されてよく、「ピクセル」及び「サンプル」という用語は互換的に使用されてよく、「画像」、「ピクチャ」、及び「フレーム」という用語は互換的に使用されてよい。通常、ただし必ずとはかぎらないが、「再構成(された)」という用語はエンコーダ側で使用され、「復号(された)」という用語はデコーダ側で使用される。
本明細書においては各種の方法が記載されており、方法の各々は記載されている方法を実現するための1つ又は複数のステップ又は行為を含む。ステップ又は行為の具体的な順序がその方法の適正な動作に必要でないかぎり、具体的なステップ及び/又は行為の順序及び/又は使用は変更され、又は組み合わせられてもよい。
本願に記載の各種の方法及びその他の態様は例えば、図17及び図18に示されるように、ビデオエンコーダ100及びデコーダ200の動き補償(170、275)、動き推定(175)、エントロピ符号化、イントラ予測(160、260)及び/又は復号モジュール(145、230)等のモジュールを変更するために使用できる。さらに、これらの態様はVVC又はHEVCに限定されず、例えば、既存か将来開発されるものかを問わず、その他の規格及び勧告並びにそのような何れかの規格及び勧告(VVC及びHEVCを含む)の延長にも適用できる。特に別段の断りがないかぎり、又は技術的に排除されないかぎり、本願に記載の態様は個別にも組合せでも使用できる。
例えば、本願では様々な数値が使用される。具体的な数値は例示の目的であり、記載されている態様はこれらの具体的な数値に限定されない。
図17は、エンコーダ100を示す。このエンコーダ100の変形型が想定されるが、エンコーダ100は明瞭にすることを目的として以下に説明されており、必ずしも予想されるすべての変形型が説明されているわけではない。
符号化の前に、映像シーケンスには例えば入力されたカラーピクチャの色変換(例えば、RGB 4:4:4からYCbCr 4:2:0への変換)の適用又は入力されたピクチャ成分のリマッピングの実行などの符号化前処理(101)が行われて、信号分布をより柔軟に圧縮できるように(例えば、色成分の1つのヒストグラム平坦化を用いる)してよい。メタデータを前処理に関連付け、ビットストリームに取り付けることができる。
エンコーダ100において、ピクチャは後述のようにエンコーダ要素により符号化される。符号化対象のピクチャは分割され(102)、例えばCUのユニットで処理される。各ユニットは、例えばイントラ又はインターモードの何れかを使って符号化される。あるユニットがイントラモードで符号化される場合、これはイントラ予測(160)を実行する。インターモードでは、動き予測(175)及び補償(170)が実行される。エンコーダは、イントラモード又はインターモードのどちらをユニットの符号化に使用するかを決定し(105)、例えば予測モードフラッグによりイントラ/インターの決定を示す。予測残差は、例えば予測ブロックを原画像ブロックから差し引く(110)ことによって計算される。
すると、予測残差は変換(125)され、量子化(130)される。量子化された変換係数のほか、動きベクトル及びその他のシンタックス要素はエントロピ符号化(145)されてビットストリームが出力される。エンコーダは、変換をスキップして、変換されていない残差信号に量子化を直接適用できる。エンコーダは、変換と量子化の両方をバイパスでき、すなわち、残差は、変換又は量子化工程を適用せずに直接コード化される。
エンコーダは、符号化されたブロックを復号して、その後の予測のための参照を提供する。量子化された変換係数は逆量子化(140)され、逆変換(150)されて、予測残差が復号される。復号された予測残差と予測ブロックが組み合わされ(155)、画像ブロックが再構成される。ループ内フィルタ(165)が再構成されたピクチャに適用され、例えば非ブロック化/SAO(Sample Adaptive Offset)フィルタ処理が実行されて、符号化アーチファクトが低減化される。フィルタ処理後の画像は、参照ピクチャバッファ(180)に記憶される。
図18は、ビデオデコーダ200のブロック図を示す。デコーダ200において、ビットストリームは後述のようにデコーダ要素により復号される。ビデオデコーダ200は一般に、図17に示される符号化パスの逆の復号パスを実行する。エンコーダ100もまた一般に、映像データの符号化の一部として映像復号も行う。
特に、デコーダの入力には映像ビットストリームが含まれ、これはビデオエンコーダ100により生成できる。ビットストリームはまず、エントロピ符号化(230)されて、変換係数、動きベクトル、及びその他のコード化情報が得られる。ピクチャ分割情報は、ピクチャがどのように分割されるかを示す。デコーダはしたがって、復号されたピクチャの分割情報に応じてピクチャを分割(235)してよい。変換係数は、逆量子化(240)され、逆変換(250)されて、予測残差が復号される。復号された予測残差と予測されたブロックを組み合わせる(255)ことで、画像ブロックが再構成される。予測ブロックは、イントラ予測(260)又は動き補償予測(すなわち、インター予測)(275)から得る(270)ことができる。ループ内フィルタ(265)が再構成された画像に適用される。フィルタ処理された画像は、参照ピクチャバッファ(280)に保存される。
復号されたピクチャにはさらに、復号後処理(285)、例えば逆色変換(例えば、YCbCr 4:2:0からRGB 4:4:4への変換)又は、符号化前処理(101)で行われたリマッピングプロセスの逆を実行する逆リマッピングを行うことができる。復号後処理は、符号化前処理の中で導出され、ビットストリーム内で信号化されたメタデータを使用できる。
図19は、各種の態様及び実施形態が実装されるシステムの例のブロック図を示す。システム1000は、後述の様々なコンポーネントを含む機器として具現化でき、本明細書に記載の態様の1つ又は複数を実行するように構成される。このような機器の例には、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信器、個人用映像記録システム、接続された家電製品、及びサーバ等の各種の電子機器が含まれるが、これらに限定されない。システム1000の要素は、単独で、又は組み合わせて、1つの集積回路(IC)、複数のIC、及び/又は個別コンポーネントの中で具現化できる。例えば、少なくとも1つの実施形態において、システム1000の処理及びエンコーダ/デコーダ要素は複数のIC及び/又は個別コンポーネントに分散される。各種の実施形態において、システム1000は1つ若しくは複数の他のシステム、又はその他の電子機器に、例えば通信バスを介して、又は専用の入力及び/又は出力ポートを通じて通信可能に連結される。各種の実施形態において、システム1000は、本明細書に記載の態様の1つ又は複数を実装するように構成される。
システム1000は、例えば本明細書に記載の各種の態様を実装するためにその中にロードされた命令を実行するように構成された少なくとも1つのプロセッサ1010を含む。プロセッサ1010は、埋込型メモリ、入力出力インタフェース、及び当該技術分野で知られている他の各種の回路を含むことができる。システム1000は、少なくとも1つのメモリ1020(例えば、揮発性メモリデバイス及び/又は不揮発性メモリデバイス)を含む。システム1000は、記憶装置1040を含み、これは不揮発性メモリ及び/又は揮発性メモリ、例えば限定されないが、Electrically Erasable Programmable Read-Only Memory(EEPROM)、Read-Only Memory(ROM)、Programmable Read-Only Memory(PROM)、Random Access Memory(RAM)、Dynamic Random Access Memory(DRAM)、Static Random Access Memory(SRAM)、フラッシュ、磁気ディスクドライブ、及び/又は光ディスクドライブを含むことができる。記憶装置1040は、非限定的な例として、内部記憶装置、外付け記憶装置(取外し可能及び取外し不能記憶装置を含む)、及び/又はネットワークアクセス可能記憶装置を含むことができる。
システム1000は、例えばデータを処理して符号化された映像又は復号された映像を提供するように構成されたエンコーダ/デコーダモジュール1030を含み、エンコーダ/デコーダモジュール1030は独自のプロセッサ及びメモリを含むことができる。エンコーダ/デコーダモジュール1030は、機器の中に含めて符号化及び/又は復号機能を実行することができモジュールを表す。周知のように、機器は符号化及び復号モジュールの一方又は両方を含むことができる。それに加えて、エンコーダ/デコーダモジュール1030は、システム1000の別々の要素として実装でき、又は当業者の間で知られているように、プロセッサ1010の中にハードウェア及びソフトウェアの組合せとして組み込むこともできる。
本明細書に記載されている各種の態様を実行するためにプロセッサ1010又はエンコーダ/デコーダ1030にロードされるプログラムコードは、記憶装置1040の中に保存し、その後、プロセッサ1010による実行のためにメモリ1020にロードできる。各種の実施形態によれば、プロセッサ1010、メモリ1020、記憶装置1040、及びエンコーダ/デコーダモジュール1030の1つ又は複数が、本明細書に記載のプロセスの実行中に各種の項目の1つ又は複数を保存できる。このように保存された項目は、入力された映像、復号された映像若しくは復号された映像の一部、ビットストリーム、マトリクス、可変値、並びに等式、数式、演算、及び演算ロジックの処理から得られた中間又は最終結果を含むことができるが、これらに限定されない。
幾つかの実施形態において、プロセッサ1010及び/又はエンコーダ/デコーダモジュール1030の内部のメモリは、命令を記憶し、符号化又は復号中に必要な処理のためのワーキングメモリを提供するために使用される。しかしながら、他の実施形態において、処理装置の外部メモリ(例えば、処理装置はプロセッサ1010又はエンコーダ/デコーダモジュール1030の何れかとすることができる)は、これらの機能の1つ又は複数のために使用される。外部メモリは、メモリ1020及び/又は記憶装置1040、例えばダイナミック揮発性メモリ及び/又は不揮発性フラッシュメモリとすることができる。幾つかの実施形態において、外部不揮発性フラッシュメモリは、例えばテレビのオペレーションシステムを記憶するために使用される。少なくとも1つの実施形態において、RAM等の高速外部ダイナミック揮発性メモリは、ビデオコード化及び復号動作のため、例えばMPEG−2(MPEGはMoving Picture Experts Groupを指し、MPEG−2はまた、ISO/IEC 13818とも呼ばれ、13818−1はH.222としても知られ、13818−2はH.262としても知られる)、HEVC(HEVCはHigh Efficiency Video Codingと呼ばれ、H.265及びMPEG−H Part 2としても知られる)、又はVVC(Versatile Video Codingであり、JVETすなわちJoint Video Experts Teamにより現在開発中の新規格)のためのワーキングメモリとして使用される。
システム1000の要素への入力は、ブロック1130に示される様々な入力装置を通じて提供できる。このような入力装置には、(i)例えば放送装置により無線で送信されるRF信号を受信する無線周波数(RF)部分、(ii)コンポーネント(COMP)入力端子(又はCOMP入力端子群)、(iii)Universal Serial Bus (USB)入力端子、及び/又は(vi)High Definition Multimedia Interface (HDMI(登録商標))入力端子を含むが、これらに限定されない。図10に示されていないその他の例は、コンポジット映像を含む。
各種の実施形態において、ブロック1130の入力装置は、当該技術分野で知られているように、関連付けられたそれぞれの入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択し(また、信号を選択する、又は信号をある周波数バンドに帯域制限する、とも言われる)、(ii)選択された信号をダウンコンバートし、(iii)より狭い周波数バンドに再び帯域制限して、(例えば)特定の実施形態ではチャネルと呼ぶことのできる信号周波数バンドを選択し、(iv)ダウンコンバートされ、帯域制限された信号を復調し、(v)エラー補正を行い、(vi)データパケットの所望のストリームを選択するためにデマルチプレックスするのに適した要素に関連付けることができる。各種の実施形態のRF部分は、これらの機能を実行するための1つ又は複数の要素、例えば周波数切替器、信号切替器、バンドリミタ、チャネル切替器、フィルタ、ダウンコンバータ、復調器、エラー補正器、及びデマルチプレクサを含む。RF部分はチューナを含むことができ、これはこれらの機能のうちの各種のものを行い、例えば受信信号をより低い周波数(例えば、中間周波数又はベースバンド周波数付近)又はベースバンドへとダウンコンバートする。1つのセットトップボックスの実施形態では、RF部分とそれに関連する入力処理要素は、ワイヤ(例えば、ケーブル)媒体上で送信されたRF信号を受信し、フィルタ処理し、ダウンコンバーティングを行い、再びフィルタ処理することにより所望の周波数バンドにすることによる周波数切替を行う。各種の実施形態は、上述の(及びその他の)要素の順序を再配置し、これらの要素の幾つかを排除し、及び/又は同様の、若しくは異なる機能を実行するその他の要素を追加する。要素を追加することは、既存の要素間に要素を挿入すること、例えば増幅器及びアナログ−デジタル変換器を挿入することを含むことができる。各種の実施形態において、RF部分はアンテナを含む。
それに加えて、USB及び/又はHDMI(登録商標)端子は、システム1000をUSB及び/又はHDMI(登録商標)コネクタを通じて他の電子機器に接続するためのそれぞれのインタフェースプロセッサを含むことができる。理解すべき点として、入力処理の様々な態様、例えばReed-Solomonエラー補正は、必要に応じて例えば別の入力処理ICの中又はプロセッサ1010の中で実装できる。同様に、USB又はHDMI(登録商標)インタフェース処理の態様は、必要に応じて例えば別のインタフェースICの中又はプロセッサ1010の中で実装できる。復調され、エラー補正され、デマルチプレックスされたストリームは、例えばプロセッサ1010、並びにメモリ及び記憶要素と共に動作して出力装置での提示のために必要に応じてデータストリームを処理するエンコーダ/デコーダ1030を含む各種の処理要素に提供される。
システム1000の各種の要素は、一体のハウジングの中に提供できる。一体のハウジング内では、様々な要素を相互接続し、適当な接続構成、例えばインターIC(I2C)バス、ワイヤリング、及びプリント回路基板を含む当該技術分野で知られている内部バスを使って相互にデータ送信できる。
システム1000は、通信チャネル1060を通じた他の機器との通信を可能にする通信インタフェース1050を含む。通信インタフェース1050は、通信チャネル1060上でデータを送受信するように構成されたトランシーバを含むことができるが、これに限定されない。通信インタフェース1050は、モデム又はネットワークカードを含むことができるがこれらに限定されず、通信チャネル1060は例えば有線及び/又は無線媒体で実装できる。
データは、各種の実施形態において、Wi-Fiネットワーク、例えばIEEE 802.11(IEEEはInstitute of Electrical and Electronics Engineersを指す)等の無線ネットワークを使ってシステム1000へとストリームされ、又はそれ以外に提供される。これらの実施形態のWi-Fi信号は、Wi-Fi通信に適応された通信チャネル1060及び通信インタフェース1050上で受信される。これらの実施形態の通信チャネル1060は典型的に、ストリーミングアプリケーション及びその他のOver The Top通信を可能にするインターネットを含む外部ネットワークへのアクセスを提供するアクセスポイント又はルータに接続される。その他の実施形態は、ストリームされたデータを、入力ブロック1130のHDMI(登録商標)接続上でデータを配信するセットトップボックスを使ってシステム1000に提供する。また別の実施形態は、ストリームされたデータを、入力ブロック1130のRF接続を使ってシステム1000に提供する。前述のように、各種の実施形態は、非ストリーミング方式でデータを提供する。それに加えて、各種の実施形態は、Wi-Fi以外の無線ネットワーク、例えば移動体通信ネットワーク又はBluetoothネットワークを使用する。
システム1000は、ディスプレイ1100、スピーカ1110、及びその他の周辺機器1120を含む各種の出力装置に出力信号を提供できる。各種の実施形態のディスプレイ1100は、例えばタッチスクリーンディスプレイ、有機発光ダイオード(OLED)ディスプレイ、カーブドディスプレイ、及び/又はフォルダブルディスプレイのうちの1つ又は複数を含む。ディスプレイ1100は、テレビ、タブレット、ラップトップ、セルフォン(移動電話)、又はその他の機器のためのものとすることができる。ディスプレイ1100はまた、他のコンポーネントの中に組み込むことも(例えば、スマートフォンの場合)、又は別々とすることも(例えば、ラップトップ用の外部モニタ)できる。他の周辺機器1120は、様々な実施形態の例において、独立型デジタルビデオディスク(又はデジタル・バーサタイル・ディスク)(どちらの用語もDVR)、ディスクプレイヤ、ステレオシステム、及び/又は照明システムのうちの1つ又は複数を含む。各種の実施形態は、システム1000の出力に基づく機能を提供する1つ又は複数の周辺機器1120を使用する。例えば、ディスクプレイヤは、システム1000の出力を再生する機能を実行する。
各種の実施形態において、制御信号がシステム1000とディスプレイ1100、スピーカ1110、又はその他の周辺機器1120との間で、AV.Link、Consumer Electronics Control(CEC)、又はその他、ユーザの介入の有無を問わず機器間の制御を可能にする通信プロトコル等のシグナリングを使って通信される。出力装置は、それぞれのインタフェース1070、1080、及び1090を通じた専用の接続を介してシステム1000に通信可能に連結できる。代替的に、出力装置は、通信インタフェース1050を介した通信チャネル1060を使ってシステム1000に接続できる。ディスプレイ1100とスピーカ1110は、例えばテレビ等の電子機器の中でシステム1000の他のコンポーネントと単独ユニットで統合できる。各種の実施形態において、ディスプレイインタフェース1070は、ディスプレイドライバ、例えばタイミングコントローラ(T Con)チップ等を含む。
ディスプレイ1100及びスピーカ1110は代替的に、例えば入力1130のRF部分が別のセットトップボックスの一部である場合、他のコンポーネントの1つ又は複数とは別にすることができる。ディスプレイ1100及びスピーカ1110が外部コンポーネントである各種の実施形態において、出力信号は、例えばHDMI(登録商標)ポート、USBポート、又はCOMP出力を含む専用の出力接続を介して提供できる。
実施形態は、プロセッサ1010によって若しくはハードウェアによって、又はハードウェアとソフトウェアの組合せによって実装されるコンピュータソフトウェアにより実行できる。非限定的な例として、実施形態は1つ又は複数の集積回路により実装できる。メモリ1020は、技術的環境に適した何れの適当な種類のものとすることもでき、非限定的な例として光メモリデバイス、磁気メモリデバイス、半導体系メモリデバイス、固定メモリ、リムーバブルメモリ等の何れかの適当なデータ記憶技術を使って実装できる。プロセッサ1010は、技術的環境に適した何れの種類とすることもでき、非限定的な例としてマイクロプロセッサ、汎用コンピュータ、特定用途コンピュータ、及びマルチコアアーキテクチャに基づくプロセッサのうちの1つ又は複数を含むことができる。
各種の実装例は復号に関する。「復号」とは、本願で使用されるかぎり、表示に適した最終出力を生成するために、例えば受信した符号化済みシーケンス上で実行されるプロセスの全部又は一部を含むことができる。各種の実施形態において、このようなプロセスは、典型的にデコーダにより実行されるプロセスの1つ又は複数、例えばエントロピ復号、逆量子化、逆変換、及び差分復号を含む。各種の実施形態において、このようなプロセスはまた、又は代替的に、本願に記載の各種の実装例のデコーダによって実行されるプロセスを含み、これは例えばLocal Illumination Compensationパラメータの導出に使用されるサンプルを特定し(前記特定することは、ブロックの形状、コード化モード、及び大きさに基づく)、導出したパラメータによるLocal Illumination Compensationを使ってそのブロックの仮予測を特定することである。
また別の例として、1つの実施形態では「復号」はエントロピ復号のみを指し、他の実施形態では「復号」は差分復号のみを指し、特定の実施形態では「復号」はエントロピ復号と差分復号の組合せを指す。「復号プロセス」という語句が具体的に動作のサブセットを指すか、一般により広い復号プロセスを指すかは、具体的な説明の内容に基づいて明確となり、当業者により十分に理解されると考えられる。
各種の実装例は符号化を含む。「復号」に関する上記の議論と同様に、「符号化」とは、本願で使用されるかぎり、例えば符号化されたビットストリームを生成するために入力された映像シーケンスに対して行われるプロセスの全部又は一部を含むことができる。各種の実施形態において、このようなプロセスは、エンコーダによって典型的に実行されるプロセスの1つ又は複数を含み、これは例えば、分割、差分符号化、変換、量子化、及びエントロピ符号化である。各種の実施形態において、このようなプロセスはまた、又は代替的に、例えば本願に記載の各種の実装例のエンコーダにより実行されるプロセスを含み、これは例えば、Local Illumination Compensationパラメータの導出に使用されるサンプルを特定し(前記特定することは、ブロックの形状、コード化モード、及び大きさに基づく)、導出したパラメータによるLocal Illumination Compensationを使ってそのブロックの仮予測を特定することである。
また別の例として、1つの実施形態では「符号化」はエントロピ符号化のみを指し、他の実施形態では「符号化」は差分符号化のみを指し、他の実施形態では「符号化」は差分符号化とエントロピ復号の組合せを指す。「符号化プロセス」という語句が具体的に動作のサブセットを指すか、一般により広い符号化プロセスを指すかは、具体的な説明の内容に基づいて明確となり、当業者により十分に理解されると考えられる。
例えばLICフラッグ等のシンタックス要素は、本明細書で使用される限り、説明的な用語であることに留意されたい。したがって、これらはその他のシンタックス要素の名称の使用を排除しない。
図がフロー図として示されている場合、対応する装置のブロック図も提供すると理解すべきである。同様に、図がブロック図として示されている場合、これは対応する方法/プロセスのフロー図も提供すると理解すべきである。
本明細書に記載の実装及び態様は、例えば方法若しくはプロセス、装置、ソフトウェアプログラム、データストリーム、又は信号において実装できる。1つの実装例に関してのみ論じられていたとしても(例えば、方法としてのみ論じられる)、論じられた特徴の実装はまた、他の形態(例えば、装置又はプログラム)においても実装できる。装置は、例えば、適当なハードウェア、ソフトウェア、及びファームウェアにおいて実装できる。方法は、例えばプロセッサにおいて実装でき、これは、例えばコンピュータ、マイクロプロセッサ、集積回路、又はブログラム可能なロジックデバイスを含む処理装置全般を指す。プロセッサはまた通信装置も含み、これは例えば、コンピュータ、セルフォン、携帯情報端末(PDA)、及びエンドユーザ間の情報通信を容易にするその他の機器を含む。
「1つの実施形態」又は「ある実施形態」又は「1つの実装例」又は「ある実装例」のほか、他のそれらの変形型への言及は、その実施形態に関連して記載された特定の特徴、構成、特性、その他が少なくとも1つの実施形態に含まれることを意味する。それゆえ、「1つの実施形態において」又は「ある実施形態において」又は「1つの実装例において」又は「ある実装例において」という語句のほか、他のあらゆる変形型が本願の全体を通じた様々な箇所に出現しても、必ずしもすべてが同じ実施形態を指しているとはかぎらない。
追加的に、本願は様々な情報を「特定する」ことに言及しているかもしれない。情報を特定することは、例えば情報を推定すること、情報を計算すること、情報を予測すること、又は情報をメモリから呼び出すことのうちの1つ又は複数を含むことができる。
さらに、本願は様々な情報に「アクセスする」ことに言及しているかもしれない。情報にアクセスすることは、例えば情報を受信すること、情報を(例えばメモリから)呼び出すこと、情報を保存すること、情報を移動させること、情報をコピーすること、情報を計算すること、情報を特定すること、情報を予測すること、又は情報を推定することのうちの1つ又は複数を含むことができる。
追加的に、本願は様々な情報を「受信する」ことに言及しているかもしれない。受信することは、「アクセスする」ことと同様に、広い用語とする。情報を受信することは、例えば情報にアクセスすること又は情報を(例えばメモリから)呼び出すことのうちの1つ又は複数を含むことができる。さらに、「受信する」ことは典型的に、例えば情報を保存すること、情報を処理すること、情報を送信すること、情報を移動させること、情報をコピーすること、情報を消去すること、情報を計算すること、情報を特定すること、情報を予測すること、又は情報を推定すること等の動作中に、ある方法又はその他の方法で含められる。
例えば「A/B」、「A及び/又はB」、及び「A及びBの少なくとも1つ」の場合の「/」、「及び/又は」、及び「〜の少なくとも1つ」のいずれかの使用は、1番目に挙げられた選択肢(A)のみの選択、又は2番目に挙げられた選択肢(B)のみの選択、又は両方の選択肢(A及びB)の選択を包含するものとすることを理解されたい。別の例として、「A、B、及び/又はC」及び「A、B、及びCの少なくとも1つ」の場合、このような語句は1つ目に挙げられた選択肢(A)のみの選択、又は2番目に挙げられた選択肢(B)のみの選択、又は3番目に挙げられた選択肢(C)のみの選択、又は1番目と2番目に挙げられた選択肢(A及びB)のみの選択、又は1番目と3番目に挙げられた選択肢(A及びC)のみの選択、又は2番目と3番目に挙げられた選択肢(B及びC)のみの選択、又は3つすべての選択肢(A及びB及びC)の選択を包含するものとする。これは、本願及び関連する分野の当業者には明らかであるとおり、挙げられた何れの数の項目にも当てはめられてよい。
また、本明細書で使用されるかぎり、「信号」という単語は、特に、対応するデコーダに対して何かを示すことを指す。例えば、特定の実施形態において、エンコーダはLICのための領域別パラメータ選択のための複数のパラメータのうちの特定の1つをシグナリングする。例えば、有効化/無効化LICは領域の大きさに依存するかもしれない。このようにして、ある実施形態において、エンコーダ側及びデコーダ側の両方で同じパラメータが使用される。それゆえ、例えば、エンコーダは特定のパラメータをデコーダに送信することができ(明示的シグナリング)、それによってデコーダは同じ特定のパラメータを使用できる。反対に、デコーダがすでに特定のパラメータ及びその他を有している場合、シグナリングは送信せずに使用することにより(暗黙的シグナリング)、単純にデコーダが特定のパラメータを知り、選択できるようにすることができる。各種の実施形態において、何れかの実際の関数の送信を回避することにより、ビット節約が実現される。シグナリングは、様々な方法で行えると理解されたい。例えば、各種の実施形態において、1つ又は複数のシンタックス要素、フラッグ、その他が情報を対応するデコーダに伝達するために使用される。上記の事柄は「シグナリング」という単語の動詞形に関するが、「信号」という用語は本明細書においては名詞としても使用できる。
当業者にとっては明らかであるように、実装例は、例えば保存又は送信可能な情報を運ぶためにフォーマットされた様々な信号を生成できる。情報は例えば、方法を実行する命令、又は説明された実装例の1つにより生成されたデータを含むことができる。例えば、信号は、説明された実施形態のビットストリームを運ぶようにフォーマットすることができる。このような信号は、例えば電磁波(例えば、スペクトルの無線周波数部分を使用する)として、又はベースバンド信号としてフォーマットすることができる。フォーマットすることは例えば、データストリームを符号化すること、及び符号化されたデータストリームでキャリアを変調することを含むことができる。信号が運ぶ情報は例えば、アナログ又はデジタル情報とすることができる。信号は、知られているように、様々な異なる有線又は無線リンク上で送信できる。信号は、プロセッサ可読媒体上に保存できる。
多くの実施形態を説明した。これらの実施形態の特徴は、単独でも、何れの組合せでも、各種のクレームカテゴリ及び種類を通じて、提供できる。さらに、実施形態は、以下の特徴、機器、又は態様の1つ又は複数を、各種のクレームカテゴリ及び種類を通じて、単独でも、何れの組合せでも含むことができる:
・デコーダ及び/又はエンコーダにおいて適用されるインター予測プロセスで使用されるLocal Illumination Compensationを変更すること
・デコーダ及び/又はエンコーダにおいて適用されるインター予測プロセスで使用されるLocal Illumination Compensationパラメータの導出を変更すること
・Local Illumination Compensationで使用されるサンプルの特定を新規なコード化(予測)モードに適応させること
・Local Illumination Compensationで使用されるサンプルの特定をCU形状、コード化モード、及び大きさに適応させること
・LICで使用されるサンプルの数nを適応させること。n=2であり、kはnがブロック幅及びブロック高さの合計より小さい最大整数であるように選択される
・上側サンプルセットの第一のサンプルの相対位置に関するオフセットを特定すること、及び/又は左側サンプルセットの第一のサンプルの相対位置に関するオフセットを特定すること
・ブロックの、より大きい寸法ではより多くのサンプルを選択すること
・特定のコード化モードを使って、又は特定のコード化パラメータを使って再構成されたサンプルを選択すること。左側サンプルが利用できず、上側サンプルが利用できない場合、エンコーダ又はデコーダでfalseに設定されたICフラッグを導出すること
・ブロック幅が第一の値より小さい場合及びブロック幅が第二の値より小さい場合、符号化又は復号においてfalseに設定されたICフラッグを導出すること
・三角形予測の場合にブロックの各寸法につき1つの、2つのICフラッグをコード化及び/又は復号すること
・デコーダ及び/又はエンコーダにおいて照明補償方法を有効化又は無効化すること
・シグナリングに、デコーダが使用する照明補償方法を識別できるようにするシンタックス要素を挿入すること
・三角形予測の場合にLICパラメータを導出するためにPU三角形に空間的に連続するサンプルを選択すること
・三角形分割方向に応じてLICパラメータを導出するためのサンプルを選択すること
・多仮説予測の場合、ブレンディング重みがLICパラメータを導出するための値より大きいか又は等しい領域に空間的に連続するサンプルを選択すること
・これらのシンタックス要素に基づいて、デコーダで適用するQP予測方法を選択すること
・デコーダでLICパラメータの導出方法を適用すること
・本明細書に記載のシンタックス要素又はその変形型の1つ又は複数を含むビットストリーム又は信号
・本明細書に記載の実施形態の何れかにより生成された情報を搬送するシンタックスを含むビットストリーム又は信号
・信号伝達に、デコーダがエンコーダにより使用されるものに対応する方法でLICを適応させることができるようにするシンタックス要素を挿入すること
・本明細書に記載のシンタックス要素、又はそれらの変形型の1つ又は複数を含むビットストリーム又は信号を生成及び/又は送信及び/又は受信及び/又は復号すること
・本明細書に記載の実施形態の何れかにより生成及び/又は送信及び/又は受信及び/又は復号すること
・本明細書に記載の実施形態の何れかによる方法、プロセス、装置、命令を記憶する媒体、データを記憶する媒体、又は信号
・本明細書に記載の実施形態の何れかによるLICパラメータの適応を実行するTV、セットトップボックス、セルフォン、タブレット、又はその他の電子機器
・本明細書に記載の実施形態の何れかによるLICパラメータの適応を実行し、結果として得られた画像を表示する(例えば、モニタ、スクリーン、又はその他の種類のディスプレイを使用する)TV、セットトップボックス、セルフォン、タブレット、又はその他の電子機器
・符号化された画像を含む信号を受信するチャネルを選択し(例えば、チューナを使用する)、本明細書に記載の実施形態の何れかによるLICパラメータの適応を実行するTV、セットトップボックス、セルフォン、タブレット、又はその他の電子機器
・符号化された画像を含む信号を無線で受信する(例えば、アンテナを使用する)、本明細書に記載の実施形態の何れかによるLICパラメータの適応を実行するTV、セットトップボックス、セルフォン、タブレット、又はその他の電子機器。

Claims (15)

  1. 映像符号化方法において、
    あるピクチャの中の符号化対象のブロックについて、少なくとも1つの空間的隣接テンプレートを特定することと、
    前記符号化対象のブロックについて、少なくとも1つの線形モデルパラメータを前記少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて特定することと、
    前記特定された少なくとも1つの線形モデルパラメータに基づく線形モデルを使って前記ブロックを符号化することと、
    を含み、
    少なくとも1つの空間的隣接テンプレートを特定することは、前記少なくとも1つの空間的隣接テンプレート内の再構成サンプルの数Nを特定することを含み、これはN=2に対応し、kはNが前記ブロック幅とブロック高さの合計より小さい最大整数となるように選択される方法。
  2. 映像復号方法において、
    復号対象のブロックについて、少なくとも1つの空間的隣接テンプレートを特定することと、
    前記復号対象のブロックについて、少なくとも1つの線形モデルパラメータを前記少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて特定することと、
    前記特定された少なくとも1つの線形モデルパラメータに基づく線形モデルを使って前記ブロックを復号することと、
    を含み、少なくとも1つの空間的隣接テンプレートを特定することは、前記少なくとも1つの空間的隣接テンプレート内の再構成サンプルの数Nを特定することを含み、これはN=2に対応し、kはNが前記ブロック幅とブロック高さの合計より小さい最大整数となるように選択される方法。
  3. 1つ又は複数のプロセッサと、少なくとも1つのメモリと、を含む映像符号化装置において、前記1つ又は複数のプロセッサは、
    あるピクチャの中の符号化対象のブロックについて、少なくとも1つの空間的隣接テンプレートを特定し、
    前記符号化対象のブロックについて、少なくとも1つの線形モデルパラメータを前記少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて特定し、
    前記特定された少なくとも1つの線形モデルパラメータに基づく線形モデルを使って前記ブロックを符号化する
    ように構成され、
    前記1つ又は複数のプロセッサはさらに、前記少なくとも1つの空間的隣接テンプレート内の再構成サンプルの数nを特定するように構成され、これはN=2に対応し、kはNが前記ブロック幅とブロック高さの合計より小さい最大整数となるように選択される装置。
  4. 1つ又は複数のプロセッサと、少なくとも1つのメモリと、を含む映像復号装置において、前記1つ又は複数のプロセッサは、
    復号対象のブロックについて、少なくとも1つの空間的隣接テンプレートを特定し、
    前記復号対象のブロックについて、少なくとも1つの線形モデルパラメータを前記少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づいて特定し、
    前記特定された少なくとも1つの線形モデルパラメータに基づく線形モデルを使って前記ブロックを復号する
    ように構成され、
    前記1つ又は複数のプロセッサはさらに、前記少なくとも1つの空間的隣接テンプレートの再構成サンプルの数Nを特定するように構成され、これはN=2に対応し、kはNが前記ブロック幅とブロック高さの合計より小さい最大整数となるように選択される装置。
  5. 少なくとも1つの空間的隣接テンプレートを特定することは、前記符号化若しくは復号対象のブロックの左隣接ラインのサンプルのうち第一のサンプルの相対位置に関するオフセットを特定すること、又は前記符号化若しくは復号対象のブロックの上隣接ラインのサンプルのうち第一のサンプルの相対位置に関するオフセットを特定することを含む、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  6. 前記少なくとも1つの空間的隣接テンプレートの再構成サンプルの前記数は、前記符号化又は復号対象のブロックの最大寸法においてより多いサンプル数に設定される、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  7. 左隣接ラインの前記再構成サンプルが利用できず、上隣接ラインの前記再構成サンプルが利用できない場合、前記符号化又は復号において、前記線形モデルを暗黙的に無効化する、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  8. 前記ブロック幅が第一の値より小さい場合、及び前記ブロック高さが第二の値より小さい場合、前記符号化又は復号において、前記線形モデルを暗黙的に無効化する、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  9. 前記少なくとも1つの空間的隣接テンプレートは、前記符号化若しくは復号対象のブロックの上隣接ラインのサンプルの中の、又は前記符号化若しくは復号対象のブロックの左隣接ラインのサンプルの中のサブサンプリングされたサンプルを含む、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  10. 前記ブロック幅及びブロック高さの少なくとも一方は2の冪と等しくない、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  11. 前記ブロック幅及びブロック高さは等しくない、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  12. 前記線形モデルは、
    −cross-component linear model、
    −block based illumination compensation linear model、
    −bi-directional optical flow
    を含む集合に属する、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  13. 前記少なくとも1つの空間的隣接テンプレートの再構成サンプルに基づく前記少なくとも1つの線形モデルパラメータは、前記符号化又は復号対象ブロックの前記空間的隣接テンプレートのサンプルと参照ブロックの前記空間的隣接テンプレートのサンプルとの間の歪を最小化することによって得られる、請求項1若しくは2の方法又は請求項3若しくは4の装置。
  14. プロセッサに請求項1による前記映像符号化方法を実行させるための命令がその中に記憶された非一時的プロセッサ可読媒体。
  15. プロセッサに請求項2による前記映像復号方法を実行させるための命令がその中に記憶された非一時的プロセッサ可読媒体。
JP2020534494A 2018-01-26 2019-01-25 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置 Active JP7299221B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023098170A JP2023130359A (ja) 2018-01-26 2023-06-15 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18305073.1A EP3518537A1 (en) 2018-01-26 2018-01-26 Method and apparatus for video encoding and decoding based on a linear model responsive to neighboring samples
EP18305073.1 2018-01-26
EP18306779.2 2018-12-20
EP18306779 2018-12-20
PCT/US2019/015104 WO2019147910A1 (en) 2018-01-26 2019-01-25 Method and apparatus for video encoding and decoding based on a linear model responsive to neighboring samples

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023098170A Division JP2023130359A (ja) 2018-01-26 2023-06-15 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置

Publications (2)

Publication Number Publication Date
JP2021511698A true JP2021511698A (ja) 2021-05-06
JP7299221B2 JP7299221B2 (ja) 2023-06-27

Family

ID=65269131

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020534494A Active JP7299221B2 (ja) 2018-01-26 2019-01-25 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置
JP2023098170A Pending JP2023130359A (ja) 2018-01-26 2023-06-15 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023098170A Pending JP2023130359A (ja) 2018-01-26 2023-06-15 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置

Country Status (6)

Country Link
US (2) US11722694B2 (ja)
EP (1) EP3744092A1 (ja)
JP (2) JP7299221B2 (ja)
CN (1) CN111630856B (ja)
MX (1) MX2020007868A (ja)
WO (1) WO2019147910A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023132554A1 (ko) * 2022-01-04 2023-07-13 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체
US11785208B2 (en) 2018-12-25 2023-10-10 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Prediction method for decoding and apparatus, and computer storage medium

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020116402A1 (ja) * 2018-12-04 2020-06-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
JP2022517911A (ja) * 2019-01-14 2022-03-11 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 重み付け予測に適応された双方向オプティカルフローによる映像符号化及び復号の方法及び装置
US11290726B2 (en) 2019-02-07 2022-03-29 Qualcomm Incorporated Inter-intra prediction mode for video data
KR20210124241A (ko) 2019-02-08 2021-10-14 인터디지털 브이씨 홀딩스 인코포레이티드 조명 보상을 이용한 픽처 인코딩 및 디코딩을 위한 방법 및 디바이스
CN111698515B (zh) * 2019-03-14 2023-02-14 华为技术有限公司 帧间预测的方法及相关装置
CN117221537A (zh) * 2019-03-18 2023-12-12 腾讯美国有限责任公司 视频编解码的方法和装置
WO2020262370A1 (ja) * 2019-06-24 2020-12-30 ソニー株式会社 画像処理装置および画像処理方法
CN116708771A (zh) * 2019-06-25 2023-09-05 Oppo广东移动通信有限公司 图像分量预测方法、装置及计算机存储介质
CN110446044B (zh) * 2019-08-21 2022-08-09 浙江大华技术股份有限公司 线性模型预测方法、装置、编码器及存储装置
CN114303370B (zh) 2019-09-01 2023-11-14 北京字节跳动网络技术有限公司 视频编解码中预测权重的对准
WO2021045171A1 (en) * 2019-09-05 2021-03-11 Sharp Kabushiki Kaisha Systems and methods for performing inter prediction coding in video coding
WO2021051044A1 (en) 2019-09-14 2021-03-18 Bytedance Inc. Quantization parameter offset for chroma deblocking filtering
WO2021057751A1 (en) * 2019-09-23 2021-04-01 Beijing Bytedance Network Technology Co., Ltd. Setting intra-block copy virtual buffer based on virtual pipeline data unit
WO2021068921A1 (en) 2019-10-10 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Motion vector handling in geometry partition mode
EP4029273A4 (en) * 2019-10-14 2023-03-15 ByteDance Inc. USE OF CHROMA QUANTIZATION PARAMETERS IN VIDEO ENCODING
US11575909B2 (en) * 2020-04-07 2023-02-07 Tencent America LLC Method and apparatus for video coding
US11689715B2 (en) * 2020-09-28 2023-06-27 Tencent America LLC Non-directional intra prediction for L-shape partitions
CN113824961B (zh) * 2021-11-22 2022-03-29 康达洲际医疗器械有限公司 一种可适用于vvc编码标准的帧间图像编码方法与系统
CN115988206B (zh) * 2023-03-21 2024-03-26 深圳传音控股股份有限公司 图像处理方法、处理设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017091773A1 (en) * 2015-11-25 2017-06-01 Qualcomm Incorporated Illumination compensation with non-square predictive blocks in video coding
US20170366818A1 (en) * 2015-01-22 2017-12-21 Mediatek Singapore Pte. Ltd. Method of Video Coding for Chroma Components
WO2018056603A1 (ko) * 2016-09-22 2018-03-29 엘지전자 주식회사 영상 코딩 시스템에서 조도 보상 기반 인터 예측 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9288500B2 (en) * 2011-05-12 2016-03-15 Texas Instruments Incorporated Luma-based chroma intra-prediction for video coding
EP2805496B1 (en) * 2012-01-19 2016-12-21 Huawei Technologies Co., Ltd. Reference pixel reduction for intra lm prediction
WO2016137368A1 (en) * 2015-02-25 2016-09-01 Telefonaktiebolaget Lm Ericsson (Publ) Encoding and decoding of inter pictures in a video
US10455249B2 (en) * 2015-03-20 2019-10-22 Qualcomm Incorporated Downsampling process for linear model prediction mode
WO2016154963A1 (en) * 2015-04-01 2016-10-06 Mediatek Inc. Methods for chroma coding in video codec
EP3148190A1 (en) * 2015-09-25 2017-03-29 Thomson Licensing Method and apparatus for intra prediction in video encoding and decoding
WO2017201141A1 (en) * 2016-05-17 2017-11-23 Arris Enterprises Llc Template matching for jvet intra prediction
US10484712B2 (en) * 2016-06-08 2019-11-19 Qualcomm Incorporated Implicit coding of reference line index used in intra prediction
US20180199062A1 (en) * 2017-01-11 2018-07-12 Qualcomm Incorporated Intra prediction techniques for video coding
JP2021016016A (ja) * 2017-10-20 2021-02-12 シャープ株式会社 動画像符号化装置及び動画像復号装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170366818A1 (en) * 2015-01-22 2017-12-21 Mediatek Singapore Pte. Ltd. Method of Video Coding for Chroma Components
WO2017091773A1 (en) * 2015-11-25 2017-06-01 Qualcomm Incorporated Illumination compensation with non-square predictive blocks in video coding
WO2017091759A1 (en) * 2015-11-25 2017-06-01 Qualcomm Incorporated Linear-model prediction with non-square prediction units in video coding
WO2018056603A1 (ko) * 2016-09-22 2018-03-29 엘지전자 주식회사 영상 코딩 시스템에서 조도 보상 기반 인터 예측 방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11785208B2 (en) 2018-12-25 2023-10-10 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Prediction method for decoding and apparatus, and computer storage medium
WO2023132554A1 (ko) * 2022-01-04 2023-07-13 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체

Also Published As

Publication number Publication date
US20230345043A1 (en) 2023-10-26
MX2020007868A (es) 2020-09-07
US11722694B2 (en) 2023-08-08
WO2019147910A1 (en) 2019-08-01
CN111630856A (zh) 2020-09-04
US20210051342A1 (en) 2021-02-18
JP7299221B2 (ja) 2023-06-27
CN111630856B (zh) 2024-05-07
JP2023130359A (ja) 2023-09-20
EP3744092A1 (en) 2020-12-02

Similar Documents

Publication Publication Date Title
JP7299221B2 (ja) 隣接サンプルに応じた線形モデルに基づく映像符号化及び復号のための方法と装置
JP7488256B2 (ja) 隣接サンプル依存パラメトリックモデルに基づいたコーディングモードの簡易化
US20220038684A1 (en) Multi-reference line intra prediction and most probable mode
AU2019354653B2 (en) Generalized bi-prediction and weighted prediction
JP2022525686A (ja) サブパーティションを有する広角度イントラ予測
CN116195254A (zh) 用于通用视频编码的模板匹配预测
EP3641311A1 (en) Encoding and decoding methods and apparatus
CN112425162A (zh) 宽角帧内预测和位置依赖性帧内预测组合
JP2021528893A (ja) 可変重みを使用する複数参照イントラ予測
CN117597933A (zh) 空间局部光照补偿
US11870975B2 (en) Intra prediction mode extension
KR20220123643A (ko) 삼각형 병합 모드에서의 서브-블록 병합 후보들
JP2024513657A (ja) ビデオエンコード及びデコードのためのテンプレートマッチング予測
CN118140481A (zh) 利用isp模式对基于模版的帧内模式推导(timd)进行扩展
KR20240072180A (ko) Isp 모드를 사용한 템플릿 기반 인트라 모드 도출(timd)의 확장
CN118120231A (zh) 改善解码器侧帧内模式导出中的角度离散化
CN114586348A (zh) 可切换的插值滤波器
CN114073093A (zh) 三角形分割的合并索引的信令通知
CN117501692A (zh) 用于视频编码和解码的模板匹配预测
CN117413520A (zh) 大面积的空间光照补偿
CN117981305A (zh) 用于对视频进行编码/解码的方法和装置
CN117616750A (zh) 基于模板的帧内模式推导
KR20210074388A (ko) 코딩 유형 또는 코딩 트리 유형의 시그널링을 이용한 비디오 인코딩 및 디코딩을 위한 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230615

R150 Certificate of patent or registration of utility model

Ref document number: 7299221

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150