JP2022516846A - アフィン線形加重イントラ予測モードのための簡易シグナリング方法 - Google Patents

アフィン線形加重イントラ予測モードのための簡易シグナリング方法 Download PDF

Info

Publication number
JP2022516846A
JP2022516846A JP2021535036A JP2021535036A JP2022516846A JP 2022516846 A JP2022516846 A JP 2022516846A JP 2021535036 A JP2021535036 A JP 2021535036A JP 2021535036 A JP2021535036 A JP 2021535036A JP 2022516846 A JP2022516846 A JP 2022516846A
Authority
JP
Japan
Prior art keywords
mode
block
prediction
encoded
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021535036A
Other languages
English (en)
Other versions
JP7241177B2 (ja
Inventor
ジャオ,リアン
ジャオ,シン
リ,シアン
リィウ,シャン
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2022516846A publication Critical patent/JP2022516846A/ja
Application granted granted Critical
Publication of JP7241177B2 publication Critical patent/JP7241177B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

開示の態様は、ビデオ符号化/復号のための方法及び機器を提供する。幾つかの例では、ビデオ復号のための機器は、符号化ビデオシーケンスの一部である現在ピクチャ内の現在ブロックの予測情報を復号する処理回路を含む。予測情報は、現在ブロックがアフィン線形加重イントラ予測(ALWIP)で符号化されるかどうかを示す。予測情報が、現在ブロックがALWIPで符号化されると示すことに応答して、処理回路は、現在ブロックに隣接する近隣ブロックの予測モードを表すALWIPモードインデックスを決定し、ALWIPモードインデックスは複数のALWIPモードのうちの1つを示す。処理回路は、複数のALWIPモードのうちの1つに従い現在ブロックを再構成する。

Description

[関連出願]
本願は、米国仮特許出願番号第62/829,439号、「SIMPLIFIED SIGNALING METHOD FOR AFFINE LINEAR WEIGHTED INTRA PREDICTION MODE」、2019年4月4日出願、の優先権の利益を主張する米国特許出願番号第16/822,985号、「SIMPLIFIED SIGNALING METHOD FOR AFFINE LINEAR WEIGHTED INTRA PREDICTION MODE」、2020年3月18日出願の優先権の利益を主張する。前述の出願の全開示は、それらの全体が参照によりここに組み込まれる。
[技術分野]
本開示は、概して、ビデオ符号化に関連する実施形態を記載する。
ここに提供される背景の説明は、本開示のコンテキストの概要を提示するためである。現在名前の挙げられた発明者の研究は、この背景の章に記載された研究の範囲で、出願時に従来技術として見なされない可能性のある記載の態様と同様に、本開示に対する従来技術として明示的に又は暗示的にも認められるものではない。
ビデオ符号化及び復号は、動き補償を伴うインターピクチャ予測を用いて実行できる。非圧縮デジタルビデオは、一連のピクチャを含むことができ、各ピクチャは、例えば1920×1080個のルミナンスサンプル及び関連するクロミナンスサンプルの空間次元を有する。一連のピクチャは、例えば毎秒60ピクチャ又は60Hzの固定又は可変ピクチャレート(略式にフレームレートとしても知られている)を有し得る。非圧縮ビデオは、かなりのビットレート要件を有する。例えば、8ビット/サンプルの1080p60 4:2:0ビデオ(60Hzフレームレートで1920×1080ルミナンスサンプル解像度)は、1.5Gbit/sの帯域幅を必要とする。1時間のこのようなビデオは600Gbyteより多くの記憶空間を必要とする。
ビデオ符号化及び復号の1つの目的は、圧縮を通じて、入力ビデオ信号の中の冗長性の削減であり得る。圧縮は、幾つかの場合には大きさで2桁以上も、前述の帯域幅又は記憶空間要件を軽減するのを助けることができる。損失又は無損失圧縮の両方、及びそれらの組み合わせが利用できる。無損失圧縮は、元の信号の正確なコピーが圧縮された元の信号から再構成可能である技術を表す。損失圧縮を用いると、再構成された信号は、元の信号と同一ではないが、元の信号と再構成された信号との間の歪みは、意図される用途のために有用な再構成された信号を生成するのに十分に小さい。ビデオの場合には、損失圧縮が広く利用される。耐えうる歪みの量は、アプリケーションに依存し、特定の消費者ストリーミングアプリケーションのユーザは、テレビジョン配信アプリケーションのユーザよりも高い歪みに耐え得る。達成可能な圧縮比は、許容可能/耐性歪みが高いほど、高い圧縮比を生じ得ることを反映できる。
ビデオエンコーダ及びデコーダは、例えば動き補償、変換、量子化、及びエントロピー符号化を含む幾つかの広い分類からの技術を利用できる。
ビデオコーデック技術は、イントラ符号化として知られる技術を含むことができる。イントラ符号化では、サンプル値は、前の再構成参照ピクチャからのサンプル又は他のデータを参照することなく、表現される。幾つかのビデオコーデックでは、ピクチャは、サンプルのブロックに空間的に細分化される。サンプルの全部のブロックがイントラモードで符号化されるとき、そのピクチャはイントラピクチャであり得る。イントラピクチャ、及び独立したデコーダリフレッシュピクチャのようなそれらの派生物は、デコーダ状態をリセットするために使用でき、従って、符号化ビデオビットストリーム及びビデオセッションの中の最初のピクチャとして、又は静止画像として使用できる。イントラブロックのサンプルは変換されることができ、変換係数は、エントロピー符号化の前に量子化できる。イントラ予測は、変換前のドメインにおけるサンプル値を最小化する技術であり得る。幾つかの場合には、変換後のDC値が小さいほど,及びAC係数が小さいほど、エントロピー符号化の後にブロックを表現するために所与の量子化ステップサイズで必要なビット数が少ない。
例えばMPEG-2生成符号化技術から知られているような伝統的なイントラ符号化は、イントラ予測を使用しない。しかしながら、幾つかの新しいビデオ圧縮技術は、例えば、復号順において先行する空間的近隣のデータブロックの符号化/復号の間に取得される周囲のサンプルデータ及び/又はメタデータから試行する。このような技術は、以後、「イントラ予測」技術と呼ばれる。少なくとも幾つかの場合には、イントラ予測は、参照ピクチャからではなく、再構成中の現在ピクチャからの参照データのみを使用する。
多くの異なる形式のイントラ予測が存在し得る。1つより多くのこのような技術が所与のビデオ符号化技術において使用できるとき、使用される技術は、イントラ予測モードで符号化され得る。特定の場合には、モードは、サブモード及び/又はパラメータを有することができ、それらは、個々に符号化され又はモードコードワードに含まれることができる。所与のモード/サブモード/パラメータの組合せのためにどのコードワードを使用すべきかは、イントラ予測を通じて符号化効率の向上に影響を与えることができ、従って、コードワードをビットストリームに変換するためにエントロピー符号化技術を使用できる。
特定のイントラ予測モードが、H.264により導入され、H.265で改良され、共同探索モデル(joint exploration model (JEM))、バーサタイルビデオ符号化(versatile video coding (VVC))、及びベンチマークセット(benchmark set (BMS))のような更に新しい符号化技術において改良された。予測ブロックは、既に利用可能なサンプルに属する近隣サンプル値を用いて形成されることができる。近隣サンプルのサンプル値は、方向に従い予測ブロックにコピーされる。使用中の方向の参照は、ビットストリーム内に符号化でき、又はそれ自体が予測されてよい。
開示の態様は、ビデオ符号化/復号のための方法及び機器を提供する。幾つかの例では、ビデオ復号のための機器は、処理回路を含む。
本開示の態様によると、デコーダにおけるビデオ復号のための方法が提供される。当該方法では、処理回路は、符号化ビデオシーケンスの一部である現在ピクチャ内の現在ブロックの予測情報を復号する。前記予測情報は、前記現在ブロックがアフィン線形加重イントラ予測(ALWIP)で符号化されるかどうかを示す。前記予測情報が、前記現在ブロックがALWIPで符号化されると示すことに応答して、前記処理回路は、前記現在ブロックに隣接する近隣ブロックの予測モードを表すALWIPモードインデックスを決定し、前記ALWIPモードインデックスは複数のALWIPモードのうちの1つを示す。前記処理回路は、前記複数のALWIPモードのうちの前記1つに従い前記現在ブロックを再構成する。
実施形態では、前記ALWIPモードインデックスは、トランケートされたバイナリコードワード、固定長コードワード、及びトランケートされた単項コードワード、のうちの1つである。
実施形態では、前記予測情報が、前記現在ブロックがALWIPで符号化されると示すことに応答して、前記処理回路は、少なくとも1つの固定モード候補を含むモード候補リストを構成する。前記少なくとも1つの固定モード候補は、前記複数のALWIPモードのうちの所定の部分集合である。
実施形態では、前記複数のALWIPモードの合計数は、2のべき乗である。
本開示の態様によると、前記予測情報が、前記現在ブロックが、ALWIPで符号化されないと示すことに応答して、前記処理回路は、前記近隣ブロックのうちの1つがALWIPで符号化されるかどうかを決定する。前記近隣ブロックのうちの前記1つがALWIPで符号化されることに応答して、前記処理回路は、(i)プリセットイントラ予測モード、及び(ii)前記近隣ブロックのうちの別の近隣ブロックのイントラ予測モード、のうちの1つに基づき、前記モード候補リストを構成する。
実施形態では、前記プリセット予測モードは、平面イントラ予測モード、DCIイントラ予測モード、水平イントラ予測モード、及び垂直イントラ予測モード、のうちの1つである。
実施形態では、前記近隣ブロックのうちの前記1つがALWIPで符号化されることに応答して、前記処理回路は、前記近隣ブロックのうちの前記1つを利用不可能として設定する。
実施形態では、前記予測情報が、前記現在ブロックはALWIPで符号化されると示し、導出されたモードが前記現在ブロックの関連するクロマブロックのために使用されることに応答して、前記処理回路は、前記関連するクロマブロックの予測モードを、プリセットイントラ予測モードになるよう設定する。
本開示の態様によると、デコーダにおけるビデオ復号のための別の方法が提供される。当該方法では、前記処理回路は、符号化ビデオシーケンスの一部である現在ピクチャ内の現在ブロックの予測情報を復号する。前記予測情報は、前記現在ブロックがアフィン線形加重イントラ予測(ALWIP)で符号化されると示す。前記処理回路は、前記現在ブロックに隣接する近隣ブロックがALWIPで符号化されるかどうかを決定する。前記近隣ブロックがALWIPで符号化されないことに応答して、前記処理回路は、(i)プリセットALWIPモード、及び(ii)別の近隣ブロックのALWIPモード、のうちの1つに基づき、モード候補リストを構成する。前記処理回路は、前記モード候補リストに基づき前記現在ブロックを再構成する。
実施形態では、前記近隣ブロックがALWIPで符号化されないことに応答して、前記処理回路は、前記近隣ブロックを利用不可能として設定する。
実施形態では、前記近隣ブロックは、前記現在ブロックの右上角又は左下角に隣接する。
実施形態では、前記モード候補リストのサイズは、前記符号化ビデオシーケンスに含まれる前記近隣ブロックの符号化情報に基づく。
実施形態では、前記予測情報は、前記現在ブロックのクロマブロックが複数のルマブロックに関連付けられることを示し、前記処理回路は、前記複数のルマブロックのうちのルマブロックが非ALWIPイントラ予測モードで符号化されるかどうかを決定する。前記ルマブロックが前記非ALWIPイントラ予測モードで符号化されることに応答して、前記処理回路は、前記現在ブロックの前記クロマブロックの予測モードが、前記ルマブロックの前記非ALWIPイントラ予測モードであると決定する。
実施形態では、前記予測情報は、前記現在ブロックのクロマブロックが複数のルマブロックに関連付けられることを示し、前記処理回路は、前記複数のルマブロックのうちのルマブロックが非ALWIPイントラ予測モードで符号化されるかどうかを決定する。前記複数のルマブロックの各々がALWIPで符号化されることに応答して、前記処理回路は、前記現在ブロックの前記クロマブロックの前記予測モードがプリセットイントラ予測モードであると決定する。
本開示の態様は、ビデオ復号のためにコンピュータにより実行されると該コンピュータにビデオ復号のための方法のうちのいずれか1つ又はその組合せを実行させる、命令を格納する非一時的コンピュータ可読媒体も提供する。
開示の主題の更なる特徴、特性、及び種々の利点は、以下の詳細な説明及び添付の図面から一層明らかになるだろう。
一実施形態による、通信システムの簡易ブロック図の概略図である。
一実施形態による、通信システムの簡易ブロック図の概略図である。
一実施形態による、デコーダの簡易ブロック図の概略図である。
一実施形態による、エンコーダの簡易ブロック図の概略図である。
別の実施形態による、エンコーダのブロック図を示す。
別の実施形態による、デコーダのブロック図を示す。
幾つかの例における例示的なイントラ予測方向及びイントラ予測モードの説明を示す。
幾つかの例における例示的なイントラ予測方向及びイントラ予測モードの説明を示す。
幾つかの例における例示的なマルチラインイントラ予測を示す。
幾つかの例における現在ブロックの最確モード(most probable mode (MPM))リストを導出するために使用される近隣ブロックの例示的な位置を示す。
幾つかの例におけるクロマブロックの例示的なイントラモード符号化を示すテーブルを示す。
幾つかの例における例示的なアフィン線形加重イントラ予測(affine linear weighted intra prediction (ALWIP))を示す。
幾つかの実施形態による、処理例の概要を示すフローチャートを示す。
本開示の幾つかの実施形態による、別の処理例の概要を示すフローチャートを示す。
一実施形態による、コンピュータシステムの概略図である。
ビデオエンコーダ及びデコーダ
図1は、本発明の一実施形態による通信システム(100)の簡易ブロック図を示す。通信システム(100)は、例えばネットワーク(150)を介して互いに通信できる複数の端末装置を含む。例えば、通信システム(100)は、ネットワーク(150)を介して相互接続された端末装置(110)及び(120)の第1ペアを含む。図1の例では、端末装置(110)及び(120)の第1ペアは、データの単方向伝送を実行する。例えば、端末装置(110)は、ネットワーク(150)を介して他の端末装置(120)への送信のために、ビデオデータ(端末装置(110)によりキャプチャされたビデオピクチャのストリーム)を符号化する。符号化ビデオデータは、1つ以上の符号化ビデオビットストリームの形式で、送信できる。端末装置(120)は、ネットワーク(150)から符号化ビデオデータを受信し、符号化ビデオデータを復号してビデオピクチャを復元し、復元したビデオデータに従いビデオピクチャを表示してよい。単方向データ伝送は、メディアサービングアプリケーション等で共通であってよい。
別の例では、通信システム(100)は、例えばビデオ会議の間に生じ得る符号化ビデオデータの双方向伝送を実行する端末装置(130)及び(140)の第2ペアを含む。データの双方向伝送では、端末装置(130)及び(140)は、ネットワーク(150)を介して端末装置(130)及び(140)への送信のために、ビデオデータ(例えば、端末装置によりキャプチャされたビデオピクチャのストリーム)を符号化してよい。端末装置(130)及び(140)のうちの各端末装置は、端末装置(130)及び(140)のうちの他方の端末装置により送信された符号化ビデオデータを受信してよく、符号化ビデオデータを復号してビデオピクチャを復元してよく、復元したビデオデータに従い、アクセス可能なディスプレイ装置においてビデオピクチャを表示してよい。
図1の例では、端末装置(110)、(120)、(130)及び(140)は、サーバ、パーソナルコンピュータ、及びスマートフォンとして示されてよいが、本開示の原理はこれらに限定されない。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレイヤ、及び/又は専用ビデオ会議設備による適用がある。ネットワーク(150)は、端末装置(110)、(120)、(130)、及び(140)の間で符号化ビデオデータを運ぶ任意の数のネットワークを表し、例えば有線(ワイヤード)及び/又は無線通信ネットワークを含む。通信ネットワーク150は、回線切り替え及び/又はパケット切り替えチャネルでデータを交換してよい。代表的なネットワークは、電子通信ネットワーク、ローカルエリアネットワーク、広域ネットワーク、及び/又はインターネットを含む。本発明の議論の目的で、ネットワーク(150)のアーキテクチャ及びトポロジは、以下で特に断りの無い限り、本開示の動作にとって重要でないことがある。
図2は、開示の主題の適用の一例として、ストリーミング環境におけるビデオエンコーダ及びビデオデコーダの配置を示す。開示の主題は、例えばビデオ会議、デジタルTV、CD、DVD、メモリスティック、等を含むデジタル媒体への圧縮ビデオの格納、他のビデオ可能アプリケーション、等に等しく適用可能である。
ストリーミングシステムは、例えば非圧縮のビデオピクチャストリーム(202)を生成するビデオソース(201)、例えばデジタルビデオカメラを含み得るキャプチャサブシステム(213)を含んでよい。一例では、ビデオピクチャストリーム(202)は、デジタルカメラにより取り込まれたサンプルを含む。ビデオピクチャストリーム(202)は、符号化ビデオデータ(204)(又は符号化ビデオビットストリーム)と比べたとき、高データ容量を強調するために太線で示され、ビデオソース(201)と結合されたビデオエンコーダ(203)を含む電子装置(220)により処理され得る。ビデオエンコーダ(203)は、ハードウェア、ソフトウェア、又はそれらの組み合わせを含み、以下に詳述するように開示の主題の態様を可能にし又は実装することができる。符号化ビデオデータ(204)(又はビデオビットストリーム(204))は、ビデオピクチャストリーム(202)と比べたとき、低データ容量を強調するために細線で示され、将来の使用のためにストリーミングサーバ(205)に格納され得る。図2のクライアントサブシステム(206)及び(208)のような1つ以上のストリーミングクライアントサブシステムは、ストリーミングサーバ(205)にアクセスして、符号化ビデオデータ(204)のコピー(207)及び(209)を読み出すことができる。クライアントサブシステム(206)は、例えば電子装置(230)内にビデオデコーダ(210)を含み得る。ビデオデコーダ(210)は、符号化ビデオデータの入力コピー(207)を復号し、ディスプレイ(212)(例えばディスプレイスクリーン)又は他のレンダリング装置(図示しない)上でレンダリングできる出力ビデオピクチャストリーム(211)を生成する。幾つかのストリーミングシステムでは、符号化ビデオデータ(204)、(207)、及び(209)(例えば、ビデオビットストリーム)は、特定のビデオ符号化/圧縮標準に従い符号化され得る。これらの標準の例は、ITU-T Recommendation H.265を含む。一例では、策定中のビデオ符号化標準は、略式にVVC(Versatile Video Coding)として知られている。開示の主題は、VVCの文脈で使用されてよい。
電子装置(220)及び(230)は他のコンポーネント(図示しない)を含み得ることに留意する。例えば、電子装置(220)は、ビデオデコーダ(図示しない)を含むことができ、電子装置(230)もビデオエンコーダ(図示しない)を含むことができる。
図3は、本開示の一実施形態によるビデオデコーダ(310)のブロック図を示す。ビデオデコーダ(310)は、電子装置(330)に含まれ得る。電子装置(330)は、受信機(331)(例えば、受信回路)を含み得る。ビデオデコーダ(310)は、図2の例では、ビデオデコーダ(210)の代わりに使用できる。
受信機(331)は、ビデオデコーダ(310)により符号化されるべき1つ以上の符号化ビデオシーケンス、同じ又は別の実施形態では、一度に1つの符号化ビデオシーケンスを受信してよい。ここで、各符号化ビデオシーケンスの復号は、他の符号化ビデオシーケンスと独立している。符号化ビデオシーケンスは、符号化ビデオデータを格納する記憶装置へのハードウェア/ソフトウェアリンクであってよいチャネル301から受信されてよい。受信機331は、他のデータ、例えば、それぞれの使用エンティティ(図示しない)へと転送され得る符号化音声データ及び/又は補助データストリームと共に、符号化ビデオデータを受信してよい。受信機331は、他のデータから符号化ビデオシーケンスを分離してよい。ネットワークジッタを除去するために、バッファメモリ(315)は、受信機(331)とエントロピーデコーダ/パーサ(320)(以後、「パーサ(320)」)との間に結合されてよい。特定の適用では、バッファメモリ(315)は、ビデオデコーダ(310)の一部である。他に、ビデオデコーダ(310)(図示しない)の外部にあり得る。更に他では、例えばネットワークジッタを除去するために、ビデオデコーダ(310)の外部に、例えば再生(playout)タイミングを処理するために、ビデオデコーダ(310)の内部にある別のバッファメモリ(315)に加えて、バッファメモリ(図示しない)が存在し得る。受信機(331)が、十分な帯域幅の記憶/転送装置から制御可能に、又はアイソクロナス(isosynchronous)ネットワークから、データを受信しているとき、バッファメモリ(315)は、必要なくてよく又は小さくできる。インターネットのようなベストエフォート型パケットネットワークで使用するために、バッファメモリ(315)が必要とされてよく、比較的大きくなり、有利なことに適応型サイズであり、少なくとも部分的にオペレーティングシステム又はビデオデコーダ(310)の外部の同様の要素(図示しない)に実装されてよい。
ビデオデコーダ(310)は、符号化ビデオシーケンスからシンボル(321)を再構成するために、パーサ(320)を含んでよい。これらのシンボルのカテゴリは、ビデオデコーダ(310)の動作を管理するために使用される情報、及び場合によっては図3に示したように電子装置(330)の統合部分ではないが電子装置(330)に結合され得るレンダー装置(312)(例えば、ディスプレイスクリーン)のようなレンダリング装置を制御するための情報を含む。レンダリング装置のための制御情報は、SEI(Supplemental Enhancement Information)メッセージ又はVUI(Video Usability Information)パラメータセットフラグメント(図示しない)の形式であってよい。パーサ(320)は、受信された符号かビデオシーケンスをパース/エントロピー復号してよい。符号化ビデオシーケンスの符号化は、ビデオ符号化技術又は標準に従うことができ、可変長符号化、ハフマン符号化、コンテキスト依存性を有する又は有しない算術的符号化、等を含む、種々の原理に従うことができる。パーサ(320)は、符号化ビデオシーケンスから、ビデオデコーダの中のピクセルのサブグループのうちの少なくとも1つについて、該グループに対応する少なくとも1つのパラメータに基づき、サブグループパラメータのセットを抽出してよい。サブグループは、GOP(Groups of Picture)、ピクチャ、タイル、スライス、マクロブロック、符号化ユニット(Coding Units:CU)、ブロック、変換ユニット(Transform Units:TU)、予測ユニット(Prediction Units:PU)、等を含み得る。パーサ(320)は、符号化ビデオシーケンスから、変換係数、量子化パラメータ値、動きベクトル、等のような情報も抽出してよい。
パーサ(320)は、バッファメモリ(315)から受信したビデオシーケンスに対してエントロピー復号/パース動作を実行して、シンボル(321)を生成してよい。
シンボル321の再構成は、符号化ビデオピクチャ又はその部分の種類(例えば、インター及びイントラピクチャ、インター及びイントラブロック)及び他の要因に依存して、複数の異なるユニットを含み得る。どのユニットがどのように含まれるかは、パーサ320により符号化ビデオシーケンスからパースされたサブグループ制御情報により制御できる。パーサ320と以下の複数のユニットとの間のこのようなサブグループ制御情報のフローは、明確さのために示されない。
既に言及した機能ブロックを超えて、ビデオデコーダ(310)は、後述のように、多数の機能ユニットに概念的に細分化できる。商用的制約の下で動作する実際の実装では、これらのユニットの多くは、互いに密に相互作用し、少なくとも部分的に互いに統合され得る。しかしながら、開示の主題を説明する目的で、機能ユニットへの以下の概念的細分化は適切である。
第1ユニットは、スケーラ/逆変換ユニット351である。スケーラ/逆変換ユニット(351)は、量子化済み変換係数、及び、どの変換を使用すべきか、ブロックサイズ、量子化係数、量子化スケーリングマトリクス、等を含む制御情報を、パーサ(320)からのシンボル(321)として受信する。スケーラ/逆変換ユニット(351)はアグリゲータ(355)に入力され得るサンプル値を含むブロックを出力できる。
幾つかの例では、スケーラ/逆変換ユニット(351)の出力サンプルは、イントラ符号化ブロック、つまり、前に再構成されたピクチャからの予測情報を使用しないが現在ピクチャの前に再構成された部分からの予測情報を使用可能なブロック、に属することができる。このような予測情報は、イントラピクチャ予測ユニット352により提供できる。幾つかの場合には、イントラピクチャ予測ユニット(352)は、再構成中のブロックと同じサイズ及び形状のブロックを、現在ピクチャバッファ(358)からフェッチした周囲の既に再構成された情報を用いて、生成する。現在ピクチャバッファ(358)は、例えば、再構成された現在ピクチャを部分的に及び/又は再構成された現在ピクチャを完全にバッファリングする。アグリゲータ(355)は、幾つかの場合には、サンプル毎に、イントラ予測ユニット(352)の生成した予測情報を、スケーラ/逆変換ユニット(351)により提供された出力サンプル情報に追加する。
他の場合には、スケーラ/逆変換ユニット(351)の出力サンプルは、インター符号化された、場合によっては動き補償されたブロックに関連し得る。このような場合には、動き補償予測ユニット(353)は、参照ピクチャメモリ(357)にアクセスして、予測ために使用されるサンプルをフェッチできる。ブロックに関連するシンボル(321)に従いフェッチしたサンプルを動き補償した後に、これらのサンプルは、アグリゲータ(355)により、出力サンプル情報を生成するために、スケーラ/逆変換ユニット(351)の出力に追加され得る(この場合、残差サンプル又は残差信号と呼ばれる)。動き補償予測ユニット(353)が予測サンプルをフェッチする参照ピクチャメモリ(357)内のアドレスは、例えばX、Y及び参照ピクチャコンポーネントを有し得るシンボル(321)の形式で、動き補償予測ユニット(353)の利用可能な動きベクトルにより制御できる。動き補償は、サブサンプルの正確な動きベクトルが使用中であるとき参照ピクチャメモリ(357)からフェッチされたサンプル値の補間、動きベクトル予測メカニズム、等を含み得る。
アグリゲータ(355)の出力サンプルは、ループフィルタユニット(356)において種々のループフィルタリング技術を受け得る。ビデオ圧縮技術は、符号化ビデオシーケンス(符号化ビデオビットストリームとも呼ばれる)に含まれ且つパーサ(320)からのシンボル(321)としてループフィルタユニット(356)に利用可能にされたパラメータにより制御されるが、符号化ピクチャ又は符号化ビデオシーケンスの(複合順序で)前の部分の複合中に取得されたメタ情報にも応答し、前に再構成されループフィルタリングされたサンプル値にも応答し得るインループフィルタ技術を含み得る。
ループフィルタユニット(356)の出力は、レンダー装置(312)へと出力でき及び将来のインターピクチャ予測で使用するために参照ピクチャメモリ(357)に格納され得るサンプルストリームであり得る。
特定の符号化ピクチャは、一旦完全に再構成されると、将来の予測のための参照ピクチャとして使用できる。例えば、現在ピクチャに対応する符号化ピクチャが完全に再構成され、符号化ピクチャが(例えばパーサ(320)により)参照ピクチャとして識別されると、現在ピクチャバッファ(358)は、参照ピクチャメモリ(357)の一部になることができ、後続の符号化ピクチャの再構成を開始する前に、新鮮な現在ピクチャバッファを再割り当てできる。
ビデオデコーダ(310)は、ITU-T Rec. H.265のような標準の所定のビデオ圧縮技術に従い復号動作を実行してよい。符号化ビデオシーケンスがビデオ圧縮技術又は標準、及びビデオ圧縮技術又は標準において文書化されたプロファイルの両方に従うという意味で、符号化ビデオシーケンスは、使用中のビデオ圧縮技術又は標準により指定されたシンタックスに従ってよい。具体的に、プロファイルは、ビデオ圧縮技術又は標準において利用可能な全部のツールから、プロファイルの下でのみ使用可能なツールとして、特定のツールを選択できる。また、遵守のために必要なことは、符号化ビデオシーケンスの複雑さが、ビデオ圧縮技術又は標準のレベルにより定められる限界の範囲内であることであり得る。幾つかの場合には、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート(例えばメガサンプル/秒で測定される)、最大参照ピクチャサイズ、等を制限する。レベルにより設定される限界は、幾つかの場合には、HRD(Hypothetical Reference Decoder)仕様及び符号化ビデオシーケンスの中でシグナリングされるHDRバッファ管理のためのメタデータを通じて更に制限され得る。
一実施形態では、受信機331は、符号化ビデオと共に追加(冗長)データを受信してよい。追加データは、符号化ビデオシーケンスの部分として含まれてよい。追加データは、データを正しく復号するため及び/又は元のビデオデータをより正確に再構成するために、ビデオデコーダ310により使用されてよい。追加データは、例えば、時間的、空間的、又は信号雑音比(SNR)の拡張レイヤ、冗長スライス、冗長ピクチャ、前方誤り訂正符号、等の形式であり得る。
図4は、本開示の一実施形態によるビデオエンコーダ(403)のブロック図を示す。ビデオエンコーダ(403)は、電子装置(420)に含まれる。電子装置(420)は、送信機(440)(例えば、送信回路)を含む。ビデオエンコーダ(403)は、図2の例では、ビデオエンコーダ(203)の代わりに使用できる。
ビデオエンコーダ(403)は、ビデオサンプルを、ビデオエンコーダ(403)により符号化されるべきビデオ画像をキャプチャし得るビデオソース(401)(図4の例では、電子装置(420)の部分ではない)から受信してよい。別の例では、ビデオソース(401)は、電子装置(420)の一部である。
ビデオソース(401)は、ビデオエンコーダ(403)により符号化されるべきソースビデオシーケンスを、任意の適切なビット深さ(例えば、8ビット、10ビット、12ビット、...)、任意の色空間(例えば、BT.601 YCrCb、RGB、...)、及び任意の適切なサンプリング構造(例えば、YCrCb 4:2:0、YCrCb 4:4:4)のデジタルビデオサンプルストリームの形式で、提供してよい。メディア提供システムでは、ビデオソース401は、前に準備されたビデオを格納する記憶装置であってよい。ビデオ会議システムでは、ビデオソース401は、ビデオシーケンスとしてローカル画像情報をキャプチャするカメラであってよい。ビデオデータは、続けて閲覧されると動きを与える複数の個別ピクチャとして提供されてよい。ピクチャ自体は、ピクセルの空間的配列として組織化されてよい。各ピクセルは、使用中のサンプリング構造、色空間、等に依存して、1つ以上のサンプルを含み得る。当業者は、ピクセルとサンプルとの間の関係を直ちに理解できる。以下の説明はサンプルに焦点を当てる。
一実施形態によると、ビデオエンコーダ(403)は、ソースビデオシーケンスのピクチャを、符号化ビデオシーケンス(443)へと、リアルタイムに又はアプリケーションにより要求される任意の他の時間制約の下で符号化し圧縮してよい。適切な符号化速度の実施は、制御部(450)の1つの機能である。幾つかの実施形態では、制御部(450)は、後述する他の機能ユニットを制御し、他の機能ユニットに機能的に結合される。結合は、明確さのために図示されない。制御部(450)により設定されるパラメータは、レート制御関連パラメータ(ピクチャスキップ、量子化器、レート歪み最適化技術のラムダ値、...)、ピクチャサイズ、GOP(group of pictures)レイアウト、最大動きベクトル探索範囲、等を含み得る。制御部(450)は、特定のシステム設計に最適化されたビデオエンコーダ(403)に関連する他の適切な機能を有するよう構成され得る。
幾つかの実施形態では、ビデオエンコーダ(403)は、符号化ループの中で動作するよう構成される。非常に簡略化された説明として、一例では、符号化ループは、ソースコーダ(430)(例えば、シンボルストリームのようなシンボルを、符号化されるべき入力ピクチャ及び参照ピクチャに基づき生成することを担う)、及びビデオエンコーダ(403)に内蔵された(ローカル)デコーダ(433)を含み得る。デコーダ(433)は、(シンボルと符号化ビットストリームとの間の任意の圧縮が、開示の主題において検討されるビデオ圧縮技術において無損失であるとき)(遠隔にある)デコーダが生成するのと同様の方法で、シンボルを再構成して、サンプルデータを生成する。再構成されたサンプルストリーム(サンプルデータ)は、参照ピクチャメモリ(434)に入力される。シンボルストリームの復号が、デコーダ位置(ローカル又はリモート)と独立にビット正確な結果をもたらすとき、参照ピクチャメモリ(434)の内容も、ローカルエンコーダとリモートエンコーダとの間でビット正確である。言い換えると、エンコーダの予測部分が、復号中に予測を用いるときデコーダが「見る」のと正確に同じサンプル値を、参照ピクチャサンプルとして「見る」。参照ピクチャ同期性のこの基本原理(及び、例えばチャネルエラーのために同期生が維持できない場合には、結果として生じるドリフト)は、幾つかの関連技術で同様に使用される。
「ローカル」デコーダ(433)の動作は、図3と関連して以上に詳述したビデオデコーダ(310)のような「リモート」デコーダのものと同じであり得る。簡単に一時的に図3も参照すると、しかしながら、シンボルが利用可能であり、エントロピーコーダ(445)及びパーサ(320)による符号化ビデオシーケンスへのシンボルの符号化/復号が無損失であり得るので、バッファメモリ(315)を含むビデオデコーダ(310)のエントロピー復号部分、及びパーサ(320)は、ローカルデコーダ(433)に完全に実装されなくてよい。
この点で行われる考察は、デコーダ内に存在するパース/エントロピー復号を除く任意のデコーダ技術も、対応するエンコーダ内と実質的に同一の機能形式で存在する必要があるということである。この理由から、開示の主題は、デコーダ動作に焦点を当てる。エンコーダ技術の説明は、それらが包括的に説明されるデコーダ技術の逆であるので、省略できる。特定の領域においてのみ、より詳細な説明が必要であり、以下に提供される。
動作中、幾つかの例では、ソースコーダ(430)は、動き補償された予測符号化を実行してよい。これは、「参照ピクチャ」として指定されたビデオシーケンスからの1つ以上の前に符号化されたピクチャを参照して予測的に入力ピクチャを符号化する。この方法では、符号化エンジン(432)は、入力ピクチャのピクセルブロックと、入力ピクチャに対する予測基準として選択されてよい参照ピクチャのピクセルブロックとの間の差分を符号化する。
ローカルビデオデコーダ(433)は、ソースコーダ(430)により生成されたシンボルに基づき、参照ピクチャとして指定されてよいピクチャの符号化ビデオデータを復号してよい。符号化エンジン432の動作は、有利なことに、損失処理であってよい。符号化ビデオデータがビデオデコーダ(図4に図示されない)において復号され得るとき、再構成ビデオシーケンスは、標準的に、幾つかのエラーを有するソースビデオシーケンスの複製であってよい。ローカルビデオデコーダ(433)は、参照ピクチャに対してビデオデコーダにより実行され得る復号処理を複製し、参照ピクチャキャッシュ(434)に格納されるべき再構成参照ピクチャを生じ得る。このように、ビデオエンコーダ(403)は、(伝送誤りが無ければ)遠端ビデオデコーダにより取得される再構成参照ピクチャと共通の内容を有する再構成参照ピクチャのコピーを格納してよい。
予測器(435)は、符号化エンジン(432)のために予測探索を実行してよい。つまり、符号化されるべき新しいピクチャについて、予測器(435)は、新しいピクチャのための適切な予測基準として機能し得る(候補参照ピクセルブロックのような)サンプルデータ又は参照ピクチャ動きベクトル、ブロック形状、等のような特定のメタデータについて、参照ピクチャメモリ(434)を検索してよい。予測器(435)は、適切な予測基準を見付けるために、サンプルブロック-ピクセルブロック毎に動作してよい。幾つかの例では、予測器435により取得された検索結果により決定されるように、入力ピクチャは、参照ピクチャメモリ434に格納された複数の参照ピクチャから引き出された予測基準を有してよい。
制御部(450)は、例えば、ビデオデータの符号化のために使用されるパラメータ及びサブグループパラメータの設定を含む、ソースコーダ(430)の符号化動作を管理してよい。
全ての前述の機能ユニットの出力は、エントロピーコーダ(445)におけるエントロピー符号化を受けてよい。エントロピーコーダ(445)は、ハフマン符号化、可変長符号化、算術符号化、等のような技術に従いシンボルを無損失圧縮することにより、種々の機能ユニットにより生成されたシンボルを、符号化ビデオシーケンスへと変換する。
送信機(440)は、符号化ビデオデータを格納し得る記憶装置へのハードウェア/ソフトウェアリンクであってよい通信チャネル(460)を介する伝送のために準備するために、エントロピーコーダ(445)により生成された符号化ビデオシーケンスをバッファリングしてよい。送信機440は、ビデオコーダ403からの符号化ビデオデータを、送信されるべき他のデータ、例えば符号化音声データ及び/又は補助データストリーム(図示されないソース)とマージ(merge)してよい。
制御部(450)は、ビデオエンコーダ(403)の動作を管理してよい。符号化中、制御部450は、それぞれのピクチャに適用され得る符号化技術に影響し得る特定の符号化ピクチャタイプを、各符号化ピクチャに割り当ててよい。例えば、ピクチャは、多くの場合、以下のピクチャタイプのうちの1つとして割り当てられてよい。
イントラピクチャ(Iピクチャ)は、予測のソースとしてシーケンス内の任意の他のピクチャを使用せずに符号化及び復号され得るピクチャであってよい。幾つかのビデオコーデックは、例えばIDR(Independent Decoder Refresh)ピクチャを含む異なる種類のイントラピクチャを許容する。当業者は、Iピクチャの変形、及びそれらの個々の適用及び特徴を認識する。
予測ピクチャ(Pピクチャ)は、殆どの場合、各ブロックのサンプル値を予測するために1つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測を用いて符号化及び復号され得るピクチャであってよい。
双方向予測ピクチャ(Bピクチャ)は、各ブロックのサンプル値を予測するために最大2つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測を用いて符号化及び復号され得るピクチャであってよい。同様に、マルチ予測ピクチャは、単一のブロックの再構成のために、2つより多くの参照ピクチャ及び関連付けられたメタデータを使用できる。
ソースピクチャは、共通に、複数のサンプルブロック(例えば、それぞれ4×4、8×8、4×8、又は16×16個のサンプルのブロック)に空間的に細分化され、ブロック毎に符号化されてよい。ブロックは、ブロックのそれぞれのピクチャに適用される符号化割り当てにより決定される他の(既に符号化された)ブロックへの参照により予測的に符号化されてよい。例えば、Iピクチャのブロックは、非予測的に符号化されてよく、又はそれらは同じピクチャの既に符号化されたブロックを参照して予測的に符号化されてよい(空間予測又はイントラ予測)。Pピクチャのピクセルブロックは、1つの前に符号化された参照ピクチャを参照して、空間予測を介して又は時間予測を介して、予測的に符号化されてよい。Bピクチャのブロックは、1つ又は2つの前に符号化された参照ピクチャを参照して、空間予測を介して又は時間予測を介して、予測的に符号化されてよい。
ビデオエンコーダ(403)は、ITU-T Rec. H.265のような所定のビデオ符号化技術又は標準に従い符号化動作を実行してよい。その動作において、ビデオエンコーダ(403)は、入力ビデオシーケンスの中の時間的及び空間的冗長性を利用する予測符号化動作を含む種々の圧縮動作を実行してよい。符号化ビデオデータは、したがって、使用されているビデオ符号化技術又は標準により指定されたシンタックスに従ってよい。
一実施形態では、送信機440は、符号化ビデオと共に追加データを送信してよい。ソースコーダ(430)は、このようなデータを符号化ビデオシーケンスの部分として含んでよい。追加データは、時間/空間/SNR拡張レイヤ、冗長ピクチャ及びスライスのような他の形式の冗長データ、SEIメッセージ、VUIパラメータセットフラグメント、等を含んでよい。
ビデオは、時系列の中の複数のソースピクチャ(ビデオピクチャ)としてキャプチャされてよい。イントラピクチャ予測(イントラ予測と省略されることがある)は、所与のピクチャの中の空間的相関を利用し、インターピクチャ予測は、ピクチャ間の(時間的又は他の)相関を利用する。一例では、符号化/復号中の特定のピクチャは、現在ピクチャと呼ばれ、ブロックにパーティションされる。現在ピクチャの中のブロックが、ビデオの中の前に符号化され且つ未だバッファリングされている参照ピクチャの中の参照ブロックと同様であるとき、現在ピクチャの中のブロックは、動きベクトルと呼ばれるベクトルにより符号化できる。動きベクトルは、参照ピクチャ内の参照ブロックを指し、複数の参照ピクチャが使用中である場合には、参照ピクチャを識別する第3次元を有することができる。
幾つかの実施形態では、双予測(bi-prediction)技術が、インターピクチャ予測で使用できる。双予測技術によると、両方とも復号順序でビデオの中の現在ピクチャより前にある(が、それぞれ表示順序で過去及び未来にあってよい)第1参照ピクチャ及び第2参照ピクチャのような2つの参照ピクチャが使用される。現在ピクチャ内のブロックは、第1参照ピクチャ内の第1参照ブロックを指す第1動きベクトル、及び第2参照ピクチャ内の第2参照ブロックを指す第2動きベクトルにより符号化できる。ブロックは、第1参照ブロック及び第2参照ブロックの結合により予測できる。
さらに、符号化効率を向上するために、インターピクチャ予測においてマージモード技術が使用できる。
本開示の幾つかの実施形態によると、インターピクチャ予測及びイントラピクチャ予測のような予測は、ブロックのユニットの中で実行される。例えば、HEVC標準によると、ビデオピクチャシーケンスの中のピクチャは、圧縮のために符号化木単位(coding tree unit:CTU)にパーティションされる。ピクチャ内のCTUは、64×64ピクセル、32×32ピクセル、又は16×16ピクセルのような、同じサイズを有する。通常、CTUは、3個の符号化木ブロック(coding tree blocks:CTB)、つまり1個のルマCTB及び2個のクロマCTB、を含む。各CTUは、1又は複数の符号化単位(coding unit:CU)に再帰的に4分木分割できる。例えば、64×64ピクセルのCTUは、64×64ピクセルの1個のCU、又は32×32ピクセルの4個のCU、又は16×16ピクセルの16個のCUに分割できる。一例では、各CUは、インター予測タイプ又はイントラ予測タイプのようなCUの予測タイプを決定するために分析される。CUは、時間的及び/又は空間的予測性に依存して、1つ以上の予測単位(prediction unit:PU)に分割される。通常、各PUは、ルマ予測ブロック(prediction block:PB)、及び2個のクロマPBを含む。一実施形態では、符号化(符号化/復号)における予測演算が、予測ブロックのユニットの中で実行される。ルマ予測ブロックを予測ブロックの一例として用いると、予測ブロックは、8×8ピクセル、16×16ピクセル、8×16ピクセル、16×8ピクセル、等のようなピクセルについて値(例えば、ルマ値)のマトリクスを含む。
図5は、本開示の別の実施形態によるビデオエンコーダ(503)の図を示す。ビデオエンコーダ(503)は、ビデオピクチャシーケンスの中の現在ビデオピクチャ内のサンプル値の処理ブロック(例えば、予測ブロック)を受信し、処理ブロックを符号化ビデオシーケンスの部分である符号化ピクチャに符号化するよう構成される。一例では、ビデオエンコーダ(503)は、図2の例では、ビデオエンコーダ(203)の代わりに使用される。
HEVCの例では、ビデオエンコーダ(503)は、8×8サンプル等の予測ブロックのような、処理ブロックのサンプル値のマトリクスを受信する。ビデオエンコーダ(503)は、例えばレート歪み最適化を用いて、処理ブロックがイントラモード、インターモード、又は双予測モードを用いて最適に符号化されるかを決定する。処理ブロックはイントラモードで符号化されるとき、ビデオエンコーダ(503)は、処理ブロックを符号化ピクチャへと符号化するために、イントラ予測技術を使用してよい。処理ブロックがインターモード又は双予測モードで符号化されるとき、ビデオエンコーダ(503)は、処理ブロックを符号化ピクチャへと符号化するために、それぞれインター予測又は双予測技術を使用してよい。特定のビデオ符号化技術では、マージモードは、予測器のギア部の符号化動きベクトルコンポーネント無しに、動きベクトルが1つ以上の動きベクトル予測器から得られるインターピクチャ予測サブモードであり得る。特定の他のビデオ符号化技術では、対象ブロックに適用可能な動きベクトルコンポーネントが存在し得る。一例では、ビデオエンコーダ(503)は、処理ブロックのモードを決定するために、モード決定モジュール(図示しない)のような他のコンポーネントを含む。
図5の例では、ビデオエンコーダ(503)は、図5に示したように一緒にインターエンコーダ(530)、イントラエンコーダ(522)、残差計算器(523)、スイッチ(526)、残差エンコーダ(524)、汎用制御部(521)、及びエントロピーエンコーダ(525)を含む。
インターエンコーダ(530)は、現在ブロック(例えば、処理中のブロック)のサンプルを受信し、ブロックを参照ピクチャ内の1つ以上の参照ブロック(例えば、前のピクチャ及び後のピクチャの中のブロック)と比較し、インター予測情報(例えば、インター符号化技術による冗長情報の説明、動きベクトル、マージモード情報)を生成し、任意の適切な技術を用いてインター予測情報に基づきインター予測結果(例えば、予測ブロック)を計算するよう構成される。幾つかの例では、参照ピクチャは、符号化ビデオ情報に基づき復号された、復号参照ピクチャである。
イントラエンコーダ(522)は、現在ブロック(例えば、処理中のブロック)のサンプルを受信し、幾つかの場合には、ブロックをサンプルピクチャ内の既に符号化されたブロックと比較し、変換後に量子化済み係数を、幾つかの場合にはイントラ予測情報(例えば、1つ以上のイントラ符号化技術によるイントラ予測方向情報)も生成するよう構成される。一例では、イントラエンコーダ(522)は、イントラ予測情報及び同じピクチャ内の参照ブロックに基づき、イントラ予測結果(例えば、予測したブロック)も計算する。
汎用制御部(521)は、一般制御データを決定し、一般制御データに基づきビデオエンコーダ(503)の他のコンポーネントを制御するよう構成される。一例では、汎用制御部(521)は、ブロックのモードを決定し、モードに基づき、制御信号をスイッチ(526)に提供する。例えば、モードがイントラモードであるとき、一般制御部(521)は、残差計算器(523)による使用のためにイントラモード結果を選択するようスイッチ(526)を制御し、イントラ予測情報を選択してビットストリーム内にイントラ予測情報を含めるよう、エントロピーエンコーダ(525)を制御し、モードがインターモードであるとき、一般制御部(521)は、残差計算器(523)による使用のためにインター予測結果を選択するようスイッチ(526)を制御し、インター予測情報を選択してビットストリーム内にインター予測情報を含めるよう、エントロピーエンコーダ(525)を制御する。
残差計算器(523)は、受信したブロックとイントラエンコーダ(522)又はインターエンコーダ(530)からの選択された予測結果との間の差(残差データ)を計算するよう構成される。残差エンコーダ(524)は、残差データに基づき動作して、残差データを符号化し、変換係数を生成するよう構成される。一例では、残差エンコーダ(524)は、残差データを空間ドメインから周波数ドメインへと変換し、変換係数を生成するよう構成される。変換係数は、次に、量子化変換係数を得るために、量子化処理を受ける。種々の実施形態では、ビデオエンコーダ(503)も残差デコーダ(528)を含む。残差デコーダ(528)は、逆変換を実行し、復号残差データを生成するよう構成される。復号残差データは、イントラエンコーダ(522)及びインターエンコーダ(530)により適切に使用できる。例えば、インターエンコーダ(530)は、復号残差データ及びインター予測情報に基づき復号ブロックを生成でき、イントラエンコーダ(522)は、復号残差データ及びイントラ予測情報に基づき復号ブロックを生成できる。復号ブロックは、復号ピクチャを生成するために適切に処理され、復号ピクチャは、幾つかの例ではメモリ回路(図示しない)にバッファリングされ、参照ピクチャとして使用できる。
エントロピーエンコーダ(525)は、符号化ブロックを含めるために、ビットストリームをフォーマットするよう構成される。エントロピーエンコーダ(525)は、HEVC標準のような適切な標準に従い種々の情報を含むよう構成される。一例では、エントロピーエンコーダ(525)は、ビットストリームに、一般制御データ、選択された予測情報(例えば、イントラ予測情報又はインター予測情報)、残差情報、及び他の適切な情報を含めるよう構成される。開示の主題によると、インターモード又は双予測モードのいずれかのマージサブモードでブロックを符号化するとき、残差情報は存在しないことに留意する。
図6は、本開示の別の実施形態によるビデオエンコーダ(610)の図を示す。ビデオデコーダ(610)は、符号化ビデオシーケンスの部分である符号化ピクチャを受信し、符号化ピクチャを復号して再構成ピクチャを生成するよう構成される。一例では、ビデオデコーダ(610)は、図2の例では、ビデオデコーダ(210)の代わりに使用される。
図6の例では、ビデオデコーダ(610)は、図6に示したように一緒にエントロピーデコーダ(671)、インターデコーダ(680)、残差デコーダ(673)、再構成モジュール(674)、イントラデコーダ(672)を含む。
エントロピーデコーダ(671)は、符号化ピクチャから、符号化ピクチャの生成されたシンタックス要素を表す特定のシンボルを再構成するよう構成され得る。このようなシンボルは、例えば、ブロックの符号化されたモード(例えば、イントラモード、インターモード、双方向モード、マージサブモード又は別のサブモードの後者の2つ)、それぞれイントラデコーダ(672)又はインターデコーダ(680)による予測のために使用される特定のサンプル又はメタデータを特定できる予測情報(例えば、イントラ予測情報又はインター予測情報)、例えば量子化された変換係数の形式の残差情報、等を含み得る。一例では、予測モードがインター又は双方向予測モードであるとき、インター予測情報がインターデコーダ(680)に提供され、予測タイプがイントラ予測タイプであるとき、イントラ予測情報がイントラデコーダ(672)に提供される。残差情報は、逆量子化され、残差デコーダ(673)に提供される。
インターデコーダ(680)は、インター予測情報を受信し、インター予測情報に基づきインター予測結果を生成するよう構成される。
イントラデコーダ(672)は、イントラ予測情報を受信し、イントラ予測情報に基づき予測結果を生成するよう構成される。
残差デコーダ(673)は、逆量子化を実行して、逆量子化された変換係数を抽出し、逆量子化された変換係数を処理して、残差を周波数ドメインから空間ドメインへと変換するよう構成される。残差デコーダ(673)は、(量子化器パラメータ(Quantizer Parameter:QP)を含むための)特定の制御情報も要求してよい。この情報は、エントロピーデコーダ(671)により提供されてよい(これは低容量制御情報のみなので、データ経路は示されない)。
再構成モジュール(674)は、空間ドメインで、残差デコーダ(673)による出力としての残差と(場合によりインター又はイントラ予測モジュールによる出力としての)予測結果とを結合して、再構成ピクチャの部分であり得る、一方で再構成ビデオの部分であり得る、再構成ブロックを形成するよう構成される。デブロッキング動作などのような他の適切な動作が、視覚的品質を向上するために実行できる。
ビデオエンコーダ(203)、(403)、及び(503)、並びにビデオデコーダ(210)、(310)、及び(610)は、任意の適切な技術を用いて実装できることに留意する。一実施形態では、ビデオエンコーダ(203)、(403)、及び(503)、並びにビデオデコーダ(210)、(310)、及び(610)は、1つ以上の集積回路を用いて実装できる。別の実施形態では、ビデオエンコーダ(203)、(403)、及び(503)、並びにビデオデコーダ(210)、(310)、及び(610)は、ソフトウェア命令を実行する1つ以上のプロセッサを用いて実装できる。
HEVC及びVVCにおけるイントラ予測
以下の説明では、用語「ブロック」は、予測ブロック、符号化ブロック、又は符号化単位として解釈できる。
図7は、幾つかの例における(例えば、HEVCにおける)例示的なイントラ予測方向及び対応するイントラ予測モードの説明を示す。図7には、全部で35個のイントラ予測モード(モード0~モード34)がある。モード0及びモード1は非指向性モードであり、その中で、モード0は平面モード(Intra_Planar)であり、モード1はDCモード(Intra_DC)である。モード2~34は指向性(又は角度)モード(Intra_Angular)であり、この中で、モード10は水平モードであり、モード26は垂直モードであり、モード2、モード18、モード34は対角モードである。
幾つかの例では、イントラモードを符号化するために、イントラ予測モードの部分集合はモード候補リストを形成する。例えば、1つ以上の最確モードは、MPMリストと呼ばれるモード候補リストを形成する。例では(例えば、HEVC)、MPMリストは、3個の最確モードを含み、現在ブロックの近隣ブロックのイントラ予測モードに基づき構成される。MPMリストは、1次MPMリストとも呼ばれる。このような例では、現在ブロックのイントラ予測モードがMPMリストからであるかどうかを示すために、MPMフラグがシグナリングされる。MPMフラグが、現在ブロックのイントラ予測モードがMPMリストからであると示す場合、現在ブロックについて、MPMリストの中の3個の最確モードのうちの1つを示すために、MPMリストインデックスがシグナリングされる。しかしながら、MPMフラグが、現在ブロックのイントラ予測モードがMPMリストからであると示す場合、現在ブロックについて、他の32個のイントラモードのうちの1つを示すために、モードインデックスがシグナリングされる。
幾つかの例では、MPMリスト生成処理は以下のように示される。
Figure 2022516846000002
MPMリスト生成処理では、leftIntraDirは、現在ブロックの左の近隣ブロック(左近隣ブロックと呼ばれる)のイントラ予測モードを示し、aboveIntraDirは、現在ブロックの上の近隣ブロック(上近隣ブロックと呼ばれる)のイントラ予測モードを示す。左近隣ブロック又は上近隣ブロックが利用可能でない場合、leftIntraDir又はaboveIntraDirはDC_IDXに設定できる。PLANAR_IDX、DC_IDX、及びVER_IDXは、それぞれ、平面モード(例えば、モード0)、DCモード(例えば、モード1)、及び垂直モード(例えば、モード26)のモードインデックスを示す。さらに、変数「offset」および「mod」は定数であり、例では、それぞれ29及び32に設定される。このような例では、左近隣ブロック及び上近隣ブロックの両方が同じ指向性モードを有するとき、第1最確モードは、同じ指向性モードに設定される。第2及び第3最確モードは、第1最確モードのモード番号に最も近い2個の指向性モードとして選択される。左近隣ブロック及び上近隣ブロックの両方が同じ非指向性モードを有するとき、第1、第2、及び第3最確モードは、それぞれ、平面モード、DCモード、及び垂直モードに設定される。左近隣ブロック及び上近隣ブロックが異なるイントラ予測モードを有するとき、第1及び第2最確モードは、それぞれ、左近隣ブロック及び上近隣ブロックのイントラ予測モードに設定され、第3最確モードは、平面モード、DCモード、又は垂直モードのうちのどれが、この順序で、最初の2個の最確モードのうちの1つと重複しないかに従い、これらのモードのうちの1つに設定される。
図8は、幾つかの例(例えば、VVC)における例示的なイントラ予測方向及び対応するイントラ予測モードの説明を示す。図8には、全部で95個のイントラ予測モード(モード-14~モード80)があり、この中で、モード18は水平モードであり、モード50は垂直モードであり、モード2、モード34、モード66は対角モードである。モード-1~-14及びモード67~80は、広角イントラ予測(Wide-Angle Intra Prediction(WAIP))モードと呼ばれる。
図7の例と同様に、図8の例で、モード符号化のためにMPMリストが構成される。例えば、マルチラインイントラ予測では、MPMリストのサイズは、現在ブロックの隣接する参照ラインについて6に、隣接しない参照ラインについて5に、設定される。隣接する参照ライン及び隣接しない参照ラインは、図9を参照して説明される。
図9は、幾つかの例(例えば、VVC)における例示的なマルチラインイントラ予測を示す。マルチラインイントラ予測では、イントラ予測のために複数の参照ラインが利用される。図9の例では、4本の参照ライン、つまり参照ライン0~3があり、参照ライン0は隣接参照ラインであり、ゼロ参照ラインとも呼ばれ、参照ライン1~3は非隣接参照ラインであり、非ゼロ参照ラインとも呼ばれる。各参照ラインは、垂直部分及び水平部分を含み、6個のセグメント、つまりセグメントA~セグメントFで構成される。セグメントA及びFは、それぞれセグメントB及びEから最も近いサンプルによりパディングされる。更に、左上参照サンプルは、図9の例ではセグメントCとDとの間に含まれる。複数の参照ラインのうちの使用されるべき1つを示すために、参照ラインインデックスは、イントラ予測モードの前にシグナリングされる。非ゼロ参照ラインインデックスがシグナリングされる場合、最確モードのみが、イントラ予測のために使用されることを許可される。
図10は、幾つかの例(例えば、VVC)における現在ブロックのMPMリストを導出するために使用される近隣ブロックの例示的な位置を示す。ブロックA及びブロックBは、それぞれ、現在ブロックの左及び上近隣符号化単位(coding unit (CU))を示す。ブロックAは、現在CUの左下角に隣接し、ブロックBは、現在CUの右上角に隣接する。変数「candIntraPredModeA」及び「candIntraPredModeB」は、それぞれ、ブロックA及びBのイントラ予測モードを示し、最初にIntra_Planar.に設定される。ブロックA(又はB)が利用可能であるとマークされた場合、candIntraPredModeA(又はcandIntraPredModeB)は、ブロックA(又はB)の実際のイントラ予測モードに設定される。幾つかの例では、MPM候補を導出するために使用される近隣ブロックの位置は、マルチラインイントラ予測では、隣接及び非隣接参照ラインについて同じである。
図11は、幾つかの例(例えば、VVC)におけるクロマブロックの例示的なイントラモード符号化を示すテーブルを示す。図11には、クロマブロックのイントラモード符号化のための8個のイントラモード、つまり、平面モード、垂直モード、水平モード、DCモード、導出モード、及び3個のクロスコンポーネント線形モデルモード(CCLM、LM_A、及びLM_L)がある。テーブルに示すように、クロマブロックのイントラモード符号化は、対応するルマブロックのイントラ予測モードに依存(例えば、直接依存)し得る。クロマ成分及びルマ成分は異なるブロックパーティション構造を使用し得るので、例えば、Iスライスでは、1つのクロマブロックが複数のルマブロックに対応し得る。従って、導出モードが、クロマブロックのイントラモード符号化のために使用されるとき、クロマブロックの中央位置をカバーする対応するルマブロックのイントラ予測モードは、クロマブロックのイントラ予測モードに直接継承される。
図12は、幾つかの例(例えば、VVC)における例示的なアフィン線形加重イントラ予測(affine linear weighted intra prediction (ALWIP))を示す。幅W及び高さHを有する予測ブロック(prediction block (PB))のサンプルを予測するために、PBのHEVC個の再構成近隣境界サンプルの左の1列、及びPBのW個の再構成近隣境界サンプルの上の1行が、ALWIPに入力として取り入れられる。再構成近隣境界サンプルが利用可能でない場合、それらは、他のイントラ予測方法を用いて生成できる。ALWIPは、マトリクスに基づくイントラ予測(matrix based intra prediction (MIP))とも呼ばれ得る。
例では、PBは、以下の3つのステップに基づき予測できる。
(1)第1の複数の平均サンプルが、PBの左の列の近隣境界サンプル(例えば、その部分集合)を平均することにより抽出され、第2の複数の平均サンプルが、PBの上の行の近隣境界サンプル(例えば、その部分集合)を平均することにより抽出される。W=H=4個のサンプルの場合、第1の複数の平均サンプル及び第2の複数の平均サンプルの合計数は4である。他の場合には、全部で8個の平均サンプルが抽出される。
(2)平均サンプルは、マトリクスベクトルにより乗算される。乗算の結果にオフセットが追加されて、元のPB内のサブサンプリングされたサンプルセット上の縮小されたPBを生成する。
(3)各方向においてサブサンプリングされたセット上の縮小されたPBに線形補間を適用することにより、サブサンプリングされたセット上の縮小されたPBから、残りの位置にある予測サンプルが生成される。
縮小されたPBを生成するために使用されるマトリクス及びオフセットは、マトリクスの3つの集合(S、S、及びS)から取り入れることができる。マトリクス集合Sは、18個のマトリクスA 、i∈{0,...,17}で構成され又は含む。各マトリクスは、16個の行、及び4個の列、並びに18個のオフセットベクトルb 、i∈{0,...,17}を有することができる。各オフセットベクトルは、16のサイズを有することができる。マトリクス集合Sに含まれるマトリクス及びオフセットベクトルは、4×4のサイズを有するブロックのために使用できる。マトリクス集合Sは、10個のマトリクスA 、i∈{0,...,9}で構成され又は含む。各マトリクスは、16個の行、及び8個の列、並びに10個のオフセットベクトルb 、i∈{0,...,9}を有することができる。各オフセットベクトルは、16のサイズを有することができる。マトリクス集合Sに含まれるマトリクス及びオフセットベクトルは、4×4、8×4、及び8×8のサイズを有するブロックのために使用できる。マトリクス集合Sは、6個のマトリクスA 、i∈{0,...,5}で構成され又は含む。各マトリクスは、64個の行、及び8個の列、並びに6個のオフセットベクトルb 、i∈{0,...,5}を有することができる。各オフセットベクトルは、64のサイズを有することができる。マトリクス集合Sに含まれるマトリクス及びオフセットベクトルは、全部の他の形状及びサイズを有するブロックのために使用できる。
図12に示されるような8×8ブロックが与えられると、ALWIPは、垂直境界に沿って4個の平均、及び水平境界に沿って4個の平均を取り入れる。結果として生じる8個の平均は、マトリクスベクトル乗算に入力される。ブロックサイズのために、マトリクスはマトリクス集合Sから取り入れられる。マトリクスベクトル乗算は、ブロックの奇数位置において16個のサンプルを生成する。従って、合計でサンプル当たり(8×6)/(8×8)=2回の乗算が実行される。オフセットを加算した後に、これらのサンプルは、削減された上境界サンプルを用いて垂直方向で補間され、次に元の左境界サンプルを用いて水平方向に補間される。この場合、補間処理は、乗算を必要としない。
ALWIPイントラ予測モードのためのMPMリスト導出
本開示の態様によると、非ALWIPモードは、マッピングテーブルに従い、ALWIPモードにマッピングできる。マッピングテーブルは、ブロックサイズに基づき変更されることができる。一実施形態では、3つのマッピングテーブルmap_angular_to_alwipidx、dix∈{0,1,2}があり、各マッピングテーブルは、それぞれのマトリクス集合(S~Sのうちの1つ)に対応し、非ALWIPイントラ予測モードpredmodeAngularを特定のALWIPモードに、式1に示すように関連付ける。
Figure 2022516846000003
マッピングテーブルのインデックスidxは、ALWIPパラメータの取り入れられるべき、3つのマトリクス集合のうちの1つを示す。インデックスは、予測単位(prediction unit (PU))の幅W及び高さHに基づき決定でき、式2及び式3に従い決定できる。
Figure 2022516846000004
本開示の態様によると、イントラモードにおける各CUについて、ALWIPが対応するPUに適用されるかどうかを示すフラグが、ビットストリーム内で送信される。フラグが、ALWIPが適用されるべきであると示すとき、ALWIPモードのインデックスpredmodeは、MPMリスト内のモード候補を示すためにシグナリングされる。例では、MPMリストは3個のMPM候補を含む。
ALWIPにより符号化される現在ブロックについてMPMリストを生成するために、上のALWIPモードmodeabove ALWIP及び左のALWIPモードmodeleft ALWIPは以下のように導出できる。
現在PUの上のPUが利用可能であり、現在PUが存在するのと同じCTUに属し、PUaboveがALWIPモードpredmodeabove ALWIP、及びidx(PU)=idx(PUabove)を用いて符号化されるとき、上のALWIPモードは式4に従い決定できる。
Figure 2022516846000005
上のPUが利用可能であり、現在PUが存在するのと同じCTUに属し、PUaboveが非ALWIPイントラ予測モードpredmodeabove Angularを用いて符号化されるとき、上のALWIPモードは式5に従いマッピングテーブルを用いて決定できる。
Figure 2022516846000006
他の場合には、上のALWIPモードは、式6に従い利用不可能に設定できる。
Figure 2022516846000007
modeleft ALWIPの値は、modeabove ALWIPの値を導出するのと同じ方法で導出できるが、左のPUが現在PUの存在するのと同じCTUに属するかどうかをチェックしない。
従って、MPMリスト生成処理リストは、導出されたmodeleft ALWIP及びmodeabove ALWIP、並びに3つの所定の固定された規定MPMリストlistidx、idx∈{0,1,2}、に基づき構成される。各々の所定の固定された規定MPMリストは、3つの異なるALWIPモードで構成され又は含む。例では、利用不可能モード-1が、規定値により代用され、重複するALWIPモードが除去される。
非ALWIPイントラ予測モードのためのMPMリスト導出
本開示の態様によると、ALWIPモードは、マッピングテーブルに従い、非ALWIPモードにマッピングできる。マッピングテーブルは、ブロックサイズに基づき変更されることができる。3つのマッピングテーブルmap_alwip_to_angularidx、idx∈{0,1,2}がある。各マッピングテーブルは、それぞれのマトリクス集合(S~Sのうちの1つ)に対応し、ALWIPイントラ予測モードpredmodeALWIPを特定の非ALWIPイントラ予測モードに、式7に示すように関連付ける。
Figure 2022516846000008
ルマブロックのMPMリスト導出について、ルマブロックの近隣ブロックがALWIPモードにより符号化されるとき、ALWIPモードを対応する非ALWIPイントラ予測モードにマッピングするために、3つのマッピングテーブルのうちの1つが使用できる。クロマブロックのMPMリスト導出について、クロマブロックの関連付けられたルマブロックがALWIPモードにより符号化されるとき、ALWIPモードを非ALWIPイントラ予測モードに変換するために、同じマッピングが使用される。
上述の例では、ALWIPモードをシグナリングするために、MPMリストが構成される。MPMリストの構成は、近隣ブロックの予測モードをチェックすることを含む。近隣ブロックの予測モードがALWIPモードではないとき、近隣ブロックの予測モードは、マッピングテーブルを用いてALWIPモードにマッピングされるべきである。近隣ブロックの予測モードがALWIPモードであるとき、現在ブロック及び近隣ブロックが同じマトリクス集合を使用するかどうかをチェックするために、近隣ブロックの幅及び高さが評価される必要がある。このMPMリスト生成処理は、複雑であり、簡略化できる。
更に、非ALWIPイントラ予測モードをシグナリングするために、近隣ブロックがALWIPモードを用いて符号化されるとき、近隣ブロックのALWIPモードを非ALWIPイントラ予測モードにマッピングするために、1つのルックアップテーブルが使用される。しかしながら、必ずしも、近隣ブロックについてALWIPモードを非ALWIPモードに変換しなくてよい。
更に、ALWIPモードは、クロマブロックのイントラ予測のために適用されないが、導出されたモードがクロマブロックについて使用され、クロマブロックの同一位置にあるルマブロックがALWIPモードを用いて符号化されるとき、同一位置にあるルマブロックのALWIPモードは、非ALWIPイントラ予測モードに変換される必要がある。この処理も、複雑であり、簡略化できる。
本開示の態様は、ALWIP及び非ALWIPモードのための簡略化されたシグナリングを提供する。実施形態は、別個に又は任意の順序で使用されてよい。
本開示の態様によると、現在ブロックのALWIPモードインデックスのシグナリング及び/又は再構成は、現在ブロックの近隣ブロックのイントラ予測モードをチェックすることなく実行される。実施形態では、シグナリング及び/又は再構成は、現在ブロックの近隣ブロックのイントラ予測モードをチェックすることなく実行できる。例えば、図10を参照すると、近隣ブロックは、左近隣ブロックA及び上近隣ブロックBであり得る。左近隣ブロックAは、現在ブロックの左下角に隣接し、上近隣ブロックBは、現在ブロックの右上角に隣接する。このような例では、シグナリング及び/又は再構成は、左近隣ブロックA及び上近隣ブロックBのイントラ予測モードをチェックすることなく実行できる。
実施形態では、ALWIPモードインデックスは直接シグナリングされる。ALWIPモードインデックスは、トランケートされたバイナリコードワード、固定長コードワード、又はトランケートされた単項コードワードのようなコードワードを用いて直接シグナリングできる。例えば、ALWIPモードインデックスは、5ビットの固定長コードワードを用いてシグナリングされる。別の例では、ALWIPモードの部分集合、例えば、K1個のALWIPモードは、M1ビットの固定長コードワードを用いてシグナリングされ、一方で、残りのALWIPモードは、M2ビットの固定長コードワードを用いてシグナリングされる。K1、M1、及びM2は、上述の例では非負整数である。
実施形態では、ALWIPモードインデックスは、MPMリストの再構成又はMPMフラグのシグナリングを有しないで、シグナリングされる。例えば、トランケートされたバイナリコードワード又は固定長コードワードのようなコードワードが、ALWIPモードインデックスをシグナリングするために利用される。
実施形態では、現在ブロックがALWIPにより符号化されるとき、現在ブロックの近隣ブロックのイントラ予測モードに関係なく、現在ブロックのMPMリスト内のモード候補が固定される。このような実施形態では、近隣ブロックの位置は、非ALWIPモードにおける予測のために使用されたもの(例えば、図10の近隣ブロックA及びB)と同じであり得る。例では、現在ブロックがALWIPにより符号化されるとき、現在ブロックの近隣ブロックのイントラ予測モードに関係なく、現在ブロックのMPMリスト内のモード候補及びモード候補の順序の両方が固定される。このような例では、近隣ブロックの位置は、非ALWIPモードにおける予測のために使用されたもの(例えば、図10の近隣ブロックA及びB)と同じであり得る。別の例では、現在ブロックがALWIPにより符号化されるとき、現在ブロックのMPMリスト内のモード候補及び/又はモード候補の順序は、現在ブロックの幅及び/又は高さに依存する。現在ブロックのMPMリスト内のモード候補及び/又はモード候補の順序は、幾つかの実施形態では、現在ブロックの幅及び/又高さのみに依存できる。
幾つかの実施形態によると、ALWIPモードの合計数は、N=2のように、2のべき乗であり、ここでNはALWIPモードの合計数である。Kは、0~5等のうちの1つのような非負整数である。
実施形態では、Kの値は、現在ブロックのブロックサイズに依存する。例えば、現在ブロックのブロックサイズは、(i)ブロック幅、(ii)ブロック高さ、(iii)ブロック幅及びブロック高さの平均、(iv)ブロック幅及びブロック高さのうちの最小のもの、(v)ブロック幅及びブロック高さのうちの最大のもの、(vi)ブロック領域サイズ、又は(vii)ブロックアスペクト比、により示すことができる。
本開示の態様によると、非ALWIPイントラ予測モードを用いて符号化される現在ブロックのMPMリストを構成するとき、現在ブロックの1つ以上の近隣ブロックの予測モードは、近隣ブロックの予測モードがALWIPモードであるとき、利用不可能である又は固定モードであるとマークされる。例では、1つ以上の近隣ブロックの位置は、他の非ALWIPモードにおける予測のために使用されたもの(例えば、図10の近隣ブロックA及びB)と同じであり得る。実施形態では、非ALWIPイントラ予測モードを用いて符号化される現在ブロックのMPMリストを構成するとき、現在ブロックの1つ以上の近隣ブロックの予測モードは、平面イントラ予測モードとしてマークされる。実施形態では、非ALWIPイントラ予測モードを用いて符号化される現在ブロックのMPMリストを構成するとき、現在ブロックの1つ以上の近隣ブロックの予測モードは、DCイントラ予測モードとしてマークされる。実施形態では、非ALWIPイントラ予測モードを用いて符号化される現在ブロックのMPMリストを構成するとき、現在ブロックの1つ以上の近隣ブロックの予測モードは、平面、DC、水平、又は垂直イントラ予測モードとしてマークされる。
本開示の態様によると、ALWIPモードを用いて符号化される現在ブロックのMPMリストを構成するとき、現在ブロックの1つ以上の近隣ブロックの予測モードは、利用可能である又は規定ALWIPモードであるとマークされる。実施形態では、近隣ブロックがALWIPにより符号化されるとき、その予測モードは利用可能であるとしてマークされ、或いは、近隣ブロックが非ALWIPにより符号化されるとき、その予測モードは規定ALWIPモードとしてマークされる。
実施形態では、現在ブロックがALWIPにより符号化されるとき、現在ブロックのMPMリストを構成するために、近隣ブロックの予測モードは、予測モードが非ALWIPモードであるとき、ALWIP予測モードに変換される。例えば、予測モードがモードインデックスkを有するALWIP予測モードに変換される。ここで、kの値は非負整数であり、ALWIPモードの最大許容モードインデックス番号を超えてはならない。
実施形態では、現在ブロックがALWIPにより符号化されるとき、現在ブロックのMPMリストを構成するために、現在ブロックの近隣ブロックの予測モードは、予測モードがALWIPモードではないとき、利用不可能であるとマークされる。
実施形態では、現在ブロックがALWIPにより符号化されるとき、MPMリストのサイズは1に設定される。左(又は上)近隣ブロックのイントラ予測モードは、イントラ予測モードがALWIPモードであるとき、MPMリストに挿入できる。左及び上近隣ブロックの両方が非ALWIPにより符号化されるとき、1つの規定ALWIPモードがMPMリストに挿入される。例では、規定ALWIPモードは、現在ブロックのブロックサイズに関係なく、固定される。例では、規定ALWIPモードは、平面モード(例えば、モード0)に設定される。
実施形態では、現在ブロックがALWIPにより符号化されるとき、MPMリストのサイズは2に設定される。左(又は上)近隣ブロックのイントラ予測モードは、イントラ予測モードがALWIPモードであるとき、MPMリストに挿入できる。左及び上近隣ブロックが非ALWIPモードを用いて符号化されるとき、規定ALWIPモードがMPMリストに挿入される。例では、規定ALWIPモードは、現在ブロックのブロックサイズに関係なく、固定される。例では、MPMフラグが、現在ブロックのイントラ予測モードがMPMリストからであると示すとき、例えばMPMフラグが真であるとき、MPMリスト内のどのMPM候補が現在ブロックのために選択されるかを示すために、別のフラグがシグナリングされる。
本開示の態様によると、ALWIPモードのMPMリストを導出するために使用された近隣ブロックの位置は、非ALWIPモードのものと同じである。実施形態では、ALWIPモードでは、MPMリストを導出するために使用される近隣ブロックの位置は、図10に示すように、現在ブロックの右上角又は左下角に隣接する。
本開示の態様によると、ALWIPモードのためのMPMリストのサイズは、例えば符号化ビデオシーケンスに含まれる符号化情報に依存する。符号化情報は、限定ではないが、1つ以上の近隣ブロックのイントラ予測モード、1つ以上の近隣ブロックの参照ラインインデックス、1つ以上の近隣ブロックのALWIPフラグ、のうちの1つ以上を含むことができる。
実施形態では、現在ブロックがALWIPにより符号化され、右上及び左下近隣ブロックの両方が非ALWIPにより符号化されるとき、現在ブロックについて、MPMリストは構成されず、ALWIPモードインデックスが直接シグナリングされる。
実施形態では、現在ブロックがALWIPにより符号化され、現在ブロックの近隣ブロックのうちの少なくとも1つがALWIPにより符号化されるとき、現在ブロックのためのMPMリストのサイズは、1又は2のような非負整数に設定される。
本開示の態様によると、ALWIPは、クロマブロックに適用されない。従って、現在クロマブロックの関連付けられたルマブロック(例えば、同一位置にあるルマブロック)がALWIPにより符号化され、導出されたモードが現在クロマブロックのために使用されるとき、規定非ALWIPモードが、現在クロマブロックのために使用される。一実施形態では、規定非ALWIPモードは平面モードである。別の実施形態では、規定非ALWIPモードはDCモードである。
本開示の態様によると、現在クロマブロックが複数のルマブロックに関連付けられ、例えば、現在クロマブロックが複数の同一位置にあるルマブロックに関連付けられ、導出されたモードが現在ブロックのために使用されるとき、複数の関連付けられたルマブロックのうちの1つが非ALWIPイントラ予測モードにより符号化されるかどうかを決定するために、複数のルマブロックがチェックされる。
実施形態では、複数の関連付けられたルマブロックのうちの1つが、非ALWIPイントラ予測モードにより符号化されると決定されると、非ALWIPイントラ予測モードが、現在クロマブロックのイントラ予測モードとして使用される。
実施形態では、複数の関連付けられたルマブロック(例えば、同一位置にあるルマブロック)のうちのいずれも、非ALWIPイントラ予測モードにより符号化されないとき、規定非ALWIPイントラ予測モードが、現在クロマブロックのイントラ予測モードとして使用される。
図13は、本開示の一実施形態による、処理(1300)の概要を示すフローチャートを示す。処理(1300)は、再構成中のブロックについて予測ブロックを生成するために、イントラモードで符号化されたブロックの再構成において使用できる。種々の実施形態では、処理(1300)は、端末装置(110)、(120)、(130)及び(140)内の処理回路、ビデオエンコーダ(203)の機能を実行する処理回路、ビデオデコーダ(210)の機能を実行する処理回路、ビデオデコーダ(310)の機能を実行する処理回路、ビデオエンコーダ(403)の機能を実行する処理回路、等のような処理回路により実行される。幾つかの実施形態では、処理(1300)は、ソフトウェア命令で実装され、したがって、処理回路がソフトウェア命令を実行すると、処理回路が処理(1300)を実行する。処理は(S1301)で開始し、(S1310)に進む。
ステップ(S1310)で、処理(1300)は、符号化ビデオシーケンスの一部である現在ピクチャ内の現在ブロックの予測情報を復号する。予測情報は、現在ブロックがアフィン線形加重イントラ予測(affine linear weighted intra prediction (ALWIP))で符号化されるかどうかを示す。予測情報が、現在ブロックはALWIPで符号化されると示すことに応答して、処理(1300)はステップ(S1320)へ進む。
ステップ(S1320)で、処理(1300)は、現在ブロックに隣接する近隣ブロックの予測モードを表すALWIPモードインデックスを決定する。ALWIPモードインデックスは、複数のALWIPモードのうちの1つを示す。次に、処理(1300)は(S1330)に進む。
ステップ(S1330)で、処理(1300)は、複数のALWIPモードのうちの1つに従い現在ブロックを再構成する。次に、処理(1300)は(S1399)に進み終了する。
実施形態では、ALWIPモードインデックスは、トランケートされたバイナリコードワード、固定長コードワード、及びトランケートされた単項コードワード、のうちの1つである。
実施形態では、予測情報が、現在ブロックがALWIPで符号化されると示すことに応答して、処理(1300)は、少なくとも1つの固定モード候補を含むモード候補リストを構成する。少なくとも1つの固定モード候補は、複数のALWIPモードのうちの所定の部分集合である。
実施形態では、複数のALWIPモードの合計数は、2のべき乗である。
本開示の態様によると、予測情報が、現在ブロックが、ALWIPで符号化されないと示すことに応答して、処理(1300)は、近隣ブロックのうちの1つがALWIPで符号化されるかどうかを決定する。近隣ブロックのうちの1つがALWIPで符号化されることに応答して、処理(1300)は、(i)プリセットイントラ予測モード、及び(ii)近隣ブロックのうちの別の近隣ブロックのイントラ予測モード、のうちの1つに基づき、モード候補リストを構成する。
実施形態では、プリセット予測モードは、平面イントラ予測モード、DCIイントラ予測モード、水平イントラ予測モード、及び垂直イントラ予測モード、のうちの1つである。
実施形態では、処理(1300)は、近隣ブロックのうちの1つがALWIPで符号化されることに応答して、近隣ブロックのうちの該1つを利用不可能として設定する。
実施形態では、予測情報が、現在ブロックはALWIPで符号化されると示し、導出されたモードが現在ブロックの関連するクロマブロックのために使用されることに応答して、処理(1300)は、関連するクロマブロックの予測モードを、プリセットイントラ予測モードになるよう設定する。
図14は、本開示の一実施形態による、処理(1400)の概要を示すフローチャートを示す。処理(1400)は、再構成中のブロックについて予測ブロックを生成するために、イントラモードで符号化されたブロックの再構成において使用できる。種々の実施形態では、処理(1400)は、端末装置(110)、(120)、(130)及び(140)内の処理回路、ビデオエンコーダ(203)の機能を実行する処理回路、ビデオデコーダ(210)の機能を実行する処理回路、ビデオデコーダ(310)の機能を実行する処理回路、ビデオエンコーダ(403)の機能を実行する処理回路、等のような処理回路により実行される。幾つかの実施形態では、処理(1400)は、ソフトウェア命令で実装され、したがって、処理回路がソフトウェア命令を実行すると、処理回路が処理(1400)を実行する。処理は(S1401)で開始し、(S1410)に進む。
ステップ(S1410)で、処理(1400)は、符号化ビデオシーケンスの一部である現在ピクチャ内の現在ブロックの予測情報を復号する。予測情報は、現在ブロックがアフィン線形加重イントラ予測(ALWIP)で符号化されると示す。次に、処理(1400)は(S1420)に進む。
ステップ(S1420)で、処理(1400)は、現在ブロックに隣接する近隣ブロックがALWIPで符号化されるかどうかを決定する。近隣ブロックがALWIPで符号化されないことに応答して、処理(1400)はステップ(S1430)へ進む。
ステップ(S1430)で、処理(1400)は、(i)プリセットALWIPモード、及び(ii)別の近隣ブロックのALWIPモード、のうちの1つに基づき、モード候補リストを構成する。次に、処理(1400)は(S1440)に進む。
ステップ(S1440)で、処理(1400)は、モード候補リストに基づき現在ブロックを再構成する。次に、処理(1400)は(S1499)に進み終了する。
実施形態では、近隣ブロックがALWIPで符号化されないことに応答して、処理(1400)は、近隣ブロックを利用不可能として設定する。
実施形態では、近隣ブロックは、現在ブロックの右上角又は左下角に隣接する。
実施形態では、モード候補リストのサイズは、符号化ビデオシーケンスに含まれる近隣ブロックの符号化情報に基づく。
実施形態では、予測情報は、現在ブロックのクロマブロックが複数のルマブロックに関連付けられることを示し、処理(1400)は、複数のルマブロックのうちのルマブロックが非ALWIPイントラ予測モードで符号化されるかどうかを決定する。ルマブロックが非ALWIPイントラ予測モードで符号化されることに応答して、処理(1400)は、現在ブロックのクロマブロックの予測モードが、ルマブロックの非ALWIPイントラ予測モードであると決定する。
実施形態では、予測情報は、現在ブロックのクロマブロックが複数のルマブロックに関連付けられることを示し、処理(1400)は、複数のルマブロックのうちのルマブロックが非ALWIPイントラ予測モードで符号化されるかどうかを決定する。複数のルマブロックの各々がALWIPで符号化されることに応答して、処理(1400)は、現在ブロックのクロマブロックの予測モードがプリセットイントラ予測モードであると決定する。
コンピュータシステム
上述の技術は、コンピュータ可読命令を用いてコンピュータソフトウェアとして実装でき、1つ以上のコンピュータ可読媒体に物理的に格納でる。例えば、図15は、本開示の主題の特定の実施形態を実装するのに適するコンピュータシステム(1500)を示す。
コンピュータソフトウェアは、アセンブリ、コンパイル、リンク等のメカニズムにより処理されて、1つ以上のコンピュータ中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、等により直接又はインタープリット、マイクロコード実行、等を通じて実行可能な命令を含むコードを生成し得る、任意の適切な機械コードまたはコンピュータ言語を用いて符号化できる。
命令は、例えばパーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム装置、モノのインターネット装置、等を含む種々のコンピュータ又はそのコンポーネントで実行できる。
コンピュータシステム(1500)の図15に示すコンポーネントは、本来例示であり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に対するようないかなる限定も示唆しない。さらに、コンポーネントの構成も、コンピュータシステム(1500)の例示的な実施形態に示されたコンポーネントのうちのいずれか又は組み合わせに関連する任意の依存性又は要件を有すると解釈されるべきではない。
コンピュータシステム(1500)は、特定のヒューマンインタフェース入力装置を含んでよい。このようなヒューマンインタフェース入力装置は、例えば感覚入力(例えば、キーストローク、スワイプ、データグラブ動作)、音声入力(例えば、音声、クラッピング)、視覚的入力(例えば、ジェスチャ)、嗅覚入力(示されない)を通じた1人以上の人間のユーザによる入力に応答してよい。ヒューマンインタフェース装置は、必ずしも人間による意識的入力に直接関連する必要のない特定の媒体、例えば音声(例えば、会話、音楽、環境音)、画像(例えば、スキャンされた画像、デジタルカメラから取得された写真画像)、ビデオ(例えば、2次元ビデオ、3次元ビデオ、立体ビデオを含む)をキャプチャするためにも使用できる。
入力ヒューマンインタフェース装置は、キーボード(1501)、マウス(1502)、トラックパッド(1503)、タッチスクリーン(1510)、データグラブ(図示しない)、ジョイスティック(1505)、マイクロフォン(1506)、スキャナ(1507)、カメラ(1508)、のうちの1つ以上を含んでよい(そのうちの1つのみが示される)。
コンピュータシステム(1500)は、特定のヒューマンインタフェース出力装置も含んでよい。このようなヒューマンインタフェース出力装置は、例えば感覚出力、音声、光、及び匂い/味を通じて1人以上の人間のユーザの感覚を刺激してよい。このようなヒューマンインタフェース出力装置は、感覚出力装置を含んでよい(例えば、タッチスクリーン(1510)、データグラブ(図示しない)、又はジョイスティック(1505(による感覚フィードバック、しかし入力装置として機能しない感覚フィードバック装置も存在し得る)、音声出力装置(例えば、スピーカ(1509)、ヘッドフォン(図示しない)、視覚的出力装置(例えば、スクリーン(1510)、CRTスクリーン、LCDスクリーン、プラズマスクリーン、OLEDスクリーンを含み、それぞれタッチスクリーン入力能力を有し又は有さず、それぞれ感覚フィードバック能力を有し又は有さず、これらのうちの幾つかは例えば立体出力、仮想現実眼鏡(図示しない)、ホログラフィックディスプレイ、及び発煙剤タンク(図示しない)、及びプリンタ(図示しない)のような手段を通じて2次元視覚出力又は3次元以上の出力を出力可能であってよい))。これらの視覚出力装置(例えば、スクリーン(1510))は、グラフィックアダプタ(1550)を通じてシステムバス(1548)に接続できる。
コンピュータシステム(1500)は、人間のアクセス可能な記憶装置、及び、例えばCD/DVD等の媒体(1521)を備えるCD/DVD ROM/RW(1520)のような光学媒体、サムドライブ(1522)、取り外し可能ハードドライブ又は個体状態ドライブ(1523)、テープ及びフロッピディスク(図示しない)のようなレガシー磁気媒体、セキュリティドングル(図示しない)等のような専用ROM/ASIC/PLDに基づく装置のような関連する媒体も含み得る。
当業者は、本開示の主題と関連して使用される用語「コンピュータ可読媒体」が伝送媒体、搬送波、又は他の一時的信号を包含しないことも理解すべきである。
コンピュータシステム(1500)は、1つ以上の通信ネットワーク(1555)へのネットワークインタフェース(1554)も含み得る。1つ以上の通信ネットワーク(1555)は、例えば無線、有線、光であり得る。1つ以上の通信ネットワーク(1555)は、更に、ローカル、広域、都市域、車両及び産業、リアルタイム、耐遅延性、等であり得る。1つ以上の通信ネットワークの例は、イーサネットのようなローカルエリアネットワーク、無線LAN、GSM、3G、4G、5G、LET等を含むセルラネットワーク、ケーブルTV、衛星TV、地上波放送TVを含むTV有線又は無線広域デジタルネットワーク、CANBusを含む車両及び産業、等を含む。特定のネットワークは、一般に、特定の汎用データポート又は周辺機器バス(1549)(例えば、コンピュータシステム(1500)のUSBポート)に取り付けられる外部ネットワークインタフェースを必要とする。他のものは、一般に、後述するようなシステムバスへの取り付けによりコンピュータシステム(1500)のコアに統合される(例えば、イーサネットインタフェースをPCコンピュータシステムへ、又はセルラネットワークインタフェースをスマートフォンコンピュータシステムへ)。これらのネットワークを用いて、コンピュータシステム(1500)は、他のエンティティと通信できる。このような通信は、単方向受信のみ(例えば、放送TV)、単方向送信のみ(例えば、特定のCANbus装置へのCANbus)、又は例えばローカル又は広域デジタルネットワークを用いて他のコンピュータシステムへの双方向であり得る。特定のプロトコル及びプロトコルスタックが、上述のネットワーク及びネットワークインタフェースの各々で使用され得る。
前述のヒューマンインタフェース装置、人間のアクセス可能な記憶装置、及びネットワークインタフェースは、コンピュータシステム(1500)のコア(1540)に取り付け可能である。
コア(1540)は、1つ以上の中央処理ユニット(CPU)(1541)、グラフィック処理ユニット(GPU)(1542)、GPGAの形式の専用プログラマブル処理ユニット(1543)、特定タスクのためのハードウェアアクセラレータ(1544)、等を含み得る。これらの装置は、読み出し専用メモリ(ROM)(1545)、ランダムアクセスメモリ(1546)、内部のユーザアクセス不可能なハードドライブ、SSD、等のような内蔵大容量記憶装置(1547)と共に、システムバス(1548)を通じて接続されてよい。幾つかのコンピュータシステムでは、追加CPU、GPU、等による拡張を可能にするために、システムバス1548は、1つ以上の物理プラグの形式でアクセス可能である。周辺機器は、コアのシステムバス1548に直接に、又は周辺機器バス1549を通じて、取り付け可能である。周辺機器バスのアーキテクチャは、PCI、USB、等を含む。
CPU(1541)、GPU(1542)、FPGA(1543)、及びアクセラレータ(1544)は、結合されて前述のコンピュータコードを生成可能な特定の命令を実行できる。該コンピュータコードは、ROM(1545)又はRAM(1546)に格納できる。一時的データもRAM(1546)に格納でき、一方で、永久的データは例えば内蔵大容量記憶装置(1547)に格納できる。メモリ装置のうちのいずれかへの高速記憶及び読み出しは、CPU(1541)、GPU(1542)、大容量記憶装置(1547)、ROM(1545)、RAM(1546)等のうちの1つ以上に密接に関連付けられ得るキャッシュメモリの使用を通じて可能にできる。
コンピュータ可読媒体は、種々のコンピュータにより実施される動作を実行するためのコンピュータコードを有し得る。媒体及びコンピュータコードは、本開示の目的のために特別に設計され構成されたものであり得、又は、コンピュータソフトウェア分野の当業者によく知られ利用可能な種類のものであり得る。
例として及び限定ではなく、アーキテクチャを有するコンピュータシステム(1500)、及び具体的にはコア(1540)は、プロセッサ(CPU、GPU、FPGA、アクセラレータ、等を含む)が1つ以上の有形コンピュータ可読媒体内に具現化されたソフトウェアを実行した結果として、機能を提供できる。このようなコンピュータ可読媒体は、コア内蔵大容量記憶装置(1547)又はROM(1545)のような非一時的特性のコア(1540)の特定の記憶装置、及び上述のようなユーザアクセス可能な大容量記憶装置と関連付けられた媒体であり得る。本開示の種々の実施形態を実装するソフトウェアは、このような装置に格納されコア(1540)により実行できる。コンピュータ可読媒体は、特定の必要に従い、1つ以上のメモリ装置又はチップを含み得る。ソフトウェアは、コア(1540)及び具体的にはその中のプロセッサ(CPU、GPU、FPGA、等を含む)に、ソフトウェアにより定義された処理に従うRAM(1546)に格納されたデータ構造の定義及び該データ構造の変更を含む、ここに記載した特定の処理又は特定の処理の特定の部分を実行させることができる。追加又は代替として、コンピュータシステムは、ここに記載の特定の処理又は特定の処理の特定の部分を実行するためにソフトウェアと一緒に又はそれに代わって動作可能な論理ハードワイヤド又は他の回路内の実装(例えば、アクセラレータ(1544))の結果として機能を提供できる。ソフトウェアへの言及は、ロジックを含み、適切な場合にはその逆も同様である。コンピュータ可読媒体への言及は、適切な場合には、実行のためにソフトウェアを格納する(集積回路(IC)のような)回路、実行のためにロジックを実装する回路、又はそれらの両方を含み得る。本開示は、ハードウェア及びソフトウェアの任意の適切な組み合わせを含む。
本開示は、幾つかの例示的な実施形態を記載したが、代替、置換、及び種々の代用の均等物が存在し、それらは本開示の範囲に包含される。当業者に明らかなことに、ここに明示的に示され又は説明されないが、本開示の原理を実施し、したがって、本開示の精神及び範囲に含まれる多数のシステム及び方法を考案可能である。
付録A:略語
ALWIP (or LWIP): Affine Linear Weighted Intra Prediction
AMVP: Advanced Motion Vector Prediction
ASIC: Application-Specific Integrated Circuit
ATMVP: Alternative/Advanced Temporal Motion Vector Prediction
BMS: Benchmark Set
BV: Block Vector
CANBus: Controller Area Network Bus
CB: Coding Block
CD: Compact Disc
CPR: Current Picture Referencing
CPUs: Central Processing Units
CRT: Cathode Ray Tube
CTBs: Coding Tree Blocks
CTUs: Coding Tree Units
CU: Coding Unit
DM: Derived Mode
DPB: Decoder Picture Buffer
DVD: Digital Video Disc
FPGA: Field Programmable Gate Areas
GOPs: Groups of Pictures
GPUs: Graphics Processing Units
GSM: Global System for Mobile communications
HDR: High Dynamic Range
HEVC: High Efficiency Video Coding
HRD: Hypothetical Reference Decoder
IBC: Intra Block Copy
IC: Integrated Circuit
ISP: Intra Sub-Partition
JEM: Joint Exploration Model
JVET: Joint Video Exploration Team
LAN: Local Area Network
LCD: Liquid-Crystal Display
LTE: Long-Term Evolution
MIP: Matrix-based Intra Prediction
MPM: Most Probable Mode
MV: Motion Vector
OLED: Organic Light-Emitting Diode
PBs: Prediction Blocks
PCI: Peripheral Component Interconnect
PDPC: Position Dependent Prediction Combination
PLD: Programmable Logic Device
PU: Prediction Unit
RAM: Random Access Memory
ROM: Read-Only Memory
SCC: Screen Content Coding
SDR: Standard Dynamic Range
SEI: Supplementary Enhancement Information
SNR: Signal Noise Ratio
SSD: Solid-state Drive
TUs: Transform Units
USB: Universal Serial Bus
VUI: Video Usability Information
VVC: Versatile Video Coding
WAIP: Wide-Angle Intra Prediction

Claims (19)

  1. デコーダが実行するビデオ復号の方法であって、
    符号化ビデオシーケンスの一部である現在ピクチャ内の現在ブロックの予測情報を復号するステップであって、前記予測情報は、前記現在ブロックがマトリクスに基づくイントラ予測(MIP)で符号化されるかどうかを示す、ステップと、
    前記予測情報が、前記現在ブロックはMIPで符号化されると示すことに応答して、MIPモードインデックスを決定するステップであって、前記MIPモードインデックスは、複数のMIPモードのうちの1つを示す、ステップと、
    前記現在ブロックを再構成するステップであって、前記予測情報が、前記現在ブロックはMIPモードで符号化されることを示すとき、前記複数のMWIPモードのうちの前記1つに従い前記現在ブロックを再構成するステップと、
    を含む方法。
  2. 前記予測情報が、前記現在ブロックはMIPで符号化されないことを示し、複数の近隣ブロックのうちの1つがMIPで符号化されることに応答して、前記現在ブロックのイントラ予測候補モードが平面イントラ予測モードであることを決定するステップ、を更に含み、
    前記現在ブロックを再構成するステップは、前記予測情報が、前記現在ブロックはMIPで符号化されないことを示し、前記複数の近隣ブロックのうちの前記1つがMIPで符号化されるとき、前記平面イントラ予測モードに従い、前記現在ブロックを再構成する、請求項1に記載の方法。
  3. 前記MIPモードインデックスは、トランケートされたバイナリコードワード、固定長コードワード、及びトランケートされた単項コードワード、のうちの1つである、請求項1又は2に記載の方法。
  4. 前記予測情報が、前記現在ブロックはMIPで符号化されると示すことに応答して、
    少なくとも1つの固定モード候補を含むモード候補リストを構成するステップであって、前記少なくとも1つの固定モード候補は、前記複数のMIPモードのうちの所定の部分集合である、ステップ、を更に含む請求項1~3のいずれか一項に記載の方法。
  5. 前記複数のMIPモードの合計数は、2のべき乗である、請求項1~4のいずれか一項に記載の方法。
  6. 前記予測情報が、前記現在ブロックはMWIPで符号化されないと示し、複数の近隣ブロックのうちの1つがMIPで符号化されることに応答して、
    (i)プリセットイントラ予測モード、及び(ii)前記近隣ブロックのうち別の近隣ブロックのイントラ予測モード、のうちの1つに基づき、モード候補リストを構成するステップであって、前記モード候補リストは、前記平面イントラ予測モードを含む、ステップ、
    を更に含む請求項2~5のいずれか一項に記載の方法。
  7. 前記プリセットイントラ予測モードは、平面イントラ予測モード、DCIイントラ予測モード、水平イントラ予測モード、及び垂直イントラ予測モード、のうちの1つである、請求項6に記載の方法。
  8. 前記構成するステップは、
    前記複数の近隣ブロックのうちの前記1つを利用不可能として設定するステップ、
    を更に含む請求項6又は7に記載の方法。
  9. 前記予測情報が、前記現在ブロックはMIPで符号化されると示し、導出されたモードが前記現在ブロックの関連するクロマブロックのために使用されることに応答して、
    前記関連するクロマブロックの予測モードを、プリセットイントラ予測モードになるよう設定するステップ、
    を更に含む請求項1~8のいずれか一項に記載の方法。
  10. デコーダが実行するビデオ復号の方法であって、
    符号化ビデオシーケンスの一部である現在ピクチャ内の現在ブロックの予測情報を復号するステップであって、前記予測情報は、前記現在ブロックがマトリクスに基づくイントラ予測(MIP)で符号化されることを示す、ステップと、
    前記現在ブロックに隣接する近隣ブロックがMIPで符号化されるかどうかを決定するステップと、
    前記近隣ブロックがMIPで符号化されないことに応答して、
    (i)プリセットMIPモード、及び(ii)別の近隣ブロックのMIPモード、のうちの1つに基づき、モード候補リストを構成するステップと、
    前記モード候補リストに基づき、前記現在ブロックを再構成するステップと、
    を含む方法。
  11. 前記構成するステップは、
    前記近隣ブロックがMIPで符号化されないことに応答して、
    前記近隣ブロックを利用不可能として設定するステップ、
    を更に含む請求項10に記載の方法。
  12. 前記近隣ブロックは、前記現在ブロックの右上角又は左下角に隣接する、請求項10又は11に記載の方法。
  13. 前記モード候補リストのサイズは、前記符号化ビデオシーケンスに含まれる前記近隣ブロックの符号化情報に基づく、請求項10~12のいずれか一項に記載の方法。
  14. 前記予測情報は、前記現在ブロックのクロマブロックが複数のルマブロックに関連付けられることを示し、前記方法は、
    前記複数のルマブロックのうちのルマブロックが非MIPイントラ予測モードで符号化されるかどうかを決定するステップと、
    前記ルマブロックが前記非MIPイントラ予測モードで符号化されることに応答して、
    前記現在ブロックの前記クロマブロックの予測モードが前記ルマブロックの前記非MIPイントラ予測モードであると決定するステップと、
    を更に含む請求項10~13のいずれか一項に記載の方法。
  15. 前記複数のルマブロックの各々がMIPで符号化されることに応答して、
    前記現在ブロックの前記クロマブロックの前記予測モードがプリセットイントラ予測モードであると決定するステップ、
    を更に含む請求項14に記載の方法。
  16. 機器であって、プロセッサとメモリとを含み、前記プロセッサが前記メモリに記憶されたプログラムをロードし実行することにより、請求項1~9のいずれか一項に記載の方法を実現する機器。
  17. 機器であって、プロセッサとメモリとを含み、前記プロセッサが前記メモリに記憶されたプログラムをロードし実行することにより、請求項10~15のいずれか一項に記載の方法を実現する機器。
  18. コンピュータプログラムであって、機器により実行されると、前記機器に請求項1~9のいずれか一項に記載の方法を実行させる、コンピュータプログラム。
  19. コンピュータプログラムであって、機器により実行されると、前記機器に請求項10~15のいずれか一項に記載の方法を実行させる、コンピュータプログラム。
JP2021535036A 2019-04-04 2020-03-30 アフィン線形加重イントラ予測モードのための簡易シグナリング方法 Active JP7241177B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962829439P 2019-04-04 2019-04-04
US62/829,439 2019-04-04
US16/822,985 US11134257B2 (en) 2019-04-04 2020-03-18 Simplified signaling method for affine linear weighted intra prediction mode
US16/822,985 2020-03-18
PCT/US2020/025660 WO2020205705A1 (en) 2019-04-04 2020-03-30 Simplified signaling method for affine linear weighted intra prediction mode

Publications (2)

Publication Number Publication Date
JP2022516846A true JP2022516846A (ja) 2022-03-03
JP7241177B2 JP7241177B2 (ja) 2023-03-16

Family

ID=72663338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021535036A Active JP7241177B2 (ja) 2019-04-04 2020-03-30 アフィン線形加重イントラ予測モードのための簡易シグナリング方法

Country Status (9)

Country Link
US (3) US11134257B2 (ja)
EP (1) EP3949409A4 (ja)
JP (1) JP7241177B2 (ja)
KR (2) KR20230167148A (ja)
CN (1) CN113545061B (ja)
AU (2) AU2020252084B2 (ja)
CA (1) CA3133477A1 (ja)
SG (1) SG11202110347TA (ja)
WO (1) WO2020205705A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022526991A (ja) * 2019-04-12 2022-05-27 北京字節跳動網絡技術有限公司 ビデオ処理方法、装置、記憶媒体、及び記録媒体
JP2022531902A (ja) * 2019-05-10 2022-07-12 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ブロックベース予測
US11546633B2 (en) 2019-05-01 2023-01-03 Beijing Bytedance Network Technology Co., Ltd. Context coding for matrix-based intra prediction
US11606570B2 (en) 2019-10-28 2023-03-14 Beijing Bytedance Network Technology Co., Ltd. Syntax signaling and parsing based on colour component
US11659185B2 (en) 2019-05-22 2023-05-23 Beijing Bytedance Network Technology Co., Ltd. Matrix-based intra prediction using upsampling
US11805275B2 (en) 2019-06-05 2023-10-31 Beijing Bytedance Network Technology Co., Ltd Context determination for matrix-based intra prediction
US11943444B2 (en) 2019-05-31 2024-03-26 Beijing Bytedance Network Technology Co., Ltd. Restricted upsampling process in matrix-based intra prediction

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021004890A2 (pt) * 2018-09-13 2021-06-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. intrapredições ponderadas lineares afins
WO2020197038A1 (ko) * 2019-03-22 2020-10-01 엘지전자 주식회사 영상 코딩 시스템에서 인트라 서브 파티션 기반의 인트라 예측 방법 및 장치
US11265580B2 (en) * 2019-03-22 2022-03-01 Tencent America LLC Supplemental enhancement information messages for neural network based video post processing
CN114501000B (zh) * 2019-04-10 2022-11-22 北京达佳互联信息技术有限公司 用于视频编码的方法和电子装置
KR20210145757A (ko) 2019-04-16 2021-12-02 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 인트라 코딩 모드에서의 행렬 도출
US11381808B2 (en) * 2019-04-25 2022-07-05 Hfi Innovation Inc. Method and apparatus of matrix based intra prediction in image and video processing
EP4340367A3 (en) * 2019-04-27 2024-04-24 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods of intra prediction
CN113785566A (zh) * 2019-04-27 2021-12-10 韦勒斯标准与技术协会公司 基于帧内预测处理视频信号的方法和设备
JP2022531147A (ja) 2019-05-01 2022-07-06 北京字節跳動網絡技術有限公司 フィルタリングを用いた行列ベースイントラ予測
WO2020221374A1 (en) * 2019-05-02 2020-11-05 Beijing Bytedance Network Technology Co., Ltd. Intra video coding using multiple reference filters
US11363284B2 (en) * 2019-05-09 2022-06-14 Qualcomm Incorporated Upsampling in affine linear weighted intra prediction
US11284093B2 (en) * 2019-05-09 2022-03-22 Qualcomm Incorporated Affine linear weighted intra prediction in video coding
CN113841409B (zh) * 2019-05-10 2023-12-19 北京字节跳动网络技术有限公司 用于视频处理的简化二次变换的有条件使用
US20230057982A1 (en) * 2019-05-15 2023-02-23 Beijing Bytedance Network Technology Co., Ltd. Matrix-based intra prediction using filtering
WO2020246805A1 (ko) * 2019-06-03 2020-12-10 엘지전자 주식회사 매트릭스 기반 인트라 예측 장치 및 방법
JP7277616B2 (ja) 2019-06-07 2023-05-19 北京字節跳動網絡技術有限公司 ビデオ・データを処理する方法、装置及び記憶媒体
CN114128270A (zh) * 2019-06-13 2022-03-01 Lg 电子株式会社 利用简化mpm列表生成方法的图像编码/解码方法和设备,以及发送比特流的方法
US20220312003A1 (en) * 2019-06-19 2022-09-29 Electronics And Telecommunications Research Institute Intra prediction mode, and entropy encoding/decoding method and device
US11197025B2 (en) 2019-06-21 2021-12-07 Qualcomm Incorporated Signaling of matrix intra prediction parameters in video coding
US11589065B2 (en) * 2019-06-24 2023-02-21 Hyundai Motor Company Method and apparatus for intra-prediction coding of video data
EP3886435A4 (en) 2019-06-25 2022-01-26 Guangdong Oppo Mobile Telecommunications Corp., Ltd. MAPPING PROCESS, ENCODER, DECODER AND COMPUTER STORAGE MEDIA
CN114467306A (zh) * 2019-07-07 2022-05-10 Oppo广东移动通信有限公司 图像预测方法、编码器、解码器以及存储介质
WO2021006612A1 (ko) 2019-07-08 2021-01-14 현대자동차주식회사 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치
JP7422858B2 (ja) 2019-08-03 2024-01-26 北京字節跳動網絡技術有限公司 ビデオ処理方法、装置、記憶媒体及び記憶方法
WO2021032045A1 (en) 2019-08-17 2021-02-25 Beijing Bytedance Network Technology Co., Ltd. Context modeling of side information for reduced secondary transforms in video
WO2021034161A1 (ko) * 2019-08-22 2021-02-25 엘지전자 주식회사 인트라 예측 장치 및 방법
US11838541B2 (en) * 2019-08-30 2023-12-05 Alibaba Group Holding Limited Matrix weighted intra prediction of video signals
US11943478B2 (en) * 2019-09-19 2024-03-26 Telefonaktiebolaget Lm Ericsson (Publ) Allowing a matrix based intra prediction block to have multiple transform blocks
WO2023048165A1 (ja) * 2021-09-24 2023-03-30 シャープ株式会社 動画像復号装置および動画像符号化装置
WO2023195708A1 (ko) * 2022-04-03 2023-10-12 엘지전자 주식회사 영상 인코딩/디코딩 방법 및 장치, 그리고 비트스트림을 저장한 기록 매체

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103748877B (zh) 2011-08-17 2017-05-10 联发科技(新加坡)私人有限公司 帧内预测方法和装置
EP3139596B1 (en) 2011-09-13 2019-09-25 HFI Innovation Inc. Method and apparatus for intra mode coding in hevc
KR102250092B1 (ko) * 2013-10-14 2021-05-10 삼성전자주식회사 다시점 비디오 부호화 방법 및 장치, 다시점 비디오 복호화 방법 및 장치
WO2017083553A1 (en) * 2015-11-10 2017-05-18 Vid Scale, Inc. Systems and methods for coding in super-block based video coding framework
WO2017139937A1 (en) * 2016-02-18 2017-08-24 Mediatek Singapore Pte. Ltd. Advanced linear model prediction for chroma coding
US10547854B2 (en) * 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
CA3025520A1 (en) * 2016-05-25 2017-11-30 Arris Enterprises Llc Improved weighted angular prediction coding for intra coding
US10448010B2 (en) * 2016-10-05 2019-10-15 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding
WO2019172676A1 (ko) * 2018-03-08 2019-09-12 삼성전자 주식회사 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치
US11611757B2 (en) * 2018-04-02 2023-03-21 Qualcomm Incorproated Position dependent intra prediction combination extended with angular modes
US11190764B2 (en) * 2018-07-06 2021-11-30 Qualcomm Incorporated Merged mode dependent intra smoothing (MDIS) and intra interpolation filter switching with position dependent intra prediction combination (PDPC)
US11616966B2 (en) * 2019-04-03 2023-03-28 Mediatek Inc. Interaction between core transform and secondary transform

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DONGCHEOL KIM,, ET AL., "NON-CE3: SIMPLIFICATION OF MIP MPM DERIVATION", vol. JVET-O0469 (version 4), JPN6022029463, 8 July 2019 (2019-07-08), pages 1 - 4, ISSN: 0004828360 *
JONATHAN PFAFF, ET AL., "CE3: AFFINE LINEAR WEIGHTED INTRA PREDICTION (CE3-4.1, CE3-4.2)", vol. JVET-N0217 (version 3), JPN6022029462, 25 March 2019 (2019-03-25), pages 1 - 17, ISSN: 0004828359 *
SHIH-TA HSIANG, ET AL., "NON-SCCE3: PALETTE INDEX CODING USING A UNIVERSAL ENTROPY CODING SCHEME", vol. JCTVC-R0135 (version 2), JPN6022029465, 29 June 2014 (2014-06-29), pages 1 - 5, ISSN: 0004828361 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022526991A (ja) * 2019-04-12 2022-05-27 北京字節跳動網絡技術有限公司 ビデオ処理方法、装置、記憶媒体、及び記録媒体
US11831877B2 (en) 2019-04-12 2023-11-28 Beijing Bytedance Network Technology Co., Ltd Calculation in matrix-based intra prediction
JP7404387B2 (ja) 2019-04-12 2023-12-25 北京字節跳動網絡技術有限公司 ビデオ処理方法、装置、記憶媒体及び記憶方法
US11546633B2 (en) 2019-05-01 2023-01-03 Beijing Bytedance Network Technology Co., Ltd. Context coding for matrix-based intra prediction
JP2022531902A (ja) * 2019-05-10 2022-07-12 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ブロックベース予測
JP7325540B2 (ja) 2019-05-10 2023-08-14 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ブロックベース予測
US11659185B2 (en) 2019-05-22 2023-05-23 Beijing Bytedance Network Technology Co., Ltd. Matrix-based intra prediction using upsampling
US11943444B2 (en) 2019-05-31 2024-03-26 Beijing Bytedance Network Technology Co., Ltd. Restricted upsampling process in matrix-based intra prediction
US11805275B2 (en) 2019-06-05 2023-10-31 Beijing Bytedance Network Technology Co., Ltd Context determination for matrix-based intra prediction
US11606570B2 (en) 2019-10-28 2023-03-14 Beijing Bytedance Network Technology Co., Ltd. Syntax signaling and parsing based on colour component

Also Published As

Publication number Publication date
CN113545061B (zh) 2024-04-19
US20230262247A1 (en) 2023-08-17
EP3949409A1 (en) 2022-02-09
JP7241177B2 (ja) 2023-03-16
SG11202110347TA (en) 2021-10-28
CA3133477A1 (en) 2020-10-08
US11134257B2 (en) 2021-09-28
CN113545061A (zh) 2021-10-22
US20200322620A1 (en) 2020-10-08
AU2023202564B2 (en) 2024-05-23
US20210385477A1 (en) 2021-12-09
KR20210074379A (ko) 2021-06-21
KR102608710B1 (ko) 2023-12-04
EP3949409A4 (en) 2023-01-11
AU2020252084B2 (en) 2023-02-02
AU2020252084A1 (en) 2021-10-14
US11722685B2 (en) 2023-08-08
AU2023202564A1 (en) 2023-05-18
WO2020205705A1 (en) 2020-10-08
KR20230167148A (ko) 2023-12-07

Similar Documents

Publication Publication Date Title
JP7241177B2 (ja) アフィン線形加重イントラ予測モードのための簡易シグナリング方法
JP7443455B2 (ja) 映像復号化のための方法、装置及びコンピュータ・プログラム
JP7046220B2 (ja) 小ブロックの予測と変換のための方法、装置、及びプログラム
JP2022059032A (ja) ビデオエンコーディング及びデコーディングのための方法、装置、コンピュータプログラム、及び非一時的なコンピュータ可読媒体
JP7362876B2 (ja) 簡略化された最確モードリスト生成スキーム
JP2022517114A (ja) ビデオ復号用の方法、装置およびプログラム
CN112534812B (zh) 用于视频解码的方法和相关装置
JP7244670B2 (ja) デコーダが実行するビデオデコーディングのための方法、装置及び非一時的なコンピュータ可読媒体、並びにエンコーダが実行するビデオエンコーディングのための方法
JP2022513457A (ja) Vvcにおける色変換のための方法及び機器
JP2022526161A (ja) ビデオ・コーディング方法及び装置
JP2021520150A (ja) 予測モードおよび符号化ブロックフラグ(cbf)のコンテキスト設計を更に向上する方法および機器
JP2022525748A (ja) ビデオ符号化のための色変換
JP7318087B2 (ja) マルチラインイントラ予測のためのモードリストを生成する方法、並びにその装置及びコンピュータプログラム
CN112235573B (zh) 视频编解码的方法、装置、电子设备、存储介质
JP7236558B2 (ja) ビデオコーディングのための方法および装置
JP2024019734A (ja) ビデオコーディングのための方法および装置
JP7189370B2 (ja) Cuに基づく補間フィルタ選択のシグナリング
JP7325622B2 (ja) 映像コーディングのための方法、装置、及びコンピュータプログラム
JP2023553996A (ja) 成分間変換係数レベル復元におけるオフセットの導出
CN115428024A (zh) 解耦变换分割技术
CN115176461A (zh) 视频编解码的方法和装置
JP7439344B2 (ja) ビデオデコーディングのための方法、デバイス、およびコンピュータプログラム
JP2023552415A (ja) ビデオ復号の方法、機器、及びコンピュータプログラム
JP2023544031A (ja) ビデオコーディングのための方法、装置、およびコンピュータプログラム
JP2023520594A (ja) ビデオ・コーディングのための方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221017

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230306

R150 Certificate of patent or registration of utility model

Ref document number: 7241177

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150