JP2019525605A - 幾何学的変換ベースの適応ループフィルタリング - Google Patents

幾何学的変換ベースの適応ループフィルタリング Download PDF

Info

Publication number
JP2019525605A
JP2019525605A JP2019505242A JP2019505242A JP2019525605A JP 2019525605 A JP2019525605 A JP 2019525605A JP 2019505242 A JP2019505242 A JP 2019505242A JP 2019505242 A JP2019505242 A JP 2019505242A JP 2019525605 A JP2019525605 A JP 2019525605A
Authority
JP
Japan
Prior art keywords
video
filter
reconstructed video
reconstructed
filter supports
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019505242A
Other languages
English (en)
Other versions
JP2019525605A5 (ja
Inventor
ジャン、リ
チェン、ウェイ−ジュン
ジャオ、シン
チェン、イ−ウェン
カルチェビチ、マルタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2019525605A publication Critical patent/JP2019525605A/ja
Publication of JP2019525605A5 publication Critical patent/JP2019525605A5/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本開示は、適応ループフィルタ(ALF)、および、特に、幾何学的変換ベースのALF(GALF)に関連する様々な技法を提供する。ある態様では、ビデオデータを復号するための方法が、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることとを含む。別の方法が、再構築されたビデオユニットについてのクロマ成分のALFのブロックレベル制御をイネーブルにすることと、再構築されたビデオユニットについて、ALFが1つのビデオブロックに対してイネーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することと、ALFが別のビデオブロックに対してディセーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することをスキップすることと、ALFのイネーブルにされたブロックレベル制御に基づいて、復号されたビデオ出力を生成することとを含む。関連するデバイス、手段、およびコンピュータ可読媒体もまた説明される。

Description

関連出願の相互参照
[0001]本特許出願は、2017年8月1日に出願された「GEOMETRY TRANSFORMATION-BASED ADAPTIVE LOOP FILTERING」と題する米国非仮特許出願第15/665,492号、および2016年8月2日に出願された「GEOMETRY TRANSFORMATION-BASED ADAPTIVE LOOP FILTERING」と題する米国仮特許出願第62/370,179号の優先権を主張し、これらは、本譲受人に譲渡され、これにより、全ての目的のために、参照により本明細書に明確に組み込まれている。
[0002]本開示は、適応ループフィルタ(ALF)に関連する様々な技法に関し、より具体的には、アドバンストビデオコーデックのコンテキストにおける幾何学的変換ベースのALF(GALF:geometry transformation-based ALF)における改善に関する。
[0003]画像/ビデオコーディングのためのALFは、それがコーディング性能において提供できる改善のために、著しい関心を集めている。ALFは、Wienerベースの適応フィルタを使用することによって、元のサンプルと、復号されたサンプルとの間の平均2乗誤差(例えば、歪み(distortion))を最小限にするために使用される。ピクチャ中のサンプルは、カテゴリに分類され、各カテゴリにおけるサンプルは、それらの関連する適応フィルタを用いてフィルタされる。GALFは、特に、(適応ループフィルタリングが適用される前に)再構築されたサンプルの勾配の向き(orientation)に依存して、フィルタサポート(filter support)におけるサンプルに適用されることになる幾何学的変換の導入によって、ALFに対するいくつかの改善を提供する。
[0004]ALFまたはGALFの現在のインプリメンテーションは、いくつかの制限を有し得る。例えば、各フレームについて(例えば、各ビデオユニットについて)、ALFまたはGALFがイネーブルにされたとき、予め定義されたフィルタサポートのうちの1つのみが、典型的に選択されシグナリングされる。加えて、現在の幾何学的変換は、90度の転置(transposition)の変更のみを考慮する。さらに、分類は、一般に、方向情報をキャプチャすることにおいて優れている勾配に依存する。しかしながら、ビデオユニットにおけるビデオブロックが明らかな方向を有していないが、行に沿ったプログレッシブな変化(progressive changes)を伴うケース、またはビデオブロックが平滑な領域を有し、ビデオブロック内のピクセルがかなり類似したサンプル値を有する場合のケースは、現在のALFまたはGALF設計では区別されることができない。最後に、現在のALFまたはGALF設計では、ピクチャ中の両方のクロマ成分(例えば、Cb、Cr)について、フィルタサポートは、単一の(例えば、5×5)ダイヤモンド形状のフィルタサポートに制限され、ルーマ成分情報は、クロマフィルタリングのために使用されない。
[0005]したがって、上記で説明された制限に対処することによって、ALFおよびGALFの性能において更なる利得(例えば、コーディング利得)を提供する技法の必要性がある。
[0006]本開示は、適応ループフィルタ(ALF)に関連する様々な技法に関し、より具体的には、高効率ビデオコーディング(HEVC:high efficiency video coding)または次世代のビデオ規格のような、アドバンストビデオコーデックのコンテキストにおける幾何学的変換ベースのALF(GALF)における改善に関する。これらの改善は、幾何学的変換における強化、複数のフィルタサポートの使用を含み、クロマ成分のフィルタリングを改善する。
[0007]一態様では、ビデオデータを復号するための方法が説明され、方法は、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることとを含む。
[0008]別の態様では、ビデオデータを復号するためのデバイスまたは装置が説明され、デバイスは、命令を記憶するように構成されたメモリと、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることとを行うための命令を実行するように構成されたプロセッサとを含む。
[0009]別の態様では、ビデオデータを符号化するための方法が説明され、方法は、複数の再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることと、復号されたビデオ出力を予測プロセスに適用することとを含む。
[0010]別の態様では、ビデオデータを符号化するためのデバイスが説明され、デバイスは、命令を記憶するように構成されたメモリと、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることと、復号されたビデオ出力を予測プロセスに適用することとを行うための命令を実行するように構成されたプロセッサとを含む。
[0011]別の態様では、ビデオデータを復号するための方法が説明され、方法は、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、再構築されたビデオユニットの各々についてのクロマ成分の適応ループフィルタリング(ALF)のブロックレベル制御をイネーブルにすることと、再構築されたビデオユニットについて、ALFが1つのビデオブロックに対してイネーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することと、ALFが別のビデオブロックに対してディセーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することをスキップすることと、ALFのイネーブルにされたブロックレベル制御に基づいて、復号されたビデオ出力を生成することとを含む。
[0012]別の態様では、ビデオデータを復号するための方法が説明され、方法は、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、復号されたビデオ出力を生成するために、1つまたは複数のルーマ成分サンプルを使用して、再構築されたビデオユニットの各々についてのクロマ成分サンプルのフィルタリングを実行することと含む。
[0013]別の態様では、ビデオデータを復号するためのデバイスが説明され、デバイスは、命令を記憶するように構成されたメモリと、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、再構築されたビデオユニットの各々についてのクロマ成分のALFのブロックレベル制御をイネーブルにすることと、再構築されたビデオユニットについて、ALFが1つのビデオブロックに対してイネーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することと、ALFが別のビデオブロックに対してディセーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することをスキップすることと、ALFのイネーブルにされたブロックレベル制御に基づいて、復号されたビデオ出力を生成することとを行うための命令を実行するように構成されたプロセッサとを含む。
[0014]別の態様では、ビデオデータを復号するためのデバイスが説明され、デバイスは、命令を記憶するように構成されたメモリと、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、復号されたビデオ出力を生成するために、1つまたは複数のルーマ成分サンプルを使用して、再構築されたビデオユニットの各々についてのクロマ成分サンプルをフィルタすることとを行うための命令を実行するように構成されたプロセッサとを含む。
[0015]別の態様では、ビデオデータを符号化するための方法が説明され、方法は、再構築されたビデオユニットの各々についてのクロマ成分のALFのブロックレベル制御をイネーブルにすることと、再構築されたビデオユニットについて、ALFが1つのビデオブロックに対してイネーブルにされたとき、ブロックレベルALFを実行することと、ALFが別のビデオブロックに対してディセーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することをスキップすることと、ALFのイネーブルにされたブロックレベル制御に基づいて、予測プロセスに適用される復号されたビデオ出力を生成することとを含む。
[0016]別の態様では、ビデオデータを符号化するための方法が説明され、方法は、復号されたビデオ出力を生成するために、1つまたは複数のルーマ成分サンプルを使用して、再構築されたビデオユニットの各々についてのクロマ成分サンプルをフィルタすることと、復号されたビデオ出力を予測プロセスに適用することとを含む。
[0017]別の態様では、ビデオデータを符号化するためのデバイスが説明され、デバイスは、命令を記憶するように構成されたメモリと、再構築されたビデオユニットの各々についてのクロマ成分の適応ループフィルタリング(ALF)のブロックレベル制御をイネーブルにすることと、再構築されたビデオユニットについて、ALFが1つのビデオブロックに対してイネーブルにされたとき、ブロックレベルALFを実行することと、ALFが別のビデオブロックに対してディセーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することをスキップすることと、ALFのイネーブルにされたブロックレベル制御に基づいて、予測プロセスに適用される復号されたビデオ出力を生成することとを行うための命令を実行するように構成されたプロセッサとを含む。
[0018]別の態様では、ビデオデータを符号化するためのデバイスが説明され、デバイスは、命令を記憶するように構成されたメモリと、復号されたビデオ出力を生成するために、1つまたは複数のルーマ成分サンプルを使用して、再構築されたビデオユニットの各々についてのクロマ成分サンプルをフィルタすることと、復号されたビデオ出力を予測プロセスに適用することとを行うための命令を実行するように構成されたプロセッサとを含む。
[0019]前述および関連する目的の達成のために、1つまたは複数の態様が、以下で十分に説明され、かつ特許請求の範囲において具体的に示される特徴を備える。以下の説明および添付の図面は、1つまたは複数の態様のある特定の例示的な特徴を詳細に示す。しかしながら、これらの特徴は、様々な態様の原理が用いられ得る様々な方法のうちのごく一部を示すものであり、本説明は、全てのそのような態様およびそれらの同等物を含むように意図される。
[0020]開示される態様は、開示される態様を限定するためでなく、例示するために提供される添付の図面と併せて以下で説明され、ここで、同様の符号は同様の要素を示す。
[0021]図1は、本開示の様々な態様による、ソースまたは符号化デバイスと、宛先または復号デバイスとの例を例示するブロック図である。 [0022]図2Aは、本開示の様々な態様による、ビデオ復号器の例を例示するブロック図である。 [0023]図2Bは、本開示の様々な態様による、ビデオ符号器の例を例示するブロック図である。 [0024]図3は、本開示の様々な態様による、ワイヤレス通信デバイスを含むネットワークの例を例示する図である。 [0025]図4は、本開示の様々な態様による、16×16画像/ビデオブロックのためのイントラ予測(intra prediction)の例を例示する図である。 [0026]図5は、本開示の様々な態様による、HEVCのために定義されるイントラ予測モードの例を例示する図である。 [0027]図6は、本開示の様々な態様による、HEVCにおいて定義される平面モード(planar mode)の例を例示する図である。 [0028]図7は、本開示の様々な態様による、HEVCにおいて定義される角度モード(angular mode)の例を例示する図である。 [0029]図8Aは、本開示の様々な態様による、ALFフィルタサポートの例を例示する図である。 [0029]図8Bは、本開示の様々な態様による、ALFフィルタサポートの例を例示する図である。 [0029]図8Cは、本開示の様々な態様による、ALFフィルタサポートの例を例示する図である。 [0030]図9は、本開示の様々な態様による、フィルタ係数シグナリングのための3つのカテゴリを有する7×7フィルタ形状の例を例示する図である。 [0031]図10は、本開示の様々な態様による、5×5ダイヤモンド形状のフィルタサポートの例を例示する図である。 [0032]図11Aは、本開示の様々な態様による、幾何学的変換の例を例示する図である。 [0032]図11Bは、本開示の様々な態様による、幾何学的変換の例を例示する図である。 [0032]図11Cは、本開示の様々な態様による、幾何学的変換の例を例示する図である。 [0033]図12Aは、本開示の様々な態様による、強対角方向(strong diagonal directions)に関する幾何学的変換の例を例示する図である。 [0033]図12Bは、本開示の様々な態様による、強対角方向に関する幾何学的変換の例を例示する図である。 [0034]図13は、本開示の様々な態様による、45度回転の幾何学的変換の例を例示する図である。 [0035]図14Aは、本開示の様々な態様による、4:2:0カラーフォーマットのためのピクチャ中のルーマおよびクロマサンプルのサンプリングロケーション(sampling locations)の例を例示する図である。 [0036]図14Bは、本開示の様々な態様による、4:2:0カラーフォーマットに関する対応するクロス成分ピクセル(cross-component pixels)の生成の例を例示する図である。 [0036]図14Cは、本開示の様々な態様による、4:2:0カラーフォーマットに関する対応するクロス成分ピクセルの生成の例を例示する図である。 [0037]図15は、本開示の様々な態様による、様々なALFおよびGALFの態様を実行するように構成された処理システムの例を例示するブロック図である。 [0038]図16は、本開示の様々な態様による、複数のフィルタサポートを用いた復号方法の例を例示するフロー図である。 [0039]図17は、本開示の様々な態様による、複数のフィルタサポートを用いた符号化方法の例を例示するフロー図である。 [0040]図18は、本開示の様々な態様による、クロマフィルタリングのブロックレベル制御を用いた復号方法の例を例示するフロー図である。 [0041]図19は、本開示の様々な態様による、クロマフィルタリングのためのルーマサンプルを用いた復号方法の例を例示するフロー図である。 [0042]図20は、本開示の様々な態様による、クロマフィルタリングのブロックレベル制御を用いた符号化方法の例を例示するフロー図である。 [0043]図21は、本開示の様々な態様による、クロマフィルタリングのためのルーマサンプルを用いた符号化方法の例を例示するフロー図である。
詳細な説明
[0044]本開示のある特定の態様および実施形態が、以下で提供される。例えば、ALFおよびGALFへの強化に関連した様々な態様が説明され、幾何学的変換を拡張すること、複数のフィルタサポートのより柔軟な使用、およびクロマフィルタリングにおける改善を含む。ALFおよびGALFへのこれらの強化は、HEVCの拡張または次世代のビデオコーディング規格のような、アドバンストビデオコーデックのコンテキストにおいてコーディング利得を提供するように意図される。これらの態様のうちのいくつかは、当業者に明らかであるように、独立に適用され得、また、それらのうちのいくつかは、組合せにおいて適用され得る。以下の説明では、説明を目的として、特定の詳細が本開示の完全な理解を提供するために示される。本開示で説明される、提案されたALFおよびGALF技法の様々な態様が、これらの特定の詳細なしで実施され得ることは、当業者によって理解されるべきである。例えば、回路、システム、ネットワーク、プロセス、および他のコンポーネントが、不要な詳細で様々な態様を曖昧にしないために、ブロック図形式のコンポーネントとして示され得る。他の事例では、周知の回路、プロセス、アルゴリズム、構造、および技法が、説明されている様々な態様を曖昧にすることを避けるために、不要な詳細なしで示され得る。
[0045]上記で説明されたように、ALFまたはGALFの現在のインプリメンテーションは、いくつかの制限を有し得る。例えば、各フレームについて(例えば、各ビデオユニットについて)、ALFまたはGALFがイネーブルにされたとき、予め定義されたフィルタサポートのうちの1つのみが、典型的に選択されシグナリングされる。より多くのフィルタサポートがローカル特性(local characteristics)に基づいて選択され得る場合、より高いコーディング利得が予期され得る。加えて、現在の幾何学的変換は、90度の転置の変更のみを考慮する。幾何学的変換インデックスをシグナリングする必要がなく、フィルタ係数の1つのセットのみが、既存の(例えば、4つの)幾何学的変換のためにシグナリングされる必要があるので、追加の幾何学的変換はまた、追加のコーディング利得をもたらし得る。さらに、分類は、一般に、方向情報をキャプチャすることにおいて優れている勾配に依存する。しかしながら、ビデオユニットにおけるビデオブロックが明らかな方向を有していないが、行に沿ったプログレッシブな変化を伴うケース、またはビデオブロックが平滑な領域を有し、ビデオブロック内のピクセルがかなり類似したサンプル値を有する場合のケースは、現在のALFまたはGALF設計では区別されることができない。最後に、現在のALFまたはGALF設計では、ピクチャ中の両方のクロマ成分(例えば、Cb、Cr)について、フィルタサポートは、単一の(例えば、5×5)ダイヤモンド形状のフィルタサポートに制限され、ルーマ成分情報は、クロマフィルタリングのために使用されない。より柔軟なフィルタサポートを可能にするとき、および/またはルーマ成分情報も考慮されるとき、より多くのコーディング利得が、クロマ成分のために予期され得る。これらの制限に対処するために、および上記で説明されたように、本開示は、幾何学的変換を拡張すること、複数のフィルタサポートのより柔軟な使用、およびクロマフィルタリングにおける改善を含む、ALFおよびGALFへの様々な強化を説明する。
[0046]図1は、システム100の例を例示するブロック図である。システム100の態様は、ALFおよびGALFに関してここで説明される様々な技法に関連して使用され得る。システム100は、ソースまたは符号化デバイス12と、宛先または復号デバイス14とを含み得る。しかしながら、1つのデバイスが、ソースデバイス12と宛先デバイス14の両方を含み得ることが理解されるべきである(例えば、図3を参照)。ソースデバイス12および/または宛先デバイス14は、モバイルまたは固定の電話ハンドセット(例えば、スマートフォン、セルラ電話、または同様のもの)、デスクトップコンピュータ、ラップトップまたはノートブックコンピュータ、タブレットコンピュータ、セットトップボックス、テレビ、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲーム機、ビデオストリーミングデバイスなどの電子デバイス、またはその他任意の好適な電子デバイスを含み得るか、あるいはその一部であり得る。いくつかの例では、ソースデバイス12および宛先デバイス14は、ワイヤレス通信のための1つまたは複数のワイヤレストランシーバを含み得る。ここで説明される様々なコーディング技法は、(例えば、インターネットを介した)ストリーミングビデオ送信、テレビ放送または送信、データ記憶媒体上での記憶のためのデジタルビデオの符号化、データ記憶媒体上に記憶されたデジタルビデオの復号、または他のアプリケーションを含む、様々なマルチメディアアプリケーションにおけるビデオコーディングに適用可能である。いくつかの例では、システム100は、ビデオ会議、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、ゲーミング、仮想現実、および/またはビデオ電話通信などのアプリケーションをサポートするために、一方向または双方向のビデオ送信をサポートし得る。
[0047]上記で説明されたようなソースデバイス12は、ビデオソース18、ビデオ符号器20、記憶装置21、および出力インターフェース22を含み得る。代替として、ビデオソース18は、ソースデバイス12とは別個であり得る。上記で説明されたような宛先デバイス14(これは、受信デバイスとも呼ばれ得る)は、入力インターフェース28、ビデオ復号器30、記憶装置31、およびディスプレイデバイス32を含み得る。代替として、ディスプレイデバイス32は、宛先デバイス14とは別個であり得る。ここで説明されるようなディスプレイデバイス32は、ユーザにビデオデータを表示し得、ブラウン管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなどの、様々なディスプレイデバイスの任意のものを備え得る。
[0048]ソースデバイス12は、符号化されたビデオビットストリームを生成するために、ビデオコーディング規格またはプロトコルを使用して、ビデオデータを符号化するために使用され得る。ビデオコーディング規格は、ITU−T H.261、ISO/IEC MPEG−1ビジュアル、ITU−T H.262またはISO/IEC MPEG−2ビジュアル、ITU−T H.263、ISO/IEC MPEG−4ビジュアル、および(ISO/IEC MPEG−4 AVCとしても知られている)ITU−T H.264を含み、そのスケーラブルビデオコーディング(SVC)およびマルチビュービデオコーディング(MVC)拡張を含む。別のビデオコーディング規格、高効率ビデオコーディング(HEVC)は、ITU−Tビデオコーディングエキスパートグループ(VCEG)およびISO/IECモーションピクチャエキスパートグループ(MPEG)のビデオコーディング共同研究部会(JCT−VC)によって完成された。HEVCへの様々な拡張は、マルチレイヤビデオコーディングを扱い、JCT−VCによってまた開発されており、MV−HEVCと呼ばれる、HEVCへのマルチビュー拡張、およびSHVCと呼ばれる、HEVCへのスケーラブル拡張、またはその他任意の好適なコーディングプロトコルを含む。さらに、動きのあるテキストおよびグラフィックスなどのスクリーンコンテンツ材料に関する新しいコーディングツールの調査が実施され、スクリーンコンテンツについてのコーディング効率を改善する技術が提案されてきた。H.265/HEVCスクリーンコンテンツコーディング(SCC)拡張が、これらの新しいコーディングツールをカバーするために開発されている。
[0049]ビデオソース18は、ソースデバイス12にビデオデータを提供し得る。ビデオソース18は、ソースデバイスの一部であり得、またはソースデバイス12以外のデバイスの一部であり得る。ビデオソース18は、ビデオキャプチャデバイス(例えば、ビデオカメラ、カメラ電話、ビデオ電話、または同様のもの)、記憶されたビデオを含むビデオアーカイブ、ビデオデータを提供するビデオサーバまたはコンテンツプロバイダ、ビデオサーバまたはコンテンツプロバイダからのビデオを受信するビデオフィードインターフェース、コンピュータグラフィックスビデオデータを生成するためのコンピュータグラフィックスシステム、このようなソースの組合せ、またはその他任意の好適なビデオソースを含み得る。
[0050]ビデオソース18からのビデオデータは、1つまたは複数の入力ピクチャまたはフレームを含み得る。ピクチャまたはフレームは、ビデオを形成する画像のシーケンスの一部である静止画像である。ピクチャまたはフレーム、あるいはその一部は、ビデオ画像またはビデオユニットと呼ばれ得る。ソースデバイス12のビデオ符号器20(または符号器)は、符号化されたビデオビットストリーム(例えば、符号化されたビデオ画像のシーケンス)を生成するために、ビデオデータを符号化する。いくつかの例では、符号化されたビデオビットストリーム(または、「ビットストリーム」)は、一連の1つまたは複数のコーディングされたビデオシーケンスである。コーディングされたビデオシーケンス(CVS)は、ベースレイヤにおけるランダムアクセスポイントピクチャを有しかつある特定の特性を有する(with certain properties)AUから開始し、ベースレイヤにおけるランダムアクセスポイントピクチャを有しかつある特定の特性を有する次のAUまでの(およびそれを含まない)(up to and not including a next AU)一連のアクセスユニット(AU)を含む。例えば、HEVCビットストリームは、ネットワーク抽象化レイヤ(NAL)ユニットと呼ばれるデータユニットを含む1つまたは複数のCVSを含み得る。
[0051]ビデオ符号器20は、複数のスライスに各ピクチャを区分することによって、ピクチャのコーディングされた表現(representations)を生成する。スライスは、他のスライスと独立であり得、それによって、スライス中の情報は、同じピクチャ内の他のスライスからのデータに依存することなくコーディングされる。スライスは、独立のスライスセグメントと、もしあれば、以前のスライスセグメントに依存する1つまたは複数の従属のスライスセグメントとを含む、1つまたは複数のスライスセグメントを含む。その後、スライスは、ルーマサンプルおよびクロマサンプルのコーディングツリーブロック(CTB)へと区分される。ルーマは、一般に、サンプルの輝度のレベルを指し、無色であると考えられる。他方では、クロマは、色彩レベルを指し、色彩情報を持つ(carries)。(例えば、ピクセル値のような)特定のピクセルロケーションのルーマおよびクロマの値は、ある特定のビット深度を使用して提供され得る。ルーマサンプルのCTBおよびクロマサンプルの1つまたは複数のCTBは、サンプルのためのシンタックスと共に、コーディングツリーユニット(CTU)と呼ばれる。CTUは、HEVC符号化のための基本処理単位である。CTUは、可変サイズの複数のコーディングユニット(CU)へと分割され得る。CUは、コーディングブロック(CB)と呼ばれるルーマおよびクロマサンプルのアレイを含む。ルーマおよびクロマCBは、予測ブロック(PB)へとさらに分割され得る。PBは、インター予測のために同じ動きパラメータを使用するルーマまたはクロマ成分のサンプルのブロックである。ルーマPBおよび1つまたは複数のクロマPBは、関連するシンタックスと共に、予測ユニット(PU)を形成する。いったんビデオデータのピクチャがCUへと区分されると、ビデオ符号器20は、予測モードを使用して各PUを予測する。その後、予測は、残差を得るために元のビデオデータから差し引かれる(以下で説明される)。各CUについて、予測モードは、シンタックスデータを使用してビットストリームの内部でシグナリングされ得る。予測モードは、イントラ予測(またはイントラピクチャ予測)またはインター予測(またはインターピクチャ予測)を含み得る。イントラ予測を使用して、各PUは、例えば、PUの平均値を見出すためのDC予測、平面をPUに合わせるための平面予測、隣接するデータから外挿するための方向予測、またはその他任意の好適なタイプの予測を使用して、同じピクチャ中の隣接する画像データから予測される。インター予測を使用すると、各PUは、(出力順序で現在のピクチャの前または後の)1つまたは複数の参照ピクチャ中の画像データからの動き補償予測を使用して予測される。ピクチャエリアを、インターピクチャ予測を使用してコーディングするか、あるいはイントラピクチャ予測を使用してコーディングするかの決定は、例えば、CUレベルにおいて行われ得る。
[0052]いくつかの例では、片方向予測(uni-prediction)を使用するインター予測が実行され得、このケースでは、各予測ブロックは、1つの動き補償された予測信号を使用し得、P予測ユニットが生成される。いくつかの例では、双方向予測(bi-prediction)を使用するインター予測が実行され得、このケースでは、各予測ブロックは、2つの動き補償された予測信号を使用し、B予測ユニットが生成される。
[0053]PUは、予測プロセスに関連するデータを含み得る。例えば、PUがイントラ予測を使用して符号化されるとき、PUは、PUのためのイントラ予測モードを記述するデータを含み得る。別の例として、PUがインター予測を使用して符号化されるとき、PUは、PUのための動きベクトルを定義するデータを含み得る。その後、ソースデバイス12におけるビデオ符号器20は、変換および量子化を実行し得る。例えば、予測に続いて、ビデオ符号器20は、PUに対応する残差値を計算し得る。残差値は、ピクセル差分値を備え得る。予測が実行された後に残り得る任意の残差データが、ブロック変換を使用して変換され、これは、離散コサイン変換、離散サイン変換、整数変換、ウェーブレット変換、または他の好適な変換関数(transform function)に基づき得る。いくつかのケースでは、1つまたは複数のブロック変換(例えば、サイズ32×32、16×16、8×8、4×4、または同様のもの)が、各CU中の残差データに適用され得る。いくつかの実施形態では、変換ユニット(TU)が、ビデオ符号器20によってインプリメントされる変換および量子化プロセスのために使用され得る。1つまたは複数のPUを有する所与のCUがまた、1つまたは複数のTUを含み得る。以下でさらに詳細に説明されるように、残差値は、ブロック変換を使用して変換係数へと変換され得、その後、エントロピーコーディングのための直列化された変換係数(serialized transform coefficients)を生成するために、TUを使用して量子化および走査され得る。
[0054]いくつかの実施形態では、CUのPUを使用するイントラ予測またはインター予測コーディングに続いて、ビデオ符号器20は、CUのTUのための残差データを計算し得る。PUは、空間領域(またはピクセル領域)中のピクセルデータを備え得る。TUは、ブロック変換の適用後の変換領域中の係数を備え得る。前述されたように、残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分値に対応し得る。ビデオ符号器20は、CUのための残差データを含むTUを形成し得、その後、CUのための変換係数を生成するためにTUを変換し得る。
[0055]ビデオ符号器20は、ALFまたはGALFをインプリメントし得、ALFおよびGALFに関してここで説明される強化のうちの1つまたは複数を実行するように構成され得る。例えば、ビデオ符号器20は、幾何学的変換を拡張すること、複数のフィルタサポートのより柔軟な使用、およびクロマフィルタリングにおける改善を含む、様々な技法をインプリメントし得る。
[0056]ビデオ符号器20は、変換係数の量子化を実行し得る。量子化は、係数を表すために使用されるデータの量を低減させるために、変換係数を量子化することによって、さらなる圧縮を提供する。例えば、量子化は、係数の一部または全てに関連付けられたビット深度を低減し得る。一例では、nビットの値を有する係数は、量子化中にmビットの値に切り捨てられ得るとともに、nは、mよりも大きい。
[0057]いったん量子化が実行されると、コーディングされたビットストリームは、量子化された変換係数、予測情報(例えば、予測モード、動きベクトル、または同様のもの)、区分情報、および他のシンタックスデータのような、その他任意の好適なデータを含む。その後、コーディングされたビットストリームの異なる要素は、ビデオ符号器20によってエントロピー符号化され得る。いくつかの例では、ビデオ符号器20は、エントロピー符号化され得る直列化されたベクトルを生成するために、予め定義された走査順序を利用して、量子化された変換係数を走査し得る。いくつかの例では、ビデオ符号器20は、適応走査を実行し得る。1次元ベクトルを形成するために、量子化された変換係数を走査した後、ビデオ符号器20は、1次元ベクトルをエントロピー符号化し得る。例えば、ビデオ符号器20は、コンテキスト適応可変長コーディング、コンテキスト適応バイナリ算術コーディング、シンタックスベースコンテキスト適応バイナリ算術コーディング、確率間隔区分エントロピーコーディング、または別の好適なエントロピー符号化技法を使用し得る。
[0058]ソースデバイス12の出力インターフェース22は、符号化またはコーディングされたビデオデータを構成するNALユニットを、宛先デバイス14に通信リンク40(例えば、図3の通信リンク125)を介して送り得る。追加または代替として、出力インターフェース22は、記憶デバイス26にコーディングされたビデオデータを送り得、そこから、コーディングされたビデオデータは、宛先デバイス14に送られ得る。宛先デバイス14の入力インターフェース28は、NALユニットを受信し得る。通信リンク40は、ワイヤレスネットワーク、有線ネットワーク、または有線ネットワークとワイヤレスネットワークの組合せを使用して送信される信号を含み得る。ワイヤレスネットワークは、任意のワイヤレスインターフェースまたはワイヤレスインターフェースの組合せを含み得、任意の好適なワイヤレスネットワーク(例えば、インターネットまたは他のワイドエリアネットワーク、パケットベースネットワーク、WiFi(登録商標)、無線周波数(RF)、UWB、WiFi−Direct、セルラ、ロングタームエボリューション(LTE(登録商標))、WiMax(登録商標)、または同様のもの)を含み得る。ワイヤレスネットワークの例が、図3に例示される。有線ネットワークは、任意の有線インターフェース(例えば、ファイバー、イーサネット(登録商標)、電力線イーサネット、同軸ケーブルを通じたイーサネット、デジタル信号線(DSL)、または同様のもの)を含み得る。有線および/またはワイヤレスネットワークは、基地局、ルータ、アクセスポイント、ブリッジ、ゲートウェイ、スイッチ、または同様のものなどの、様々な機器を使用してインプリメントされ得る。符号化されたビデオデータは、ワイヤレス通信プロトコルのような通信規格に従って変調され、受信デバイスに送信され得る。
[0059]いくつかの例では、ソースデバイス12は、コーディングされたビデオデータを記憶装置21に記憶し得る。出力インターフェース22は、ビデオ符号器20から、または記憶装置21から、コーディングされたビデオデータを取り出し得る。記憶装置21は、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体の任意のものを含み得る。例えば、記憶装置21は、ハードドライブ、ストレージディスク、フラッシュメモリ、揮発性または不揮発性メモリ、または符号化されたビデオデータを記憶するためのその他任意の好適なデジタル記憶媒体を含み得る。ビデオ符号器20とは別個に示されているが、記憶装置21、または記憶装置21の少なくとも一部は、ビデオ符号器20の一部としてインプリメントされ得る。
[0060]入力インターフェース28は、コーディングされたビデオデータを受信し、ビデオ復号器30による後の使用のために、ビデオ復号器30(または復号器)または記憶装置31にビデオデータを提供し得る。ビデオ復号器30は、(例えば、エントロピー復号器を使用した)エントロピー復号、および符号化されたビデオデータを構成するコーディングされたビデオシーケンスの要素を抽出することによって、コーディングされたビデオデータを復号し得る。その後、ビデオ復号器30は、符号化されたビデオデータの再スケーリング(rescale)を行い、それに対して逆変換を実行し得る。その後、残差がビデオ復号器30の予測段(例えば、予測プロセス)に渡される。その後、ビデオ復号器30は、ピクセルのブロック(例えば、PU)を予測し得る。いくつかの例では、予測は、逆変換の出力に加算(added)される。
[0061]ビデオ復号器30は、ビデオ符号器20と同様に、ALFまたはGALFをインプリメントし得、ALFおよびGALFに関してここで説明される強化のうちの1つまたは複数を実行するように構成され得る。例えば、ビデオ復号器30は、幾何学的変換を拡張すること、複数のフィルタサポートのより柔軟な使用、およびクロマフィルタリングにおける改善を含む、様々な技法をインプリメントし得る。この点について、ビデオ符号器20は、コーディングされたビデオデータを生成するために、ここで説明されるALFおよびGALFのための技法のうちのいくつかを実行し得、ビデオ復号器30が、コーディングされたビデオデータを復号するために、コーディングされたビデオデータに対して対応する技法を実行し得るように、ビデオ復号器30に関連情報をシグナリングし得る。
[0062]宛先デバイス14は、復号されたビデオデータをコンテンツの消費者に表示するためのディスプレイデバイス32に復号されたビデオを出力し得る。いくつかの態様では、ディスプレイデバイス32は、宛先デバイス14の一部であり得る。いくつかの態様では、ビデオディスプレイデバイス32は、宛先デバイス14以外の別個のデバイスの一部であり得る。
[0063]いくつかの態様では、ソースデバイス12および/または宛先デバイス14は、それぞれ、オーディオ符号化デバイスおよびオーディオ復号デバイスと一体化され得る。ソースデバイス12および/または宛先デバイス14はまた、1つまたは複数のマイクロプロセッサ、デジタルシグナルプロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアまたはそれらの任意の組合せなどの、上記で説明されたコーディング技法をインプリメントするのに必要な他のハードウェアまたはソフトウェアを含み得る。ソースデバイス12および宛先デバイス14は、それぞれのデバイスにおいて、組み合わされた符号器/復号器(コーデック)の一部として一体化され得る。
[0064]図2Aを参照すると、図1のビデオ符号器20の例を例示するブロック図200が示される。ビデオ符号器20は、例えば、符号化の動作を実行し得、シンタックス構造(例えば、シンタックス要素)を生成し得る。ビデオ符号器20は、ビデオスライス内のビデオデータ(例えば、ビデオブロック)のイントラ予測およびインター予測コーディングを実行し得る。イントラコーディングは、少なくとも部分的に、空間的予測に依拠して、所与のビデオフレームまたはピクチャ内の空間的冗長性を低減または除去する。インターコーディングは、少なくとも部分的に、時間的予測に依拠して、ビデオシーケンスの、隣り合うまたは周囲のフレーム内の時間的冗長性を低減または除去する。イントラモード(Iモード)は、いくつかの空間ベースの圧縮モードのうちの任意のものを指し得る。上記で説明された片方向予測(Pモード)または双方向予測(Bモード)のようなインターモードは、いくつかの時間ベースの圧縮モードのうちの任意のものを指し得る。
[0065]ビデオ符号器20は、ビデオデータを受信するビデオデータメモリ33、区分ユニット35、予測処理ユニット41、ALFユニット64、復号されたピクチャバッファ(DPB)66、加算器50、変換処理ユニット52、量子化ユニット54、およびエントロピー符号化ユニット56を含む。予測処理ユニット41は、動き推定ユニット(MEU)42、動き補償ユニット(MCU)44、およびイントラ予測処理ユニット46を含む。ビデオブロック再構築のために、ビデオ符号器20はまた、逆量子化ユニット58、逆変換処理ユニット60、および加算器62を含む。ALFユニット64に加えて、ビデオ符号器20は、例えば、非ブロック化フィルタ(deblocking filter)およびサンプル適応オフセット(SAO)フィルタなどの、他のループフィルタを含み得る。後処理デバイス(図示せず)が、ビデオ符号器20によって生成される符号化またはコーディングされたビデオデータに対する追加の処理を実行し得る。本開示の技法は、いくつかの事例では、例えば、ALFユニット64における、ビデオ符号器20によってインプリメントされ得る。
[0066]図2Aに示されるように、ビデオ符号器20は、ビデオデータを受信し、区分ユニット35は、データを複数のビデオブロックに区分する。この区分はまた、スライス、スライスセグメント、タイル、または他のより大きい単位への区分のみならず、例えば、最大のコーディングユニット(LCU)およびCUの4分木構造に従う、ビデオブロック区分を含み得る。ビデオ符号器20は、概して、符号化されるべきビデオスライス内のビデオブロックを符号化するコンポーネントを例示する。スライスは、複数のビデオブロックに(および、場合によっては、タイルと呼ばれるビデオブロックのセットに)分割され得る。予測処理ユニット41は、予測動作またはプロセスを実行し得、これは、誤差の結果(例えば、コーディングレートおよび歪みのレベル、または同様のもの)に基づいて、現在のビデオブロックのための、複数のイントラ予測コーディングモードのうちの1つまたは複数のインター予測コーディングモードのうちの1つのような、複数の可能なコーディングモードのうちの1つを選択することを含み得る。予測処理ユニット41は、結果として得られたイントラまたはインターコーディングされたブロックを、残差ブロックデータを生成するために加算器50に、および参照ピクチャとして使用するための符号化されたブロックを再構築するために加算器62に提供し得る。
[0067]予測処理ユニット41内のイントラ予測処理ユニット46は、空間的圧縮を提供するために、コーディングされるべき現在のブロックと同じフレームまたはスライス中の1つまたは複数の隣接するブロックに関連して(relative to)、現在のビデオブロックのイントラ予測コーディングを実行し得る。予測処理ユニット41内の動き推定ユニット42および動き補償ユニット44は、時間的圧縮を提供するために、1つまたは複数の参照ピクチャ中の1つまたは複数の予測ブロックに関連して、現在のビデオブロックのインター予測コーディングを実行する。
[0068]動き推定ユニット42は、ビデオシーケンスのための所定のパターンに従って、ビデオスライスのためのインター予測モードを決定するように構成され得る。所定のパターンは、Pスライス、Bスライス、またはGPBスライスとして、シーケンス中のビデオスライスを指定し得る。動き推定ユニット42および動き補償ユニット44は、高度に一体化され得るが、概念的な目的のために別個に例示されている。動き推定ユニット42によって実行される動き推定は、動きベクトルを生成するプロセスであり、これは、ビデオブロックに関する動きを推定する。動きベクトルは、例えば、参照ピクチャ内の予測ブロックに関連して、現在のビデオフレームまたはピクチャ内のビデオブロックの予測ユニット(PU)の変位を示し得る。
[0069]予測ブロックは、絶対差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of square difference)、または他の差分メトリックによって決定され得るピクセル差分に関して、コーディングされるべきビデオブロックのPUと密接に一致することが見出されたブロックである。いくつかの例では、ビデオ符号器20は、DPB66に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。例えば、ビデオ符号器20は、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット42は、フルピクセル位置および分数ピクセル位置に関連して動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。
[0070]動き推定ユニット42は、PUの位置と参照ピクチャの予測ブロックの位置とを比較することによって、インターコーディングされたスライス中のビデオブロックのPUのための動きベクトルを計算する。参照ピクチャは、その各々がDPB66に記憶された1つまたは複数の参照ピクチャを識別する、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択され得る。動き推定ユニット42は、計算された動きベクトルを、エントロピー符号化ユニット56および動き補償ユニット44に送る。
[0071]動き補償ユニット44によって実行される動き補償は、動き推定によって決定される動きベクトルに基づいて、予測ブロックをフェッチまたは生成すること、場合によっては、サブピクセル精度への補間を実行することを伴い得る。現在のビデオブロックのPUのための動きベクトルを受信すると、動き補償ユニット44は、参照ピクチャリストにおいて動きベクトルがそれを指す予測ブロックの位置を特定し得る。ビデオ符号器20は、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。ピクセル差分値は、ブロックのための残差データを形成し、ルーマ差分成分とクロマ差分成分の両方を含み得る。加算器50は、この減算演算を実行する1つまたは複数のコンポーネントを表す。動き補償ユニット44はまた、ビデオスライスのビデオブロックを復号する際に宛先デバイス14によって使用するための、ビデオブロックとビデオスライスとに関連付けられたシンタックス要素を生成し得る。
[0072]イントラ予測処理ユニット46は、上記で説明されたように、動き推定ユニット42および動き補償ユニット44によって実行されるインター予測の代替として、現在のブロックをイントラ予測し得る。具体的には、イントラ予測処理ユニット46は、現在のブロックを符号化するために使用すべきイントラ予測モードを決定し得る。いくつかの例では、イントラ予測処理ユニット46は、例えば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在のブロックを符号化し得、イントラ予測ユニット処理46は、テストされたモードから使用すべき適切なイントラ予測モードを選択し得る。例えば、イントラ予測処理ユニット46は、様々なテストされたイントラ予測モードに関する(for)レート−歪み分析を使用してレート−歪み値を計算し得、テストされたモードの中で最良のレート−歪み特性を有するイントラ予測モードを選択し得る。レート−歪み分析は、一般に、符号化されたブロックと、符号化されたブロックを生成するために符号化された元の符号化されていないブロックとの間の歪み(または誤差)の量、ならびに、符号化されたブロックを生成するために使用されたビットレート(すなわち、ビット数)を決定する。イントラ予測処理ユニット46は、どのイントラ予測モードがブロックのための最良のレート−歪み値を示すかを決定するために、様々な符号化されたブロックに関する歪みおよびレートから比を計算し得る。
[0073]ブロックのためのイントラ予測モードを選択した後、イントラ予測処理ユニット46は、エントロピー符号化ユニット56にブロックのための選択されたイントラ予測モードを示す情報を提供し得る。エントロピー符号化ユニット56は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオ符号器20は、様々なブロックのための符号化コンテキストの定義のみならず、最確イントラ予測モード(most probable intra-prediction mode)のインジケーション、イントラ予測モードインデックステーブル、およびコンテキストの各々に対して使用すべき修正されたイントラ予測モードインデックステーブルを、送信されたビットストリーム構成データ中に含め得る。ビットストリーム構成データは、複数のイントラ予測モードインデックステーブルと、複数の修正されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)とを含み得る。
[0074]予測処理ユニット41が、インター予測またはイントラ予測のいずれかを介して現在のビデオブロックのための予測ブロックを生成した後、ビデオ符号器20は、現在のビデオブロックから予測ブロックを減算することによって、残差ビデオブロックを形成する。残差ブロックにおける残差ビデオデータは、1つまたは複数のTUに含まれ、変換処理ユニット52に適用され得る。変換処理ユニット52は、離散コサイン変換(DCT)または概念的に同様の変換などの変換を使用して、残差ビデオデータを残差変換係数に変換する。変換処理ユニット52は、残差ビデオデータを、ピクセル領域から、周波数領域のような変換領域に変換し得る。
[0075]変換処理ユニット52は、結果として得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、ビットレートをさらに低減させるために、変換係数を量子化する。量子化プロセスは、係数の一部または全てに関連付けられたビット深度を低減させ得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。いくつかの例では、量子化ユニット54は、その後、量子化された変換係数を含む行列の走査を実行し得る。代替として、エントロピー符号化ユニット56が走査を実行し得る。
[0076]量子化に続いて、エントロピー符号化ユニット56は、量子化された変換係数をエントロピー符号化する。例えば、エントロピー符号化ユニット56は、コンテキスト適応可変長コーディング(CAVLC)、コンテキスト適応バイナリ算術コーディング(CABAC)、シンタックスベースのコンテキスト適応バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディング、または別のエントロピー符号化技法を実行し得る。エントロピー符号化ユニット56によるエントロピー符号化に続いて、符号化されたビットストリームは、宛先デバイス14に送信されるか、または宛先デバイス14による後の送信または取り出しのためにアーカイブ/記憶され得る。エントロピー符号化ユニット56はまた、コーディングされている現在のビデオスライスのための動きベクトルおよび他のシンタックス要素をエントロピー符号化し得る。
[0077]逆量子化ユニット58および逆変換処理ユニット60は、参照ピクチャの参照ブロックとして後に使用するためのピクセル領域における残差ブロックを再構築するために、それぞれ逆量子化および逆変換を適用する。動き補償ユニット44は、参照ピクチャリスト内の参照ピクチャのうちの1つの予測ブロックに残差ブロックを加算することによって、参照ブロックを計算し得る。動き補償ユニット44はまた、動き推定において使用するためのサブ整数ピクセル値を計算するために、再構築された残差ブロックに1つまたは複数の補間フィルタを適用し得る。加算器62は、ALFユニット64のための参照ブロックを生成するために、動き補償ユニット44によって生成された動き補償された予測ブロックに再構築された残差ブロックを加算する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するための参照ブロックとして動き推定ユニット42および動き補償ユニット44によって使用される前に、ALFユニット64においてフィルタされ、DPB66において記憶され得る。
[0078]ALFユニット64は、ここで説明される様々な技法を含む、様々なALFおよびGALF動作を実行し得る。本開示で説明されるALFおよびGALF強化をサポートするコンポーネント(例えば、図15を参照)を含む、ALFユニット64によってサポートされる様々な動作の態様が、以下でより詳細に説明される。さらに、ALFユニット64は、図16、図18、および図19で説明される符号化方法のうちの任意のものを実行し得る。
[0079]ビデオ復号器30に関連するさらなる詳細が、図2Bを参照して以下で提供される。ビデオ復号器30は、符号化されたビットストリームを受信するビデオデータメモリ78、エントロピー復号ユニット80、予測処理ユニット81、逆量子化ユニット86、逆変換処理ユニット88、加算器90、ALFユニット92、およびDPB94を含む。予測処理ユニット81は、動き補償ユニット82およびイントラ予測処理ユニット84を含む。ビデオ復号器30は、いくつかの例では、図2Aからのビデオ符号器20に関して説明された符号化パスとは概して逆の復号パスを実行し得る。
[0080]復号プロセス中、ビデオ復号器30は、ソースデバイス12におけるビデオ符号器20によって送られた符号化されたビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化されたビデオビットストリームを受信する。ビデオ復号器30は、ソースデバイス12から符号化されたビデオビットストリームを受信し得るか、あるいは、サーバ、媒体認識ネットワーク要素(MANE)、ビデオエディタ/スプライサ、または上記で説明された技法のうちの1つまたは複数をインプリメントするように構成された他のそのようなデバイスなどの、ネットワークエンティティ(図示せず)から符号化されたビデオビットストリームを受信し得る。ネットワークエンティティは、ソースデバイス12を含むことも含まないこともある。いくつかのビデオ復号システムでは、ネットワークエンティティおよび宛先デバイス14におけるビデオ復号器30は、別個のデバイスの一部であり得、一方、他の事例では、ネットワークエンティティに関して説明される機能は、ビデオ復号器30を備える同じデバイスによって実行され得る。
[0081]ビデオ復号器30のエントロピー復号ユニット80は、量子化された係数、動きベクトル、および他のシンタックス要素を生成するために、ビットストリームをエントロピー復号する。エントロピー復号ユニット80は、予測処理ユニット81に動きベクトルおよび他のシンタックス要素を転送する。ビデオ復号器30は、ビデオスライスレベルおよび/またはビデオブロックレベルにおいてシンタックス要素を受信し得る。エントロピー復号ユニット80は、固定長のシンタックス要素と可変長のシンタックス要素の両方を処理および構文解析し得る。
[0082]ビデオスライスがイントラコーディングされた(I)スライスとしてコーディングされるとき、予測処理ユニット81のイントラ予測処理ユニット84は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの以前に復号されたブロックからのデータとに基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコーディングされた(すなわち、B、P、またはGPB)スライスとしてコーディングされるとき、予測処理ユニット81の動き補償ユニット82は、エントロピー復号ユニット80から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリスト内の参照ピクチャのうちの1つから生成され得る。ビデオ復号器30は、DPB94に記憶された参照ピクチャに基づいて、デフォルトの構築技法を使用して、参照フレームリスト、すなわち、リスト0およびリスト1を構築し得る。
[0083]動き補償ユニット82は、動きベクトルと他のシンタックス要素とを構文解析することによって、現在のビデオスライスのビデオブロックのための予測情報を決定し、復号されている現在のビデオブロックのための予測ブロックを生成するために予測情報を使用する。例えば、動き補償ユニット82は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(例えば、イントラまたはインター予測)と、インター予測スライスタイプ(例えば、Bスライス、Pスライス、またはGPBスライス)と、スライスのための1つまたは複数の参照ピクチャリストのための構築情報と、スライスの各インター符号化されたビデオブロックのための動きベクトルと、スライスの各インターコーディングされたビデオブロックのためのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報とを決定するために、パラメータセット中の1つまたは複数のシンタックス要素を使用し得る。
[0084]動き補償ユニット82はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット82は、参照ブロックのサブ整数ピクセルについての補間された値を計算するために、ビデオブロックの符号化中にソースデバイス12におけるビデオ符号器20によって使用された補間フィルタを使用し得る。このケースでは、動き補償ユニット82は、受信されたシンタックス要素から、ソースデバイス12におけるビデオ符号器20によって使用された補間フィルタを決定し得、予測ブロックを生成するために、この補間フィルタを使用し得る。
[0085]逆量子化ユニット86は、ビットストリームにおいて提供されかつエントロピー復号ユニット80によって復号された、量子化された変換係数を逆量子化、すなわち量子化解除する。逆量子化プロセスは、量子化の程度、また同様に、適用されるべき逆量子化の程度を決定するために、ビデオスライス中の各ビデオブロックについて、ソースデバイス12におけるビデオ符号器20によって計算された量子化パラメータの使用を含み得る。逆変換処理ユニット88は、ピクセル領域における残差ブロックを生成するために、逆変換(例えば、逆DCTまたは他の好適な逆変換)、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。
[0086]動き補償ユニット82が、動きベクトルと他のシンタックス要素とに基づいて現在のビデオブロックのための予測ブロックを生成した後、ビデオ復号器30は、逆変換処理ユニット88からの残差ブロックを、動き補償ユニット82によって生成された対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器90は、この加算演算を実行する1つまたは複数のコンポーネントを表す。所望される場合、およびALFユニット92に加えて、(コーディングループ中またはコーディングループ後のいずれかの)ループフィルタもまた、ピクセル遷移を平滑化するために、または別様にビデオ品質を改善するために使用され得る。例えば、非ブロック化フィルタおよびサンプル適応オフセット(SAO)フィルタなどの1つまたは複数のループフィルタが、ALFユニット92に加えて使用され得る。その後、所与のフレームまたはピクチャ中の復号されたビデオブロックは、後続の動き補償のために使用される参照ピクチャを記憶するDPB94に記憶される。DPB94はまた、図1に示されるディスプレイデバイス32のようなディスプレイデバイス上での後の提示のために、復号されたビデオを記憶する。
[0087]ALFユニット92は、ここで説明される様々な技法を含む、様々なALFおよびGALF動作を実行し得る。本開示で説明されるALFおよびGALF強化をサポートするコンポーネント(例えば、図15を参照)を含む、ALFユニット92によってサポートされる様々な動作の態様が、以下でより詳細に説明される。さらに、ALFユニット92は、図17、図20、および図21で説明される符号化方法のうちの任意のものを実行し得る。
[0088]本開示のALFおよびGALF技法は、ソースデバイス12のようなビデオ符号化デバイス、宛先デバイス14のようなビデオ復号デバイスによって、または、典型的に「コーデック」と呼ばれるビデオ符号化/復号デバイスによって実行され得る。さらに、本開示のALFおよびGALF技法はまた、ビデオプリプロセッサ(例えば、図15の(1つまたは複数の)プロセッサ1505を参照)によっても実行され得、それは、図2A、図2B、および図15に関連して説明されるALFユニット64および92の機能のうちの少なくともいくつかをインプリメントし得る。
[0089]図3は、基地局105と、ワイヤレス通信デバイス115−aおよび115−bとを含むワイヤレスネットワーク300を示す。ワイヤレスネットワーク300は、図1のシステム100の一部を表し得る。上記で説明されたように、符号化されたビデオデータ(例えば、コーディングされたビデオデータを有する符号化されたビットストリーム)は、ワイヤレスネットワーク300のようなワイヤレスネットワークを介して送信され得る。
[0090]基地局105は、ワイヤレス通信デバイス115−aと115−bの両方が、通信リンク125を使用して基地局105と通信することを可能にするカバレッジ140を提供する。ワイヤレス通信デバイス115−aおよび115−bは、基地局105を通じて互いに通信し得、または基地局105を通じて遠隔デバイスと通信することが可能であり得る。ワイヤレス通信デバイス115−aおよび115−bによる通信は、セルラ通信規格、または何らかの他のワイヤレス通信規格に準拠して構成および処理された(例えば、変調された)信号を使用し得る。一例では、ワイヤレス通信デバイス115−aおよび115−bのうちの1つは、異なる基地局を基地局105と通信させることによって、その基地局のカバレッジ下にある別のワイヤレス通信デバイスと通信し得る。別の例では、ワイヤレス通信デバイス115−aおよび115−bのうちの1つは、基地局105を通じて、サーバ、データベース、ネットワーク記憶デバイス、またはその他任意のタイプの非モバイル宛先デバイスと通信し得る。
[0091]1つのシナリオでは、ワイヤレス通信デバイス115−aまたはワイヤレス通信デバイス115−bのいずれかが、送信またはソースデバイス(例えば、送信機)として動作し得る。このようなシナリオでは、ワイヤレス通信デバイスは、ワイヤレス通信デバイスの一部であるソースデバイス12を使用してビデオデータを符号化し得る。符号化されたビデオデータは、宛先デバイスにワイヤレスネットワーク300を介して送信され得る。ビデオデータを符号化するために、ワイヤレス通信デバイスは、ソースデバイス12におけるビデオ符号器20およびALUユニット64を使用する。
[0092]別のシナリオでは、ワイヤレス通信デバイス115−aまたはワイヤレス通信デバイス115−bのいずれかが、受信または宛先デバイス(例えば、受信機)として動作し得る。このようなシナリオでは、ワイヤレス通信デバイスは、ワイヤレス通信デバイスの一部である宛先デバイス14を使用してビデオデータを復号し得る。ビデオデータを復号するために、ワイヤレス通信デバイスは、宛先デバイス14におけるビデオ復号器30およびALUユニット92を使用する。
[0093]なお別のシナリオでは、ワイヤレス通信デバイス115−aは、送信またはソースデバイスとして動作し得、ワイヤレス通信デバイス115−bは、受信または宛先デバイスとして動作し得る。このようなシナリオでは、ワイヤレス通信デバイス115−aは、ワイヤレス通信デバイス115−aの一部であるソースデバイス12におけるビデオ符号器20およびALFユニット64を使用してビデオデータを符号化し得、ワイヤレス通信デバイス115−bは、ワイヤレス通信デバイス115−bの一部である宛先デバイス14におけるビデオ復号器30およびALFユニット92を使用して符号化されたビデオデータを復号し得る。
[0094]図3に関連して上記で説明されたシナリオは、例示として提供されており、限定するように意図されるものではない。ワイヤレス通信デバイス115−aまたは115−bは、ソースデバイス12(およびそれぞれにビデオ符号器20およびALFユニット64)であり得るかまたはそれを含み得、宛先デバイス14(およびそれぞれにビデオ復号器30およびALFユニット92)であり得るかまたはそれを含み得、あるいはソースデバイス12と宛先デバイス14の両方であり得るかまたはそれらを含み得る。
[0095]本開示におけるALFおよびGALF技法は、様々なビデオコーディング規格に関連して説明される。ビデオコーディング規格には、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、および、そのスケーラブルビデオコーディング(SVC)拡張とマルチビュービデオコーディング(MVC)拡張とを含むITU−T H.264(ISO/IEC MPEG−4 AVCとしても知られる)が含まれる。
[0096]これらのビデオコーディング規格に加えて、新しいビデオコーディング規格、すなわち高効率ビデオコーディング(HEVC)が、ITU−Tビデオコーディングエキスパートグループ(VCEG)およびISO/IECモーションピクチャエキスパートグループ(MPEG)のビデオコーディング共同研究部会(JCT−VC)によって開発されてきた。HEVC WDと呼ばれる、最新のHEVCドラフト仕様は、一般に入手可能である(例えば、http://phenix.int-evry.fr/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC-N1003-v1.zipを参照)。HEVC規格は、2013年1月に完成された。
[0097]ある特定のグループ、すなわちITU−T VCEG(Q6/16)およびISO/IEC MPEG(JTC 1/SC 29/WG 11)は、(スクリーンコンテンツコーディングおよびハイダイナミックレンジコーディングについてのその現在の拡張と近い将来の拡張とを含む)現在のHEVC規格のそれを著しく超過し得る圧縮能力を有する将来のビデオコーディング技術の標準化を考慮している。これらのグループは、この分野におけるそれらの専門家によって提案された圧縮技術設計を評価するために、JVET(Joint Video Exploration Team)として知られる共同コラボレーションの取り組みにおいて協働している。参照ソフトウェアの最新のバージョン、すなわち、Joint Exploration Model 3またはJEM 3は、一般に入手可能である(例えば、https://jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/tags/HM-16.6-JEM-3.0/を参照)。
[0098]HEVC規格は、イントラ予測をサポートし、それは、その空間的に隣接する再構築された画像サンプル(例えば、ピクセル)を使用して、画像ブロック予測を実行する。16×16画像/ビデオブロックのためのイントラ予測の典型的な例が、図4のダイヤグラム400において示される。ダイヤグラム400では、イントラ予測を用いて、16×16画像/ビデオブロック(黒い太線の四角)が、(破線の矢印によって示される)選択された予測方向に沿って、上/上部(above/top)および左に隣接する再構築されたサンプル(例えば、参照サンプル)によって予測される。
[0099]加えて、HEVCでは、ルーマブロック(例えば、ルーマ成分の画像/ビデオブロック)のイントラ予測は、35通りのモードを含む。図5のダイヤグラム500に示されるこれらのモードは、平面モード(0)、DCモード(1)、および33通りの角度モードを含む。HEVCにおいて定義されるイントラ予測の35通りのモードは、下記表1に示されるようにインデックス付けされる。
[00100]平面モード(0)の場合、これは、典型的に最もよく使用されるイントラ予測モードであり、予測サンプルは、図6のダイヤグラム600において示されるように生成される。N×Nブロックのための平面モード予測を実行するために、(x,y)に位置する各サンプルpxy(例えば、図6のサンプル610を参照)について、予測値は、バイリニアフィルタを用いて、4つの特定の隣接する再構築されたサンプル、すなわち、参照サンプルを使用して計算される。4つの参照サンプルは、右上の再構築されたサンプル(TR)、左下の再構築されたサンプル(BL)、rx,−1についてTによって示される、現在のサンプルの同じ列に位置する再構築されたサンプル、およびr−1,yについてRによって示される、現在のサンプルと同じ行に位置する再構築されたサンプルを含む。平面モードは、下記の式(1)に示されるように公式化され得る:
[00101]DCモード(1)の場合、予測ブロックは、隣接する再構築されたサンプルの平均値で単純に埋められる。一般に、平面モードとDCモードの両方が、平滑に変化するおよび一定の画像領域をモデル化するために適用される。
[00102]上記で説明されたように全部で33通りの異なる予測方向を含む、HEVCにおける角度イントラ予測モードの場合、イントラ予測プロセスは、次の通り説明される。各所与の角度イントラ予測について、イントラ予測方向は、例えば、図5に従って、適宜に識別され得る。例えば、イントラモード10は、純水平(pure horizontal)の予測方向に対応し、一方、イントラモード26は、純垂直(pure vertical)の予測方向に対応する。予測ブロックの各サンプルについて、特定のイントラ予測方向が与えられると、図7のダイヤグラム700における例に示されるように、サンプルの座標(x,y)が、予測方向に沿って隣接する再構築されたサンプルの行/列に最初に投影される。サンプル710の座標(x,y)が、2つの隣接する再構築されたサンプルLおよびRの間の分数位置(fractional position)αに投影されると仮定すると、(x,y)の予測値は、下記の式(2)によって示されるように、2タップバイリニア補間フィルタを使用して計算される:
[00103]浮動小数点演算を回避するために、HEVCでは、式(2)における計算は、下記の式(3)によって示されるように、整数演算を使用して近似され得る:
ここで、aは、32αに等しい整数である。
[00104]HEVCでは、インループ適応フィルタの使用が評価されたが、最終版には含まれなかった。ビデオコーディングの分野では、復号されたビデオ信号の品質を向上させるために、フィルタリングを適用することは一般的である。フィルタは、フィルタされたピクチャまたはフレームが将来のフレームの予測のために使用されないポストフィルタ(post-filter)として、またはフィルタされたピクチャまたはフレームが将来のフレームを予測するために使用される(例えば、イントラ予測)、インループフィルタとして適用され得る。フィルタは、例えば、元の信号またはサンプルと、復号されたフィルタされた信号またはサンプルとの間の誤差を最小限にすることによって設計され得る。変換係数と同様に、フィルタh(k,l)、k=−K,...,K,l=−K,...Kの係数は、式(4)に示されるように、量子化コーディングされ、復号器に送られる:
式(4)におけるnormFactorは、通常、2に等しい。normFactorの値が大きいほど、量子化はより正確であり、量子化されたフィルタ係数f(k,l)は、より良好な性能を提供する。他方では、normFactorのより大きい値は、送信すべきより多くのビットを必要とする係数f(k,l)を生成する。
[00105]復号器(例えば、ビデオ復号器30)では、下記の式(5)に示されるように、復号されたフィルタ係数f(k,l)が、再構築された画像R(i,j)に適用される:
ここで、iおよびjは、フレーム内のピクセルの座標である。
[00106]適応ループフィルタ(ALF)は、JEM 2.0において用いられ、基本的な概念は、HM−3におけるブロックベースの適応を用いたALFと同様である。ルーマ成分について、ピクチャ全体における4×4ブロックは、1次元(1D)ラプラシアン方向(Laplacian direction)(最大3つまでの方向)および2次元(2D)ラプラシアンアクティビティ(最大5つまでのアクティビティ値)に基づいて分類される。方向Dirおよび非量子化アクティビティActの計算は、式(6)〜式(9)に示され、ここで、
は、4×4ブロックの左上に対する相対座標(i,j)を有する再構築されたピクセルを示す。Actは、両端値を含む0〜4の範囲にさらに量子化される。
[00107]方向Dirは、サンプルの1D方向を指し得る。例えば、同じ水平線上に位置するサンプルは、水平方向を有することになり、同じ垂直線上に位置するサンプルは、垂直方向を有することになる。アクティビティは、現在のサンプルと、サンプルの近隣との間の差を指し得る。ここで使用される場合、「サンプル」および「ピクセル」という用語は、交換可能であり得る。
[00108]全体で、各ブロックは、15(5×3)個のクラスのうちの1つにカテゴリ分類され得、インデックスが、ブロックのDirおよびActの値に従って、各4×4ブロックに割り当てられる。グループインデックスをCによって示し、
に等しく設定され、ここにおいて、
は、Actの量子化された値である。したがって、最大15セットまでのALFパラメータが、ピクチャのルーマ成分のためにシグナリングされ得る。シグナリングコストを節約するために、これらグループは、グループインデックス値に沿って(along)マージされ得る。各マージされたグループについて、1セットのALF係数がシグナリングされ得る。最大3つまでの円対称フィルタ形状(フィルタサポートとも呼ばれる)がサポートされる。例えば、図8Aは、第1のフィルタサポート、すなわち、5×5ダイヤモンド形状のフィルタサポートのダイヤグラム800を示す。図8Bおよび図8Cは、ダイヤグラム810および820において、それぞれ第2のフィルタサポート(7×7ダイヤモンド形状のフィルタサポート)および第3のフィルタサポート(トランケートされた(truncated)9x9ダイヤモンド形状のフィルタサポート)を示す。
[00109]ピクチャ中の両方のクロマ成分(例えば、Cb、Cr)のために、ALF係数の単一のセットが適用され、5×5ダイヤモンド形状のフィルタが常に使用される。
[00110]復号器側において、各ピクセルサンプル
がフィルタされ、式(10)に示されるように、ピクセル値I′i,jをもたらし、ここで、Lはフィルタ長を示し、fm,nはフィルタ係数を表し、oはフィルタオフセットを示す。
[00111]現在のJEM2.0では、BDによって示されるビット深度は、9に設定され、これは、フィルタ係数が、[−256,256]の範囲にあり得ることを意味する。
[00112]現在の設計では、2つのクロマ成分について、最大1つまでのフィルタのみがサポートされることに留意されたい。
[00113]現在のALFにおける重要な態様が、フィルタ係数のシグナリングである。
[00114]フィルタの総数:フィルタの総数(または、マージされたグループの総数)は、ALFが1つのスライスに対してイネーブルにされたとき、最初にシグナリングされ得る。それは、ルーマ成分に適用される。クロマ成分については、1つのフィルタのみが適用され得るので、このような情報をシグナリングする必要はない。
[00115]フィルタサポート:3つのフィルタサポート(例えば、図8A〜図8Cを参照)のインデックスがシグナリングされ得る。
[00116]フィルタインデックス:Cの非連続値を有するクラスがマージされ得、すなわち、同じフィルタを共有し得る。それがマージされているか否かを示すために各クラスの1つのフラグをコーディングすることによって、フィルタインデックスが導出され得る。
[00117]froceCoeff0フラグ:froceCoeff0フラグは、フィルタのうちの少なくとも1つがコーディングされる必要がないかどうかを示すために使用され得る。このフラグが0に等しいとき、フィルタは全て、コーディングされる必要がある。このフラグが1に等しいとき、CodedVarBinによって示される、各マージされたグループの1つのフラグが、フィルタがシグナリングされるべきか否かをフィルタに示すためにさらにシグナリングされる。フィルタがシグナリングされないとき、これは、フィルタに関連付けられたフィルタ係数が全て0に等しいことを意味する。
[00118]予測方法:フィルタの複数のグループがシグナリングされる必要があるとき、2つの方法のうちの1つが使用され得る。
[00119]第1の方法では、フィルタは全て、フィルタ情報に直接的にコーディングされる。このケースでは、例えば、フィルタ係数の値は、いかなる予測符号化技法も使用することなく、ビットストリームに符号化され得る。
[00120]第2の方法では、第1のフィルタのフィルタ係数が、直接的にコーディングされる。残りのフィルタについては、それらは、フィルタ情報に予測的に(predictively)コーディングされる。このケースでは、フィルタ係数の値は、以前にコーディングされたフィルタに関連付けられたフィルタ係数に関連した(relative to)差分または残差値によって定義され得る。以前にコーディングされたフィルタは、直近のものであり、すなわち、現在のフィルタと、それを予測したもの(its predictor)とのフィルタインデックスは、連続している。
[00121]上記の2つの方法のうちの1つの使用を示すために、マージされたグループの数が1より大きく、froceCoeff0が0に等しいとき、1つのフラグがコーディングされる。
[00122]ゴロムコーディングを用いた(with)フィルタ係数:1つの位置と、DCフィルタ係数の位置との間の距離に基づいて、1つのフィルタサポートが複数のカテゴリに分割され得る。一例では、3つのカテゴリを有する7×7ダイヤモンド形状の対称フィルタが、図9のダイヤグラム900に図示される。各正方形は、1つのフィルタ係数を示し、同じ背景色を有する正方形は、同じゴロムパラメータを用いてコーディングされる。
[00123]フィルタ係数のシグナリングは、2つの部分から成る。シグナリングの第1の部分は、ゴロムパラメータを含む。ゴロムパラメータの1つの値(kMinによって示される)が、最初にシグナリングされ、各カテゴリのための1ビットフラグによって後続される。1ビットフラグは、カテゴリi(図9の7×7ダイヤモンド形状の対称フィルタサポートの場合、iは、両端値を含む1〜3)のパラメータが、iが1より大きいとき、以前のカテゴリ(i−1)のために使用されたゴロムパラメータと比較して、または、iが1に等しいとき、kMinと比較して、同じであるかまたは1だけ増加したかを示す。
[00124]シグナリングの第2の部分は、係数を含む。選択されたゴロムパラメータに基づいて、係数の絶対値がコーディングされ、符号フラグによって後続される。
[00125]現在のALFに関連付けられた別の態様が、フィルタ係数の時間的予測である。参照ピクチャのALF係数は、記憶され、現在のピクチャのALF係数として再利用されることが可能である。現在のピクチャのために、参照ピクチャのために記憶されたALF係数が使用され得、したがって、ALF係数シグナリングをバイパスすることが可能であり得る。このケースでは、参照ピクチャのうちの1つに対する1つのインデックスのみがシグナリングされる必要があり、示された参照ピクチャの記憶されたALF係数は、現在のピクチャのために単純に引き継がれる。時間的予測の使用を示すために、インデックスを送る前に、1つのフラグが最初にコーディングされ得る。
[00126]現在のALFでは、フィルタサポートは、各スライスについて、3つのフィルタサポート(例えば、図8A〜図8Cを参照)のうちの1つが選択されることになるように、ルーマ成分についてはスライスごとに選択されることに留意することが重要である。しかしながら、クロマ成分については、使用される唯一のフィルタサポートは、5×5ダイヤモンド形状のフィルタサポートである。クロマ情報は、典型的にルーマ情報よりも小さいので、より大きいフィルタサポートは、必要とされない可能性があり、それはまた、復号器の複雑さを増す可能性がある。
[00127]上記で説明されたように、幾何学的変換ベースのALF(GALF)は、特に、(適応ループフィルタリングが適用される前に)再構築されたサンプルの勾配の向きに依存して、フィルタサポートにおけるサンプルに適用されることになる幾何学的変換の導入によって、ALFに対するいくつかの改善を提供する。GALFは、JEMの最新のバージョン、すなわち、JEM3.0に採用されている。GALFでは、分類は、対角勾配を考慮することによって修正され、その後、幾何学的変換が、フィルタ係数に適用され得る。各2×2ブロックは、その方向性と、アクティビティの量子化された値とに基づいて、25個のクラスのうちの1つにカテゴリ分類される。GALF動作に関するさらなる詳細が、以下で提供される。
[00128]既存または現在のALFの設計と同様に、GALFにおける分類は、依然として、各N×Nルーマブロックの1Dラプラシアン方向および2Dラプラシアンアクティビティに基づく。しかしながら、方向とアクティビティの両方の定義が、ローカル特性をより良くキャプチャするために修正されている。最初に、既存のALFにおいて使用される水平および垂直勾配に加えて、2つの対角勾配の値が、1Dラプラシアンを使用して計算される。式(11)〜(14)から見られるように、ターゲットピクセルをカバーする6×6ウィンドウ内の全てのピクセルの勾配の和が、ターゲットピクセルの表された勾配(represented gradient)として用いられる。いくつかのインプリメンテーションでは、6×6のウィンドウサイズは、複雑さとコーディング性能との間の良好なトレードオフを提供し得る。各ピクセルは、4つの勾配値に関連付けられるとともに、垂直勾配がgによって示され、水平勾配がgによって示され、135度対角勾配がgd1によって示され、45度対角勾配がgd2によって示される。
式(11)〜(14)におけるインデックスiおよびjは、2×2ブロックにおける左上ピクセルの座標を指す。
[00129]方向性Dを割り当てるために、式(15)におけるRh,vによって示される、水平および垂直勾配の最大値と最小値の比、および式(16)におけるRd0,d1によって示される、2つの対角勾配の最大値と最小値の比が、2つのしきい値tおよびtを用いて、互いに比較される。
[00130]水平/垂直および対角勾配の検出された比を比較することによって、5つ方向モード、すなわち、両端値を含む[0,4]の範囲内のDが、式(17)において定義される。Dの値およびそれらの物理的意味が、下記表2で説明される。表2に示される情報に基づいて、より大きい重みが1つの方向におけるサンプルのために必要であるかどうか、および/または、より小さい重みが別の方向におけるサンプルのために必要であるかどうかを決定することが可能になり得る。
[00131]アクティビティ値Aは、式(18)に示されるように計算される:
ここで、Aは、両端値を含む0〜4の範囲にさらに量子化され、量子化された値は、
として示される。
[00132]したがって、GALFスキームでは、各N×Nブロックは、下記の式(19)に示されるように、その方向性Dと、アクティビティの量子化された値
とに基づいて、25個のクラスのうちの1つにカテゴリ分類または分類され得る:
[00133]GALFの特徴のうちの1つが、幾何学的変換の使用である。各カテゴリについて、フィルタ係数の1つのセットがシグナリングされ得る。同じカテゴリインデックスでマーク付けされたブロックの異なる方向をより良く区別するために、変換なし、対角、垂直反転、および回転を含む、4つの幾何学的変換が導入される。5×5フィルタサポートの例が、図10のダイヤグラム1000に例示され、3つの幾何学的変換が、図11A〜図11Cに図示されるとともに、図11Aのダイヤグラム1100が、対角変換の例を示し、図11Bのダイヤグラム1110が、垂直反転の例を示し、図11Cのダイヤグラム1120が、回転変換の例を示す。図11A〜図11Cを図10と比較すると、下記の式(20)に示されるような、幾何学的変換に関する式を得ることが容易である:
ここで、Kはフィルタのサイズであり、0≦k,l≦K−1が係数座標であり、したがって、ロケーション(0,0)が左上隅にあり、ロケーション(K−1,K−1)が右下隅にある。既存のALFでのように、ダイヤモンド形状のフィルタサポートが使用されるとき、フィルタサポートの外にある座標を有する係数は、単純に0に設定され得ることに留意されたい。幾何学的変換インデックスを示す1つのアプローチが、追加のオーバヘッドを回避するために、それを暗黙的に導出することである。GALFでは、変換は、そのブロック(例えば、ビデオブロック)のために計算された勾配値に依存して、フィルタ係数f(k,l)に適用される。変換と、式(11)〜(14)を使用して計算された4つの勾配との間の関係が、表3に説明される。要約すると、変換は、2つの勾配(水平および垂直、または45度および135度の勾配)のうちのどちらがより大きいかに基づく。この比較に基づいて、より正確な方向情報が抽出され得る。したがって、異なるフィルタリング結果が、変換により得られ得るとともに、フィルタ係数のオーバヘッドは、増大される必要がない。
[00134]フィルタサポートに関しては、HMにおけるALFと同様に、GALFもまた、5×5および7×7ダイヤモンド形状のフィルタサポートを採用する(例えば、図8Aおよび図8Bを参照)。加えて、元の9×7のトランケートされたダイヤモンド形状のフィルタサポート(例えば、図8Cを参照)は、9×9ダイヤモンド形状のフィルタサポートによって置き換えられる。
[00135]加えて、時間的予測が利用可能でないときに(イントラコーディングされたフレーム)、コーディング効率を改善するために、16個の固定フィルタのセットが各クラスに割り当てられ得る。固定フィルタの使用を示すために、各クラスのためのフラグと、もし必要であるならば、選ばれた固定フィルタのインデックスとがシグナリングされ得る。固定フィルタが所与のクラスのために選択されるときでさえも、適応フィルタの係数f(k,l)は、依然としてこのクラスのために送られ得、このケースでは、再構築された画像に適用されることになるフィルタの係数は、係数の両方のセットの和となる。いくつかのクラスが、たとえ異なる固定フィルタがそれらのために選ばれたとしても、ビットストリーム中でシグナリングされる同じ係数f(k,l)を共有し得る。いくつかのインプリメンテーションでは、固定フィルタの使用はまた、インターコーディングされたフレームにも適用され得る。
[00136]ALFと同様に、GALFにおける重要な態様が、フィルタ係数のシグナリングである。
[00137]固定フィルタからの予測パターンおよび予測インデックス:3つのケースが定義される。ケース1では、25個のクラスのいずれのフィルタも、固定フィルタから予測されない;ケース2では、25個のクラスの全てのフィルタが、固定フィルタから予測される;およびケース3では、25個のクラスのいくつかに関連付けられたフィルタが、固定フィルタから予測され、25個のクラスの残りに関連付けられたフィルタは、固定フィルタから予測されない。インデックスが、3つのケースのうちのどれが使用されているかを示すために最初にコーディングされ得る。加えて、以下の考慮事項も、適用され得る。ケース1である場合、固定フィルタのインデックスをさらにシグナリングする必要はない。ケース2である場合、各クラスのための選択された固定フィルタのインデックスがシグナリングされ得る。それ以外の場合(ケース3である場合)、各クラスのための1ビットが最初にシグナリングされ、固定フィルタが使用される場合、インデックスがさらにシグナリングされる。
[00138]DCフィルタ係数のスキッピング:全てのフィルタ係数の和が、2(ここにおいて、Kは、フィルタ係数のビット深度を示す)に等しくなければならないので、現在のピクセル(図10のCのような、フィルタサポート内の中心ピクセル)に適用されているDCフィルタ係数は、シグナリングの必要なしに導出され得る。
[00139]フィルタインデックス:フィルタ係数を表すために必要とされるビット数を低減させるために、異なるクラスがマージされ得る。しかしながら、クラスの任意のセット、式(19)で定義されたようなクラスインデックスを示すCの非連続値を有するクラスさえもが、マージされ得る。どのクラスがマージされるかの情報は、25個のクラスの各々のために、インデックスiを送ることによって提供される。同じインデックスiを有するクラスは、コーディングされた同じフィルタ係数を共有するそれらである。インデックスiは、トランケートされたバイナリ2値化(truncated binary binarization)方法またはプロセスを使用してコーディングされ、これは、次により詳細に説明される。
[00140]トランケートされたバイナリ(TB:truncated binary)2値化プロセスでは、プロセスへの入力は、値cMaxおよびsynValを有するシンタックス要素のためのTB2値化のための要求である。プロセスの出力は、シンタックス要素のTB2値化である。シンタックス要素synValのTB2値化プロセスのビンストリング(bin string)は、次の通り式(21)によって指定される:
[00141]synValが値u未満である場合、TBビンストリングは、(1<<k)−1に等しいcMax値とともに(with)、synValのためのFL2値化プロセスを呼び出すことによって導出される。それ以外の場合(synValがu以上である)、TBビンストリングは、(1<<(k+1))−1に等しいcMax値で(with)、(synVal+u)のためのFL2値化プロセスを呼び出すことによって導出される。
[00142]25個のクラスの各々のためのフィルタインデックスをコーディングするとき、cMaxは、マージング後のフィルタの総数に設定される。
[00143]ALFと同様に、forceCoef0フラグもまた使用される。このフラグが1に等しいとき、マージされたグループ(コーディングされるべき全てのフィルタ)の各々についてのCodedVarBinによって示される1ビットフラグが、シグナリングされたフィルタ係数が全てゼロであるかどうかを示すためにさらにシグナリングされる。さらに、このフラグが1に等しいとき、予測的にコーディングすること、すなわち、現在のフィルタと以前にコーディングされたフィルタとの間の差分をコーディングすることは、ディセーブルにされる。
[00144]固定フィルタからの予測が可能にされるとき、上述されたシグナリング/コーディングされるべきフィルタは、再構築された画像に適用されたフィルタと、選択された固定フィルタとの間の差分であることが留意されるべきである。
[00145]係数のような他の情報は、JEM2.0の場合と同じ方法でコーディングされ得る。
[00146]上記で説明されたように、現在のALFおよびGALF設計は、いくつかの制限を有する。留意すべき1つのトレードオフは、より大きいフィルタサポートが歪みを最小限にするために使用される場合、これは、サイド情報として送られるビット数(例えば、オーバヘッド)を増大させ得るということである。
[00147]例えば、各フレームについて、ALFまたはGALFがイネーブルにされたとき、3つの予め定義されたフィルタサポートのうちの1つが選択されシグナリングされ得る。より多くのフィルタサポートが、ローカル特性に基づいて選択され得る場合、より高いコーディング利得が達成され得る。例えば、いくつかの異なるクラスが存在し、これらのクラスの各々は、同じフィルタサポートを使用してコーディングされることになる。しかしながら、方向がほとんどないかあるいは全くないクラス(例えば、テクスチャ)については、小さいフィルタサポートが十分であり得、一方、垂直方向または強垂直方向を有するもののような他のクラスについては、垂直方向に沿ってより多くのサンプルを有することが、対称サポート領域を使用することよりも有用であり得る。
[00148]さらに、予め定義された4つの幾何学的変換(例えば、変換なし、対角、垂直反転、および回転)は、90度の転置の変更のみを考慮する。幾何学的変換インデックスをシグナリングする必要がなく、フィルタ係数の1つのセットのみが、4つの幾何学的変換のためにシグナリングされる必要があるので、4つより多くの幾何学的変換を使用することは、追加のコーディング利得をもたらし得る。
[00149]また、分類は、方向情報をキャプチャすることにおいて優れている勾配に依存する。しかしながら、HEVCイントラ予測モードにおいて使用される平面モード(0)(例えば、図5を参照)と同様に、1つのブロックが、明らかな方向を有していないが、行に沿ったプログレッシブな変化を伴うケースが存在し得る。それが平滑な領域であり、1つのブロック内のピクセルがかなり類似したサンプル値を有し得る、別のケースが存在し得る。無方向モードのこれらの2つの異なるケースは、現在のALF/GALF設計では区別されない。
[00150]最後に、現在の設計では、ピクチャ中の両方のクロマ成分のために、単一の5×5ダイヤモンド形状のフィルタのみが適用される。フィルタサポートのより柔軟なスキームが可能にされる場合、より多くのコーディング利得が、クロマ成分のために予期され得る。さらに、ルーマ成分の情報も含むことによって、クロマフィルタリングのコーディング性能が改善され得る。
[00151]これらの問題を考慮して、本開示は、幾何学的変換を拡張すること、複数のフィルタサポートのより柔軟な使用、およびクロマフィルタリングにおける改善を含む、上記で説明されたALFおよびGALF設計への様々な強化を説明する。これらの強化の詳細が、以下に提供される。以下で説明される様々な態様の各々は、個別に、または代替として、これらの態様の2つ以上の組合せにおいて適用され得ることが理解される。さらに、以下で説明される態様のうちの任意のものについて、ALF/GALF分類は、M×Nブロックに基づき得ると仮定され得、ここで、MまたはNは、例えば、1、2、または4などの、正の値である。
[00152]現在のALF/GALF設計における制限に適用され得る第1の解決策または技法では、複数のフィルタサポートが、1つのコーディングされたスライス/タイル/ピクチャ内で使用され得、フィルタサポートは、分類結果に依存し得る。スライス、タイル、ピクチャ、またはフレームは、ビデオユニットと呼ばれ得、これは順に、1つまたは複数のビデオブロックを含み得る。この第1の解決策または技法では、フィルタサポートインデックスを直接的にシグナリングすることは必要でない可能性がある。
[00153]一例では、フィルタサポートは、クラスインデックスに関連付けられ得る。
[00154]追加または代替として、フィルタサポートは、アクティビティを考慮することなく、方向性にのみ関連付けられ得る。すなわち、量子化された方向性インデックスの各々のために、1つのフィルタサポートが定義される。したがって、我々は、方向性とアクティビティの両方か、または方向性だけを考慮し得る。
[00155]追加または代替として、フィルタサポートは、(例えば、強水平/垂直または強対角のような強パターンなどの)式(17)においてDが1または3に等しいような、強方向性を表す方向性インデックスにのみ関連付けられ得る。このケースでは、他のクラスについて、それらは、同じフィルタサポートを共有し得る。
[00156]追加または代替として、フィルタサポートは、例えば、イントラ予測方向、ブロック区分サイズ、量子化パラメータ(QP)などの、符号化/復号された情報によって決定され得る。あるインプリメンテーションでは、フィルタサポートの形状は、現在のブロック/ピクセルに対して適用されるイントラ予測モードの方向に近い方向に沿って対称であり得る。あるインプリメンテーションでは、フィルタサポートは、現在のブロック/ピクセルの区分サイズがより大きい場合、より大きくなり得る。あるインプリメンテーションでは、フィルタサポートは、現在のブロックのQPがより大きい場合、より大きくなり得る。オーバヘッドは、QPに高度に依存し得、フィルタサポートのサイズは、QPのサイズに基づいて変化し得る。
[00157]一例では、複数のフィルタサポートが、1つのコーディングされたスライス/タイル/ピクチャ内の異なるクラスに適用されるとき、同じフィルタ長が適用され得、フィルタ長は、1つのコーディングされたスライス/タイル/ピクチャ内で1回シグナリングされ得る。フィルタ長は、特定のフィルタによって実行されるフィルタリングに関与するサンプルの数を指し得る。追加または代替として、フィルタ長はまた、フィルタサポートに依存し得る。各フィルタサポートについて、フィルタ長がシグナリングされる必要があり得る。
[00158]現在のALF/GALF設計における制限に適用され得る第2の解決策または技法では、複数のフィルタサポートが、1つのコーディングされたスライス/タイル/ピクチャ内で使用され得、フィルタサポートは、シグナリングされ得る。
[00159]一例では、各クラス/各方向性/各強方向性のための複数のフィルタサポートは、オフライントレーニングを通じて予め定義される。各クラス/各方向性/各強方向性のための選択されたフィルタサポートのうちの1つが、シグナリングされ得る。いくつかのケースでは、選択されたフィルタサポートのシグナリングまたはインジケーションは、フィルタサポートの対応するインデックスによるものである。例えば、方向0および4については、選択されたフィルタサポートのインデックスを送る(例えば、シグナリングする、示す)ことが可能である。
[00160]別の例では、(例えば、コーディングされたツリーユニット(CTU:coded tree unit)レベルALFにおいて)ブロックレベルALF/GALFスキームが適用される場合、異なるサイズのための複数のフィルタサポートが予め定義され得、フィルタサポートのグループが、初期グループ(例えば、デフォルトグループ)として使用され得る。ブロックレベルALF/GALFでは、各ブロック(例えば、各ビデオブロック)について、ALF/GALFを実行する(そのブロックに対してALF/GALFをイネーブルにする)か、またはALF/GALFを実行しない(そのブロックに対してALF/GALFをディセーブルにする)かを制御することが可能である。CTUレベルALFについては、各CTUは、ALF/GALFがイネーブルにされるかまたはディセーブルにされるかを示すためのフラグを有し得る。
[00161]スライス/タイル/ピクチャに対してALF/GALFを適用するとき、フィルタサポートのグループは、フィルタサポートの現在のグループにおける各フィルタサポートの選択頻度(selection frequency)に基づいて更新され得る。例えば、以前にコーディングされたブロック(例えば、コーディングされたビデオブロック)のために、最小のフィルタサポートが頻繁に選択されシグナリングされた場合、現在のブロック(例えば、ビデオブロック)をフィルタリングするとき、最大のグループフィルタサポートは、予め定義された複数のフィルタサポートのうちのより小さいフィルタサポートによって置き換えられ得る。
[00162]現在のALF/GALF設計における制限に適用され得る第3の解決策または技法では、上記で説明された様々な態様において、ローカル情報に基づく複数のフィルタサポートの使用がイネーブルにされたとき、次の2つの態様もまた適用し得る。第1に、異なるクラスのマージングプロセスは、2つのクラスに関連付けられた2つのフィルタサポートのフィルタ係数の数が同じであるときに適用され得る。第2に、異なるクラスのための2つのフィルタが異なる数のフィルタ係数に関連付けられているとき、他方のフィルタからの一方のフィルタの予測コーディングは、ディセーブルにされ得る。
[00163]現在のALF/GALF設計における制限に適用され得る第4の解決策または技法では、既存の幾何学的変換(例えば、図11A〜図11Cを参照)に加えて、45度回転の幾何学的変換が、さらに導入され得る。一例では、フィルタ係数の総数は、他の幾何学的変換のために使用されるそれらと同じに保たれる。別の例では、新しい幾何学的変換は、例えば、式(17)においてDが0に等しいときの、「無方向」カテゴリについてはイネーブルにされない。
[00164]図12Aおよび図12Bは、強対角方向のための追加のタイプの幾何学的変換を示す。例えば、図12Aは、7×7ダイヤモンド形状のフィルタサポート(変換なし)のダイヤグラム1200と、Dが3に等しく(例えば、式(17)を参照)、gd2>gd1(例えば、式(13)および式(14)を参照)の場合の幾何学的変換された7×7ダイヤモンド形状のフィルタのダイヤグラム1210とを示す。図12Bは、7×7ダイヤモンド形状のフィルタサポート(図12Aのものと同様)のダイヤグラム1220と、Dが3に等しく(例えば、式(17)を参照)、gd2>gd1(例えば、式(13)および式(14)を参照)の場合の幾何学的変換された7×7ダイヤモンド形状のフィルタのダイヤグラム1230とを示す。図12Bの例における幾何学的変換された7×7ダイヤモンド形状のフィルタについては、図12Aに示された例における幾何学的変換された7×7ダイヤモンド形状のフィルタと比較して、低減された数のフィルタ係数が必要とされ得る。
[00165]図14は、45度回転の幾何学的変換の例を例示する。図13のダイヤグラム1300は、5×5ダイヤモンド形状のフィルタサポート(変換なし)を示し、ダイヤグラム1310は、45度回転の幾何学的変換後の幾何学的変換された5×5ダイヤモンド形状のフィルタを示す。
[00166]現在のALF/GALF設計における制限に適用され得る第5の解決策または技法では、現在の行および隣接する行および/または現在の列および隣接する列のエネルギーが評価される(例えば、決定されるまたは識別される)、新しい規則が分類プロセスに導入され得る。
[00167]一例では、1つの行/列/ブロックの平滑さとして定義され得る1つの行/列のエネルギーが、評価される。
[00168]別の例では、1つの行/列のエネルギーは、現在のピクセルを含む連続したサンプルの値の平均関数(average function)として定義され得る。
[00169]別の例では、2つ以上のカテゴリが、隣接する行/列のエネルギーの類似度(similarities)に基づいて定義され得る。すなわち、エネルギーの類似度に基づいて、追加のカテゴリまたはクラスを導入することが可能である。例えば、ポテンシャル量子化(potential quantization)後に、隣接する行/列の間の差分が0に近くない場合、N×Nブロックは、1つのカテゴリに分類され得、さもなければ、差分が0に近いとき、N×Nブロックは、別のカテゴリに分類され得る。
[00170]追加または代替として、この新しい規則は、1つのブロックが「無方向」カテゴリであると分類されたとき、すなわち、式(17)においてDが0に等しいときにのみ適用され得る。
[00171]追加または代替として、分類プロセスは、変換領域において動作され得、ここで、変換プロセスは、現在のピクセル/ブロックをカバーするある特定のブロックに対して最初に適用され、その後、分類は、低頻度(low-frequency)変換係数を使用して導出され得る。例えば、1つの有意なDC係数(平坦な画像領域)のみが存在するか、あるいは1つ(または、2つまたは少数の)有意な低頻度係数(平滑に変化する画像領域)も存在する場合、異なる分類インデックスが適用され得る。
[00172]現在のALF/GALF設計における制限に適用され得る第6の解決策または技法では、隣接するピクセルと現在のピクセルとの値がチェックされる、新しい規則が分類のために導入され得る。この新しい規則では、隣接するピクセルの総数は、Cntによって示され得る。
[00173]一例では、隣接するピクセルは、現在のピクセルの上、左、下、および右側として位置する4つの隣接するピクセルとして定義される。
[00174]別の例では、規則は、現在のピクセルのサンプル値よりも大きいサンプル値を有する隣接するピクセルの数として定義され、このような数をK(両端値を含む、0...Cntである)によって示す。Kは、
になるように、さらに量子化され得る。
[00175]追加または代替として、この新しい規則は、現在のピクセルのサンプル値よりも小さいサンプル値を有する隣接するピクセルの数として定義され得る。
[00176]一例では、この新しい規則は、式(18)におけるAまたは
が、M(Mは、0から開始する)よりも小さくないときのように、高バリアンス(high variances)を有するクラスのためにのみ使用され得る。
[00177]追加または代替として、
は、下記の式(22)において説明されるように、この新しい規則を考慮することによって拡張され得る:
ここにおいて、
は、
の最大値を示し、Mおよびbは、2つの非負整数値である。
[00178]追加または代替として、式(19)において導出されたクラスインデックスCは、次のように修正され得る:
[00179]現在のALF/GALF設計における制限に適用され得る第7の解決策または技法では、ルーマ成分の処理またはフィルタリングに適用され得る上記で説明された様々な解決策または技法がまた、個別にまたはそれらの任意の組合せにおいて、両方のクロマ成分にも適用され得る。一例では、第1のクロマ成分は、Cbクロマ成分であり得、第2のクロマ成分は、Crクロマ成分であり得る。
[00180]現在のALF/GALF設計における制限に適用され得る第8の解決策または技法では、クロマフィルタリング制御が、現在の設計で行われているようなスライスレベルの代わりに、ブロックレベルにおいて実行され得る(例えば、ブロックレベル制御)。
[00181]一例では、(ブロックレベルクロマフィルタリングの)オン/オフ制御が、対応するルーマブロックに関連付けられた、イネーブルにされたまたはディセーブルにされたフィルタリングから予測または決定され得る。
[00182]別の例では、(ブロックレベルクロマフィルタリングを示す)オン/オフ制御フラグの使用が、シグナリングされ得る。あるインプリメンテーションでは、2つの色成分(例えば、2つのクロマ成分)は、別個のオン/オフ制御フラグを有し得る。代替として、オン/オフ制御フラグは、2つの色成分間で共有され得る。
[00183]現在のALF/GALF設計における制限に適用され得る第9の解決策または技法では、適応ループフィルタにおいてクロマ隣接サンプルだけを使用するのではなく、対応するルーマ成分のサンプルが、クロマフィルタリングのコーディング性能を改善するために、参照サンプルとして使用され得る。
[00184]一例では、クロマ成分のためのフィルタは、元のクロマ信号(サンプル/ピクセル)と、復号されたフィルタされたルーマ信号(サンプル/ピクセル)との間の誤差を最小限にするように構成され得る。
[00185]別の例では、4:4:4カラーフォーマットについて、式(10)に示されたピクセル/サンプル
は、ルーマ成分におけるピクセル/サンプルに対応するものである。ルーマ成分における対応するピクセルは、同じサンプリング位置におけるそれらのピクセルである。すなわち、コロケートされた(collocated)ルーマサンプルによって、隣接するクロマサンプルを置き換えることが可能であり得る。
[00186]上記の例では、対応するルーマサンプルは、クロマフィルタの品質を改善するために使用される。しかしながら、4:2:0カラーフォーマットについてなど、ルーマおよびクロマの解像度が異なるいくつかのカラーフォーマットでは、ルーマおよびクロマピクセルのサンプリング位置は、位置合わせされていない。したがって、異なる方法が、対応するルーマピクセルを導出するために必要である。
[00187]4:4:4とは異なるカラーフォーマットについての別の例では、コロケートされていないルーマおよびクロマサンプル間の対応関係が、図14Aのダイヤグラム1400における点線の円によって示される。1つの対応関係は、クロマサンプルの真上に位置するルーマサンプルを関連させることである。すなわち、使用されるべきルーマサンプルの値は、クロマサンプルの真上にあるルーマサンプルの値である。別の対応関係は、クロマサンプルの真下に位置するルーマサンプルを関連させることである。すなわち、使用されるべきルーマサンプルの値は、クロマサンプルの真下にあるルーマサンプルの値である。図14Aにおける点線の円は、対応関係が、クロマサンプルの上にあるルーマサンプルとのものであるケースと、対応関係が、クロマサンプルの下にあるルーマサンプルとのものである別のケースとを示す。
[00188]別の例では、図14Bのダイヤグラム1410において説明されるように、現在のクロマピクセルまたはサンプルの真上および真下に位置するルーマピクセルまたはサンプルが、予め定義された重み係数(例えば、1/2および1/2)を使用して、仮想ルーマピクセルまたはサンプルを生成するために使用される。
[00189]別の例では、図14Cのダイヤグラム1420において説明されるように、現在のクロマピクセルまたはサンプルを取り囲んでいる6個のルーマピクセルまたはサンプルが、予め定義された重み係数を使用して、仮想ルーマピクセルまたはサンプルを生成するために使用される。重み係数および/または周囲のまたは隣接するピクセルの数は、図14Cに示されるそれらとは異なり得ることが理解されるべきである。
[00190]追加または代替として、式(10)に示されたフィルタオフセットoが導出されない。代わりに、フィルタオフセットは、ビットストリームの一部としてシグナリングされ得る。一例では、シグナリング方法は、他のフィルタ係数をコーディングするためのものと同じであり得る。
[00191]追加または代替として、全てのフィルタ係数の和が(浮動精度(floating precision)において)1に等しくなる、または(整数精度において)2に等しくなるという、ALF/GALFにおいて使用される仮定は、適用されない可能性がある。これは、元のフィルタが同じ色成分を使用することに基づいており、提案されたアプローチは、クロマ成分を予測するためにルーマ成分を使用するからである。したがって、全てのフィルタ係数(DCフィルタ係数を含む)が、シグナリングされる必要があり得る。代替として、対称フィルタサポートが利用されるとき、非冗長のフィルタ係数のみがシグナリングされる必要がある。
[00192]追加または代替として、隣接するルーマサンプルと、ならびにALF/GALF前の現在の復号されたクロマサンプルとの両方が、フィルタリングプロセスにおいて使用され得る。
[00193]ここで使用される場合、「ルーマ」および「ルーマ成分」という用語、ならびに「クロマ」および「クロマ成分」という用語は、交換可能に使用され得る。上述されたように、「ピクセル」および「サンプル」という用語もまた、交換可能に使用され得る。したがって、「ルーマサンプル」または「ルーマピクセル」という用語は、「ルーマ成分サンプル」を指し得、「クロマサンプル」または「クロマピクセル」という用語は、「クロマ成分サンプル」を指し得る。
[00194]現在のALF/GALF設計における制限に適用され得る第10の解決策または技法では、フィルタインデックスをコーディングすることに関する。マージング後のフィルタの総数は、TotalCnt(1以上)によって、クラスインデックスは、C(0から開始する)によって、およびCに等しいインデックスを有するクラスのフィルタインデックスが、iによって示され得る。iは、両端値を含む、[0,TotalCnt−1]内にあり得ることに留意されたい。
[00195]この解決策または技法では、CがcTotalCntより小さいとき、iは、Cより大きくなり得ない(may not be larger than)ことが提案される。
[00196]追加または代替として、上記で説明されたトランケートされたバイナリ2値化方法が、フィルタインデックスをコーディングするために使用される場合、入力パラメータcMaxは、TotalCntとして固定される代わりに、min(C,TotalCnt)になるように修正され得る。ここで、関数min(・)は、2つの入力パラメータのうちのより小さい値を返す。
[00197]追加または代替として、Cが0に等しいクラスのためのフィルタインデックスをシグナリングすることは、スキップされ得る。このケースでは、フィルタインデックスは、0になるように導出される。
[00198]上記で説明された様々な解決策または技法に基づいて、これらの解決策または技法に関連付けられたデバイス、システム、および方法に関するさらなる詳細が、図15〜図21に関して以下でより詳細に説明される。さらに、「ALF」という用語を使用するとき、それは、コンテキストに従って「ALF」または「GALF]を指し得ることが理解されるべきである。したがって、上記で説明された解決策または技法が、「ALF」への強化を提供することを示すとき、それは、そのような解決策または技法が、提供されている強化のタイプに基づいて、「ALF」、「GALF」、または両方への強化を提供することを指し得る。
[00199]図15は、ここで説明される様々なALFおよびGALFの態様を実行するように構成された処理システム1500の例を示す。処理システム1500は、例えば、図3に示されたワイヤレス通信デバイス115−aおよび115−bのうちの1つに対応し得る。この点について、デバイス1500は、ビデオ符号器20とALFユニット64とを有するソースデバイス12、ビデオ復号器30とALFユニット92とを有する宛先デバイス14、またはそれぞれのビデオ復号器および符号器とALFユニットとを有するソースデバイス12と宛先デバイス14の両方をインプリメントし得る。
[00200]処理システム1500のコンポーネントおよびサブコンポーネントは、本開示の様々な態様による、ここで説明された1つまたは複数の方法(例えば、それぞれ図16〜図21における方法1600、1700、1800、1900、2000、および2100)をインプリメントまたは実行するように構成され得る。具体的には、処理システム1500のコンポーネントおよびサブコンポーネントは、ALFおよびGALF動作を強化するための技法を実行し得る。
[00201]処理システム1500の例が、メモリ1503、1つまたは複数のプロセッサ1505、およびトランシーバ1509のなどの様々なコンポーネントを含み得、これらは、1つまたは複数のバスを介して互いに通信状態にあり得、これらは、本開示の1つまたは複数の方法を含む、ここで説明されたALFおよびGALF機能および/または動作のうちの1つまたは複数をイネーブルにするために動作し得る。
[00202]トランシーバ1509は、ビデオデータを表す情報を受信する(例えば、ソースデバイスからのコーディングされたビデオデータを有する符号化されたビットストリームを受信する)ように構成された受信機(RX)1508aを含み得る。追加または代替として、トランシーバ1509は、ビデオデータを表す情報を送信する(例えば、受信または宛先デバイスに、コーディングされたビデオデータを有する符号化されたビットストリームを送信する)ように構成された送信機(TX)1508bを含み得る。受信機1508aは、無線周波数(RF)デバイスであり得、セルラまたは何らかの他のワイヤレス通信規格に準拠して、ビデオデータを表す情報を搬送する信号を復調するように構成され得る。同様に、送信機1508bは、RFデバイスであり得、セルラまたは何らかの他のワイヤレス通信規格に準拠して、ビデオデータを表す情報を搬送する信号を変調するように構成され得る。
[00203]ここで説明された様々な機能および/または動作は、1つまたは複数のプロセッサ1505に含まれるか、またはそれによって実行され得、かつ、ある態様では、単一のプロセッサによって実行され得、一方、他の態様では、機能および/または動作のうちの異なるものが、2つ以上の異なるプロセッサの組合せによって実行され得る。例えば、ある態様では、1つまたは複数のプロセッサ1505は、画像/ビデオプロセッサ、モデムプロセッサ、ベースバンドプロセッサ、またはデジタルシグナルプロセッサのうちの任意の1つまたは任意の組合せを含み得る。
[00204]1つまたは複数のプロセッサ1505は、ビデオ符号器20およびそのそれぞれのALFユニット64、ビデオ復号器30およびそのそれぞれのALFユニット92、またはビデオ符号器20とビデオ復号器30の両方を実行またはインプリメントするように構成され得る。代替として、1つまたは複数のプロセッサ1505は、モデム1507を含み得、これは、ビデオ符号器20およびそのそれぞれのALFユニット64、ビデオ復号器30およびそのそれぞれのALFユニット92、またはビデオ符号器20とビデオ復号器30の両方を実行またはインプリメントするように構成され得る。
[00205]ALFユニット64およびALFユニット92は、図15に示さるサブコンポーネントのうちの1つまたは複数をそれぞれ含み得る。1つのインプリメンテーションでは、示されるサブコンポーネントの各々は、ALFユニット64とALFユニット92の両方に含まれ、ここで、これらのサブコンポーネントの各々は、ALFユニット64を使用して任意の符号化特徴または動作を実行させることが、ALFユニット92を使用して対応する復号特徴または動作を実行させるのと一致する方法で、イネーブルまたはディセーブルにされ得る。
[00206]ALFユニット64/92は、複数のフィルタサポートコンポーネント1510、複数のフィルタサポートシグナリングコンポーネント1520、ローカル情報コンポーネント1530、45度回転コンポーネント1540、分類規則コンポーネント1550、ルーマおよびクロマアプリケーションコンポーネント1560、クロマブロックレベル制御コンポーネント1570、またはクロマフィルタリングにおけるルーマサンプルコンポーネント1580のうちの1つまたは複数を含み得る。これらサブコンポーネントの各々は、単独でハードウェアにおいて、単独でソフトウェアにおいて、またはハードウェアとソフトウェアの組合せにおいて、インプリメントされ得る。さらに、これらのサブコンポーネントのうちの2つ以上のものの特徴または機能が、組み合わされ得る。
[00207]複数のフィルタサポートコンポーネント1510は、コーディングされたスライス/タイル/ピクチャと共に使用される複数のフィルタサポートを有することに関連して上記で説明された特徴または機能のうちの1つまたは複数を実行するように構成され得、ここで、フィルタサポートは、分類結果に基づき得る。
[00208]複数のフィルタサポートシグナリングコンポーネント1520は、コーディングされたスライス/タイル/ピクチャと共に使用される複数のフィルタサポートを有することに関連して上記で説明された特徴または機能のうちの1つまたは複数を実行するように構成され得、ここで、フィルタサポートは、シグナリングされ得る(例えば、ソースデバイスにおけるビデオ符号器20から、宛先デバイス14におけるビデオ復号器30にシグナリングされる)。いくつかのインプリメンテーションでは、複数のフィルタサポートコンポーネント1510の態様および複数のフィルタサポートシグナリングコンポーネント1520の態様が、単一のコンポーネントに組み合わされ得る。
[00209]ローカル情報コンポーネント1530は、ローカル情報に基づく複数のフィルタサポートの使用をイネーブルにすることに関連して上記で説明された特徴または機能のうちの1つまたは複数を実行するように構成され得る。
[00210]45度回転コンポーネント1540は、45度回転を有する幾何学的変換を使用することに関連して上記で説明された特徴または機能のうちの1つまたは複数を実行するように構成され得る。
[00211]分類規則コンポーネント1550は、ALFまたはGALFのための分類プロセスに新しい規則を導入することに関連して上記で説明された特徴または機能のうちの1つまたは複数を実行するように構成され得、ここで、新しい規則は、行および/または列のエネルギーを評価すること、隣接するピクセルの値をチェックすること、または両方を伴う。
[00212]ルーマおよびクロマアプリケーションコンポーネント1560は、個別にまたは組合せにおいて、ルーマ成分に適用される方法がクロマ成分にも適用されることに関連して上記で説明された特徴または機能のうちの1つまたは複数を実行するように構成され得る。
[00213]クロマブロックレベル制御コンポーネント1570は、クロマフィルタリングのブロックレベル制御を有することに関連して上記で説明された特徴または機能のうちの1つまたは複数を実行するように構成され得る。
[00214]クロマフィルタリングにおけるルーマサンプルコンポーネント1580は、クロマフィルタリングのコーディング性能を改善するために、対応するルーマ成分のサンプルを使用することに関連して上記で説明された特徴または機能のうちの1つまたは複数を実行するように構成され得る。
[00215]メモリ1503は、少なくとも1つのプロセッサ1505によって実行されるアプリケーションのローカルバージョンおよび/またはここで使用されるデータを記憶するように構成され得る。メモリ1503は、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、テープ、磁気ディスク、光ディスク、揮発性メモリ、不揮発性メモリ、およびそれらの任意の組合せなどの、コンピュータまたは少なくとも1つのプロセッサ1505によって使用可能な任意のタイプのコンピュータ可読媒体を含み得る。ある態様では、例えば、メモリ1503は、ここで説明された様々なALFおよびGALF機能および/または動作をインプリメントまたは実行するために、1つまたは複数のプロセッサ1505によって実行され得る1つまたは複数のコンピュータ実行可能コードを記憶する非一時的なコンピュータ可読記憶媒体であり得る。
[00216]限定することなく、明確さのために、図16〜図21における方法が、少なくとも図1、図2A、図2B、図3、図8A〜図8C、図9、図10、図11A〜図11C、図12A、図12B、図13、図14A〜図14C、および図15を参照して上記で説明された態様のうちの1つまたは複数を参照して以下で説明され得る。
[00217]図16は、ALF/GALFにおける1つのスライス、タイル、ピクチャ、またはフレーム内で複数のフィルタサポートを使用して、ビデオデータを復号するための方法1600の例を例示するフロー図である。方法1600の態様は、宛先デバイス14、ビデオ復号器30、ALFユニット92、処理システム1500、および/または(1つまたは複数の)プロセッサ1505によって実行またはインプリメントされ得る。
[00218]ブロック1610において、方法1600は、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することを含む。ある態様では、各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する。
[00219]ブロック1620において、方法1600は、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することを含む。
[00220]ブロック1630において、方法1600は、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることを含む。
[00221]方法1600の別の態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別することを含み、再構築されたビデオユニットの各々をフィルタすることは、それぞれのフィルタサポートのうちの1つを使用して、1つの再構築されたビデオユニット内の複数のビデオブロックの各々をフィルタすることを含む。
[00222]方法1600の別の態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、再構築されたビデオユニットのうちの1つ内の複数のビデオブロックを分類することを含み、分類における複数のクラスの各々は、一意の(a unique)フィルタサポートに関連付けられている。
[00223]方法1600の別の態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、再構築されたビデオユニットのうちの1つ内の複数のビデオブロックについて、異なるフィルタサポートを識別することを含み、複数のビデオブロックのためのフィルタサポートの各々は、方向性または強方向性に関連付けられているか、1つの再構築されたビデオユニットから復号される情報に基づいているか、またはこれらの組合せである。ある態様では、1つの再構築されたビデオユニットから復号される情報は、イントラ予測方向情報、ブロック区分サイズ情報、または量子化パラメータ(QP)情報のうちの1つまたは複数を含む。
[00224]方法1600の別の態様では、方法は、コーディングされたビデオデータを有する符号化されたビットストリームと共に、各再構築されたビデオユニットについて、複数のフィルタサポートの全てに同様に適用されることになるフィルタ長のインジケーションを受信することをさらに含む。
[00225]方法1600の別の態様では、方法は、コーディングされたビデオデータを有する符号化されたビットストリームと共に、各再構築されたビデオユニットについて、複数のフィルタサポートの各々に適用されることになるフィルタ長の1つまたは複数のインジケーションを受信することをさらに含む。
[00226]方法1600の別の態様では、方法は、コーディングされたビデオデータを有する符号化されたビットストリームと共に、各再構築されたビデオユニットについて、複数のフィルタサポートの各々のインジケーションを受信することをさらに含み、ここで、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、インジケーションに少なくとも基づく。ある態様では、複数のフィルタサポートの各々は、オフライントレーニングを通じて選択されたフィルタサポートの予め定義されたグループからのものである。別の態様では、複数のフィルタサポートの各々は、1つまたは複数のクラス、1つまたは複数の方向性、または1つまたは複数の強方向性に関連付けられる。なお別の態様では、フィルタサポートの予め定義されたグループについて、再構築されたビデオユニットに関連付けられた複数のフィルタサポートのうちの1つが、再構築されたビデオユニットに関連付けられた複数のフィルタサポートのうちの他のものとは異なる。さらに、複数のフィルタサポートの各々について、方法は、予め定義されたグループからの選択されたフィルタサポートのインジケーションを受信することをさらに含み得る。
[00227]方法1600の別の態様では、再構築されたビデオユニットのうちの1つにおけるビデオブロックの各サイズについて、複数のフィルタサポートは、予め定義された、ビデオブロックサイズに関連付けられているフィルタサポートの現在のグループからのものであり、現在のグループは、現在のグループにおける各フィルタサポートの選択頻度に基づいて動的に更新される。
[00228]方法1600の別の態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含み、分類に関連付けられた異なるクラスの間でマージすることは、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタサポートの各々について同じであるときに適用可能である。
[00229]方法1600の別の態様では、方法は、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタの各々について異なるとき、予測コーディングをディセーブルにすることをさらに含み、予測コーディングをディセーブルにすることは、他方のフィルタからの2つのフィルタのうちの一方の予測コーディングをディセーブルにすることを含む。
[00230]方法1600の別の態様では、方法は、幾何学的変換のグループから45度回転を有する幾何学的変換を識別することをさらに含み、ここにおいて、幾何学的変換は、フィルタすることに関連して複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される。いくつかのインプリメンテーションでは、同じ数のフィルタ係数が、45度回転を有する幾何学的変換と、幾何学的変換のグループにおける他の幾何学的変換とに関連付けられる。いくつかのインプリメンテーションでは、方法は、関連する方向性が無方向であることを示すとき、45度回転を有する幾何学的変換をディセーブルにすることをさらに含む。
[00231]方法1600の別の態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む。いくつかのインプリメンテーションでは、現在の行または列のエネルギー、または隣接する行または列のエネルギーは、それぞれの行または列の平滑さ、またはそれぞれの行または列の現在のピクセルを含む連続したサンプルの値の平均関数として定義される。いくつかのインプリメンテーションでは、複数のビデオブロックのうちのビデオブロックの分類は、それぞれのビデオブロックの方向性が無方向であることを示すとき、エネルギーの評価に少なくとも基づく。
[00232]方法1600の別の態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む。いくつかのインプリメンテーションでは、隣接するピクセルは、現在のピクセルの上、左、下、および右に位置する4つの隣接するピクセル、現在のピクセルの値より大きい値を有する、現在のピクセルに隣り合うピクセル、または現在のピクセルの値より小さい値を有する、現在のピクセルに隣り合うピクセルを含む。
[00233]方法1600の別の態様では、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることは、各再構築されたビデオユニットのルーマ成分、各再構築されたビデオユニットの第1のクロマ成分(例えば、CbまたはCr)、各再構築されたビデオユニットの第2のクロマ(例えば、CrまたはCb)成分、各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、またはこれらの組合せのうちの1つまたは複数をフィルタすることを含む。
[00234]図17は、ALF/GALFにおける1つのスライス、タイル、ピクチャ、またはフレーム内で複数のフィルタサポートを使用してビデオデータを符号化するための方法1700の例を例示するフロー図である。方法1700の態様は、ソースデバイス12、ビデオ符号器20、ALFユニット64、処理システム1500、および/または(1つまたは複数の)プロセッサ1505によって実行またはインプリメントされ得る。
[00235]ブロック1710において、方法1700は、複数の再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することを含む。各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する。
[00236]ブロック1720において、方法1700は、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることを含む。
[00237]ブロック1730において、方法は、復号されたビデオ出力を予測プロセスに適用することを含む(例えば、ビデオ符号器20における予測処理ユニット41に適用される)。
[00238]方法1700のある態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別することを含み、再構築されたビデオユニットの各々をフィルタすることは、それぞれのフィルタサポートのうちの1つを使用して、1つの再構築されたビデオユニット内の複数のビデオブロックの各々をフィルタすることを含む。
[00239]方法1700のある態様では、方法は、複数のフィルタサポートの各々のインジケーション(例えば、シグナリング)を生成することと、コーディングされたビデオデータを有する符号化されたビットストリームと共に、インジケーションを送信することとをさらに含む。
[00240]方法1700のある態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含み、分類に関連付けられた異なるクラスの間でマージすることは、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタサポートの各々について同じであるときに適用可能である。
[00241]方法1700の別の態様では、方法は、幾何学的変換のグループから45度回転を有する幾何学的変換を識別することをさらに含み、ここで、幾何学的変換は、フィルタすることに関連して複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される。
[00242]方法1700の別の態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む。
[00243]方法1700の別の態様では、再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む。
[00244]方法1700の別の態様では、復号されたビデオ出力を生成するために、それぞれの複数のフィルタサポートを使用して、再構築されたビデオユニットの各々をフィルタすることは、各再構築されたビデオユニットのルーマ成分、各再構築されたビデオユニットの第1のクロマ成分(例えば、CbまたはCr)、各再構築されたビデオユニットの第2のクロマ(例えば、CrまたはCb)成分、各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、またはこれらの組合せのうちの1つまたは複数をフィルタすることを含む。
[00245]図18は、ALF/GALFにおけるクロマフィルタリングのブロックレベル制御を使用して、ビデオデータを復号するための方法1800の例を例示するフロー図である。方法1800の態様は、宛先デバイス14、ビデオ復号器30、ALFユニット92、処理システム1500、および/または(1つまたは複数の)プロセッサ1505によって実行またはインプリメントされ得る。
[00246]ブロック1810において、方法1800は、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することを含む。各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する。
[00247]ブロック1820において、方法1800は、再構築されたビデオユニットの各々についてのクロマ成分のためのALF(またはGALF)のブロックレベル制御をイネーブルにすることを含む。ある態様では、ALFのブロックレベル制御は、各再構築されたビデオユニット内の1つまたは複数のビデオブロックをフィルタすることと、各再構築されたビデオユニット内の1つまたは複数のビデオブロックをフィルタしないこととを含む。別の態様では、クロマ成分は、第1のクロマ成分(例えば、Cb)、第2のクロマ成分(例えば、Cr)、または第1のクロマ成分と第2のクロマ成分の両方を指す。
[00248]ブロック1830において、方法1800は、再構築されたビデオユニットについて、ALFが1つのビデオブロックに対してイネーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することと、ALFが別のビデオブロックに対してディセーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することをスキップすることとを含む。
[00249]ブロック1840において、方法1800は、ALFのイネーブルにされたブロックレベル制御に基づいて、復号されたビデオ出力を生成することを含む。
[00250]方法1800のある態様では、ALFのブロックレベル制御をイネーブルにすることは、対応するルーマブロックにおけるルーマ成分のフィルタリングをイネーブルまたはディセーブルにすることに基づいて、再構築されたビデオユニットのうちの1つにおける特定のクロマブロックのためのクロマ成分のブロックレベルフィルタリングをイネーブルまたはディセーブルにすることを含む。あるインプリメンテーションでは、対応するルーマブロックにおけるルーマ成分のフィルタリングをイネーブルにすることに応答して、特定のクロマブロックのためのクロマ成分のブロックレベルフィルタリングをイネーブルにし、または対応するルーマブロックにおけるルーマ成分のフィルタリングをディセーブルにすることに応答して、特定のクロマブロックのためのクロマ成分のブロックレベルフィルタリングをディセーブルにする。
[00251]方法1800のある態様では、方法は、コーディングされたビデオデータを有する符号化されたビットストリームと共に、クロマ成分のALFのブロックレベル制御をイネーブルにするためのインジケーション(例えば、シグナリング)を受信することをさらに含む。あるインプリメンテーションでは、インジケーションは、異なるビデオブロックについてのクロマ成分のブロックレベルフィルタリングをイネーブルまたはディセーブルにすることを示すように構成された1つまたは複数の制御フラグを含み得る。あるインプリメンテーションでは、インジケーションは、第1のクロマ成分のブロックレベルフィルタリングをイネーブルまたはディセーブルにするための第1のインジケーションと、第1のインジケーションとは異なる、第2のクロマ成分のブロックレベルフィルタリングをイネーブルまたはディセーブルにするための第2のインジケーションとを含み得る。
[00252]図19は、ALF/GALFにおけるクロマフィルタリングのためにルーマサンプルを使用して、ビデオデータを復号するための方法1900の例を例示するフロー図である。方法1900の態様は、宛先デバイス14、ビデオ復号器30、ALFユニット92、処理システム1500、および/または(1つまたは複数の)プロセッサ1505によって実行またはインプリメントされ得る。
[00253]ブロック1910において、方法1900は、再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することを含む。
[00254]ブロック1920において、方法1900は、復号されたビデオ出力を生成するために、1つまたは複数のルーマ成分サンプルを使用して、再構築されたビデオユニットの各々についてのクロマ成分サンプルのフィルタリングを実行することを含む。
[00255]方法1900のある態様では、1つまたは複数のルーマ成分サンプルを使用して、再構築されたビデオユニットの各々についてのクロマ成分サンプルのフィルタリングを実行することは、参照サンプルとして対応するルーマ成分サンプルを使用することを含む。
[00256]方法1900のある態様では、クロマ成分サンプルのフィルタリングを実行するためのフィルタが、元のクロマ成分サンプルと、復号されたフィルタされたルーマ成分サンプルとの間の誤差を最小限にするように構成される。
[00257]方法1900のある態様では、4:4:4カラーフォーマットについて、フィルタされるべき各クロマ成分サンプルは、対応するルーマ成分サンプルである。
[00258]方法1900のある態様では、4:2:0カラーフォーマットについて、クロマ成分サンプルが、クロマ成分サンプルの真上に位置するルーマ成分サンプルに関連するか(例えば、図14Aを参照)、クロマ成分サンプルが、クロマ成分サンプルの真下に位置するルーマ成分サンプルに関連するか(例えば、図14Aを参照)、クロマ成分サンプルが、クロマ成分サンプルの真上および真下の等しく重み付けされたルーマ成分サンプルから生成される仮想ルーマ成分サンプルに関連するか(例えば、図14Bを参照)、またはクロマ成分サンプルが、クロマ成分サンプルの真上および真下の等しく重み付けされたルーマ成分サンプルと、クロマ成分サンプルの真上および真下のルーマ成分サンプルのすぐ左の等しく重み付けされたルーマ成分サンプルと、クロマ成分サンプルの真上および真下のルーマ成分サンプルのすぐ左の等しく重み付けされたルーマ成分サンプルとから生成される仮想ルーマ成分サンプルに関連する(例えば、図14Cを参照)。
[00259]方法1900のある態様では、方法は、コーディングされたビデオデータを有する符号化されたビットストリームと共に、クロマ成分サンプルのフィルタリングを実行するためのフィルタのためのオフセットのインジケーション(例えば、シグナリング)を受信することをさらに含む。
[00260]方法1900のある態様では、方法は、コーディングされたビデオデータを有する符号化されたビットストリームと共に、クロマ成分サンプルのフィルタリングを実行するためのフィルタのための係数のインジケーション(例えば、シグナリング)を受信することをさらに含み、係数は、DC係数を含む。DC係数は、現在のクロマサンプルに適用されるフィルタ係数を示す。
[00261]方法1900のある態様では、1つまたは複数のルーマ成分サンプルを使用して、再構築されたビデオユニットの各々についてのクロマ成分サンプルのフィルタリングを実行することは、クロマ成分サンプルと共に(with)、隣接するルーマ成分サンプルを使用することを含む。
[00262]図20は、ALF/GALFにおけるクロマフィルタリングのブロックレベル制御を使用して、ビデオデータを符号化するための方法2000の例を例示するフロー図である。方法2000の態様は、ソースデバイス12、ビデオ符号器20、ALFユニット64、処理システム1500、および/または(1つまたは複数の)プロセッサ1505によって実行またはインプリメントされ得る。
[00263]ブロック2010において、方法2000は、再構築されたビデオユニットの各々についてのクロマ成分のALF(またはGALF)のブロックレベル制御をイネーブルにすることを含む。各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する。
[00264]ブロック2020において、方法2000は、再構築されたビデオユニットについて、ALFが1つのビデオブロックに対してイネーブルにされたとき、ブロックレベルALFを実行することと、ALFが別のビデオブロックに対してディセーブルにされたとき、クロマ成分のためのブロックレベルALFを実行することをスキップすることとを含む。
[00265]ブロック2030において、方法2000は、ALFのイネーブルにされたブロックレベル制御に基づいて、予測プロセスに適用される復号されたビデオ出力を生成することを含む。
[00266]方法2000のある態様では、ALFのブロックレベル制御をイネーブルにすることは、対応するルーマブロックにおけるルーマ成分のフィルタリングをイネーブルまたはディセーブルにすることに基づいて、再構築されたビデオユニットのうちの1つにおける特定のクロマブロックのためのクロマ成分のフィルタリングをイネーブルまたはディセーブルにすることを含む。
[00267]方法2000のある態様では、方法は、クロマ成分のALFのブロックレベル制御をイネーブルにするためのインジケーション(例えば、シグナリング)を生成することと、コーディングされたビデオデータを有する符号化されたビットストリームと共に、インジケーションを送信することとをさらに含む。いくつかのインプリメンテーションでは、インジケーションは、異なるビデオブロックについてのクロマ成分のブロックレベルフィルタリングをイネーブルまたはディセーブルにすることを示すように構成された1つまたは複数の制御フラグを含む。いくつかのインプリメンテーションでは、インジケーションは、第1のクロマ成分のブロックレベルフィルタリングをイネーブルまたはディセーブルにするための第1のインジケーションと、第1のインジケーションとは異なる、第2のクロマ成分のブロックレベルフィルタリングをイネーブルまたはディセーブルにするための第2のインジケーションとを含む。
[00268]図21は、ALF/GALFにおけるクロマフィルタリングのためにルーマサンプルを使用して、ビデオデータを符号化するための方法2100の例を例示するフロー図である。方法2100の態様は、ソースデバイス12、ビデオ符号器20、ALFユニット64、処理システム1500、および/または(1つまたは複数の)プロセッサ1505によって実行またはインプリメントされ得る。
[00269]ブロック2110において、方法2100は、復号されたビデオ出力を生成するために、1つまたは複数のルーマ成分サンプルを使用して、再構築されたビデオユニットの各々についてのクロマ成分サンプルをフィルタすることを含む。
[00270]ブロック2120において、方法2100は、復号されたビデオ出力を予測プロセスに適用することを含む。
[00271]方法2100のある態様では、4:4:4カラーフォーマットについて、フィルタされるべき各クロマ成分サンプルは、対応するルーマ成分サンプルである。
[00272]方法2100のある態様では、4:2:0カラーフォーマットについて、クロマ成分サンプルが、クロマ成分サンプルの真上に位置するルーマ成分サンプルに関連するか(例えば、図14Aを参照)、クロマ成分サンプルが、クロマ成分サンプルの真下に位置するルーマ成分サンプルに関連するか(例えば、図14Aを参照)、クロマ成分サンプルが、クロマ成分サンプルの真上および真下の等しく重み付けされたルーマ成分サンプルから生成される仮想ルーマ成分サンプルに関連するか(例えば、図14Bを参照)、またはクロマ成分サンプルが、クロマ成分サンプルの真上および真下の等しく重み付けされたルーマ成分サンプルと、クロマ成分サンプルの真上および真下のルーマ成分サンプルのすぐ左の等しく重み付けされたルーマ成分サンプルと、クロマ成分サンプルの真上および真下のルーマ成分サンプルのすぐ左の等しく重み付けされたルーマ成分サンプルとから生成される仮想ルーマ成分サンプルに関連する(例えば、図14Cを参照)。
[00273]方法2100のある態様では、方法は、コーディングされたビデオデータを有する符号化されたビットストリームと共に、クロマ成分サンプルをフィルタするためのフィルタのための係数のインジケーション(例えば、シグナリング)を送信することをさらに含み、係数は、DC係数を含む。DC係数は、現在のクロマサンプルに適用されるフィルタ係数を示す。
[00274]コンポーネントが、ある特定の動作を実行する「ように構成される」ものとして説明されている場合、このような構成は、例えば、動作を実行するように電子回路または他のハードウェアを設計することによって、動作を実行するようにプログラム可能な電子回路(例えば、マイクロプロセッサ、または他の好適な電子回路)をプログラミングすることによって、またはそれらの任意の組合せで、達成され得る。
[00275]添付の図面に関連して、上記に示された本開示は、例を説明しており、インプリメントされ得るまたは特許請求の範囲内にある例のみを表すものではない。本説明において使用されるとき、「例(example)」という用語は、「好ましい」または「他の例よりも有利である」ということではなく、「例、事例、または例示を提供する」を意味する。本開示は、説明された技法の理解を提供することを目的とした特定の詳細を含む。しかしながら、これらの技法は、これらの特定の詳細なしで実施され得る。いくつかの事例では、周知の構造および装置は、説明された例の概念を曖昧にすることを避けるために、ブロック図形式で示される。
[00276]ここで説明された機能は、ハードウェア、プロセッサによって実行されるソフトウェア、ファームウェア、またはこれらの任意の組合せでインプリメントされ得る。プロセッサによって実行されるソフトウェアでインプリメントされる場合、これら機能は、(非一時的な)コンピュータ可読媒体上で、1つまたは複数の命令またはコードとして記憶または送信され得る。他の例およびインプリメンテーションは、添付の特許請求の範囲および本開示の範囲および趣旨内にある。例えば、ソフトウェアの性質により、上記で説明された機能は、特別にプログラムされたプロセッサ、ハードウェア、ファームウェア、ハードワイヤリング、またはこれらの任意のものの組合せによって実行されるソフトウェアを使用してインプリメントされ得る。機能をインプリメントする特徴はまた、様々な位置に物理的に位置し得、機能の部分が異なる物理的なロケーションにおいてインプリメントされるように分散されることを含む。また、特許請求の範囲を含め、ここで使用される場合、「〜のうちの少なくとも1つ(at least one of)」で前置きされるアイテムの列挙中で使用される「または(or)」は、例えば、「A、B、またはCのうちの少なくとも1つ」という列挙が、AまたはBまたはCまたはABまたはACまたはBCまたはABC(すなわち、AおよびBおよびC)を意味するように、選言的列挙(disjunctive list)を示す。
[00277]ここで説明されたようなコンピュータ可読媒体は、ワイヤレスブロードキャストまたは有線ネットワーク送信のような一時的な媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、ブルーレイディスク、または他のコンピュータ可読媒体のような記憶媒体(すなわち、非一時的な記憶媒体)を含み得る。いくつかの例では、ネットワークサーバ(図示せず)は、例えば、ネットワーク送信を介して、宛先デバイスに符号化されたビデオデータを提供し、ソースデバイスから符号化されたビデオデータを受信し得る。同様に、ディスクスタンピング設備のような媒体製造設備のコンピューティングデバイスは、ソースデバイスから符号化されたビデオデータを受信し、符号化されたビデオデータを含むディスクを製造し得る。したがって、コンピュータ可読媒体は、様々な例において、様々な形態の1つまたは複数のコンピュータ可読媒体を含むことが理解され得る。
[00277]ここで説明されたようなコンピュータ可読媒体は、ワイヤレスブロードキャストまたは有線ネットワーク送信のような一時的な媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、ブルーレイディスク、または他のコンピュータ可読媒体のような記憶媒体(すなわち、非一時的な記憶媒体)を含み得る。いくつかの例では、ネットワークサーバ(図示せず)は、例えば、ネットワーク送信を介して、宛先デバイスに符号化されたビデオデータを提供し、ソースデバイスから符号化されたビデオデータを受信し得る。同様に、ディスクスタンピング設備のような媒体製造設備のコンピューティングデバイスは、ソースデバイスから符号化されたビデオデータを受信し、符号化されたビデオデータを含むディスクを製造し得る。したがって、コンピュータ可読媒体は、様々な例において、様々な形態の1つまたは複数のコンピュータ可読媒体を含むことが理解され得る。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1] ビデオデータを復号するための方法であって、前記方法は、
再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、
前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、
復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることと
を備える方法。
[C2] 各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する、C1に記載の方法。
[C3] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別することを含み、
前記再構築されたビデオユニットの各々をフィルタすることは、前記それぞれのフィルタサポートのうちの1つを使用して、前記1つの再構築されたビデオユニット内の前記複数のビデオブロックの各々をフィルタすることを含む、
C1に記載の方法。
[C4] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックを分類することを含み、前記分類における複数のクラスの各々は、一意のフィルタサポートに関連付けられている、C1に記載の方法。
[C5] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックについて、異なるフィルタサポートを識別することを含み、前記複数のビデオブロックのための前記フィルタサポートの各々は、方向性または強方向性に関連付けられているか、前記1つの再構築されたビデオユニットから復号される情報に基づいているか、またはこれらの組合せである、C1に記載の方法。
[C6] 前記1つの再構築されたビデオユニットから復号される前記情報は、
イントラ予測方向情報、
ブロック区分サイズ情報、または
量子化パラメータ(QP)情報
のうちの1つまたは複数を含む、C5に記載の方法。
[C7] 前記コーディングされたビデオデータを有する前記符号化されたビットストリームと共に、各再構築されたビデオユニットについて、前記複数のフィルタサポートの全てに同様に適用されることになるフィルタ長のインジケーションを受信することをさらに備える、C1に記載の方法。
[C8] 前記コーディングされたビデオデータを有する前記符号化されたビットストリームと共に、各再構築されたビデオユニットについて、前記複数のフィルタサポートの各々に適用されることになるフィルタ長の1つまたは複数のインジケーションを受信することをさらに備える、C1に記載の方法。
[C9] 前記コーディングされたビデオデータを有する前記符号化されたビットストリームと共に、各再構築されたビデオユニットについて、前記複数のフィルタサポートの各々のインジケーションを受信すること
をさらに備え、
ここにおいて、前記再構築されたビデオユニットの各々についての前記複数のフィルタサポートを識別することは、前記インジケーションに少なくとも基づく、
C1に記載の方法。
[C10] 前記複数のフィルタサポートの各々は、オフライントレーニングを通じて選択されたフィルタサポートの予め定義されたグループからのものである、C9に記載の方法。
[C11] 前記複数のフィルタサポートの各々は、1つまたは複数のクラス、1つまたは複数の方向性、または1つまたは複数の強方向性に関連付けられる、C10に記載の方法。
[C12] フィルタサポートの前記予め定義されたグループについて、前記再構築されたビデオユニットに関連付けられた前記複数のフィルタサポートのうちの1つが、前記再構築されたビデオユニットに関連付けられた前記複数のフィルタサポートのうちの他のものとは異なる、C10に記載の方法。
[C13] 前記複数のフィルタサポートの各々について、前記予め定義されたグループからの選択されたフィルタサポートのインジケーションを受信する、C10に記載の方法。
[C14] 前記再構築されたビデオユニットのうちの1つにおけるビデオブロックの各サイズについて、前記複数のフィルタサポートは、予め定義された、前記ビデオブロックサイズに関連付けられているフィルタサポートの現在のグループからのものであり、前記現在のグループは、前記現在のグループにおける各フィルタサポートの選択頻度に基づいて動的に更新される、C1に記載の方法。
[C15] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含み、
前記分類に関連付けられた異なるクラスの間でマージすることは、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタサポートの各々について同じであるときに適用可能である、
C1に記載の方法。
[C16] フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタの各々について異なるとき、予測コーディングをディセーブルにすることをさらに備え、予測コーディングをディセーブルにすることは、他方のフィルタからの前記2つのフィルタのうちの一方の予測コーディングをディセーブルにすることを含む、C1に記載の方法。
[C17] 幾何学的変換のグループから45度回転を有する幾何学的変換を識別することをさらに備え、ここにおいて、前記幾何学的変換は、前記フィルタすることに関連して前記複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される、C1に記載の方法。
[C18] 同じ数のフィルタ係数が、前記45度回転を有する前記幾何学的変換と、前記幾何学的変換のグループにおける他の幾何学的変換とに関連付けられる、C17に記載の方法。
[C19] 関連する方向性が無方向であることを示すとき、前記45度回転を有する前記幾何学的変換をディセーブルにすることをさらに備える、C17に記載の方法。
[C20] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む、C1に記載の方法。
[C21] 前記現在の行または列のエネルギー、または前記隣接する行または列のエネルギーは、
前記それぞれの行または列の平滑さ、または
前記それぞれの行または列の現在のピクセルを含む連続したサンプルの値の平均関数
として定義される、C20に記載の方法。
[C22] 前記複数のビデオブロックのうちのビデオブロックの前記分類は、前記それぞれのビデオブロックの方向性が無方向であることを示すとき、エネルギーの評価に少なくとも基づく、C20に記載の方法。
[C23] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、前記現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む、C1に記載の方法。
[C24] 前記隣接するピクセルは、
前記現在のピクセルの上、左、下、および右に位置する4つの隣接するピクセル、
前記現在のピクセルの値より大きい値を有する、前記現在のピクセルに隣り合うピクセル、または
前記現在のピクセルの値より小さい値を有する、前記現在のピクセルに隣り合うピクセル
を含む、C23に記載の方法。
[C25] 復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることは、
各再構築されたビデオユニットのルーマ成分、
各再構築されたビデオユニットの第1のクロマ成分、
各再構築されたビデオユニットの第2のクロマ成分、
各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、または
これらの組合せ
のうちの1つまたは複数をフィルタすることを含む、C1に記載の方法。
[C26] 前記方法は、ワイヤレス通信デバイス上で実行可能であり、ここにおいて、前記デバイスは、
前記コーディングされたビデオデータを記憶するように構成されたメモリと、
前記メモリ中に記憶された前記コーディングされたビデオデータを処理するための命令を実行するように構成されたプロセッサと、
前記コーディングされたビデオデータを有する前記符号化されたビットストリームを表す情報を受信するように構成された受信機と
を備える、C1に記載の方法。
[C27] 前記ワイヤレス通信デバイスは、セルラ電話であり、前記コーディングされたビデオデータを有する前記符号化されたビットストリームを表す前記情報は、前記受信機によって受信され、セルラ通信規格に従って変調される、C26に記載の方法。
[C28] ビデオデータを復号するためのデバイスであって、前記デバイスは、
命令を記憶するように構成されたメモリと、
再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、
前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、
復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることと
を行うための前記命令を実行するように構成されたプロセッサと
を備えるデバイス。
[C29] 各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する、C28に記載のデバイス。
[C30] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別するための前記命令を実行するようにさらに構成され、
前記再構築されたビデオユニットの各々をフィルタするための前記命令を実行するように構成された前記プロセッサは、前記それぞれのフィルタサポートを使用して、前記1つの再構築されたビデオユニット内の前記複数のビデオブロックの各々をフィルタするための前記命令を実行するようにさらに構成される、
C28に記載のデバイス。
[C31] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成され、前記分類における複数のクラスの各々は、一意のフィルタサポートに関連付けられている、C28に記載のデバイス。
[C32] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックについて、異なるフィルタサポートを識別するための前記命令を実行するようにさらに構成され、前記複数のビデオブロックのための前記フィルタサポートの各々は、方向性または強方向性に関連付けられているか、前記1つの再構築されたビデオユニットから復号される情報に基づいているか、またはこれらの組合せである、C28に記載のデバイス。
[C33] 前記符号化されたビットストリームを受信するための前記命令を実行するように構成された前記プロセッサは、前記符号化されたビットストリームと共に、各再構築されたビデオユニットについて、前記複数のフィルタサポートの各々のインジケーションを受信するための前記命令を実行するようにさらに構成され、
前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記インジケーションに少なくとも基づいて、前記複数のフィルタサポートを識別するための前記命令を実行するようにさらに構成される、
C28に記載のデバイス。
[C34] 前記複数のフィルタサポートの各々は、オフライントレーニングを通じて選択されたフィルタサポートの予め定義されたグループからのものである、
前記複数のフィルタサポートの各々は、1つまたは複数のクラス、1つまたは複数の方向性、または1つまたは複数の強方向性に関連付けられる、または
これらの組合せである、
C33に記載のデバイス。
[C35] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成され、
前記分類に関連付けられた異なるクラスの間でマージすることは、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタサポートの各々について同じであるときに適用可能である、
C1に記載の方法。
[C36] 前記プロセッサは、幾何学的変換のグループから45度回転を有する幾何学的変換を識別するための前記命令を実行するようにさらに構成され、ここにおいて、前記幾何学的変換は、前記フィルタすることに関連して前記複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される、C28に記載のデバイス。
[C37] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成される、C28に記載のデバイス。
[C38] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、前記現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成される、C28に記載のデバイス。
[C39] 前記復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタするための前記命令を実行するように構成された前記プロセッサは、
各再構築されたビデオユニットのルーマ成分、
各再構築されたビデオユニットの第1のクロマ成分、
各再構築されたビデオユニットの第2のクロマ成分、
各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、または
これらの組合せ
のうちの1つまたは複数をフィルタするための前記命令を実行するようにさらに構成される、C28に記載のデバイス。
[C40] 前記デバイスは、ワイヤレス通信デバイスであり、
前記コーディングされたビデオデータを有する前記符号化されたビットストリームを表す情報を受信するように構成された受信機
をさらに備える、C28に記載のデバイス。
[C41] 前記ワイヤレス通信デバイスは、セルラ電話であり、前記情報は、前記受信機によって受信され、セルラ通信規格に従って変調される、C40に記載のデバイス。
[C42] ビデオデータを符号化するための方法であって、前記方法は、
複数の再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、
復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることと、
前記復号されたビデオ出力を予測プロセスに適用することと
を備える方法。
[C43] 各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する、C42に記載の方法。
[C44] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別することを含み、
前記再構築されたビデオユニットの各々をフィルタすることは、前記それぞれのフィルタサポートのうちの1つを使用して、前記1つの再構築されたビデオユニット内の前記複数のビデオブロックの各々をフィルタすることを含む、
C42に記載の方法。
[C45] 前記複数のフィルタサポートの各々のインジケーションを生成することと、
コーディングされたビデオデータを有する符号化されたビットストリームと共に、前記インジケーションを送信することと
をさらに備える、C42に記載の方法。
[C46] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含み、
前記分類に関連付けられた異なるクラスの間でマージすることは、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタサポートの各々について同じであるときに適用可能である、
C42に記載の方法。
[C47] 幾何学的変換のグループから45度回転を有する幾何学的変換を識別することをさらに備え、ここにおいて、前記幾何学的変換は、前記フィルタすることに関連して前記複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される、C42に記載の方法。
[C48] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む、C42に記載の方法。
[C49] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、前記現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む、C42に記載の方法。
[C50] 復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることは、
各再構築されたビデオユニットのルーマ成分、
各再構築されたビデオユニットの第1のクロマ成分、
各再構築されたビデオユニットの第2のクロマ成分、
各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、または
これらの組合せ
のうちの1つまたは複数をフィルタすることを含む、C42に記載の方法。
[C51] ビデオデータを符号化するためのデバイスであって、前記デバイスは、
命令を記憶するように構成されたメモリと、
前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、
復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることと、
前記復号されたビデオ出力を予測プロセスに適用することと
を行うための前記命令を実行するように構成されたプロセッサと
を備えるデバイス。
[C52] 各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する、C51に記載のデバイス。
[C53] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別するための前記命令を実行するようにさらに構成され、
前記再構築されたビデオユニットの各々をフィルタするための前記命令を実行するように構成された前記プロセッサは、前記それぞれのフィルタサポートを使用して、前記1つの再構築されたビデオユニット内の前記複数のビデオブロックの各々をフィルタするための前記命令を実行するようにさらに構成される、
C51に記載のデバイス。
[C54]前記プロセッサは、
前記複数のフィルタサポートの各々のインジケーションを生成することと、
コーディングされたビデオデータを有する符号化されたビットストリームと共に、前記インジケーションを送信することと
を行うための前記命令を実行するようにさらに構成される、C51に記載のデバイス。
[C55] 前記プロセッサは、幾何学的変換のグループから45度回転を有する幾何学的変換を識別するための前記命令を実行するようにさらに構成され、ここにおいて、前記幾何学的変換は、前記フィルタすることに関連して前記複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される、C51に記載のデバイス。
[C56] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成される、C51に記載のデバイス。
[C57] 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、前記現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成される、C51に記載のデバイス。
[C58] 前記復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタするための前記命令を実行するように構成された前記プロセッサは、
各再構築されたビデオユニットのルーマ成分、
各再構築されたビデオユニットの第1のクロマ成分、
各再構築されたビデオユニットの第2のクロマ成分、
各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、または
これらの組合せ
のうちの1つまたは複数をフィルタするための前記命令を実行するようにさらに構成される、C51に記載のデバイス。

Claims (58)

  1. ビデオデータを復号するための方法であって、前記方法は、
    再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、
    前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、
    復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることと
    を備える方法。
  2. 各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する、請求項1に記載の方法。
  3. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別することを含み、
    前記再構築されたビデオユニットの各々をフィルタすることは、前記それぞれのフィルタサポートのうちの1つを使用して、前記1つの再構築されたビデオユニット内の前記複数のビデオブロックの各々をフィルタすることを含む、
    請求項1に記載の方法。
  4. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックを分類することを含み、前記分類における複数のクラスの各々は、一意のフィルタサポートに関連付けられている、請求項1に記載の方法。
  5. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックについて、異なるフィルタサポートを識別することを含み、前記複数のビデオブロックのための前記フィルタサポートの各々は、方向性または強方向性に関連付けられているか、前記1つの再構築されたビデオユニットから復号される情報に基づいているか、またはこれらの組合せである、請求項1に記載の方法。
  6. 前記1つの再構築されたビデオユニットから復号される前記情報は、
    イントラ予測方向情報、
    ブロック区分サイズ情報、または
    量子化パラメータ(QP)情報
    のうちの1つまたは複数を含む、請求項5に記載の方法。
  7. 前記コーディングされたビデオデータを有する前記符号化されたビットストリームと共に、各再構築されたビデオユニットについて、前記複数のフィルタサポートの全てに同様に適用されることになるフィルタ長のインジケーションを受信することをさらに備える、請求項1に記載の方法。
  8. 前記コーディングされたビデオデータを有する前記符号化されたビットストリームと共に、各再構築されたビデオユニットについて、前記複数のフィルタサポートの各々に適用されることになるフィルタ長の1つまたは複数のインジケーションを受信することをさらに備える、請求項1に記載の方法。
  9. 前記コーディングされたビデオデータを有する前記符号化されたビットストリームと共に、各再構築されたビデオユニットについて、前記複数のフィルタサポートの各々のインジケーションを受信すること
    をさらに備え、
    ここにおいて、前記再構築されたビデオユニットの各々についての前記複数のフィルタサポートを識別することは、前記インジケーションに少なくとも基づく、
    請求項1に記載の方法。
  10. 前記複数のフィルタサポートの各々は、オフライントレーニングを通じて選択されたフィルタサポートの予め定義されたグループからのものである、請求項9に記載の方法。
  11. 前記複数のフィルタサポートの各々は、1つまたは複数のクラス、1つまたは複数の方向性、または1つまたは複数の強方向性に関連付けられる、請求項10に記載の方法。
  12. フィルタサポートの前記予め定義されたグループについて、前記再構築されたビデオユニットに関連付けられた前記複数のフィルタサポートのうちの1つが、前記再構築されたビデオユニットに関連付けられた前記複数のフィルタサポートのうちの他のものとは異なる、請求項10に記載の方法。
  13. 前記複数のフィルタサポートの各々について、前記予め定義されたグループからの選択されたフィルタサポートのインジケーションを受信する、請求項10に記載の方法。
  14. 前記再構築されたビデオユニットのうちの1つにおけるビデオブロックの各サイズについて、前記複数のフィルタサポートは、予め定義された、前記ビデオブロックサイズに関連付けられているフィルタサポートの現在のグループからのものであり、前記現在のグループは、前記現在のグループにおける各フィルタサポートの選択頻度に基づいて動的に更新される、請求項1に記載の方法。
  15. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含み、
    前記分類に関連付けられた異なるクラスの間でマージすることは、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタサポートの各々について同じであるときに適用可能である、
    請求項1に記載の方法。
  16. フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタの各々について異なるとき、予測コーディングをディセーブルにすることをさらに備え、予測コーディングをディセーブルにすることは、他方のフィルタからの前記2つのフィルタのうちの一方の予測コーディングをディセーブルにすることを含む、請求項1に記載の方法。
  17. 幾何学的変換のグループから45度回転を有する幾何学的変換を識別することをさらに備え、ここにおいて、前記幾何学的変換は、前記フィルタすることに関連して前記複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される、請求項1に記載の方法。
  18. 同じ数のフィルタ係数が、前記45度回転を有する前記幾何学的変換と、前記幾何学的変換のグループにおける他の幾何学的変換とに関連付けられる、請求項17に記載の方法。
  19. 関連する方向性が無方向であることを示すとき、前記45度回転を有する前記幾何学的変換をディセーブルにすることをさらに備える、請求項17に記載の方法。
  20. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む、請求項1に記載の方法。
  21. 前記現在の行または列のエネルギー、または前記隣接する行または列のエネルギーは、
    前記それぞれの行または列の平滑さ、または
    前記それぞれの行または列の現在のピクセルを含む連続したサンプルの値の平均関数
    として定義される、請求項20に記載の方法。
  22. 前記複数のビデオブロックのうちのビデオブロックの前記分類は、前記それぞれのビデオブロックの方向性が無方向であることを示すとき、エネルギーの評価に少なくとも基づく、請求項20に記載の方法。
  23. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、前記現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む、請求項1に記載の方法。
  24. 前記隣接するピクセルは、
    前記現在のピクセルの上、左、下、および右に位置する4つの隣接するピクセル、
    前記現在のピクセルの値より大きい値を有する、前記現在のピクセルに隣り合うピクセル、または
    前記現在のピクセルの値より小さい値を有する、前記現在のピクセルに隣り合うピクセル
    を含む、請求項23に記載の方法。
  25. 復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることは、
    各再構築されたビデオユニットのルーマ成分、
    各再構築されたビデオユニットの第1のクロマ成分、
    各再構築されたビデオユニットの第2のクロマ成分、
    各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、または
    これらの組合せ
    のうちの1つまたは複数をフィルタすることを含む、請求項1に記載の方法。
  26. 前記方法は、ワイヤレス通信デバイス上で実行可能であり、ここにおいて、前記デバイスは、
    前記コーディングされたビデオデータを記憶するように構成されたメモリと、
    前記メモリ中に記憶された前記コーディングされたビデオデータを処理するための命令を実行するように構成されたプロセッサと、
    前記コーディングされたビデオデータを有する前記符号化されたビットストリームを表す情報を受信するように構成された受信機と
    を備える、請求項1に記載の方法。
  27. 前記ワイヤレス通信デバイスは、セルラ電話であり、前記コーディングされたビデオデータを有する前記符号化されたビットストリームを表す前記情報は、前記受信機によって受信され、セルラ通信規格に従って変調される、請求項26に記載の方法。
  28. ビデオデータを復号するためのデバイスであって、前記デバイスは、
    命令を記憶するように構成されたメモリと、
    再構築されたビデオユニットがそれから生成される、コーディングされたビデオデータを有する符号化されたビットストリームを受信することと、
    前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、
    復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることと
    を行うための前記命令を実行するように構成されたプロセッサと
    を備えるデバイス。
  29. 各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する、請求項28に記載のデバイス。
  30. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別するための前記命令を実行するようにさらに構成され、
    前記再構築されたビデオユニットの各々をフィルタするための前記命令を実行するように構成された前記プロセッサは、前記それぞれのフィルタサポートを使用して、前記1つの再構築されたビデオユニット内の前記複数のビデオブロックの各々をフィルタするための前記命令を実行するようにさらに構成される、
    請求項28に記載のデバイス。
  31. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成され、前記分類における複数のクラスの各々は、一意のフィルタサポートに関連付けられている、請求項28に記載のデバイス。
  32. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックについて、異なるフィルタサポートを識別するための前記命令を実行するようにさらに構成され、前記複数のビデオブロックのための前記フィルタサポートの各々は、方向性または強方向性に関連付けられているか、前記1つの再構築されたビデオユニットから復号される情報に基づいているか、またはこれらの組合せである、請求項28に記載のデバイス。
  33. 前記符号化されたビットストリームを受信するための前記命令を実行するように構成された前記プロセッサは、前記符号化されたビットストリームと共に、各再構築されたビデオユニットについて、前記複数のフィルタサポートの各々のインジケーションを受信するための前記命令を実行するようにさらに構成され、
    前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記インジケーションに少なくとも基づいて、前記複数のフィルタサポートを識別するための前記命令を実行するようにさらに構成される、
    請求項28に記載のデバイス。
  34. 前記複数のフィルタサポートの各々は、オフライントレーニングを通じて選択されたフィルタサポートの予め定義されたグループからのものである、
    前記複数のフィルタサポートの各々は、1つまたは複数のクラス、1つまたは複数の方向性、または1つまたは複数の強方向性に関連付けられる、または
    これらの組合せである、
    請求項33に記載のデバイス。
  35. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成され、
    前記分類に関連付けられた異なるクラスの間でマージすることは、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタサポートの各々について同じであるときに適用可能である、
    請求項1に記載の方法。
  36. 前記プロセッサは、幾何学的変換のグループから45度回転を有する幾何学的変換を識別するための前記命令を実行するようにさらに構成され、ここにおいて、前記幾何学的変換は、前記フィルタすることに関連して前記複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される、請求項28に記載のデバイス。
  37. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成される、請求項28に記載のデバイス。
  38. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、前記現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成される、請求項28に記載のデバイス。
  39. 前記復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタするための前記命令を実行するように構成された前記プロセッサは、
    各再構築されたビデオユニットのルーマ成分、
    各再構築されたビデオユニットの第1のクロマ成分、
    各再構築されたビデオユニットの第2のクロマ成分、
    各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、または
    これらの組合せ
    のうちの1つまたは複数をフィルタするための前記命令を実行するようにさらに構成される、請求項28に記載のデバイス。
  40. 前記デバイスは、ワイヤレス通信デバイスであり、
    前記コーディングされたビデオデータを有する前記符号化されたビットストリームを表す情報を受信するように構成された受信機
    をさらに備える、請求項28に記載のデバイス。
  41. 前記ワイヤレス通信デバイスは、セルラ電話であり、前記情報は、前記受信機によって受信され、セルラ通信規格に従って変調される、請求項40に記載のデバイス。
  42. ビデオデータを符号化するための方法であって、前記方法は、
    複数の再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、
    復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることと、
    前記復号されたビデオ出力を予測プロセスに適用することと
    を備える方法。
  43. 各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する、請求項42に記載の方法。
  44. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別することを含み、
    前記再構築されたビデオユニットの各々をフィルタすることは、前記それぞれのフィルタサポートのうちの1つを使用して、前記1つの再構築されたビデオユニット内の前記複数のビデオブロックの各々をフィルタすることを含む、
    請求項42に記載の方法。
  45. 前記複数のフィルタサポートの各々のインジケーションを生成することと、
    コーディングされたビデオデータを有する符号化されたビットストリームと共に、前記インジケーションを送信することと
    をさらに備える、請求項42に記載の方法。
  46. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含み、
    前記分類に関連付けられた異なるクラスの間でマージすることは、フィルタ係数の数が、2つの異なるクラスに関連付けられた2つの異なるフィルタサポートの各々について同じであるときに適用可能である、
    請求項42に記載の方法。
  47. 幾何学的変換のグループから45度回転を有する幾何学的変換を識別することをさらに備え、ここにおいて、前記幾何学的変換は、前記フィルタすることに関連して前記複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される、請求項42に記載の方法。
  48. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む、請求項42に記載の方法。
  49. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することは、前記複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、前記現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類することを含む、請求項42に記載の方法。
  50. 復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることは、
    各再構築されたビデオユニットのルーマ成分、
    各再構築されたビデオユニットの第1のクロマ成分、
    各再構築されたビデオユニットの第2のクロマ成分、
    各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、または
    これらの組合せ
    のうちの1つまたは複数をフィルタすることを含む、請求項42に記載の方法。
  51. ビデオデータを符号化するためのデバイスであって、前記デバイスは、
    命令を記憶するように構成されたメモリと、
    前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別することと、
    復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタすることと、
    前記復号されたビデオ出力を予測プロセスに適用することと
    を行うための前記命令を実行するように構成されたプロセッサと
    を備えるデバイス。
  52. 各再構築されたビデオユニットは、ビデオスライス、ビデオタイル、ビデオピクチャ、またはビデオフレームに対応する、請求項51に記載のデバイス。
  53. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記再構築されたビデオユニットのうちの1つ内の複数のビデオブロックの各々について、異なるフィルタサポートを識別するための前記命令を実行するようにさらに構成され、
    前記再構築されたビデオユニットの各々をフィルタするための前記命令を実行するように構成された前記プロセッサは、前記それぞれのフィルタサポートを使用して、前記1つの再構築されたビデオユニット内の前記複数のビデオブロックの各々をフィルタするための前記命令を実行するようにさらに構成される、
    請求項51に記載のデバイス。
  54. 前記プロセッサは、
    前記複数のフィルタサポートの各々のインジケーションを生成することと、
    コーディングされたビデオデータを有する符号化されたビットストリームと共に、前記インジケーションを送信することと
    を行うための前記命令を実行するようにさらに構成される、請求項51に記載のデバイス。
  55. 前記プロセッサは、幾何学的変換のグループから45度回転を有する幾何学的変換を識別するための前記命令を実行するようにさらに構成され、ここにおいて、前記幾何学的変換は、前記フィルタすることに関連して前記複数のフィルタサポートのそれぞれ1つのフィルタ係数に適用される、請求項51に記載のデバイス。
  56. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、現在の行のエネルギー、現在の列のエネルギー、隣接する行のエネルギー、または隣接する列のエネルギーのうちの1つまたは複数を評価することに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成される、請求項51に記載のデバイス。
  57. 前記再構築されたビデオユニットの各々についての複数のフィルタサポートを識別するための前記命令を実行するように構成された前記プロセッサは、前記複数のビデオブロックのうちの現在のビデオブロックにおける現在のピクセルの値と、前記現在のピクセルに隣接するピクセルの値とに少なくとも部分的に基づいて、各再構築されたビデオユニット内の複数のビデオブロックを分類するための前記命令を実行するようにさらに構成される、請求項51に記載のデバイス。
  58. 前記復号されたビデオ出力を生成するために、前記それぞれの複数のフィルタサポートを使用して、前記再構築されたビデオユニットの各々をフィルタするための前記命令を実行するように構成された前記プロセッサは、
    各再構築されたビデオユニットのルーマ成分、
    各再構築されたビデオユニットの第1のクロマ成分、
    各再構築されたビデオユニットの第2のクロマ成分、
    各再構築されたビデオユニットの第1のクロマ成分および第2のクロマ成分、または
    これらの組合せ
    のうちの1つまたは複数をフィルタするための前記命令を実行するようにさらに構成される、請求項51に記載のデバイス。
JP2019505242A 2016-08-02 2017-08-02 幾何学的変換ベースの適応ループフィルタリング Pending JP2019525605A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662370179P 2016-08-02 2016-08-02
US62/370,179 2016-08-02
US15/665,492 2017-08-01
US15/665,492 US11095922B2 (en) 2016-08-02 2017-08-01 Geometry transformation-based adaptive loop filtering
PCT/US2017/045035 WO2018026887A1 (en) 2016-08-02 2017-08-02 Geometry transformation-based adaptive loop filtering

Publications (2)

Publication Number Publication Date
JP2019525605A true JP2019525605A (ja) 2019-09-05
JP2019525605A5 JP2019525605A5 (ja) 2020-08-20

Family

ID=61071859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019505242A Pending JP2019525605A (ja) 2016-08-02 2017-08-02 幾何学的変換ベースの適応ループフィルタリング

Country Status (9)

Country Link
US (2) US11095922B2 (ja)
EP (2) EP3494697A2 (ja)
JP (1) JP2019525605A (ja)
KR (1) KR20190032396A (ja)
CN (2) CN109479130B (ja)
BR (1) BR112019001571A2 (ja)
CA (1) CA3028469A1 (ja)
TW (2) TW201808011A (ja)
WO (2) WO2018026888A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022553696A (ja) * 2020-04-26 2022-12-26 テンセント・アメリカ・エルエルシー 幾何学的クロスコンポーネントフィルタリング
JP7514395B2 (ja) 2021-08-02 2024-07-10 テンセント・アメリカ・エルエルシー 参照画像再サンプリング(rpr)によるルマ及びクロマのための適応アップサンプリングフィルタ

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104375302B (zh) * 2014-10-27 2020-09-08 上海中航光电子有限公司 一种像素结构、显示面板及其像素补偿方法
US11095922B2 (en) 2016-08-02 2021-08-17 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering
US10440396B2 (en) 2017-03-28 2019-10-08 Qualcomm Incorporated Filter information sharing among color components
EP3454556A1 (en) * 2017-09-08 2019-03-13 Thomson Licensing Method and apparatus for video encoding and decoding using pattern-based block filtering
MX2020003722A (es) 2017-10-09 2020-09-18 Arris Entpr Llc Predicción de peso en planos desiguales adaptativa.
CN111512632B (zh) * 2017-11-01 2023-07-14 Vid拓展公司 用于简化视频译码中的自适应环路滤波器的方法
US10728549B2 (en) * 2017-11-06 2020-07-28 Dolby Laboratories Licensing Corporation Adaptive loop filtering for high-dynamic range video
US20190238845A1 (en) * 2018-01-26 2019-08-01 Qualcomm Incorporated Adaptive loop filtering on deblocking filter results in video coding
US10609402B2 (en) * 2018-05-02 2020-03-31 Tencent America LLC Method and apparatus for prediction and transform for small blocks
EP3815359A1 (en) * 2018-06-27 2021-05-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Contour mode prediction
CN111131826A (zh) * 2018-10-31 2020-05-08 上海天荷电子信息有限公司 定长码单元含多个编码参数变长码的数据压缩方法和装置
KR20210087450A (ko) 2018-11-06 2021-07-12 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 기하학적 파티션을 이용한 인터 예측을 위한 사이드 정보 시그널링
CN111418205B (zh) 2018-11-06 2024-06-21 北京字节跳动网络技术有限公司 用于帧间预测的运动候选
WO2020094067A1 (en) 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Simplified parameter derivation for intra prediction
WO2020103933A1 (en) 2018-11-22 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Configuration method for default motion candidate
CN113170122B (zh) 2018-12-01 2023-06-27 北京字节跳动网络技术有限公司 帧内预测的参数推导
CN113261290B (zh) 2018-12-28 2024-03-12 北京字节跳动网络技术有限公司 基于修改历史的运动预测
WO2020140862A1 (en) 2018-12-30 2020-07-09 Beijing Bytedance Network Technology Co., Ltd. Conditional application of inter prediction with geometric partitioning in video processing
EP3700205A1 (en) * 2019-02-19 2020-08-26 Nokia Technologies Oy Quantization parameter derivation for cross-channel residual encoding and decoding
WO2020169101A1 (en) * 2019-02-22 2020-08-27 Beijing Bytedance Network Technology Co., Ltd. Neighbouring sample selection for intra prediction
CN113519164A (zh) 2019-03-02 2021-10-19 北京字节跳动网络技术有限公司 对分割结构的限制
US11159791B2 (en) * 2019-03-16 2021-10-26 Mediatek Inc. Method and apparatus for signaling adaptive loop filter parameters in video coding
MX2021011247A (es) * 2019-03-24 2021-10-01 Beijing Bytedance Network Tech Co Ltd Filtrado de bucle adaptativo no lineal en procesamiento de video.
KR20230165888A (ko) * 2019-04-02 2023-12-05 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 양방향 광학 흐름 기반 비디오 코딩 및 디코딩
WO2020204419A1 (ko) * 2019-04-03 2020-10-08 엘지전자 주식회사 적응적 루프 필터 기반 비디오 또는 영상 코딩
EP3928524A4 (en) 2019-04-15 2022-06-22 Beijing Bytedance Network Technology Co., Ltd. TIME PREDICTION OF PARAMETERS IN A NONLINEAR ADAPTIVE LOOP FILTER
KR20210145749A (ko) 2019-04-16 2021-12-02 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩을 위한 적응형 루프 필터링
CN113728630B (zh) 2019-04-19 2023-11-17 北京字节跳动网络技术有限公司 不同运动矢量细化中的基于区域的梯度计算
CN113711609B (zh) 2019-04-19 2023-12-01 北京字节跳动网络技术有限公司 利用光流的预测细化过程中的增量运动矢量
CN113711604B (zh) 2019-04-20 2023-10-27 北京字节跳动网络技术有限公司 视频编解码中色度和亮度语法元素的信令
CN113906763B (zh) * 2019-05-05 2024-01-12 北京字节跳动网络技术有限公司 用于视频编解码的色度去方块协调
CN115567707A (zh) 2019-05-30 2023-01-03 抖音视界有限公司 色度分量的自适应环路滤波
JP7446339B2 (ja) 2019-06-04 2024-03-08 北京字節跳動網絡技術有限公司 幾何学的分割モードコーディングを用いた動き候補リスト
WO2020244571A1 (en) 2019-06-04 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction using neighboring block information
EP3970366A4 (en) 2019-06-14 2023-03-29 Beijing Bytedance Network Technology Co., Ltd. HANDLING VIDEO UNIT LIMITS AND VIRTUAL LIMITS
WO2020249124A1 (en) 2019-06-14 2020-12-17 Beijing Bytedance Network Technology Co., Ltd. Handling video unit boundaries and virtual boundaries based on color format
EP3993425A4 (en) * 2019-06-25 2023-01-25 SZ DJI Technology Co., Ltd. LOOP FILTRATION METHOD AND APPARATUS
WO2021006624A1 (ko) 2019-07-08 2021-01-14 엘지전자 주식회사 적응적 루프 필터를 적용하는 비디오 또는 영상 코딩
CN114391252A (zh) * 2019-07-08 2022-04-22 Lg电子株式会社 基于自适应环路滤波器的视频或图像编码
WO2021006654A1 (ko) * 2019-07-09 2021-01-14 엘지전자 주식회사 적응적 루프 필터 기반 비디오 또는 영상 코딩
CN117478878A (zh) * 2019-07-09 2024-01-30 北京字节跳动网络技术有限公司 用于自适应环路滤波的样点确定
US11432015B2 (en) * 2019-07-11 2022-08-30 Qualcomm Incorporated Adaptive loop filtering across raster-scan slices
WO2021004542A1 (en) * 2019-07-11 2021-01-14 Beijing Bytedance Network Technology Co., Ltd. Sample padding in adaptive loop filtering
CN117354547A (zh) 2019-07-14 2024-01-05 北京字节跳动网络技术有限公司 自适应参数集中的自适应环路滤波的指示
BR112022000794A2 (pt) 2019-07-15 2022-03-15 Beijing Bytedance Network Tech Co Ltd Método de processamento de dados de vídeo, aparelho para processamento de dados de vídeo, meios de armazenamento e gravação não transitórios legíveis por computador
WO2021040480A1 (ko) 2019-08-29 2021-03-04 엘지전자 주식회사 인루프 필터링 기반 영상 코딩 장치 및 방법
CN118118668A (zh) * 2019-08-29 2024-05-31 Lg 电子株式会社 基于自适应环路滤波的图像编译装置和方法
AU2020347030A1 (en) 2019-09-10 2022-03-31 Xris Corporation Image signal encoding/decoding method and device therefor
WO2021051046A1 (en) 2019-09-14 2021-03-18 Bytedance Inc. Quantization parameter for chroma deblocking filtering
US11202068B2 (en) * 2019-09-16 2021-12-14 Mediatek Inc. Method and apparatus of constrained cross-component adaptive loop filtering for video coding
CN114424529A (zh) 2019-09-18 2022-04-29 北京字节跳动网络技术有限公司 视频编解码中自适应环路滤波器的两部分信令
WO2021054424A1 (en) * 2019-09-18 2021-03-25 Panasonic Intellectual Property Corporation Of America System and method for video coding
CN114430902B (zh) 2019-09-22 2023-11-10 北京字节跳动网络技术有限公司 自适应环路滤波中的填充过程
WO2021057946A1 (en) * 2019-09-27 2021-04-01 Beijing Bytedance Network Technology Co., Ltd. Adaptive loop filtering between different video units
CN114450959A (zh) 2019-09-28 2022-05-06 北京字节跳动网络技术有限公司 视频编解码中的几何分割模式
WO2021072177A1 (en) 2019-10-09 2021-04-15 Bytedance Inc. Cross-component adaptive loop filtering in video coding
KR20220071203A (ko) 2019-10-10 2022-05-31 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 적응적 루프 필터링에서 이용 불가능한 샘플 위치들에서의 패딩 프로세스
WO2021068922A1 (en) 2019-10-10 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Deblocking of blocks coded in geometry partition mode
CN114586370B (zh) 2019-10-14 2024-01-23 字节跳动有限公司 在视频编解码中使用色度量化参数的方法、装置及介质
CN115244924A (zh) * 2019-10-29 2022-10-25 抖音视界有限公司 跨分量自适应环路滤波器的信令通知
KR20220082058A (ko) * 2019-11-18 2022-06-16 엘지전자 주식회사 루프 필터링을 제어하는 영상 코딩 장치 및 방법
BR112022010230A2 (pt) 2019-11-30 2023-03-14 Beijing Bytedance Network Tech Co Ltd Método de processamento de dados de vídeo, aparelho para processar dados de vídeo, meio de armazenamento não transitório legível por computador e meio de gravação não transitório legível por computador
EP4055827A4 (en) 2019-12-09 2023-01-18 ByteDance Inc. USING QUANTIFICATION GROUPS IN VIDEO CODING
US11463688B2 (en) * 2019-12-09 2022-10-04 Qualcomm Incorporated Joint chroma residual video coding
KR102619404B1 (ko) 2019-12-11 2023-12-28 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로스 컴포넌트 적응적 루프 필터링을 위한 샘플 패딩
CN114868395A (zh) 2019-12-24 2022-08-05 抖音视界(北京)有限公司 采用几何分割进行帧间预测的高级语法
CN114902657A (zh) 2019-12-31 2022-08-12 字节跳动有限公司 视频编解码中的自适应颜色变换
WO2021134706A1 (zh) * 2019-12-31 2021-07-08 北京大学 环路滤波的方法与装置
CN112135133B (zh) 2020-01-13 2022-03-01 杭州海康威视数字技术股份有限公司 编码、解码方法、装置、设备及机器可读存储介质
KR20230029670A (ko) 2020-06-30 2023-03-03 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 적응적 루프 필터링을 위한 경계 위치
WO2023051561A1 (en) * 2021-09-29 2023-04-06 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2023143584A1 (en) * 2022-01-29 2023-08-03 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2024016983A1 (en) * 2022-07-20 2024-01-25 Mediatek Inc. Method and apparatus for adaptive loop filter with geometric transform for video coding
WO2024027808A1 (en) * 2022-08-04 2024-02-08 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013534388A (ja) * 2010-10-05 2013-09-02 メディアテック インコーポレイテッド 適応ループフィルタリングの方法及び装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10120395A1 (de) 2001-04-25 2002-10-31 Bosch Gmbh Robert Einrichtung zur Interpolation von Abtastwerten sowie Bildencoder und Bilddecoder
EP1537746A2 (en) * 2002-09-06 2005-06-08 Koninklijke Philips Electronics N.V. Content-adaptive multiple description motion compensation for improved efficiency and error resilience
JP5096776B2 (ja) * 2007-04-04 2012-12-12 キヤノン株式会社 画像処理装置及び画像検索方法
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
EP2192786A1 (en) * 2008-11-27 2010-06-02 Panasonic Corporation Frequency domain filters for video coding
US9094658B2 (en) 2010-05-10 2015-07-28 Mediatek Inc. Method and apparatus of adaptive loop filtering
US20130058421A1 (en) 2010-05-17 2013-03-07 Thomson Licensing Methods and apparatus for adaptive directional filter for video restoration
US9819966B2 (en) * 2010-09-01 2017-11-14 Qualcomm Incorporated Filter description signaling for multi-filter adaptive filtering
US20120177104A1 (en) 2011-01-12 2012-07-12 Madhukar Budagavi Reduced Complexity Adaptive Loop Filter (ALF) for Video Coding
JP5670226B2 (ja) * 2011-03-04 2015-02-18 Kddi株式会社 動画像符号化装置、動画像符号化方法、およびプログラム
CN105120270B (zh) * 2011-05-16 2018-09-04 寰发股份有限公司 采用样本自适应偏移处理重构视频的方法及装置
US9807403B2 (en) * 2011-10-21 2017-10-31 Qualcomm Incorporated Adaptive loop filtering for chroma components
CN103096057B (zh) 2011-11-08 2016-06-29 华为技术有限公司 一种色度帧内预测方法和装置
US9445088B2 (en) * 2012-04-09 2016-09-13 Qualcomm Incorporated LCU-based adaptive loop filtering for video coding
US20150365703A1 (en) * 2014-06-13 2015-12-17 Atul Puri System and method for highly content adaptive quality restoration filtering for video coding
CN104683819A (zh) 2015-01-31 2015-06-03 北京大学 一种自适应环路滤波方法及装置
US10701356B2 (en) * 2015-10-13 2020-06-30 Lg Electronic Inc. Image decoding method and apparatus by deriving a frequency component based on filtering in image coding system
CN105306957B (zh) 2015-10-23 2019-04-26 湘潭中星电子有限公司 自适应环路滤波方法和设备
CN105791877B (zh) 2016-03-15 2019-06-07 北京大学 视频编解码中自适应环路滤波的方法
US11095922B2 (en) 2016-08-02 2021-08-17 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013534388A (ja) * 2010-10-05 2013-09-02 メディアテック インコーポレイテッド 適応ループフィルタリングの方法及び装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANLE CHEN ET AL.: "Algorithm Description of Joint Exploration Test Model 3", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-C1001_v3, JPN6021027062, July 2016 (2016-07-01), pages 27 - 30, ISSN: 0004550616 *
MARTA KARCZEWICZ, LI ZHANG AND WEI-JUNG CHIEN: "Improvements on adaptive loop filter", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-B0060, JPN6021027059, February 2016 (2016-02-01), pages 1 - 5, ISSN: 0004550615 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022553696A (ja) * 2020-04-26 2022-12-26 テンセント・アメリカ・エルエルシー 幾何学的クロスコンポーネントフィルタリング
JP7467617B2 (ja) 2020-04-26 2024-04-15 テンセント・アメリカ・エルエルシー 幾何学的クロスコンポーネントフィルタリング
JP7514395B2 (ja) 2021-08-02 2024-07-10 テンセント・アメリカ・エルエルシー 参照画像再サンプリング(rpr)によるルマ及びクロマのための適応アップサンプリングフィルタ

Also Published As

Publication number Publication date
CA3028469A1 (en) 2018-02-08
WO2018026888A2 (en) 2018-02-08
US20180041779A1 (en) 2018-02-08
US20180041778A1 (en) 2018-02-08
TW201808011A (zh) 2018-03-01
US11095922B2 (en) 2021-08-17
CN109479130B (zh) 2021-04-20
CN109565594A (zh) 2019-04-02
KR20190032396A (ko) 2019-03-27
WO2018026888A3 (en) 2018-03-15
CN109479130A (zh) 2019-03-15
BR112019001571A2 (pt) 2019-05-07
CN109565594B (zh) 2022-03-29
EP3494697A2 (en) 2019-06-12
EP3494698A1 (en) 2019-06-12
WO2018026887A1 (en) 2018-02-08
TW201808006A (zh) 2018-03-01

Similar Documents

Publication Publication Date Title
CN109479130B (zh) 基于几何变换的自适应环路滤波
JP7150130B2 (ja) 広角イントラ予測を伴う位置依存イントラ予測組み合わせ
CN110463202B (zh) 一种用于解码视频数据的方法、装置和设备
JP7295879B2 (ja) 角度モードで拡張された位置依存型イントラ予測組合せ
CN109076218B (zh) 基于多个滤波器混淆的视频编码/解码方法、装置
JP7422684B2 (ja) ブロックベースの適応ループフィルタ(alf)の設計およびシグナリング
JP6783788B2 (ja) ビデオコーディングにおけるサブブロックの動き情報の導出
JP6552923B2 (ja) ビデオコード化における動きベクトル予測
JP6254136B2 (ja) 統合されたマージモードおよび適応動きベクトル予測モード候補選択
JP7504925B2 (ja) ビデオコーディングのための組み合わされたインターおよびイントラ予測モード
JP6672145B2 (ja) インター色成分残差予測
JP2019526988A (ja) 候補リストの構築のためのジオメトリベースの優先度
JP6158337B2 (ja) 深度マップコーディング
JP2019533363A (ja) ビデオコーディングのための動きベクトルコーディング
JP6293756B2 (ja) スケーラブルビデオ符号化における変換基準の調整
JP2019519141A (ja) フィルタ処理情報のシグナリング
JP2015531561A (ja) スケーラブルビデオコーディングのための重み付け予測モード
JP2015531561A5 (ja)
KR20210014197A (ko) 서브블록 단위의 시간적 움직임 정보 예측을 위한 인터 예측 방법 및 그 장치
TW202038614A (zh) 用於視訊寫碼之空間時間運動向量預測圖案
KR20240038959A (ko) 결합된 인터 및 인트라 예측을 수행하기 위한 방법 및 시스템
CN116868571A (zh) 对于帧间预测的改进的局部光照补偿
CN116156199B (zh) 用于视频解码、视频编码的方法、计算设备和存储介质
CN110944184B (zh) 视频解码方法及视频解码器
CN110958452B (zh) 视频解码方法及视频解码器

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200707

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220222