JP2022544350A - 映像コード化のためのブロック分割方法 - Google Patents

映像コード化のためのブロック分割方法 Download PDF

Info

Publication number
JP2022544350A
JP2022544350A JP2021576628A JP2021576628A JP2022544350A JP 2022544350 A JP2022544350 A JP 2022544350A JP 2021576628 A JP2021576628 A JP 2021576628A JP 2021576628 A JP2021576628 A JP 2021576628A JP 2022544350 A JP2022544350 A JP 2022544350A
Authority
JP
Japan
Prior art keywords
block
mode
blocks
partitioning
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021576628A
Other languages
English (en)
Other versions
JPWO2021030019A5 (ja
Inventor
リャオ,ルーリン
チェン,ジエ
イエ,ヤン
ルオ,ジャンコン
Original Assignee
アリババ グループ ホウルディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホウルディング リミテッド filed Critical アリババ グループ ホウルディング リミテッド
Publication of JP2022544350A publication Critical patent/JP2022544350A/ja
Publication of JPWO2021030019A5 publication Critical patent/JPWO2021030019A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本開示は、映像コンテンツを処理するためのシステム及び方法を提供する。方法は、ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、第1の区画のための第1の予測信号及び第2の区画のための第2の予測信号を生成するために、複数のブロックに対してインター予測を行うことと、分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することとを含み得る。

Description

関連出願の相互参照
[001] 本開示は、両方とも参照によりその全体が本明細書に援用される、2019年8月15日に出願された米国仮特許出願第62/887,039号及び2019年9月23日に出願された米国仮特許出願第62/903,970号に対する優先権の利益を主張する。
技術分野
[002] 本開示は、概して、映像処理に関し、より詳細には、三角形分割又は幾何学的分割を使用して動き予測を行うための方法及びシステムに関する。
背景
[003] 映像は、視覚情報を捕捉する静的ピクチャ(又は「フレーム」)の組である。記憶メモリ及び伝送帯域幅を減らすために、映像は、記憶又は伝送前に圧縮し、表示前に解凍することができる。圧縮プロセスは、通常、符号化と呼ばれ、解凍プロセスは、通常、復号と呼ばれる。最も一般的には、予測、変換、量子化、エントロピーコード化及びインループフィルタリングに基づく規格化された映像コード化技術を使用する様々な映像コード化形式がある。特定の映像コード化形式を指定するHigh Efficiency Video Coding(HEVC/H.265)規格、Versatile Video Coding(VVC/H.266)規格、AVS規格等の映像コード化規格が規格化組織によって策定されている。一層進化した映像コード化技術が映像規格に採用されるにつれて、新たな映像コード化規格のコード化効率が一層高くなる。
開示の概要
[004] 本開示の実施形態は、映像コンテンツを処理するための方法を提供する。この方法は、ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、第1の区画のための第1の予測信号及び第2の区画のための第2の予測信号を生成するために、複数のブロックに対してインター予測を行うことと、分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することとを含み得る。
[005] 本開示の実施形態は、映像コンテンツを処理するためのシステムを提供する。このシステムは、1組の命令を記憶するメモリと、少なくとも1つのプロセッサとを含み、少なくとも1つのプロセッサは、システムに、ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、第1の区画のための第1の予測信号及び第2の区画のための第2の予測信号を生成するために、複数のブロックに対してインター予測を行うことと、分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することとを行わせるように、1組の命令を実行するように構成される。
[006] 本開示の実施形態は、コンピュータシステムの少なくとも1つのプロセッサによって実行可能な命令を記憶する非一時的コンピュータ可読媒体であって、命令の実行は、ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、第1の区画のための第1の予測信号及び第2の区画のための第2の予測信号を生成するために、複数のブロックに対してインター予測を行うことと、分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することとを含む方法をコンピュータシステムに行わせる、非一時的コンピュータ可読媒体を提供する。
図面の簡単な説明
[007] 本開示の実施形態及び様々な態様を以下の詳細な説明及び添付図面に示す。図中に示す様々な特徴は、縮尺通りに描かれていない。
[008]本開示の実施形態と合致する、例示的な映像シーケンスの構造を示す。 [009]本開示の実施形態と合致する、ハイブリッド映像コード化システムの例示的な符号化プロセスの概略図を示す。 [010]本開示の実施形態と合致する、ハイブリッド映像コード化システムの別の例示的な符号化プロセスの概略図を示す。 [011]本開示の実施形態と合致する、ハイブリッド映像コード化システムの例示的な復号プロセスの概略図を示す。 [012]本開示の実施形態と合致する、ハイブリッド映像コード化システムの別の例示的な復号プロセスの概略図を示す。 [013]本開示の実施形態と合致する、映像を符号化又は復号するための例示的な機器のブロック図である。 [014]本開示の実施形態と合致する、三角形分割に基づく例示的なインター予測を示す。 [015]本開示の実施形態と合致する、動きベクトルにマージインデックスを関連付けるための例示的な表を示す。 [016]本開示の実施形態と合致する、例示的なクロマ重みマップ及び例示的なルマ重みサンプルを示す。 [017]本開示の実施形態と合致する、単予測領域又は双予測領域内に位置する動きベクトルを記憶するための4×4サブブロックの例を示す。 [018]本開示の実施形態と合致する、マージモードの例示的な構文構造を示す。 [019]本開示の実施形態と合致する、マージモードの別の例示的な構文構造を示す。 [020]本開示の実施形態と合致する、例示的な幾何学的分割を示す。 [021]本開示の実施形態と合致する、dis[]のための例示的な参照表を示す。 [022]本開示の実施形態と合致する、GeoFilter[]のための例示的な参照表を示す。 [023]本開示の実施形態と合致する、angleIdx及びdistanceIdxのための例示的な参照表を示す。 [023]本開示の実施形態と合致する、angleIdx及びdistanceIdxのための例示的な参照表を示す。 [023]本開示の実施形態と合致する、angleIdx及びdistanceIdxのための例示的な参照表を示す。 [023]本開示の実施形態と合致する、angleIdx及びdistanceIdxのための例示的な参照表を示す。 [024]本開示の実施形態と合致する、stepDisのための例示的な参照表を示す。 [024]本開示の実施形態と合致する、stepDisのための例示的な参照表を示す。 [025]本開示の実施形態と合致する、stepDisのための別の例示的な参照表を示す。 [025]本開示の実施形態と合致する、stepDisのための別の例示的な参照表を示す。 [026]本開示の実施形態と合致する、幾何学的分割サブモードの総数を140に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [026]本開示の実施形態と合致する、幾何学的分割サブモードの総数を140に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [026]本開示の実施形態と合致する、幾何学的分割サブモードの総数を140に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [026]本開示の実施形態と合致する、幾何学的分割サブモードの総数を140に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [027]本開示の実施形態と合致する、幾何学的分割サブモードの総数を108に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [027]本開示の実施形態と合致する、幾何学的分割サブモードの総数を108に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [027]本開示の実施形態と合致する、幾何学的分割サブモードの総数を108に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [028]本開示の実施形態と合致する、幾何学的分割サブモードの総数を80に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [028]本開示の実施形態と合致する、幾何学的分割サブモードの総数を80に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [029]本開示の実施形態と合致する、幾何学的分割サブモードの総数を64に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [029]本開示の実施形態と合致する、幾何学的分割サブモードの総数を64に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [030]本開示の実施形態と合致する、幾何学的分割モードのための例示的な構文構造を示す。 [031]本開示の実施形態と合致する、幾何学的分割モードのための別の例示的な構文構造を示す。 [032]本開示の実施形態と合致する、幾何学的分割モードのための更に別の例示的な構文構造を示す。 [033]本開示の実施形態と合致する、インター予測ブロックのための例示的なサブブロック変換を示す。 [034]本開示の実施形態と合致する、統一構文構造の一例を示す。 [035]本開示の実施形態と合致する、統一構文構造の別の例を示す。 [036]本開示の実施形態と合致する、統一構文構造の更に別の例を示す。 [037]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための例示的な参照表を示す。 [037]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための例示的な参照表を示す。 [037]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための例示的な参照表を示す。 [037]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための例示的な参照表を示す。 [038]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための別の例示的な参照表を示す。 [039]本開示の実施形態と合致する、より大きいブロック寸法のみを分割する角度を認める一例を示す。 [040]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための更に別の例示的な参照表を示す。 [040]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための更に別の例示的な参照表を示す。 [040]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための更に別の例示的な参照表を示す。 [040]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための更に別の例示的な参照表を示す。 [041]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための更に別の例示的な参照表を示す。 [041]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための更に別の例示的な参照表を示す。 [041]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための更に別の例示的な参照表を示す。 [041]本開示の実施形態と合致する、三角形分割及び幾何学的分割を含むangleIdx及びdistanceIdxのための更に別の例示的な参照表を示す。 [042]本開示の実施形態と合致する、Dis[]のための例示的な参照表を示す。 [043]本開示の実施形態と合致する、例示的なコード化単位の構文構造を示す。 [044]本開示の実施形態と合致する、SBT分割及びGEO分割の例を示す。 [045]本開示の実施形態と合致する、別の例示的なコード化単位の構文構造を示す。 [046]本開示の実施形態と合致する、幾何学的分割サブモードの総数を80に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [046]本開示の実施形態と合致する、幾何学的分割サブモードの総数を80に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [047]本開示の実施形態と合致する、幾何学的分割サブモードの総数を64に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [047]本開示の実施形態と合致する、幾何学的分割サブモードの総数を64に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [048]本開示の実施形態と合致する、Rho[]のための例示的な参照表を示す。 [049]本開示の実施形態と合致する、1ブロック当たりのそれぞれの演算数の表を示す。 [050]本開示の実施形態と合致する、Rhosubblk[]のための例示的な参照表を示す。 [051]本開示の実施形態と合致する、135°の角度の例示的なマスクを示す。 [052]本開示の実施形態と合致する、45°の角度の例示的なマスクを示す。 [053]本開示の実施形態と合致する、135°の角度の例示的なマスクを示す。 [054]本開示の実施形態と合致する、45°の角度の例示的なマスクを示す。 [055]本開示の実施形態と合致する、様々なブロック形状のための三角形分割モードの例示的な角度を示す。 [056]本開示の実施形態と合致する、幾何学的分割サブモードの総数を140に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [056]本開示の実施形態と合致する、幾何学的分割サブモードの総数を140に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [056]本開示の実施形態と合致する、幾何学的分割サブモードの総数を140に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [056]本開示の実施形態と合致する、幾何学的分割サブモードの総数を140に設定したときのangleIdx及びdistanceIdxのための例示的な参照表を示す。 [057]本開示の実施形態と合致する、映像コンテンツを処理するための例示的方法のフローチャートである。
詳細な説明
[058] ここで、その例が添付図面に示される例示的実施形態を詳細に参照する。以下の説明は、添付図面を参照し、添付図面では、他に指示がない限り、異なる図中の同じ数字が同じ又は同様の要素を表す。例示的実施形態についての以下の説明に記載される実装形態は、本発明と合致する全ての実装形態を表すわけではない。むしろ、それらは、添付の特許請求の範囲で列挙する本発明に関係する態様と合致する機器及び方法の例に過ぎない。別段の定めがない限り、「又は」という語は、実行不可能な場合を除いて、あり得る全ての組み合わせを包含する。例えば、ある構成要素がA又はBを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、その構成要素は、A若しくはB又はA及びBを含むことができる。第2の例として、ある構成要素がA、B又はCを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、その構成要素は、A、若しくはB、若しくはC、又はA及びB、又はA及びC、又はB及びC、又はA、及びB、及びCを含むことができる。
[059] 映像コード化システムは、デジタル映像信号を圧縮するために、例えば消費される記憶空間を減らすか、又はかかる信号に関連する伝送帯域幅の消費量を減らすために多くの場合に使用される。オンライン映像ストリーミング、テレビ会議又は映像監視等の映像圧縮の様々な応用において、(例えば、1920×1080ピクセルの解像度を有する)高精細度(HD)映像の人気が高まるにつれて、映像データの圧縮効率を高めることができる映像コード化ツールを開発することが継続的に求められている。
[060] 例えば、映像監視の応用は、多くの応用シナリオ(例えば、セキュリティ、交通、環境のモニタリング等)において一層且つ広範に使用されており、監視装置の数及び解像度が急激に増加している。多くの映像監視の応用シナリオは、より多くの情報を捕捉するためにHD映像をユーザに提供することを選択し、HD映像は、かかる情報を捕捉するために、1フレーム当たりでより多くのピクセルを有する。しかし、HD映像ビットストリームは、伝送のための高帯域幅及び記憶のための大きい空間を要求する高ビットレートを有し得る。例えば、平均的な1920×1080の解像度を有する監視映像ストリームは、リアルタイム伝送のために4Mbpsもの帯域幅を必要とし得る。更に、映像監視は、一般に、常時監視を行い、それは、映像データを記憶する場合に記憶システムにとって大きい課題となり得る。従って、HD映像の高帯域幅及び大きい記憶域に対する需要は、映像監視におけるHD映像の大規模な展開に対する主な制限になっている。
[061] 映像とは、視覚的情報を記憶するために時系列順に配置される静止ピクチャ(又は「フレーム」)の組である。それらのピクチャを時系列順に捕捉し、記憶するために、映像捕捉装置(例えば、カメラ)を使用することができ、かかるピクチャを時系列順に表示するために、映像再生装置(例えば、テレビ、コンピュータ、スマートフォン、タブレットコンピュータ、ビデオプレーヤ又は表示機能を有する任意のエンドユーザ端末)を使用することができる。更に、一部の応用では、監視、会議又は生放送等のために、映像捕捉装置が捕捉映像を映像再生装置(例えば、モニタを有するコンピュータ)にリアルタイムで伝送することができる。
[062] かかる応用が必要とする記憶空間及び伝送帯域幅を減らすために、映像を記憶及び伝送前に圧縮し、表示前に解凍することができる。この圧縮及び解凍は、プロセッサ(例えば、汎用コンピュータのプロセッサ)又は専用ハードウェアによって実行されるソフトウェアによって実装され得る。圧縮のためのモジュールを一般に「符号器」と呼び、解凍のためのモジュールを一般に「復号器」と呼ぶ。符号器及び復号器は、まとめて「コーデック」と呼ぶことができる。符号器及び復号器は、様々な適切なハードウェア、ソフトウェア又はその組み合わせとして実装することができる。例えば、符号器及び復号器のハードウェア実装は、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、書換可能ゲートアレイ(FPGA)、ディスクリートロジック又はその任意の組み合わせ等の回路を含み得る。符号器及び復号器のソフトウェア実装は、プログラムコード、コンピュータ実行可能命令、ファームウェア又はコンピュータ可読媒体内に固定される任意の適切なコンピュータによって実装されるアルゴリズム若しくはプロセスを含み得る。映像の圧縮及び解凍は、MPEG-1、MPEG-2、MPEG-4、H.26xシリーズ等の様々なアルゴリズム又は規格によって実装され得る。一部の応用では、コーデックが第1のコード化規格から映像を解凍し、第2のコード化規格を使用して、解凍された映像を再圧縮することができ、その場合、コーデックを「トランスコーダ」と呼ぶことができる。
[063] 映像符号化プロセスは、ピクチャを再構築するために使用可能な有用な情報を識別し、保つことができ、再構築に重要でない情報を無視することができる。無視された重要でない情報を完全に再構築できない場合、かかる符号化プロセスは、「非可逆」と呼ぶことができる。さもなければ、かかる符号化プロセスは、「可逆」と呼ぶことができる。殆どの符号化プロセスは、非可逆であり、これは、必要な記憶空間及び伝送帯域幅を減らすためのトレードオフである。
[064] 符号化されているピクチャ(「現ピクチャ」と呼ぶ)の有用な情報は、参照ピクチャ(例えば、過去に符号化され、再構築されたピクチャ)に対する変化を含む。かかる変化は、ピクセルの位置変化、光度変化又は色変化を含むことができ、そのうちの位置変化が最も関係している。オブジェクトを表すピクセル群の位置変化は、参照ピクチャと現ピクチャとの間のオブジェクトの動きを反映し得る。
[065] 別のピクチャを参照することなくコード化されるピクチャ(即ちそのようなピクチャは自らの参照ピクチャである)を「Iピクチャ」と呼ぶ。参照ピクチャとして過去のピクチャを使用してコード化されるピクチャを「Pピクチャ」と呼ぶ。参照ピクチャとして過去のピクチャ及び将来のピクチャの両方を使用してコード化される(即ち参照が「双方向」である)ピクチャを「Bピクチャ」と呼ぶ。
[066] 先に述べたように、HD映像を使用する映像監視は、高帯域幅及び大きい記憶域の需要の課題に直面する。この課題に対処するために、符号化映像のビットレートを下げることができる。Iピクチャ、Pピクチャ及びBピクチャのうち、Iピクチャが最も高いビットレートを有する。殆どの監視映像の背景は、ほぼ静的であるため、符号化映像の全体的なビットレートを下げる1つの方法は、映像の符号化のためにより少ないIピクチャを使用することであり得る。
[067] しかし、符号化映像内において、Iピクチャは、一般に主要なものではないため、Iピクチャをより少なく使用する改善策は、些細なものであり得る。例えば、典型的な映像ビットストリームでは、Iピクチャ、Bピクチャ及びPピクチャの比率が1:20:9である場合があり、Iピクチャが総ビットレートの10%未満を占めることがある。換言すれば、かかる例では、全てのIピクチャを除去しても、低減されるビットレートは、10%に過ぎない可能性がある。
[068] 図1は、本開示の実施形態に合致する、映像シーケンス100の一例の構造を示す。映像シーケンス100は、生中継映像又は捕捉され、アーカイブされている映像であり得る。映像100は、現実の映像、コンピュータによって生成される映像(例えば、コンピュータゲーム映像)又はその組み合わせ(例えば、拡張現実効果を有する現実の映像)であり得る。映像シーケンス100は、映像捕捉装置(例えば、カメラ)、過去に捕捉された映像を含む映像アーカイブ(例えば、記憶装置内に記憶される映像ファイル)又は映像コンテンツプロバイダから映像を受信するための映像フィードインタフェース(例えば、映像ブロードキャストトランシーバ)から入力され得る。
[069] 図1に示すように、映像シーケンス100は、ピクチャ102、104、106及び108を含む、タイムラインに沿って時間的に配置される一連のピクチャを含み得る。ピクチャ102~106は、連続的であり、ピクチャ106とピクチャ108との間に更に多くのピクチャがある。図1では、ピクチャ102は、Iピクチャであり、その参照ピクチャは、ピクチャ102自体である。ピクチャ104は、Pピクチャであり、矢印によって示すように、その参照ピクチャは、ピクチャ102である。ピクチャ106は、Bピクチャであり、矢印によって示すように、その参照ピクチャは、ピクチャ104及び108である。一部の実施形態では、ピクチャ(例えば、ピクチャ104)の参照ピクチャは、そのピクチャの直前又は直後になくてもよい。例えば、ピクチャ104の参照ピクチャは、ピクチャ102に先行するピクチャであり得る。ピクチャ102~106の参照ピクチャは、例に過ぎず、本開示は、参照ピクチャの実施形態を、図1に示す例として限定しないことに留意すべきである。
[070] 典型的には、映像コーデックは、全ピクチャを一度に符号化又は復号せず、それは、かかるタスクが計算的に複雑であるためである。むしろ、映像コーデックは、ピクチャを基本セグメントに分割し、ピクチャをセグメントごとに符号化又は復号することができる。本開示では、そのような基本セグメントを基本処理単位(「BPU」)と呼ぶ。例えば、図1の構造110は、映像シーケンス100のピクチャ(例えば、ピクチャ102~108の何れか)の構造の一例を示す。構造110では、ピクチャが4×4の基本処理単位に分けられており、その境界が破線で示されている。一部の実施形態では、基本処理単位は、一部の映像コード化規格(例えば、MPEGファミリ、H.261、H.263又はH.264/AVC)内の「マクロブロック」と呼ぶことができ、他の一部の映像コード化規格(例えば、H.265/HEVC又はH.266/VVC)内の「コード化ツリー単位」(「CTU」)と呼ぶことができる。128×128、64×64、32×32、16×16、4×8、16×32又はピクセルのあらゆる任意の形状及びサイズ等、基本処理単位は、ピクチャ内で可変サイズを有することができる。基本処理単位のサイズ及び形状は、コード化の効率及び基本処理単位内で保とうとする詳細度のバランスに基づいてピクチャについて選択することができる。
[071] 基本処理単位は、コンピュータメモリ内(例えば、映像フレームバッファ内)に記憶される様々な種類の映像データ群を含み得る論理単位であり得る。例えば、カラーピクチャの基本処理単位は、無彩色の輝度情報を表すルマ成分(Y)、色情報を表す1つ又は複数のクロマ成分(例えば、Cb及びCr)並びにルマ成分及びクロマ成分が同じサイズを有し得る基本処理単位の関連構文要素を含むことができる。一部の映像コード化規格(例えば、H.265/HEVC又はH.266/VVC)では、ルマ成分及びクロマ成分が「コード化ツリーブロック」(「CTB」)と呼ばれ得る。基本処理単位に対して行われるいかなる操作も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。
[072] 映像のコード化は、複数の操作段階を有し、その例を図2A~図2B及び図3A~図3Bで詳述する。それぞれの段階について、基本処理単位のサイズは、依然として処理するのに大き過ぎる場合があり、従って本開示で「基本処理副単位」と呼ぶセグメントに更に分けることができる。一部の実施形態では、基本処理副単位は、一部の映像コード化規格(例えば、MPEGファミリ、H.261、H.263又はH.264/AVC)内の「ブロック」と呼ぶことができるか、又は他の一部の映像コード化規格(例えば、H.265/HEVC又はH.266/VVC)内の「コード化単位」(「CU」)と呼ぶことができる。基本処理副単位は、基本処理単位と同じ又はそれよりも小さいサイズを有し得る。基本処理単位と同様に、基本処理副単位もコンピュータメモリ内(例えば、映像フレームバッファ内)に記憶される様々な種類の映像データ群(例えば、Y、Cb、Cr及び関連構文要素)を含み得る論理単位である。基本処理副単位に対して行われるいかなる操作も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。処理の必要性に応じて、かかる分割は、更なるレベルに対して行われ得ることに留意すべきである。様々な段階が様々な方式を使用して基本処理単位を分割できることにも留意すべきである。
[073] 例えば、(その一例を図2Bで詳述する)モード決定段階において、基本処理単位に対して何れの予測モード(例えば、イントラピクチャ予測又はインターピクチャ予測)を使用するかを符号器が決定することができ、基本処理単位は、かかる決定を下すには大き過ぎる場合がある。符号器は、基本処理単位を複数の基本処理副単位(例えば、H.265/HEVC又はH.266/VVCにおけるCU)に分け、個々の基本処理副単位ごとに予測の種類を決定することができる。
[074] 別の例では、(その一例を図2Aに詳述する)予測段階において、符号器は、基本処理副単位(例えば、CU)のレベルにおいて予測操作を行うことができる。しかし、一部の事例では、処理するのに基本処理副単位が依然として大き過ぎる場合がある。符号器は、基本処理副単位をより小さいセグメント(例えば、H.265/HEVC又はH.266/VVC内で「予測ブロック」又は「PB」と呼ばれる)に更に分けることができ、そのレベルにおいて予測操作を行うことができる。
[075] 別の例では、(その一例を図2Aに詳述する)変換段階において、符号器は、残差基本処理副単位(例えば、CU)に対する変換操作を行うことができる。しかし、一部の事例では、処理するのに基本処理副単位が依然として大き過ぎる場合がある。符号器は、基本処理副単位をより小さいセグメント(例えば、H.265/HEVC又はH.266/VVC内で「変換ブロック」又は「TB」と呼ばれる)に更に分けることができ、そのレベルにおいて変換操作を行うことができる。同じ基本処理副単位の分割方式は、予測段階と変換段階とで異なり得ることに留意すべきである。例えば、H.265/HEVC又はH.266/VVCでは、同じCUの予測ブロック及び変換ブロックは、異なるサイズ及び数を有し得る。
[076] 図1の構造110では、基本処理単位112が3×3の基本処理副単位に更に分けられており、その境界が点線で示されている。同じピクチャの異なる基本処理単位を異なる方式で基本処理副単位に分けることができる。
[077] 一部の実装形態では、映像の符号化及び復号に並列処理及び誤り耐性の機能を与えるために、ピクチャを処理のための領域に分けることができ、それにより、ピクチャの領域について、符号化又は復号プロセスがピクチャの他の任意の領域の情報に依存しないようにすることができる。換言すれば、ピクチャの各領域を独立に処理することができる。そうすることで、コーデックは、ピクチャの異なる領域を並列に処理し、従ってコード化の効率を高めることができる。更に、領域のデータが処理内で破損するか又はネットワーク伝送内で失われる場合、コーデックは、破損するか又は失われたデータに依存することなく、同じピクチャの他の領域を正しく符号化又は復号することができ、従って誤り耐性の機能を提供する。一部の映像コード化規格では、ピクチャを異なる種類の領域に分割することができる。例えば、H.265/HEVC及びH.266/VVCは、「スライス」及び「タイル」という2種類の領域を提供する。映像シーケンス100の様々なピクチャは、ピクチャを領域に分けるための様々な分割方式を有し得ることにも留意すべきである。
[078] 例えば、図1では、構造110が3つの領域114、116及び118に分けられており、その境界が構造110内の実線として示されている。領域114は、4個の基本処理単位を含む。領域116及び118のそれぞれは、6個の基本処理単位を含む。図1の構造110の基本処理単位、基本処理副単位及び領域は、例に過ぎず、本開示は、その実施形態を限定しないことに留意すべきである。
[079] 図2Aは、本開示の実施形態と合致する、符号化プロセス200Aの一例の概略図を示す。例えば、符号化プロセス200Aは、符号器によって実行され得る。図2Aに示すように、符号器は、プロセス200Aに従って映像シーケンス202を映像ビットストリーム228に符号化することができる。図1の映像シーケンス100と同様に、映像シーケンス202は、時系列順に配置されるピクチャ(「元のピクチャ」と呼ぶ)の組を含み得る。図1の構造110と同様に、映像シーケンス202のそれぞれの元のピクチャは、符号器によって基本処理単位、基本処理副単位又は処理のための領域に分けられ得る。一部の実施形態では、符号器は、映像シーケンス202のそれぞれの元のピクチャに関する基本処理単位のレベルにおいてプロセス200Aを実行することができる。例えば、符号器は、プロセス200Aを反復的な方法で実行することができ、符号器は、プロセス200Aの1回の反復において基本処理単位を符号化することができる。一部の実施形態では、符号器は、映像シーケンス202のそれぞれの元のピクチャの領域(例えば、領域114~118)についてプロセス200Aを並列に実行することができる。
[080] 図2Aでは、符号器は、映像シーケンス202の元のピクチャの基本処理単位(「元のBPU」と呼ぶ)を予測段階204にフィードして、予測データ206及び予測されたBPU208を生成することができる。符号器は、元のBPUから、予測されたBPU208を減算して、残差BPU210を生成することができる。符号器は、残差BPU210を変換段階212及び量子化段階214にフィードして、量子化された変換係数216を生成することができる。符号器は、予測データ206及び量子化された変換係数216をバイナリコード化段階226にフィードして、映像ビットストリーム228を生成することができる。構成要素202、204、206、208、210、212、214、216、226及び228は、「順方向経路」と呼ぶことができる。プロセス200A中、符号器は、量子化段階214後、量子化された変換係数216を逆量子化段階218及び逆変換段階220にフィードして、再構築された残差BPU222を生成することができる。符号器は、再構築された残差BPU222を、予測されたBPU208に加えて、プロセス200Aの次の反復の予測段階204に使用される予測基準224を生成することができる。プロセス200Aの構成要素218、220、222及び224は、「再構築経路」と呼ぶことができる。再構築経路は、符号器及び復号器の両方が予測に同じ参照データを使用することを確実にするために使用され得る。
[081] 符号器は、プロセス200Aを反復的に実行して、(順方向経路内で)元のピクチャのそれぞれの元のBPUを符号化し、(再構築経路内で)元のピクチャの次の元のBPUを符号化するための予測された基準224を生成することができる。元のピクチャの全ての元のBPUを符号化した後、符号器は、映像シーケンス202内の次のピクチャの符号化に進むことができる。
[082] プロセス200Aを参照すると、符号器は、映像捕捉装置(例えば、カメラ)によって生成される映像シーケンス202を受信することができる。本明細書で使用する「受信(する)」という用語は、データを入力するための、受信すること、入力すること、取得すること、取り出すこと、得ること、読み出すこと、アクセスすること又は任意の方法の任意のアクションを指すことができる。
[083] 予測段階204では、現在の反復において、符号器が元のBPU及び予測基準224を受信し、予測操作を行って予測データ206及び予測されたBPU208を生成することができる。予測基準224は、プロセス200A前の反復の再構築経路から生成され得る。予測段階204の目的は、予測データ206及び予測基準224から予測されたBPU208として元のBPUを再構築するために使用され得る予測データ206を抽出することにより、情報の冗長性を減らすことである。
[084] 理想的には、予測されたBPU208は、元のBPUと同一であり得る。しかし、理想的でない予測及び再構築操作により、予測されたBPU208は、概して、元のBPUと僅かに異なる。そのような差を記録するために、符号器は、予測されたBPU208を生成した後、それを元のBPUから減算して残差BPU210を生成することができる。例えば、符号器は、予測されたBPU208のピクセルの値(例えば、グレースケール値又はRGB値)を元のBPUの対応するピクセルの値から減算することができる。元のBPUの対応するピクセルと、予測されたBPU208との間のかかる減算の結果、残差BPU210の各ピクセルは、残差値を有し得る。元のBPUと比較して、予測データ206及び残差BPU210は、より少ないビットを有し得るが、品質を著しく損なうことなく元のBPUを再構築するためにそれらを使用することができる。
[085] 残差BPU210を更に圧縮するために、変換段階212において、符号器は、残差BPU210を2次元「基底パターン」の組に分解することにより、残差BPU210の空間的冗長性を低減することができ、各基底パターンは、「変換係数」に関連する。基底パターンは、同じサイズ(例えば、残差BPU210のサイズ)を有することができる。それぞれの基底パターンは、残差BPU210の変動周波数(例えば、輝度変動周波数)成分を表すことができる。基底パターンの何れも、他の任意の基底パターンの任意の組み合わせ(例えば、線形結合)から再現することができない。換言すれば、分解は、残差BPU210の変動を周波数領域内に分解することができる。かかる分解は、関数の離散フーリエ変換に類似し、基底パターンは、離散フーリエ変換の基底関数(例えば、三角関数)に類似し、変換係数は、基底関数に関連する係数に類似する。
[086] 様々な変換アルゴリズムが様々な基底パターンを使用することができる。例えば、離散コサイン変換、離散サイン変換等、変換段階212では、様々な変換アルゴリズムを使用することができる。変換段階212における変換は、可逆的である。即ち、符号器は、変換の逆操作(「逆変換」と呼ぶ)によって残差BPU210を復元することができる。例えば、残差BPU210のピクセルを復元するために、逆変換は、基底パターンの対応するピクセルの値を、関連するそれぞれの係数で乗算し、積を加算して加重和をもたらすことであり得る。映像コード化規格では、符号器及び復号器の両方が同じ変換アルゴリズム(従って同じ基底パターン)を使用することができる。従って、符号器は、変換係数のみを記録することができ、復号器は、符号器から基底パターンを受信することなく、かかる変換係数から残差BPU210を再構築することができる。残差BPU210と比較して、変換係数の方が少ないビットを有し得るが、それらの変換係数は、品質を著しく損なうことなく残差BPU210を再構築するために使用され得る。従って、残差BPU210が更に圧縮される。
[087] 符号器は、量子化段階214において変換係数を更に圧縮することができる。変換プロセスでは、様々な基底パターンが様々な変動周波数(例えば、輝度変動周波数)を表すことができる。人間の目は、概して、低周波変動を認識することが得意であるため、符号器は、復号の際の著しい品質劣化を引き起こすことなく高周波変動の情報を無視することができる。例えば、量子化段階214において、符号器は、各変換係数を整数値(「量子化パラメータ」と呼ぶ)で除算し、商をその最近隣数に丸めることにより、量子化された変換係数216を生成することができる。かかる操作後、高周波基底パターンの一部の変換係数をゼロに変換することができ、低周波基底パターンの変換係数をより小さい整数に変換することができる。符号器は、ゼロ値の量子化された変換係数216を無視することができ、それにより変換係数が更に圧縮される。量子化プロセスも可逆的であり、量子化された変換係数216は、量子化の逆操作(「逆量子化」と呼ぶ)内で変換係数に再構築することができる。
[088] 符号器は、丸め操作内でかかる除算の剰余を無視するため、量子化段階214は、非可逆であり得る。典型的には、量子化段階214は、プロセス200A内で最大の情報損失に寄与し得る。情報損失が大きいほど、量子化された変換係数216が必要とし得るビットが少なくなる。情報損失の様々なレベルを得るために、符号器は、量子化パラメータの様々な値又は量子化プロセスの他の任意のパラメータを使用することができる。
[089] バイナリコード化段階226において、符号器は、例えば、エントロピーコード化、可変長コード化、算術コード化、ハフマンコード化、コンテキスト適応バイナリ算術コード化又は他の任意の可逆若しくは非可逆圧縮アルゴリズム等のバイナリコード化技法を使用し、予測データ206及び量子化された変換係数216を符号化することができる。一部の実施形態では、予測データ206及び量子化された変換係数216に加えて、符号器は、例えば、予測段階204で使用される予測モード、予測操作のパラメータ、変換段階212の変換の種類、量子化プロセスのパラメータ(例えば、量子化パラメータ)、符号器制御パラメータ(例えば、ビットレート制御パラメータ)等の他の情報をバイナリコード化段階226において符号化することができる。符号器は、バイナリコード化段階226の出力データを使用して映像ビットストリーム228を生成することができる。一部の実施形態では、映像ビットストリーム228をネットワーク伝送のために更にパケット化することができる。
[090] プロセス200Aの再構築経路を参照すると、逆量子化段階218では、符号器は、量子化された変換係数216に対して逆量子化を行って、再構築された変換係数を生成することができる。逆変換段階220では、符号器は、再構築された変換係数に基づいて、再構築された残差BPU222を生成することができる。符号器は、再構築された残差BPU222を、予測されたBPU208に加えて、プロセス200Aの次の反復内で使用される予測基準224を生成することができる。
[091] 映像シーケンス202を符号化するためにプロセス200Aの他のバリエーションを使用できることに留意すべきである。一部の実施形態では、符号器がプロセス200Aの段階を異なる順序で実行することができる。一部の実施形態では、プロセス200Aの1つ又は複数の段階を単一の段階に組み合わせることができる。一部の実施形態では、プロセス200Aの単一の段階を複数の段階に分けることができる。例えば、変換段階212と量子化段階214とを単一の段階に組み合わせることができる。一部の実施形態では、プロセス200Aは、追加の段階を含み得る。一部の実施形態では、プロセス200Aは、図2A内の1つ又は複数の段階を省くことができる。
[092] 図2Bは、本開示の実施形態に合致する、符号化プロセスの別の例200Bの概略図を示す。プロセス200Bは、プロセス200Aから修正され得る。例えば、プロセス200Bは、ハイブリッド映像コード化規格(例えば、H.26xシリーズ)に準拠する符号器によって使用され得る。プロセス200Aと比較して、プロセス200Bの順方向経路は、モード決定段階230を更に含み、予測段階204を空間的予測段階2042及び時間的予測段階2044に分ける。プロセス200Bの再構築経路は、ループフィルタ段階232及びバッファ234を追加で含む。
[093] 概して、予測技法は、空間的予測及び時間的予測の2つの種類に分類することができる。空間的予測(例えば、イントラピクチャ予測又は「イントラ予測」)は、現BPUを予測するために、同じピクチャ内の既にコード化された1つ又は複数の隣接BPUのピクセルを使用することができる。即ち、空間的予測における予測基準224は、隣接BPUを含み得る。空間的予測は、ピクチャの固有の空間的冗長性を減らすことができる。時間的予測(例えば、インターピクチャ予測又は「インター予測」)は、現BPUを予測するために、既にコード化された1つ又は複数のピクチャの領域を使用することができる。即ち、時間的予測における予測基準224は、コード化されたピクチャを含み得る。時間的予測は、ピクチャの固有の時間的冗長性を減らすことができる。
[094] プロセス200Bを参照すると、順方向経路において、符号器は、空間的予測段階2042及び時間的予測段階2044で予測操作を行う。例えば、空間的予測段階2042では、符号器は、イントラ予測を行うことができる。符号化されているピクチャの元のBPUに関して、予測基準224は、同じピクチャ内の(順方向経路内で)符号化され、(再構築経路内で)再構築されている1つ又は複数の隣接BPUを含み得る。符号器は、隣接BPUを外挿することにより、予測されたBPU208を生成することができる。外挿技法は、例えば、線形外挿又は線形補間、多項式外挿又は多項式補間等を含み得る。一部の実施形態では、予測されたBPU208のピクセルごとに対応するピクセルの値を外挿することによって等、符号器がピクセルレベルで外挿を行うことができる。外挿に使用される隣接BPUは、垂直方向(例えば、元のBPUの上)、水平方向(例えば、元のBPUの左)、対角線方向(例えば、元のBPUの左下、右下、左上又は右上)又は使用される映像コード化規格内で規定される任意の方向等、様々な方向から元のBPUに対して位置し得る。イントラ予測では、予測データ206は、例えば、使用される隣接BPUの位置(例えば、座標)、使用される隣接BPUのサイズ、外挿のパラメータ、元のBPUに対する使用される隣接BPUの方向等を含み得る。
[095] 別の例では、時間的予測段階2044では、符号器は、インター予測を行うことができる。現ピクチャの元のBPUに関して、予測基準224は、(順方向経路内で)符号化され、(再構築経路内で)再構築されている1つ又は複数のピクチャ(「参照ピクチャ」と呼ぶ)を含み得る。一部の実施形態では、参照ピクチャがBPUごとに符号化され再構築され得る。例えば、符号器は、再構築された残差BPU222を、予測されたBPU208に加えて、再構築されたBPUを生成することができる。同じピクチャの全ての再構築されたBPUが生成されると、符号器は、参照ピクチャとして再構築されたピクチャを生成することができる。符号器は、参照ピクチャの範囲(「探索窓」と呼ぶ)内の一致領域を探すために「動き推定」の操作を行うことができる。参照ピクチャ内の探索窓の位置は、現ピクチャ内の元のBPUの位置に基づいて決定することができる。例えば、探索窓は、現ピクチャ内の元のBPUと参照ピクチャ内で同じ座標を有する位置に中心を置くことができ、所定の距離にわたって広げることができる。符号器が探索窓内で元のBPUと同様の領域を(例えば、pel再帰アルゴリズム、ブロックマッチングアルゴリズム等を使用することによって)識別すると、符号器は、その領域を一致領域として決定することができる。一致領域は、元のBPUと異なる(例えば、それよりも小さい、等しい、大きい又は異なる形状の)寸法を有し得る。参照ピクチャ及び現ピクチャは、(例えば、図1に示すように)タイムライン内で時間的に隔てられているため、時間が経つにつれて一致領域が元のBPUの位置に「移動する」と見なすことができる。符号器は、かかる動きの方向及び距離を「動きベクトル」として記録することができる。(例えば、図1のピクチャ106のような)複数の参照ピクチャが使用される場合、符号器は、参照ピクチャごとに一致領域を探し、その関連する動きベクトルを求めることができる。一部の実施形態では、符号器は、個々の一致する参照ピクチャの一致領域のピクセル値に重みを割り当てることができる。
[096] 動き推定は、例えば、平行移動、回転、拡大縮小等の様々な種類の動きを識別するために使用することができる。インター予測では、予測データ206は、例えば、一致領域の位置(例えば、座標)、一致領域に関連する動きベクトル、参照ピクチャの数、参照ピクチャに関連する重み等を含み得る。
[097] 予測されたBPU208を生成するために、符号器は、「動き補償」の操作を行うことができる。動き補償は、予測データ206(例えば、動きベクトル)及び予測基準224に基づいて、予測されたBPU208を再構築するために使用することができる。例えば、符号器は、動きベクトルに従って参照ピクチャの一致領域を動かすことができ、その中では、符号器は、現ピクチャの元のBPUを予測することができる。(例えば、図1のピクチャ106のような)複数の参照ピクチャが使用される場合、符号器は、個々の動きベクトルに従って参照ピクチャの一致領域を動かし、一致領域のピクセル値を平均することができる。一部の実施形態では、符号器が、個々の一致する参照ピクチャの一致領域のピクセル値に重みを割り当てた場合、符号器は、動かした一致領域のピクセル値の加重和を加えることができる。
[098] 一部の実施形態では、インター予測は、単方向又は双方向であり得る。単方向のインター予測は、現ピクチャに対して同じ時間的方向にある1つ又は複数の参照ピクチャを使用することができる。例えば、図1のピクチャ104は、参照ピクチャ(即ちピクチャ102)がピクチャ104に先行する単方向のインター予測ピクチャである。双方向のインター予測は、現ピクチャに対して両方の時間的方向にある1つ又は複数の参照ピクチャを使用することができる。例えば、図1のピクチャ106は、参照ピクチャ(即ちピクチャ104及び108)がピクチャ104に対して両方の時間的方向にある双方向のインター予測ピクチャである。
[099] プロセス200Bの順方向経路を引き続き参照すると、空間的予測段階2042及び時間的予測段階2044後、モード決定段階230において、符号器は、プロセス200Bの現在の反復のための予測モード(例えば、イントラ予測又はインター予測の1つ)を選択することができる。例えば、符号器は、レート歪み最適化技法を実行することができ、かかる技法では、符号器は、候補予測モードのビットレート及び候補予測モード下の再構築された参照ピクチャの歪みに応じて、コスト関数の値を最小化するための予測モードを選択することができる。選択される予測モードに応じて、符号器は、対応する予測されたBPU208及び予測されたデータ206を生成することができる。
[100] プロセス200Bの再構築経路において、順方向経路内でイントラ予測モードが選択されている場合、予測基準224(例えば、現ピクチャ内で符号化され再構築されている現BPU)を生成した後、符号器は、後に使用するために(例えば、現ピクチャの次のBPUを外挿するために)空間的予測段階2042に予測基準224を直接フィードすることができる。順方向経路内でインター予測モードが選択されている場合、予測基準224(例えば、全てのBPUが符号化され再構築されている現ピクチャ)を生成した後、符号器は、ループフィルタ段階232に予測基準224をフィードすることができ、ループフィルタ段階232では、符号器は、予測基準224にループフィルタを適用して、インター予測によって引き起こされる歪み(例えば、ブロッキングアーティファクト)を減らすか又はなくすことができる。例えば、デブロッキング、サンプル適応オフセット、適応ループフィルタ等、符号器は、ループフィルタ段階232で様々なループフィルタ技法を適用することができる。ループフィルタされた参照ピクチャは、後に使用するために(例えば、映像シーケンス202の将来のピクチャのためのインター予測参照ピクチャとして使用するために)バッファ234(又は「復号されたピクチャバッファ」)内に記憶することができる。符号器は、時間的予測段階2044で使用するために1つ又は複数の参照ピクチャをバッファ234内に記憶することができる。一部の実施形態では、符号器は、量子化された変換係数216、予測データ206及び他の情報と共にループフィルタのパラメータ(例えば、ループフィルタの強度)をバイナリコード化段階226で符号化することができる。
[101] 図3Aは、本開示の実施形態に合致する、復号プロセス300Aの一例の概略図を示す。プロセス300Aは、図2Aの圧縮プロセス200Aに対応する解凍プロセスであり得る。一部の実施形態では、プロセス300Aは、プロセス200Aの再構築経路と同様であり得る。復号器は、プロセス300Aに従って映像ビットストリーム228を映像ストリーム304に復号することができる。映像ストリーム304は、映像シーケンス202と非常に類似し得る。しかし、圧縮及び解凍プロセス(例えば、図2A~図2Bの量子化段階214)における情報損失により、概して、映像ストリーム304は、映像シーケンス202と同一ではない。図2A~図2Bのプロセス200A及び200Bと同様に、復号器は、映像ビットストリーム228内に符号化される各ピクチャについて、基本処理単位(BPU)のレベルにおいてプロセス300Aを実行することができる。例えば、復号器は、プロセス300Aを反復的な方法で実行することができ、復号器は、プロセス300Aの1回の反復において基本処理単位を復号することができる。一部の実施形態では、復号器は、映像ビットストリーム228内に符号化される各ピクチャの領域(例えば、領域114~118)についてプロセス300Aを並列に実行することができる。
[102] 図3Aでは、復号器は、符号化されたピクチャの基本処理単位(「符号化されたBPU」と呼ぶ)に関連する映像ビットストリーム228の一部をバイナリ復号段階302にフィードすることができる。バイナリ復号段階302では、復号器は、その部分を予測データ206及び量子化された変換係数216に復号することができる。復号器は、量子化された変換係数216を逆量子化段階218及び逆変換段階220にフィードして、再構築された残差BPU222を生成することができる。復号器は、予測データ206を予測段階204にフィードして、予測されたBPU208を生成することができる。復号器は、再構築された残差BPU222を、予測されたBPU208に加えて、予測された基準224を生成することができる。一部の実施形態では、予測された基準224がバッファ(例えば、コンピュータメモリ内の復号されたピクチャバッファ)内に記憶され得る。復号器は、プロセス300Aの次の反復内で予測操作を行うための予測された基準224を予測段階204にフィードすることができる。
[103] 復号器は、プロセス300Aを反復的に実行して、符号化されたピクチャの各符号化されたBPUを復号し、符号化されたピクチャの次の符号化されたBPUを符号化するための予測された基準224を生成することができる。符号化されたピクチャの全ての符号化されたBPUを復号した後、復号器は、表示するためにピクチャを映像ストリーム304に出力し、映像ビットストリーム228内の次の符号化されたピクチャの復号に進むことができる。
[104] バイナリ復号段階302では、復号器は、符号器が使用したバイナリコード化技法(例えば、エントロピーコード化、可変長コード化、算術コード化、ハフマンコード化、コンテキスト適応バイナリ算術コード化又は他の任意の可逆圧縮アルゴリズム)の逆操作を行うことができる。一部の実施形態では、予測データ206及び量子化された変換係数216に加えて、復号器は、例えば、予測モード、予測操作のパラメータ、変換の種類、量子化プロセスのパラメータ(例えば、量子化パラメータ)、符号器制御パラメータ(例えば、ビットレート制御パラメータ)等の他の情報をバイナリ復号段階302において復号することができる。一部の実施形態では、映像ビットストリーム228がネットワーク上においてパケット単位で伝送される場合、復号器は、映像ビットストリーム228をパケット化解除してからそれをバイナリ復号段階302にフィードすることができる。
[105] 図3Bは、本開示の実施形態に合致する、復号プロセスの別の例300Bの概略図を示す。プロセス300Bは、プロセス300Aから修正され得る。例えば、プロセス300Bは、ハイブリッド映像コード化規格(例えば、H.26xシリーズ)に準拠する復号器によって使用され得る。プロセス300Aと比較して、プロセス300Bは、予測段階204を空間的予測段階2042及び時間的予測段階2044に更に分け、ループフィルタ段階232及びバッファ234を追加で含む。
[106] プロセス300Bでは、復号されている符号化されたピクチャ(「現ピクチャ」と呼ぶ)の符号化された基本処理単位(「現BPU」と呼ぶ)に関して、復号器によってバイナリ復号段階302から復号される予測データ206は、現BPUを符号化するために何れの予測モードが符号器によって使用されたかに応じて様々な種類のデータを含み得る。例えば、現BPUを符号化するためにイントラ予測が符号器によって使用された場合、予測データ206は、イントラ予測、イントラ予測操作のパラメータ等を示す予測モードインジケータ(例えば、フラグ値)を含み得る。イントラ予測操作のパラメータは、例えば、基準として使用される1つ又は複数の隣接BPUの位置(例えば、座標)、隣接BPUのサイズ、外挿のパラメータ、元のBPUに対する隣接BPUの方向等を含み得る。別の例では、現BPUを符号化するためにインター予測が符号器によって使用された場合、予測データ206は、インター予測、インター予測操作のパラメータ等を示す予測モードインジケータ(例えば、フラグ値)を含み得る。インター予測操作のパラメータは、例えば、現BPUに関連する参照ピクチャの数、参照ピクチャにそれぞれ関連する重み、それぞれの参照ピクチャ内の1つ又は複数の一致領域の位置(例えば、座標)、一致領域にそれぞれ関連する1つ又は複数の動きベクトル等を含み得る。
[107] 予測モードインジケータに基づき、復号器は、空間的予測段階2042で空間的予測(例えば、イントラ予測)を行うか、又は時間的予測段階2044で時間的予測(例えば、インター予測)を行うかを決めることができる。かかる空間的予測又は時間的予測の実行の詳細は、図2Bに示されており、以下で繰り返さない。かかる空間的予測又は時間的予測を行った後、復号器は、予測されたBPU208を生成することができる。図3Aに記載したように、復号器は、予測されたBPU208と、再構築された残差BPU222とを加えて、予測基準224を生成することができる。
[108] プロセス300Bでは、復号器は、プロセス300Bの次の反復内で予測操作を行うための予測された基準224を空間的予測段階2042又は時間的予測段階2044にフィードすることができる。例えば、現BPUが空間的予測段階2042においてイントラ予測を使用して復号される場合、予測基準224(例えば、復号された現BPU)を生成した後、復号器は、後に使用するために(例えば、現ピクチャの次のBPUを外挿するために)空間的予測段階2042に予測基準224を直接フィードすることができる。現BPUが時間的予測段階2044においてインター予測を使用して復号される場合、予測基準224(例えば、全てのBPUが復号されている参照ピクチャ)を生成した後、符号器は、ループフィルタ段階232に予測基準224をフィードして歪み(例えば、ブロッキングアーティファクト)を減らすか又はなくすことができる。復号器は、図2Bに記載した方法で予測基準224にループフィルタを適用することができる。ループフィルタされた参照ピクチャは、後に使用するために(例えば、映像ビットストリーム228の将来の符号化ピクチャのためのインター予測参照ピクチャとして使用するために)バッファ234(例えば、コンピュータメモリ内の復号されたピクチャバッファ)内に記憶することができる。復号器は、時間的予測段階2044で使用するために1つ又は複数の参照ピクチャをバッファ234内に記憶することができる。一部の実施形態では、現BPUを符号化するためにインター予測が使用されたことを予測データ206の予測モードインジケータが示す場合、予測データは、ループフィルタのパラメータ(例えば、ループフィルタの強度)を更に含むことができる。
[109] 図4は、本開示の実施形態に合致する、映像を符号化又は復号するための機器400の一例のブロック図である。図4に示すように、機器400は、プロセッサ402を含み得る。プロセッサ402が本明細書に記載の命令を実行するとき、機器400は、映像を符号化又は復号するための専用マシンになり得る。プロセッサ402は、情報を操作又は処理することができる任意の種類の回路であり得る。例えば、プロセッサ402は、任意の数の中央処理装置(「CPU」)、グラフィックス処理装置(「GPU」)、ニューラル処理ユニット(「NPU」)、マイクロコントローラユニット(「MCU」)、光プロセッサ、プログラム可能論理コントローラ、マイクロコントローラ、マイクロプロセッサ、デジタル信号プロセッサ、知的財産(IP)コア、プログラム可能論理アレイ(PLA)、プログラム可能アレイ論理(PAL)、汎用アレイ論理(GAL)、複合プログラム可能論理装置(CPLD)、書換可能ゲートアレイ(FPGA)、システムオンチップ(SoC)、特定用途向け集積回路(ASIC)等の任意の組み合わせを含み得る。一部の実施形態では、プロセッサ402は、単一の論理構成要素としてグループ化されるプロセッサの組であり得る。例えば、図4に示すように、プロセッサ402は、プロセッサ402a、プロセッサ402b及びプロセッサ402nを含む複数のプロセッサを含み得る。
[110] 機器400は、データ(例えば、命令、コンピュータコード、中間データ等の組)を記憶するように構成されるメモリ404も含み得る。例えば、図4に示すように、記憶データは、プログラム命令(例えば、プロセス200A、200B、300A又は300B内の段階を実装するためのプログラム命令)及び処理用データ(例えば、映像シーケンス202、映像ビットストリーム228又は映像ストリーム304)を含み得る。プロセッサ402は、プログラム命令及び処理用データに(例えば、バス410を介して)アクセスし、プログラム命令を実行して処理用データに対する操作又は処理を行うことができる。メモリ404は、高速ランダムアクセス記憶装置又は不揮発性記憶装置を含み得る。一部の実施形態では、メモリ404は、任意の数のランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、光学ディスク、磁気ディスク、ハードドライブ、ソリッドステートドライブ、フラッシュドライブ、セキュリティデジタル(SD)カード、メモリスティック、コンパクトフラッシュ(CF)カード等の任意の組み合わせを含み得る。メモリ404は、単一の論理構成要素としてグループ化される(図4には不図示の)メモリ群でもあり得る。
[111] 内蔵バス(例えば、CPUメモリバス)、外部バス(例えば、ユニバーサルシリアルバスポート、周辺機器コンポーネント相互接続エクスプレスポート)等のバス410は、機器400内の構成要素間でデータを転送する通信装置であり得る。
[112] 曖昧さを招くことなく説明を簡単にするために、本開示では、プロセッサ402及び他のデータ処理回路をまとめて「データ処理回路」と呼ぶ。データ処理回路は、完全にハードウェアとして又はソフトウェア、ハードウェア若しくはファームウェアの組み合わせとして実装することができる。加えて、データ処理回路は、単一の独立したモジュールであり得るか、又は機器400の他の任意の構成要素内に完全に若しくは部分的に組み合わされ得る。
[113] 機器400は、ネットワーク(例えば、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク等)との有線通信又は無線通信を提供するためのネットワークインタフェース406を更に含み得る。一部の実施形態では、ネットワークインタフェース406は、任意の数のネットワークインタフェースコントローラ(NIC)、無線周波数(RF)モジュール、トランスポンダ、トランシーバ、モデム、ルータ、ゲートウェイ、有線ネットワークアダプタ、無線ネットワークアダプタ、Bluetoothアダプタ、赤外線アダプタ、近距離無線通信(「NFC」)アダプタ、セルラネットワークチップ等の任意の組み合わせを含み得る。
[114] 一部の実施形態では、1つ又は複数の周辺装置への接続を提供するための周辺装置インタフェース408を任意選択的に機器400が更に含み得る。図4に示すように、周辺装置は、これのみに限定されないが、カーソル制御装置(例えば、マウス、タッチパッド又はタッチスクリーン)、キーボード、ディスプレイ(例えば、ブラウン管ディスプレイ、液晶ディスプレイ又は発光ダイオードディスプレイ)、映像入力装置(例えば、映像アーカイブに結合されるカメラ又は入力インタフェース)等を含み得る。
[115] 映像コーデック(例えば、プロセス200A、200B、300A又は300Bを実行するコーデック)は、機器400内の任意のソフトウェア又はハードウェアモジュールの任意の組み合わせとして実装できることに留意すべきである。例えば、プロセス200A、200B、300A又は300Bの一部の又は全ての段階は、メモリ404内にロード可能なプログラム命令等の機器400の1つ又は複数のソフトウェアモジュールとして実装され得る。別の例では、プロセス200A、200B、300A又は300Bの一部の又は全ての段階は、専用データ処理回路(例えば、FPGA、ASIC、NPU等)等の機器400の1つ又は複数のハードウェアモジュールとして実装され得る。
[116] 本開示は、動き予測において使用するためのブロック分割方法を提供する。開示する方法は、符号器又は復号器によって実行され得ることが予期される。
[117] インター予測に関して、三角形分割モードがサポートされる。三角形分割モードは、8×8以上であり、三角形スキップ又はマージモードによってコード化されるブロックに適用することができる。三角形スキップ/マージモードは、通常マージモード、MMVDモード、複合インター及びイントラ予測(CIIP)モード又はサブブロックマージモードと並行して信号化される。
[118] 三角形分割モードが使用される場合、ブロックは、対角線分割又は逆対角線分割(図5)を使用して2つの三角形区画に均等に分けることができる。ブロック内のそれぞれの三角形区画は、自らの動きを使用してインター予測される。それぞれの区画について、単予測のみが認められる。換言すれば、各区画は、1つの動きベクトル及び1つの参照インデックスを有する。従来の双予測と同様に、2つの動き補償予測のみが各ブロックに必要であることを確実にするために、単予測動き制約を適用する。各区画の単予測動きは、拡張マージ予測について構築されるマージ候補リストから直接導出され、リスト内の所与のマージ候補からの単予測動きの選択は、以下に記載する手順による。
[119] 三角形分割モードが現ブロックに使用される場合、三角形分割の方向(対角線又は逆対角線)を示すフラグ及び2つのマージインデックス(区画ごとに1つ)が更に信号化される。三角形区画のそれぞれを予測した後、適応重みを伴う混合処理を使用して、対角線エッジ又は逆対角線エッジに沿ったサンプル値を調節する。これは、ブロック全体の予測信号であり、他の予測モードと同様に変換及び量子化のプロセスをブロック全体に適用することができる。サブブロック変換(SBT)モードは、三角形分割モードを使用してコード化されるブロックに適用できないことに留意されたい。三角形分割モードを使用して予測されるブロックの動きフィールドは、4×4サブブロック内に記憶することができる。
[120] 三角形分割モードに関する単予測候補リストの構築を以下に記載する。
[121] マージ候補インデックスを所与として、図6に例示するように、単予測動きベクトルは、拡張マージ予測について構築されるマージ候補リストから導出される。リスト内の候補について、三角形分割モードの単予測動きベクトルとしてそのLX(L0又はL1)動きベクトルを使用し、Xは、マージ候補インデックス値のパリティに等しい(即ちX=0又は1)。図6では、これらの動きベクトルを「x」で印付けしてある。対応するLX動きベクトルが存在しない場合、拡張マージ予測候補リスト内の同じ候補のL(1-X)動きベクトルが三角形分割モードの単予測動きベクトルとして使用される。
[122] 三角形区画エッジに沿った混合について以下で説明する。
[123] 各三角形区画について、それぞれの動きを使用して予測した後、対角線エッジ又は逆対角線エッジの周りのサンプルを導出するために、2つの予測信号に混合を適用する。以下の重みを混合プロセスに使用する。
[124] 図7に示すように、ルマについて{7/8,6/8,5/8,4/8,3/8,2/8,1/8}であり、クロマについて{6/8,4/8,2/8}である。
[125] 三角形分割モードを使用して予測されるブロック内のルマサンプル及びクロマサンプルそれぞれの重みは、以下の式を使用して計算される。
- 比率
Figure 2022544350000002
- ブロックを第1の方向から(例えば、左上角から右下角へと)分ける場合、分割方向splitDirを0に設定する。そうではなく、ブロックを第2の方向から(例えば、右上角から左下角へと)分ける場合、splitDirを1に設定する。
Figure 2022544350000003
ここで、sampleWeightLは、ルマサンプルの重みマップを表し、sampleWeightCは、クロマサンプルの重みマップを表し、(x,y)は、ルマ/クロマサンプルの位置を表し、(CuWL,CuHL)は、ルマサンプル内のブロックの幅及び高さを表し、(CuWC,CuHC)は、クロマサンプル内のブロックの幅及び高さを表す。
[126] 次に、三角形分割モードにおける動きフィールド記憶について以下で説明する。
[127] 三角形分割モードによってコード化されるブロックの動きベクトルは、4×4サブブロック内に記憶される。各4×4サブブロックの位置に応じて、単予測動きベクトル又は双予測動きベクトルが記憶される。Mv1及びMv2は、図5の区画1及び区画2の単予測動きベクトルをそれぞれ表す。4×4サブブロックが単予測領域内に位置する場合、Mv1又はMv2は、その4×4サブブロックのために記憶される。そうではなく、4×4サブブロックが双予測領域内に位置する場合、双予測動きベクトルが記憶される。双予測動きベクトルは、以下のプロセスに従ってMv1及びMv2から導出される。
[128] 1.Mv1及びMv2が異なる参照ピクチャリストからのものである(一方がL0から、他方がL1からのものである)場合、Mv1及びMv2を単純に組み合わせて双予測動きベクトルを形成する。
[129] 2.そうではなく、Mv1及びMv2が同じリストからのものである場合、双予測動きの代わりに単予測動きMv2のみを記憶する。
[130] 4×4サブブロック内の全てのサンプルが重み付けされる場合、その4×4サブブロックは、双予測領域内にあると見なされることに留意されたい。さもなければ、その4×4サブブロックは、単予測領域内にあると見なされる。(陰影領域である)双予測領域及び単予測領域の例を図8に示す。
[131] 4×4サブブロックが双予測領域内に位置するかどうかを決定するために、以下の式を使用することができる。
- 比率
Figure 2022544350000004
- ブロックを左上角から右下角へと分ける場合、分割方向splitDirを0に設定する。そうではなく、ブロックを右上角から左下角へと分ける場合、splitDirを1に設定する。
- 変数
Figure 2022544350000005
- CuWL>CuHL及びsplitDir=0である場合、

Figure 2022544350000006
が成立する場合、4×4サブブロックは、双予測領域内に位置し、
- さもなければ、4×4サブブロックは、単予測領域内に位置し、
- CuWL≦CuHL及びsplitDir=0である場合、

Figure 2022544350000007
が成立する場合、4×4サブブロックは、双予測領域内に位置し、
- さもなければ、4×4サブブロックは、単予測領域内に位置し、
- CuWL>CuHL及びsplitDir=1である場合、

Figure 2022544350000008
が成立する場合、4×4サブブロックは、双予測領域内に位置し、
- さもなければ、4×4サブブロックは、単予測領域内に位置し、
- CuWL≦CuHL及びsplitDir=1である場合、

Figure 2022544350000009
が成立する場合、4×4サブブロックは、双予測領域内に位置し、
- さもなければ、4×4サブブロックは、単予測領域内に位置し、
ここで、(x,y)は、4×4サブブロックの左上ルマサンプルの位置を表し、(CuWL,CuHL)は、ルマサンプル内のブロックの幅及びブロックの高さを表す。
[132] 三角形分割モードのための例示的な構文構造を以下で説明する。
[133] マージモードの例示的な構文構造を図9~図10にそれぞれ示す。図示のCIIPフラグは、ブロックが三角形分割モードを使用して予測されるかどうかを示すために使用される。
[134] 本開示と合致する幾何学的分割モードを以下の通り説明する。
[135] 開示する実施形態では、映像コンテンツをコード化するために幾何学的分割モードを使用することもできる。幾何学的分割モードでは、ブロックが2つの区画に分けられ、2つの区画は、図11に示すように、矩形又は非矩形であり得る。次いで、その2つの区画を、その固有の動きベクトルを用いてインター予測する。単予測動きは、図6に関して上記で説明した同じプロセスを使用して導出される。幾何学的区画のそれぞれを予測した後、三角形分割モードで使用したプロセスと同様に、適応重みを伴う混合処理を使用して、分割エッジに沿ったサンプル値を調節する。これは、ブロック全体の予測信号であり、他の予測モードと同様に、変換及び量子化のプロセスをブロック全体に適用することができる。SBTモードは、幾何学的分割モードを使用してコード化されるブロックに適用できることに留意されたい。最後に、幾何学的分割モードを使用して予測されるブロックの動きフィールドを4×4サブブロック内に記憶することができる。幾何学的分割モードの利点は、このモードが動き補償に関してより柔軟な分割方法を提供することである。
[136] 幾何学的分割モードは、その幅及び高さが何れも8以上であり、max(幅,高さ)/min(幅,高さ)の比率が4以下であるブロックにのみ適用され、幾何学的スキップ又はマージモードによってコード化される。幾何学的分割モードは、通常マージモード、MMVDモード、CIIPモード、サブブロックマージモード又は三角形分割モードと並行してブロックごとに信号化される。このモードが現ブロックに使用される場合、現ブロックを分けるために140の分割方法(32の量子化された角度+5の量子化された距離)の何れが使用されるかを示す幾何学的分割モードインデックス及び2つのマージインデックスが更に信号化される。様々な設定にもよるが、幾何学的分割サブモードの総数は、140(16の量子化された角度+9の量子化された距離)、108(16の量子化された角度+7の量子化された距離)、80(12の量子化された角度+7の量子化された距離)及び64(10の量子化された角度+7の量子化された距離)の1つであり得ることに留意されたい。
[137] 幾何学的分割エッジに沿った混合を以下の通り説明する。その固有の動きを使用して各幾何学的区画を予測した後、区画エッジの周りのサンプルを導出するために、2つの予測信号に混合プロセスを適用する。一部の実施形態では、各ルマサンプルの重みが以下の式を使用して計算される。
distFromLine=((x<<1)+1)×Dis[displacementX]+((y<<1)+1)×Dis[displacementY]-rho
distScaled=Min((abs(distFromLine))>>4,14)
sampleWeightL[x][y]=distFromLine≦0?GeoFilter[distScaled]:8-GeoFilter[distScaled]
ここで、(x,y)は、各ルマサンプルの位置を表し、Dis[]及びGeoFilter[]は、図12~図13の表12及び表13A~13Bのそれぞれに示す2つの参照表である。
[138] パラメータdisplacementX、displacementY及びrhoは、下記の通り計算する。
displacementX=angleIdx
displacementY=(displancementX+NumAngles>>2)%NumAngles
rho=distanceIdx×stepSize×scaleStep+CuW×Dis[displacementX]+CuH×Dis[displacementY]
stepSize=stepDis+64
scaleStep=(wIdx≧hIdx)?(1<<hIdx):(1<<wIdx)
wIdx=log2(CuW)-3
hIdx=log2(CuH)-3
whRatio=(wIdx≧hIdx)?(wIdx-hIdx):(hIdx-wIdx)
Figure 2022544350000010
angleN=(wIdx≧hIdx)?8-angleN:angleN
ここで、(CuW,CuH)は、ルマサンプル内のブロックの幅及び高さであり、NumAnglesは、32に設定され、angleIdx及びdistanceIdxは、図14の表14から導出され、stepDisは、図15Aの表15Aから導出される。
[139] 一部の実施形態では、パラメータdisplacementX、displacementY及びrhoは、下記の通り計算することもできる。
displacementX=angleIdx
displacementY=(displancementX+NumAngles>>2)%NumAngles
rho=distanceIdx×(stepSize<<scaleStep)+Dis[displacementX]<<wIdx
+Dis[displacementY]<<hIdx
stepSize=stepDis+77
scaleStep=(wIdx≧hIdx)?hIdx-3:wIdx-3
wIdx=log2(CuW)
hIdx=log2(CuH)
whRatio=(wIdx≧hIdx)?(wIdx-hIdx):(hIdx-wIdx)
Figure 2022544350000011
ここで、(CuW,CuH)は、ルマサンプル内のブロックの幅及び高さであり、NumAnglesは、32に設定され、stepDisは、図15Bの表15Bから導出される。幾何学的分割サブモードの総数が140、108、80及び64にそれぞれ設定される場合、angleIdx及びdistanceIdxは、図15C~図15Fの表15C、表15D、表15E及び表15Fから導出される。
[140] 例えば、YUV4:2:0映像形式では、クロマサンプルの重みは、各2×2ルマサブブロックの左上ルマサンプルの重みからサブサンプルされる。
[141] 幾何学的分割モードにおける動きフィールド記憶について以下で説明する。
[142] 幾何学的分割モードによってコード化されるブロックの動きベクトルは、4×4サブブロック内に記憶される。4×4サブブロックごとに単予測動きベクトル又は双予測動きベクトルが記憶される。双予測動きの導出プロセスは、上記のプロセスと同じである。4×4サブブロックに関して、単予測動きベクトルが記憶されるか、又は双予測動きベクトルが記憶されるかを決定するために、2種類の方法を提案する。
[143] 第1の方法では、4×4サブブロックに関して、その4つの角のサンプル重み値を合計する。合計が閾値2よりも小さく、閾値1よりも大きい場合、この4×4サブブロックに関して双予測動きベクトルが記憶される。さもなければ、単予測動きベクトルが記憶される。閾値1及び閾値2は、32>>(((log2(CuW)+log2(CuH))>>1)-1)及び32-閾値1にそれぞれ設定される。
[144] 第2の方法では、4×4サブブロックの位置に応じて、この4×4サブブロックに関して、何れの動きベクトルが記憶されるかを決定するために、以下の式を使用する。
rhosubblk=3×Dis[displacementX]+3×Dis[displacementY]
distFromLinesubblk
=((xsubblk<<3)+1)×Dis[displacementX]
+((ysubblk<<3)+1)×Dis[displacementY]-rho+rhosubblk
motionMask[xsubblk][ysubblk]=abs(distFromLinesubblk)<256?2:(distFromLinesubblk≦0?0:1)
ここで、(xsubblk, ysubblk)は、各4×4サブブロックの位置を表す。変数Dis[]、displacementX、displacementY及びrhoは、上記の変数と同じである。motionMask[xsubblk][ysubblk]の値が2に等しい場合、この4×4サブブロックに関して双予測動きベクトルを記憶する。さもなければ、この4×4サブブロックに関して単予測動きベクトルを記憶する。
[145] 図16~図17Bにおいて、幾何学的分割モードに関する3つの例示的な構文構造をそれぞれ示す。
[146] 一部の実施形態では、サブブロック変換を使用することができる。サブブロック変換では、図18に示すように残差ブロックを2つの残差サブブロックに分ける。2つの残差サブブロックの1つのみがコード化される。もう一方の残差サブブロックに関しては、残差が0に等しく設定される。
[147] 残差を伴うインター予測ブロックでは、サブブロック変換が適用されるかどうかを示すために、CUレベルフラグが信号化される。サブブロック変換モードが使用される場合、残差ブロックが2つのサブブロックへの水平方向又は垂直方向の対称分割又は非対称分割であることを示すためのパラメータが信号化される。
[148] 三角形分割モード及び幾何学的分割モードは、動き補償のコード化効率を改善するための2つの分割方法である。三角形分割は、幾何学的分割の一部と見なすことができる。しかし、本実装形態では、幾何学的分割モードの構文構造、混合プロセス及び動きフィールド記憶は、三角形分割モードのものと異なる。例えば、これらの2つのモードでは、以下のプロセスが異なる。
[149] 1.マージモードでコード化されるブロックでは、(三角形分割モードフラグ及び幾何学的分割モードフラグを含む)2つのフラグが信号化される。更に、三角形分割モードは、その幅又は高さが4に等しいブロックに適用することができる。しかし、幾何学的分割モードは、それらのブロックに適用することができない。
[150] 2.三角形分割モードによってコード化されるルマサンプルの重みの計算に使用される式は、幾何学的分割モードにおけるルマサンプルの重みの計算と異なる。更に、三角形分割モードによってコード化されるクロマサンプルの重みは、別々に計算されるのに対して、幾何学的分割モードによってコード化されるクロマサンプルの重みは、対応するルマサンプルからサブサンプルされる。
[151] 3.三角形分割モード又は幾何学的分割モードによってコード化されるブロックの動きベクトルは、何れも4×4サブブロック内に記憶される。各4×4サブブロックの位置に応じて、単予測動きベクトル又は双予測動きベクトルが記憶される。しかし、4×4サブブロックに関して記憶される単予測動きベクトル又は双予測動きベクトルの一方を選択するプロセスは、三角形分割モードと幾何学的分割モードとで異なる。
[152] 4.SBTモードは、三角形分割モードの場合に認められないが、幾何学的分割モードに適用することができる。
[153] 三角形分割モードは、幾何学的分割モードの一部と見なすことができるため、それは、三角形分割モード及び幾何学的分割モードで使用される全てのプロセスを統一することができる。
[154] 三角形分割モード及び幾何学的分割モードの構文を統一するために、ブロックが2つの区画に分けられるかどうかを示すために1つのフラグのみを使用することができる。ブロックのサイズが64ルマサンプル以上である場合、フラグが信号化される。フラグが真である場合、ブロックを分けるために何れの分割方法が使用されるかを示すために、分割モードインデックスが更に信号化される。
[155] 一実施形態では、ブロックがサブブロックマージモード、通常マージモード及びMMVDモードを使用してコード化されない場合、フラグ(例えば、図19~図20のCIIPフラグ)が信号化される。
[156] 別の実施形態では、マージ構文構造の初めにフラグ(例えば、図21の三角形/幾何学的フラグ)が信号化される。
[157] ブロックが2つの区画に分けられる場合、何れの分割方法が使用されるかを示すために、分割モードインデックスが更に信号化される。
[158] 一実施形態では、2つの三角形分割モード(例えば、左上角から右下角への又は右上角から左下角へのブロックの分割)が分割モードリストの最前部に置かれ、その後で幾何学的分割モードが続く。換言すれば、分割モードインデックスが0又は1に等しい場合、ブロックは、三角形分割モードを使用して分けられる。さもなければ、ブロックは、幾何学的分割モードを使用して分けられる。
[159] 別の実施形態では、図22Aの表22Aに示すように、三角形分割モードが幾何学的分割モードの1つとして扱われる。例えば、分割モードインデックスが19に等しい場合、ブロックは、左上角から右下角へと分けられる。別の例として、分割モードインデックス58は、ブロックが右上角から左下角へと分けられることを表す。
[160] 更に別の実施形態では、図22Bの表22Bに示すように、三角形分割モードも幾何学的分割モードの1つとして扱われる。分割モードインデックスが10に等しい場合、ブロックは、左上角から右下角へと分けられる。更に、24である分割モードインデックスは、ブロックが右上角から左下角へと分けられることを表す。
[161] ブロックの分割モードの数は、ブロックサイズ及び/又はブロック形状に依存し得ることに留意されたい。
[162] 一実施形態では、ブロックの幅若しくは高さが4に等しいか、又はmax(幅,高さ)/min(幅,高さ)の比率が4を超える場合、ブロックに関して2つの分割モードのみが認められる。さもなければ、142の分割モードが認められる。
[163] 別の実施形態では、ブロックのサイズが閾値を上回る場合、分割モードの数が減らされる。例えば、ブロックのサイズが1024ルマサンプルを上回る場合、24の量子化された角度及び4の量子化された距離のみが認められる。
[164] 更に別の実施形態では、ブロックの形状が縦長又は横長である場合、分割モードの数が減らされる。例えば、max(幅,高さ)/min(幅,高さ)の比率が2を上回る場合、24の量子化された角度及び4の量子化された距離のみが認められる。更に、図23に示すように、大きい方の寸法に沿ってブロックを分割する角度のみが認められ得る。図23に示すように、横長のブロックでは、破線で示す3つの角度が認められず、実線で示す角度のみが認められる。
[165] 更に別の実施形態では、ブロックのサイズが閾値を上回り、ブロックの形状が縦長又は横長である場合、分割モードの数が減らされ得る。例えば、ブロックのサイズが1024ルマサンプルを上回り、max(幅,高さ)/min(幅,高さ)の比率が2を上回る場合、24の量子化された角度及び4の量子化された距離のみが認められる。これは、図23に示す制限と更に組み合わせることができる。
[166] 角度インデックス及び距離インデックスのための参照表は、変更され得る。
[167] 一実施形態では、図24の表24に示すように、分割モードインデックスが使用され、角度インデックスの一次の代わりに距離インデックスの一次である。
[168] 別の実施形態では、分割モードインデックスの順序が分割方法の発生に関係する。より頻繁に発生する分割方法が参照表の最前部に置かれる。一例を図25の表25に示す。角度インデックス0、4、8及び距離が0である12は、ブロックを分割する際に使用される確率がより高い。
[169] 先に述べたように、三角形分割モードは、そのサイズが64ルマサンプル以上のブロックに適用することができる。しかし、幾何学的分割モードは、その幅及び高さが何れも8以上であり、max(幅,高さ)/min(幅,高さ)の比率が4以下であるブロックに適用することができる。それは、三角形分割モード及び幾何学的分割モードのブロックサイズ及びブロック形状に対する制限を統一することができる。
[170] 一実施形態では、その幅及び高さが何れも8以上であり、max(幅,高さ)/min(幅,高さ)の比率が4以下であるブロックに三角形分割モード及び幾何学的分割モードの両方を適用することができる。
[171] 別の実施形態では、そのサイズが64ルマサンプル以上のブロックに三角形分割モード及び幾何学的分割モードの両方を適用することができる。
[172] 更に別の実施形態では、そのサイズが64ルマサンプル以上であり、max(幅,高さ)/min(幅,高さ)の比率が4以下であるブロックに三角形分割モード及び幾何学的分割モードの両方を適用することができる。
[173] 本開示の実施形態は、三角形分割モード及び幾何学的分割モードの重み計算プロセスを統一するための方法も提供する。
[174] 一実施形態では、三角形分割のルマサンプルのための重み計算プロセスは、以下の2つの修正を用いて、(上記の混合処理において記載した)幾何学的分割モードに使用されるプロセスで置換される。
[175] 1.Dis[]内の値を図26の表26内の値で置換する。
[176] 2.wIdx=log2(CuW)-2及びhIdx=log2(CuH)-2。
[177] 加えて、三角形分割モードによってコード化されるブロックでは、ブロックが左上角から右下角へと分けられる場合、angleIdx及びdistanceIdxは、4及び0にそれぞれ設定される。さもなければ、(例えば、ブロックが右上角から左下角へと分けられる)angleIdx及びdistanceIdxは、12及び0にそれぞれ設定される。
[178] 別の実施形態では、三角形分割モード及び幾何学的分割モードの両方に関して、クロマサンプルの重みが各2×2ルマサブブロックの左上ルマサンプルの重みからサブサンプルされる。
[179] 更に別の実施形態では、三角形分割モード及び幾何学的分割モードの両方に関して、幾何学的分割モードによってコード化されるルマサンプルに使用されるのと同じプロセスを使用して、クロマサンプルの重みが計算される。
[180] 本開示では、三角形分割モード及び幾何学的分割モードにおいて使用される動きフィールド記憶のプロセスを統一することもできる。
[181] 一実施形態では、三角形分割モードのための動きフィールド記憶は、幾何学的分割モードのためのもので置換される。即ち、4×4サブブロックの4つの角に位置する4つのルマサンプルの重みが合計される。合計が閾値2よりも小さく、閾値1よりも大きい場合、この4×4サブブロックに関して双予測動きベクトルが記憶され得る。さもなければ、単予測動きが記憶される。閾値1及び閾値2は、32>>(((log2(CuW)+log2(CuH))>>1)-1)及び32-閾値1にそれぞれ設定される。
[182] 別の実施形態では、三角形分割モード又は幾何学的分割モードを使用してコード化されるブロックについて、各ルマサンプルの重みを確認する。ルマサンプルの重みが0又は8に等しくない場合、ルマサンプルは、重み付けされたサンプルと見なされる。4×4サブブロック内の全てのルマサンプルが重み付けされる場合、4×4サブブロックに関して双予測動きが記憶される。さもなければ、単予測動きが記憶される。
[183] SBTと幾何学的分割モードとの間の相互作用をSBTと三角形分割モードとの間の相互作用と調和させるために、本開示では、幾何学的分割モードのSBTを無効化することができる。SBTと幾何学的分割モードとの組み合わせは、ブロック内に2つの交差境界を作り出す場合があり、かかる交差境界は、主観的品質問題を引き起こし得る。
[184] 一実施形態では、図27の表27に示すように、幾何学的分割が使用される場合、cu_sbt_flagが信号化されない。図27では、関係する構文をイタリック体で示し、灰色で強調表示してある。
[185] 別の実施形態では、GEO分割モードに応じてSBT分割モードの一部が無効化される。SBT分割エッジがGEO分割エッジと交差する場合、このSBT分割モードは認められない。さもなければ、SBT分割モードは認められる。図28は、SBT分割モード及びGEO分割モードの一例を示す。更に、GEO分割エッジとSBT分割エッジとの交差があるかどうかを決定するために、角度インデックス及び距離インデックスを使用することができる。一例では、現ブロックの角度インデックスが0である場合(即ち垂直分割エッジ)、現ブロックに水平SBT分割を適用することができない。更に、SBT構文は、変更箇所がイタリック体及び灰色で強調表示してある図29の表29のように修正することができる。
[186] 幾何学的分割モードは、ブロックを2つの幾何学的形状区画に分け、それぞれの幾何学的区画は、自らの動きベクトルを用いて動き補償を行う。幾何学的分割モードは、インター予測の予測精度を改善する。しかし、以下の側面において複雑であり得る。
[187] 第1の側面では、幾何学的分割サブモードの総数が膨大である。従って、現実の実装では、混合重み及び動きフィールド記憶のための全てのマスクを記憶することは、不可能である。140サブモードの場合にマスクを記憶するのに必要な総ビット数は、下記の通りである。
- 混合重みについて、(8×8+8×16+8×32+8×64+16×8+16×16+16×32+16×64+32×8+32×16+32×32+32×64+64×8+64×16+64×32+64×64+64×128+128×64+128×128)×140×4=26,414,080ビット=3,301,760バイト≒3.3メガバイト
- 動きフィールド記憶について、(2×2+2×4+2×8+2×16+4×2+4×4+4×8+4×16+8×2+8×4+8×8+8×16+16×2+16×4+16×8+16×16+16×32+32×16+32×32)×140×2=825,440ビット=103,180バイト≒103キロバイト
Figure 2022544350000012
[188] 第2の側面では、マスクを記憶する代わりにその場で計算する場合、計算量が増える。混合重み及び動きフィールド記憶のためのマスクを計算するための式は、複雑である。より詳細には、乗算演算(×)、シフト演算(<<)、加算演算(+)及び比較演算の数が膨大である。サイズW×Hのブロックを仮定して、ブロックごとのそれぞれの演算数は、下記の通りである。
- 乗算:5+2×W×H+2×(W×H/16)
- シフト:4+3×W×H+2×(W×H/16)
- 加算:8+6×W×H+5×(W×H/16)
- 比較:4+2×W×H+2×(W×H/16)
[189] 以下の表に詳細を列挙する。
Figure 2022544350000013
[190] 加えて、Dis[]、GeoFilter[]、stepDis[]並びにangleIdx及びdistanceIdxのための参照表である、予め計算された4つの表を記憶するためにメモリが更に必要である。各表のサイズを下記の通り列挙する。
Figure 2022544350000014
[191] 第3の側面では、現在の幾何学的分割モードの設計において、45°/135°及びdistanceIdx0の組み合わせが常に認められておらず、それは、VVCにおける三角形分割モードがこれらの分割の選択肢をサポートすると仮定するからである。しかし、以下の表に示すように、正方形でないブロックでは、三角形分割モードにおける分割角度が45°又は135°ではない。従って、正方形でないブロックに関して、これらの2つの分割角度を除外することは、無意味である。
Figure 2022544350000015
[192] 第4の側面では、distanceIdx0による水平分割又はdistanceIdx0による垂直分割等、幾何学的分割モードでは、角度及び距離の一部の組み合わせがサポートされない(これは、バイナリツリー分割との冗長性を回避するためである)ため、それぞれの幾何学的分割サブモードに関する角度及び距離を導出するために参照表が使用される。角度及び距離の組み合わせの制限が除去される場合、参照表は、不要であり得る。
[193] 第5の側面では、三角形分割モード及び幾何学的分割モードにおいて使用される混合プロセス、動きフィールド記憶及び構文構造が統一されておらず、これは、それらの2つのモードについて2種類のロジックがソフトウェア実装及びハードウェア実装の両方で必要になることを意味する。加えて、三角形モードのためのマスクを記憶するのに必要な総ビット数は、下記の通りである。
- 混合重みについて、(4×16+4×32+4×64+8×8+8×16+8×32+8×64+16×4+16×8+16×16+16×32+16×64+32×4+32×8+32×16+32×32+32×64+64×4+64×8+64×16+64×32+64×64+64×128+128×64+128×128)×2×4=384,512ビット=48,064バイト≒48キロバイト
- 動きフィールド記憶について、(1×4+1×8+1×16+2×2+2×4+2×8+2×16+4×1+4×2+4×4+4×8+4×16+8×1+8×2+8×4+8×8+8×16+16×1+16×2+16×4+16×8+16×16+16×32+32×16+32×32)×2×2=12,016ビット=1,502バイト≒1.5キロバイト
Figure 2022544350000016
[194] 上述の問題を解決するために幾つかの解決策を提案する。
[195] 第1の解決策は、幾何学的分割モードの単純化を対象とする。
[196] 混合重み及び動きフィールド記憶のためのマスクをその場で計算することを回避するために、そのサイズが256×256又は64×64である予め計算された幾つかのマスクから各ブロックのマスクを導出することを提案する。提案する方法は、マスクを記憶するためのメモリを減らすことができる。
[197] 提案するクロップ方法では、第1のマスクの組及び第2のマスクの組が予め定義される。第1のマスクの組g_sampleWeightL[]は、幾つかのマスクを含むことができ、マスクのそれぞれは、256×256のサイズを有し、マスクは、各ブロックの混合重みを導出するために使用される。第2のマスクの組g_motionMask[]は、幾つかのマスクを含むことができ、マスクのそれぞれは、64×64のサイズを有し、マスクは、各ブロックの動きフィールド記憶のためのマスクを導出するために使用される。第1の組及び第2の組内のマスクの数は、幾何学的分割サブモードの数に依存する。様々なサイズのブロックに関して、それらのブロックのマスクは、第1の組及び第2の組内のマスクの1つからクロップされる。
[198] 一実施形態では、第1の組及び第2の組内の定義済みマスクは、図14及び図15A~図15Fに関して且つ動きフィールド記憶に関して説明した式を使用して計算され得る。第1の組及び第2の組内のマスクの数は、何れもNであり、Nは、幾何学的分割モード内でサポートされる角度の数に設定される。第1の組及び第2の組内のインデックスnを有するn番目のマスクは、角度nのマスクを表し、nは、0~N-1の範囲内にある。
[199] 一例では、幾何学的分割サブモードの数が140、即ち16の角度及び9の距離に設定される場合、変数Nは、16に設定される。別の例では、幾何学的分割サブモードの数が108、即ち16の角度及び7の距離に設定される場合、変数Nは、16に設定される。他の例では、幾何学的分割サブモードの数が80(12の角度及び7の距離)及び64(10の角度及び7の距離)に設定される場合、変数Nは、12及び10にそれぞれ設定される。
[200] 幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
- 幾何学的分割インデックスKを使用して、変数angleIdx A及びdistanceIdx Dを参照表から得る。参照表の例を図15Cの表15C、図15Dの表15D、図22Bの表22B、図30の表30及び図31の表31に示す。
- 変数offsetX及びoffsetYを下記の通り計算する。
Figure 2022544350000017
- sampleWeightL[x][y]=g_sampleWeightL[A%N][x+offsetX][y+offsetY]
[201] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[202] 更に、動きフィールド記憶のためのマスクが下記の通り導出される。
- 変数offsetXmotion及びoffsetYmotionを下記の通り計算する。
Figure 2022544350000018
- motionMask[xsubblk][ysubblk]=g_motionMask[A%N][xsubblk+offsetXmotion][ysubblk+offsetYmotion]
[203] 定義済みマスクを記憶するのに必要なビット数を下記の通り列挙する。
- 混合重みについて、(256×256)×16×4=4,193,304ビット=524,288バイト≒524キロバイト
- 動きフィールド記憶について、(64×64)×16×2=131,072ビット=16,384バイト≒16キロバイト
Figure 2022544350000019
[204] 更に、マスクは、下記の簡易化した式を使用してその場で計算することができる。
distFromLine=(((x+offsetX)<<1)+1)×Dis[displacementX]+(((y+offsetY)<<1)+1)×Dis[displacementY]-Rho[displacementX]
distScaled=Min((abs(distFromLine)+4)>>3,26)
sampleWeightL[x][y]=distFromLine≦0?GeoFilter[distScaled]:8-GeoFilter[distScaled]
ここで、(x,y)は、各ルマサンプルの位置を表し、Dis[]及びGeoFilter[]は、表12及び表13のそれぞれに示す2つの参照表である。Rho[]は、図32の表32に示す参照表である。
[205] パラメータdisplacementX及びdisplacementYは、下記の通り計算する。
displacementX=angleIdx%16
displacementY=(displancementX+NumAngles>>2)%NumAngles
[206] ここで、NumAnglesは、32に設定される。幾何学的分割サブモードの総数が140、108、80及び64にそれぞれ設定される場合、angleIdxは、図15C、表15D、表15E及び表15Fから導出される。angleIdxは、表22B、表30及び表31に示す参照表から導出することもできる。
distFromLinesubblk=(((xsubblk+offsetXmotion)<<3)+1)×Dis[displacementX]+(((ysubblk+offsetYmotion)<<3)+1)×Dis[displacementY]-Rhosubblk[displacementX]
motioMask[xsubblk][ysubblk]=abs(distFromLinesubblk)<256?2:(distFromLinesubblk≦0?0:1)
[207] サイズW×Hのブロックを仮定して、ブロックごとのそれぞれの演算数は、下記の通りである。
- 乗算:4+2×W×H+2×(W×H/16)
- シフト:9+3×W×H+2×(W×H/16)
- 加算:7+8×W×H+6×(W×H/16)
- 比較:6+2×W×H+2×(W×H/16)
[208] ブロックごとのそれぞれの演算数に関する詳細は、図33の表33に列挙する。
[209] Dis[]、GeoFilter[]、Rho[]、Rhosubblk[]並びにangleIdx及びdistanceIdxのための参照表である、予め計算された5つの表を記憶するためにメモリが必要である。Rhosubblk[]のための参照表は、図34に示す。各表のサイズを下記の通り列挙する。
Figure 2022544350000020
[210] 提案する方法の計算量は、元の幾何学的設計のものと同様である。より詳細には、元の幾何学的設計と比較する。
- 乗算演算の数は、W×Hのブロックで1増加する
- シフト演算の数は、W×Hのブロックで5増加する
- 比較演算の数は、W×Hのブロックで2増加する
- 加算演算の数は、W×Hのブロックで2×W×H+(W×H/16)-1増加する
- メモリの使用量は、17ビット増加する
[211] マスクを計算するために使用する式は、下記の通り更に簡易化することができる。
- 幾何学的分割インデックスKを使用して、変数angleIdx A及びdistanceIdx Dを参照表から得る。参照表の例を表15C、表15D、表22B、表30及び表31に示す。
- angleIdx及びdistanceIdxが表15C、表15D及び表22Bを使用して導出される場合、変数N(第1の組及び第2の組内のマスクの数)が16に設定される。
他方では、angleIdx及びdistanceIdxが表30及び表31を使用して導出される場合、変数Nが12及び10にそれぞれ設定される。
- 変数offsetX及びoffsetYを下記の通り計算する。
Figure 2022544350000021
- 変数displacementX及びdisplacementYを下記の通り計算する。
displacementX=angleIdx
displacementY=(displancementX+NumAngles>>2)%NumAngles
ここで、NumAnglesは、32に設定される。
- 位置(x,y)にあるルマサンプルの重みを下記の通り計算する。
weightIdx=(((x+offsetX)<<1)+1)*disLut[displacementX]+(((y+offsetY)<<1)+1))*disLut[displacementY]
partFlip=(angleIdx>=13&&angleIdx<=27)?0:1
weightIdxL=partFlip?32+weightIdx:32-weightIdx
sampleWeightL[x][y]=Clip3(0,8,(weightIdxL+4)>>3)
ここで、distLut[]は、以下で示す参照表である。
Figure 2022544350000022
[212] 別の実施形態では、第1の組及び第2の組内の定義済みマスクは、図14及び図15A~図15Fに関して且つ動きフィールド記憶に関して説明した式を使用して計算され得る。第1の組及び第2の組内のマスクの数は、何れもNreducedであり、Nreduced=(N>>1)+1であり、Nは、幾何学的分割モード内でサポートされる角度の数である。一例では、幾何学的分割サブモードの数が140に設定される場合、変数Nreducedは、9に設定される。即ち、16の角度及び9の距離である。別の例では、幾何学的分割サブモードの数が108(16の角度と7の距離)、80(12の角度と7の距離)及び64(10の角度と7の距離)に設定される場合、変数Nreducedは、9、7及び6にそれぞれ設定される。
[213] 0~Nreduced-1の角度では、それらのマスクは、第1の組及び第2の組内のマスクから直接クロップされる。他方では、Nreduced~N-1の角度のマスクは、第1の組及び第2の組内のマスクからクロップされ、水平方向に反転される。本実施形態と合致して、図35Aは、135°の角度のマスクの例を示し、図35Bは、45°の角度のマスクの例を示す。
[214] 幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
- 幾何学的分割インデックスKを使用して、変数angleIdx A及びdistanceIdx Dを参照表から得る。参照表の例を表15C、表15D、表22B、表30及び表31に示す。
- 変数offsetX及びoffsetYを下記の通り計算することができる。
Figure 2022544350000023

Figure 2022544350000024
[215] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[216] 他方では、動きフィールド記憶のためのマスクが下記の通り導出される。
[217] 変数offsetXmotion及びoffsetYmotionを下記の通り計算する。
Figure 2022544350000025
[218] 定義済みマスクを記憶するのに必要なビット数を下記の通り列挙する。
- 混合重みについて、(256×256)×9×4=2,359,296ビット=294,912バイト≒295キロバイト
- 動きフィールド記憶について、(64×64)×9×2=131,072ビット=16,384バイト≒16キロバイト
Figure 2022544350000026
[219] 第3の実施形態では、第1の組及び第2の組内の定義済みマスクは、上記の式を使用して計算することができる。第1の組及び第2の組内のマスクの数は、何れもNreducedであり、Nreduced=(N>>1)+1であり、Nは、幾何学的分割モード内でサポートされる角度の数である。0~Nreduced-1の角度では、それらのマスクは、第1の組及び第2の組内のマスクから直接クロップされる。他方では、Nreduced~N-1の角度のマスクは、第1の組及び第2の組内のマスクからクロップされ、垂直方向に反転される。本実施形態と合致して、図36は、135°の角度のマスクの例を示し、図36Bは、45°の角度のマスクの例を示す。
[220] 幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
[221] 幾何学的分割インデックスKを使用して、変数angleIdx A及びdistanceIdx Dを参照表から得る。参照表の例を表15C、表15D、表22B、表30及び表31に示す。
[222] 変数offsetX及びoffsetYを下記の通り計算することができる。
Figure 2022544350000027

Figure 2022544350000028
[223] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[224] 他方では、動きフィールド記憶のためのマスクが下記の通り導出される。
[225] 変数offsetXmotion及びoffsetYmotionを下記の通り計算することができる。
Figure 2022544350000029
[226] 定義済みマスクを記憶するのに必要なビット数を下記の通り列挙する。
- 混合重みについて、(256×256)×9×4=2,359,296ビット=294,912バイト≒295キロバイト
- 動きフィールド記憶について、(64×64)×9×2=131,072ビット=16,384バイト≒16キロバイト
Figure 2022544350000030
[227] 上記の実施形態において、オフセット導出及びクロマ重み導出のための方法を修正できることに留意されたい。
[228] オフセット導出のための異なる方法を下記の通り示す。上記の実施形態と比較して、違いをイタリック体及び太文字で強調表示してある。
[229] オフセット導出のための式は、distanceIdxが0でないときにオフセットが0に等しくないことを保証するように修正することができる。一例では、変数offsetX及びoffsetYを下記の通り計算する。
Figure 2022544350000031
[230] オフセット導出は、幾何学的分割モード内でサポートされる距離の数に基づき得る。一例では、7の距離がサポートされる場合、変数offsetX及びoffsetYを(第1の実施形態で示した方法と同じである)下記の通り計算する。
Figure 2022544350000032
[231] 別の例では、9の距離がサポートされる場合、変数offsetX及びoffsetYを下記の通り計算する。
Figure 2022544350000033
[232] オフセット導出は、分割角度に基づき得る。一例では、135°~225°の角度及び315°~45°の角度では、オフセットが垂直方向に加えられる。さもなければ、45°~135°の角度及び225°~315°の角度では、オフセットが水平方向に加えられる。変数offsetX及びoffsetYを下記の通り計算する。
Figure 2022544350000034
[233] クロマサンプルの重みは、第1のマスクの組g_sampleWeightL[]から直接導出され得る。幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、クロマサンプルの混合重みのためのマスクが下記の通り導出される。
- クロマブロックのサイズは、W’×H’である。
- 幾何学的分割インデックスKを使用して、変数angleIdx A及びdistanceIdx Dを参照表から得る。参照表の例を表15C、表15D、表22B、表30及び表31に示す。
- 変数offsetXchroma及びoffsetYchromaを下記の通り計算する。
Figure 2022544350000035
- sampleWeightC[x][y]=g_sampleWeightL[A%N][x+offsetXchroma][y+offsetYchroma]
ここで、(x,y)は、各クロマサンプルの位置を表す。
[234] 第1の組内の定義済みマスクのサイズは、256×256でない場合がある。このサイズは、最大ブロックサイズ及び最大シフトオフセットに依存し得る。最大ブロックサイズがSであると仮定して、サポートされる距離の数は、Nであり、それぞれの距離のシフトオフセットは、offset=(D×S)>>0として定められる。次いで、定義済みマスクの幅及び高さを下記の通り計算することができる。
S+((((Nd-1)>>1)×S)>>O)<<1
[235] 一例では、変数S、N及びOが128、9及び4にそれぞれ設定される。定義済みマスクのサイズは、192×192に設定される。別の例では、変数S、N及びOが128、7及び3にそれぞれ設定される。定義済みマスクのサイズは、224×224に設定される。
[236] 一部の実施形態では、クロップ方法と同様に、第1のマスクの組及び第2のマスクの組が予め定義される。第1のマスクの組g_sampleWeightL[]は、そのサイズが256×256の幾つかのマスクを含むことができ、それらのマスクは、各ブロックの混合重みを導出するために使用される。第2のマスクの組g_motionMask[]は、そのサイズが64×64の幾つかのマスクを含むことができ、それらのマスクは、各ブロックの動きフィールド記憶のためのマスクを導出するために使用される。正方形のブロックでは、クロップ方法と同様に、マスクは、第1の組及び第2の組内のマスクの1つからクロップされる。正方形でないブロックでは、マスクは、第1の組及び第2の組内のマスクの1つからクロップされ、その後、アップサンプリングプロセスが続く。
[237] 一実施形態では、第1の組及び第2の組内の定義済みマスクは、上記の式を使用して計算され得る。第1の組及び第2の組内のマスクの数は、何れもNであり、Nは、幾何学的分割モード内でサポートされる角度の数に設定される。第1の組及び第2の組内のインデックスnを有するn番目のマスクは、角度nのマスクを表し、nは、0~N-1の範囲内にある。幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
- 幾何学的分割インデックスKを使用して、変数angleIdx A及びdistanceIdx Dを参照表から得る。参照表の例を表15C、表15D、表22B、表30及び表31に示す。
- 変数minSizeをmin(W,H)に設定する。
- 変数ratioWH及びratioHWをlog2(max(W/H,1))及びlog2(max(H/W,1))にそれぞれ設定する。
- 変数offsetX及びoffsetYを下記の通り計算することができる。
Figure 2022544350000036
- sampleWeightL[x][y]=g_sampleWeightL[A%N][(x>>ratioWH)+offsetX][(y>>ratioHW)+offsetY]
[238] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[239] 他方では、動きフィールド記憶のためのマスクが下記の通り導出される。
- 変数minSubblkをmin(W,H)>>2に設定する。
- 変数offsetXmotion及びoffsetYmotionを下記の通り計算することができる。
Figure 2022544350000037
motionMask[xsubblk][ysubblk]=g_motionMask[A%N][(xsubblk>>ratioWH)+offsetXmotion][(ysubblk>>ratioHW)+offsetYmotion]
[240] 別の実施形態では、第1の組及び第2の組内の定義済みマスクは、上記の式を使用して計算され得る。第1の組及び第2の組内のマスクの数は、何れもNreducedであり、Nreduced=(N>>1)+1であり、Nは、幾何学的分割モード内でサポートされる角度の数である。幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
- 幾何学的分割インデックスKを使用して、変数angleIdx A及びdistanceIdx Dを参照表から得る。参照表の例を表15C、表15D、表22B、表30及び表31に示す。
- 変数minSizeをmin(W,H)に設定する。
- 変数ratioWH及びratioHWをlog2(max(W/H,1))及びlog2(max(H/W,1))にそれぞれ設定する。
- 変数offsetX及びoffsetYを下記の通り計算することができる。
Figure 2022544350000038
[241] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[242] 他方では、動きフィールド記憶のためのマスクが下記の通り導出される。
- 変数minSubblkをmin(W,H)>>2に設定する。
- 変数offsetXmotion及びoffsetYmotionを下記の通り計算することができる。
Figure 2022544350000039
[243] 第3の実施形態では、第1の組及び第2の組内の定義済みマスクは、上記の式を使用して計算され得る。第1の組及び第2の組内のマスクの数は、何れもNreducedであり、Nreduced=(N>>1)+1であり、Nは、幾何学的分割モード内でサポートされる角度の数である。幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
- 幾何学的分割インデックスKを使用して、変数angleIdx A及びdistanceIdx Dを参照表から得る。参照表の例を表15C、表15D、表22B、表30及び表31に示す。
- 変数minSizeをmin(W,H)に設定する。
- 変数ratioWH及びratioHWをlog2(max(W/H,1))及びlog2(max(H/W,1))にそれぞれ設定する。
- 変数offsetX及びoffsetYを下記の通り計算することができる。
Figure 2022544350000040
[244] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[245] 他方では、動きフィールド記憶のためのマスクが下記の通り導出される。
- 変数minSubblkをmin(W,H)>>2に設定する。
- 変数offsetXmotion及びoffsetYmotionを下記の通り計算することができる。
Figure 2022544350000041
[246] 上記のオフセット導出及びクロマ重み導出のための様々な方法が本明細書に適用され得ることに留意されたい。
[247] 幾何学的分割モードの元の設計では、135°又は45°でブロックの中心を横断してブロックを分割する組み合わせが常に除外される。主な目的は、幾何学的分割モードから、三角形分割モードを用いた冗長な分割の選択肢を除去することである。しかし、三角形分割モードを使用してコード化される正方形でないブロックでは、分割角度は、135°でも45°でもない。従って、2つの角度は、ブロックの形状に基づいて適応的に除外することができる。
[248] 本開示の一部の実施形態では、除外される2つの角度は、ブロックの形状に基づいて変更される。正方形のブロックでは、135°及び45°を除外し、これは、元の幾何学的分割の設計と同じである。他のブロック形状では、除外される角度が図37の表37に列挙されている。例えば、そのサイズが8×16(即ち幅対高さの比率が1対2)のブロックでは、112.5°及び67.5°の角度、即ちangleIdx10及びangleIdx6が除外される。次いで、幾何学的分割インデックスのための参照表が図38の表38のように修正される。図38では、除外した角度に関係する表38の部分を灰色で強調表示してある。
[249] この実施形態は、本開示の他の実施形態と組み合わされ得ることに留意されたい。例えば、除外した角度を使用する混合重み及び動きフィールド記憶のマスクは、三角形分割モードの方法を使用して計算することができる。他の角度については、クロップ方法を使用してマスクを導出する。
[250] 先に述べたように、三角形分割モード及び幾何学的モードにおいて使用される混合プロセス、動きフィールド記憶及び構文構造は、統一されていない。本開示では、全てのプロセスを統一することを提案する。
[251] 一実施形態では、上記で説明した提案するクロップ方法は、三角形分割モード及び幾何学的分割モードの両方に関して、混合及び動きフィールド記憶のプロセス内で使用される。加えて、それぞれの幾何学的分割サブモードの角度及び距離の参照表が除去される。第1のマスクの組及び第2のマスクの組は、予め定義され、上記の式を使用してそれぞれ計算することができる。第1の組及び第2の組内のマスクの数は、何れもNreducedであり、Nreduced=(N>>1)+1であり、Nは、幾何学的分割モード内でサポートされる角度の数である。Nは、幾何学的分割モード内でサポートされる距離の数を表すものとする。従って、幾何学的分割サブモードの総数は、N×Nである。一例では、N及びNを8及び7にそれぞれ設定する。別の例では、N及びNを12及び7にそれぞれ設定する。他の例では、N及びNを偶数及び奇数にそれぞれ設定する。
[252] 幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
- 変数NhalfDをND>>1に設定する。
- 変数angleIdx A及びdistanceIdx DをK%N及びK/Nにそれぞれ設定する。
- 変数offsetX及びoffsetYを下記の通り計算する。
Figure 2022544350000042

Figure 2022544350000043
[253] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[254] 他方では、動きフィールド記憶のためのマスクが下記の通り導出される。
- 変数offsetXmotion及びoffsetYmotionを下記の通り計算する。
Figure 2022544350000044
[255] 定義済みマスクを記憶するのに必要なビット数は、(256×256)×((N>>1)+1)×4+(64×64)×((N>>1)+1)×2である。
Figure 2022544350000045
[256] 別の実施形態では、上記で説明した提案するクロップ方法は、三角形分割モード及び幾何学的分割モードの両方に関して、混合及び動きフィールド記憶のプロセス内で使用される。加えて、それぞれの幾何学的分割サブモードの角度及び距離の参照表が除去される。第1のマスクの組及び第2のマスクの組は、予め定義され、上記の式を使用してそれぞれ計算することができる。第1の組及び第2の組内のマスクの数は、何れもNreducedであり、Nreduced=(N>>1)+1であり、Nは、幾何学的分割モード内でサポートされる角度の数である。Nは、幾何学的分割モード内でサポートされる距離の数を表すものとする。従って、幾何学的分割サブモードの総数は、N×Nである。
[257] 幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
- 変数NhalfDをND>>1に設定する。
- 変数angleIdx A及びdistanceIdx DをK%N及びK/Nにそれぞれ設定する。
- 変数offsetX及びoffsetYを下記の通り計算する。
Figure 2022544350000046

Figure 2022544350000047
[258] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[259] 他方では、動きフィールド記憶のためのマスクが下記の通り導出される。
- 変数offsetXmotion及びoffsetYmotionを下記の通り計算する。
Figure 2022544350000048
[260] 第3の実施形態では、上記で説明した提案するアップサンプル方法は、三角形分割モード及び幾何学的分割モードの両方に関して、混合及び動きフィールド記憶のプロセス内で使用される。加えて、それぞれの幾何学的分割サブモードの角度及び距離の参照表が除去される。第1のマスクの組及び第2のマスクの組は、予め定義され、上記の式を使用してそれぞれ計算することができる。第1の組及び第2の組内のマスクの数は、何れもNreducedであり、Nreduced=(N>>1)+1であり、Nは、幾何学的分割モード内でサポートされる角度の数である。Nは、幾何学的分割モード内でサポートされる距離の数を表すものとする。従って、幾何学的分割サブモードの総数はN×Nである。幾何学的分割インデックスがKに設定され、そのサイズがW×Hであるブロックでは、ルマサンプルの混合重みのためのマスクが下記の通り導出される。
- 変数NhalfDをND>>1に設定する。
- 変数angleIdx A及びdistanceIdx DをK%N及びK/Nにそれぞれ設定する。
- 変数minSizeをmin(W,H)に設定する。
- 変数ratioWH及びratioHWをlog2(max(W/H,1))及びlog2(max(H/W,1))にそれぞれ設定する。
- 変数offsetを下記の通り計算する。
offset=((256-minSize)>>1)+D>NhalfD?((D-NhalfD)×minSize)>>3:-((D×minSize)>>3)
Figure 2022544350000049
[261] クロマサンプルのための混合重みは、ルマサンプルの重みからサブサンプルされる。即ち、対応するそれぞれの2×2ルマサブブロックの左上ルマサンプルの重みは、YUV4:2:0映像形式のクロマサンプルの重みとして使用される。
[262] 他方では、動きフィールド記憶のためのマスクが下記の通り導出される。
- 変数minSubblkをmin(W,H)>>2に設定する。
- 変数offsetmotionを下記の通り計算する。
offsetmotion=((64-minSubblk)>>1)+D>NhalfD?((D-NhalfD)×minSize)>>5:-((D×minSize)>>5)
Figure 2022544350000050
[263] 図39は、本開示の一部の実施形態による、映像コンテンツを処理するための例示的方法3900のフローチャートである。一部の実施形態では、方法3900は、コーデック(例えば、図2A~図2Bの符号化プロセス200A若しくは200Bを使用する符号器又は図3A~図3Bの復号プロセス300A若しくは300Bを使用する復号器)によって実行され得る。例えば、コーデックは、映像シーケンスを符号化するか又は別のコードに変換するための機器(例えば、機器400)の1つ又は複数のソフトウェア又はハードウェア構成要素として実装することができる。一部の実施形態では、映像シーケンスは、非圧縮映像シーケンス(例えば、映像シーケンス202)又は復号される圧縮映像シーケンス(例えば、映像ストリーム304)であり得る。一部の実施形態では、映像シーケンスは、機器のプロセッサ(例えば、プロセッサ402)に関連する監視装置(例えば、図4の映像入力装置)によって捕捉され得る監視映像シーケンスであり得る。映像シーケンスは、複数のピクチャを含み得る。機器は、ピクチャのレベルで方法3900を実行することができる。例えば、機器は、方法3900内でピクチャを1つずつ処理することができる。別の例では、機器は、方法3900内で1度に複数のピクチャを処理することができる。方法3900は、以下のステップを含み得る。
[264] ステップ3902では、複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することができる。
[265] 複数のブロックは、ピクチャに関連する第1のブロックのサブブロックである。ピクチャは、(第1のブロックを含む)複数のブロックに関連し得、ブロックのそれぞれが複数のサブブロックとして分割され得ることが理解されるであろう。第1のブロックは、クロマブロック及びルマブロックに関連し得る。従って、複数のブロック(例えば、サブブロック)のそれぞれは、クロマサブブロック及びルマサブブロックに関連し得る。複数のブロック(例えば、サブブロック)の分割モードを決定することができ、その分割モードに基づいて複数のブロック(例えば、サブブロック)を分割することができる。分割することは、第1のブロック上のインター予測の改善をもたらし得る。例示的な分割モードは、三角形分割モード又は幾何学的分割モードを含み得る。
[266] 上記で論じたように、分割モードは、少なくとも1つの指示信号に従って決定することができる。例えば、図19に関して、第1のブロックの分割モードを決定するために、第1の指示信号(例えば、サブブロックマージフラグ)、第2の指示信号(例えば、通常マージ/MMVDフラグ)及び第3の指示信号(例えば、CIIPフラグ)が与えられる。図19に示すように、第1の指示信号(例えば、サブブロックマージフラグ)に従い、第1のブロックがサブブロックマージモードを使用してコード化されるかどうかを決定することができる。第1のブロックがサブブロックマージモードを使用してコード化されないという決定に応答して、第2の指示信号(例えば、通常マージ/MMVDフラグ)に従い、第1のブロックが通常モード又はMMVD(merge mode with motion vector differences)の1つを使用してコード化されるかどうかを決定することができる。第1のブロックが通常モード又はMMVDを使用してコード化されないという決定に応答して、CIIPフラグを使用して、第1のブロックがCIIPを使用してコード化されるかどうかを決定することができる。
[267] 一部の実施形態では、第1のブロックがCIIPを使用してコード化されるかどうかを第3の指示信号に従って決定する前に、ステップ3902は、第1のブロックのサイズが所与の条件を満たすかどうかを決定することと、第1のブロックのサイズが所与の条件を満たすという決定に応答して、第3の指示信号を生成すること、又は第1のブロックのサイズが所与の条件を満たさないという決定に応答して、第1のブロックがCIIPモードを使用してコード化されると決定することとを更に含み得る。所与の条件は、第1のブロックの幅及び高さが何れも8以上であることと、幅と高さとの間のより大きい値と、幅と高さとの間のより小さい値との比率が4以下であることとを含み得る。
[268] 次いで、第1のブロックがCIIPモードを使用してコード化されないという決定に応答して、第1のブロックの分割モードが三角形分割モード又は幾何学的分割モードの1つであると決定することができる。
[269] 第1のブロックの分割モードが三角形分割モード又は幾何学的分割モードの1つであると決定される場合、分割モードインデックス、角度インデックス又は距離インデックスに従ってターゲット分割方式を更に決定することができる。次いで、ターゲット分割方式に対応する分割エッジを決定することができる。
[270] 概して、分割モード(三角形分割モード又は幾何学的分割モード)は、複数の分割方式に関連し得、分割モードインデックスは、複数の分割方式のうちの分割方式の数を示すことができる。分割モードインデックスは、角度インデックス及び距離インデックスに関連し得る。角度インデックスは、分割モードインデックスに対応する所与の分割方式の分割エッジの角度を示すことができ、距離インデックスは、分割エッジと第1のブロックの中心との間の距離を示すことができる。
[271] 一部の実施形態では、参照表(例えば、図22Aの表22A又は図22Bの表22B)は、複数の分割方式に関連する複数の分割モードインデックス、複数の角度インデックス及び複数の距離インデックスを含み得る。分割モードインデックス(例えば、K)を所与として、分割方式に関連する角度インデックス及び距離インデックスを決定することができる。従って、ターゲット分割方式は、分割モードインデックスに従って参照表において決定することができる。
[272] 複数の分割方式のうち、参照表は、第1の分割モードインデックスに関連する第1の分割方式及び第2の分割モードインデックスに関連する第2の分割方式を含むことができ、第1の分割方式及び第2の分割方式は、三角形分割モードを対象とする。例えば、図22Bの表22Bに関して、「10」の分割モードインデックスは、ブロックを左上角から右下角へと分けることに関連する。「24」の分割モードインデックスは、ブロックを右上角から左下角へと分けることに関連する。
[273] ステップ3904では、第1の区画のための第1の予測信号及び第2の区画のための第2の予測信号を生成するために、複数のブロックに対してインター予測を行うことができる。第1の予測信号を生成するために第1の区画に第1の動きベクトルを適用することができ(例えば、第1の区画のための動きベクトル)、第2の予測信号を生成するために第2の区画に第2の動きベクトルを適用することができる(例えば、第2の区画のための動きベクトル)。第1の予測信号及び第2の予測信号は、4×4サブブロック内に記憶することができる。
[274] 3906では、分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することができる。第1のブロックに対してインター予測を適用する前に第1のブロックが分割されているため、ブロックのコード化を終えるために第1のブロックの区画を混合することができる。一部の実施形態では、分割エッジに関連するエッジブロックを混合することができる。各区画のブロックのための予測信号は、同一であることが理解されるであろう。分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合するために、エッジブロックのそれぞれの重みを決定することができる。
[275] 一部の実施形態では、混合重みを決定するためにマスクの組を生成することができる。例えば、第1のマスクの組(例えば、g_sampleWeightL[])は、幾つかのマスクを含むことができ、各マスクのサイズは、256×256であり、マスクは、各ブロックの混合重みを導出するために使用される。マスクの組の数(即ちN)は、幾何学的分割モード内でサポートされる角度の数に設定することができる。例えば、図22Bの表22Bに関して、幾何学的分割モード内でサポートされる角度の数は、64であり、従って、マスクの数は、16である。ブロックのサイズ、ターゲット分割方式の角度の値及びターゲット分割方式の距離の値に基づいて、第1のオフセット(例えば、offsetX)及び第2のオフセット(例えば、offsetY)を決定することができる。例えば、以下の式を使用して、W×Hのサイズを有するブロックに関してoffsetX及びoffsetYを求めることができる。
Figure 2022544350000051
ここで、A及びDは、それぞれ角度インデックス及び距離インデックスである。角度インデックスA及び距離インデックスDは、分割モードインデックスKを使用して、参照表(例えば、図22Bの表22B)から得ることができる。従って、マスクの組の数は、参照表の角度インデックスの数に基づいて決定され、ターゲット分割方式の角度の値は、ターゲット分割方式に対応する参照表の角度インデックスに基づいて決定され、ターゲット分割方式の距離の値は、ターゲット分割方式に対応する参照表の距離インデックスに基づいて決定される。
[276] 角度インデックスAは、分割が水平であるか又は垂直であるかを決定するために使用される。角度インデックスAが、図22Bの参照表である表22Bから導出される事例では、角度インデックスAが8又は24に等しい場合、ブロックは、水平分割である。他方では、角度インデックスが0又は16に等しい場合、ブロックは、垂直分割である。従って、水平分割又は(非垂直分割及びH≧W)という条件は、A%16==8又は(A%16!=0及びH≧W)と均等である。
[277] 別の例として、以下の式を使用して、W×Hのサイズを有するブロックに関してoffsetX及びoffsetYを求めることができる。
Figure 2022544350000052
ここで、NhalfDは、幾何学的分割モード内でサポートされる距離の数の半分であり、角度インデックスA及び距離インデックスDは、分割モードインデックスKに基づいて決定することができる。例えば、A=K%N及びD=K/Nである。従って、ターゲット分割方式の角度の値は、分割モードインデックス及び幾何学的分割モード内でサポートされる角度の数に基づいて決定され、ターゲット分割方式の距離の値は、分割モードインデックス及び幾何学的分割モード内でサポートされる角度の数に基づいて決定される。
[278] マスクの組(例えば、g_sampleWeightL[])に基づいて、第1のオフセット及び第2のオフセット(offsetX及びoffsetY)を使用して、エッジサブブロックのための複数の混合重みを生成することができ、決定することができる。
[279] 一部の実施形態では、マスクの組を使用することなしに第1のオフセット(例えば、offsetX)及び第2のオフセット(例えば、offsetY)を決定することができ、混合重みをその場で決定することができる。例えば、以下の式を使用して、エッジブロックのそれぞれの重みを計算することができる。
Figure 2022544350000053
displacementX=angleIdx
displacementY=(displancementX+NumAngles>>2)%NumAngles、ここで、NumAnglesは、32に設定される。
[280] 位置(x,y)にあるルマサンプルの重み(例えば、sampleWeightL[x][y])を下記の通り計算することができる。
weightIdx=(((x+offsetX)<<1)+1)*disLut[displacementX]+(((y+offsetY)<<1)+1))*disLut[displacementY]
partFlip=(angleIdx>=13&&angleIdx<=27)?0:1
weightIdxL=partFlip?32+weightIdx:32-weightIdx
sampleWeightL[x][y]=Clip3(0,8,(weightIdxL+4)>>3)
[281] 第1のブロックがクロマブロック及びルマブロックを含むため、複数の混合重みは、エッジブロックのための複数のルマ重み及びエッジブロックのための複数のクロマ重みを含み得る。複数のクロマ重みのうちのクロマ重みは、クロマ重みに対応する2×2サブブロックの左上角のルマ重みに基づいて決定される。例えば、図7に関して、クロマブロックのためのクロマ重みとして、2×2ルマサブブロックの左上角のルマ重みを使用することができる。
[282] 従って、分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することは、エッジブロックのための複数のルマ重みに従ってエッジブロックのルマ値を決定するために、第1の予測信号及び第2の予測信号を混合することと、エッジブロックのための複数のクロマ重みに従ってエッジブロックのクロマ値を決定するために、第1の予測信号及び第2の予測信号を混合することとを更に含み得る。
[283] 一部の実施形態では、命令を含む非一時的コンピュータ可読記憶媒体も提供され、命令は、上記の方法を実行するための装置(開示した符号器及び復号器等)によって実行され得る。一般的な非一時的媒体は、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ若しくは他の任意の磁気データ記憶媒体、CD-ROM、他の任意の光学データ記憶媒体、孔のパターンを有する任意の物理媒体、RAM、PROM及びEPROM、フラッシュEPROM若しくは他の任意のフラッシュメモリ、NVRAM、キャッシュ、レジスタ、他の任意のメモリチップ若しくはカートリッジ及びそれらのもののネットワーク化されたバージョンを含む。装置は、1つ又は複数のプロセッサ(CPU)、入力/出力インタフェース、ネットワークインタフェース及び/又はメモリを含み得る。
[284] 実施形態は、以下の条項を使用して更に記載することができる。
1.映像コンテンツを処理するための方法であって、
ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、
第1の区画のための第1の予測信号及び第2の区画のための第2の予測信号を生成するために、複数のブロックに対してインター予測を行うことと、
分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することと
を含む方法。
2.複数のブロックを分割エッジに沿って分割することは、
複数のブロックの分割モードを決定することと、
分割モードに基づいて複数のブロックを分割することと
を更に含む、条項1に記載の方法。
3.複数のブロックは、第1のブロックのサブブロックであり、及び複数のブロックのための分割モードを決定することは、
第1の指示信号に従い、第1のブロックがサブブロックマージモードを使用してコード化されるかどうかを決定することと、
第1のブロックがサブブロックマージモードを使用してコード化されないという決定に応答して、第2の指示信号に従い、第1のブロックが通常モード又はMMVD(merge mode with motion vector differences)のいずれか1つを使用してコード化されるかどうかを決定することと、
第1のブロックが通常モード又はMMVDのいずれか1つを使用してコード化されないという決定に応答して、第3の指示信号に従い、第1のブロックが複合インター及びイントラ予測(CIIP)モードを使用してコード化されるかどうかを決定することと、
第1のブロックがCIIPモードを使用してコード化されないという決定に応答して、複数のブロックの分割モードが三角形分割モード又は幾何学的分割モードのいずれか1つであると決定することと
を更に含む、条項2に記載の方法。
4.複数のブロックを分割エッジに沿って分割することは、
分割モードインデックス、角度インデックス又は距離インデックスに従ってターゲット分割方式を決定することと、
ターゲット分割方式に対応する分割エッジを決定することと
を更に含む、条項2又は3に記載の方法。
5.マスクの組を生成することと、
第1のブロックのサイズ、ターゲット分割方式の角度の値及びターゲット分割方式の距離の値に基づいて、第1のオフセット及び第2のオフセットを決定することと、
第1のオフセット及び第2のオフセットを使用して、マスクの組に基づいて複数の混合重みを生成することと
を更に含む、条項4に記載の方法。
6.マスクの組の数は、幾何学的分割モード内でサポートされる角度の数に基づいて決定され、ターゲット分割方式の角度の値は、分割モードインデックスと、幾何学的分割モード内でサポートされる角度の数とに基づいて決定され、及びターゲット分割方式の距離の値は、分割モードインデックスと、幾何学的分割モード内でサポートされる角度の数とに基づいて決定される、条項5に記載の方法。
7.分割モードインデックス、角度インデックス又は距離インデックスに従ってターゲット分割方式を決定することは、
参照表に従ってターゲット分割方式を決定することであって、参照表は、複数の分割方式に関連する複数の分割モードインデックス、複数の角度インデックス及び複数の距離インデックスを含む、決定すること
を更に含む、条項5又は6に記載の方法。
8.マスクの組の数は、参照表の角度インデックスの数に基づいて決定され、ターゲット分割方式の角度の値は、ターゲット分割方式に対応する参照表の角度インデックスに基づいて決定され、及びターゲット分割方式の距離の値は、ターゲット分割方式に対応する参照表の距離インデックスに基づいて決定される、条項7に記載の方法。
9.参照表は、複数の分割方式のうち、第1の分割モードインデックスに関連する第1の分割方式及び第2の分割モードインデックスに関連する第2の分割方式を含み、第1の分割方式及び第2の分割方式は、三角形分割モードに対応する、条項7又は8に記載の方法。
10.第1の分割モードインデックスは、10に等しく、且つ第1の分割モードインデックスに関連する第1の分割方式は、ブロックの左上角から右下角へとブロックを分けることに対応し、及び第2の分割モードインデックスは、24に等しく、且つ第2の分割モードインデックスに関連する第2の分割方式は、ブロックの右上角から左下角へとブロックを分けることに対応する、条項9に記載の方法。
11.複数の混合重みは、エッジブロックのための複数のルマ重み及びエッジブロックのための複数のクロマ重みを含み、及び分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することは、
エッジサブブロックのための複数のルマ重みに従ってエッジブロックのルマ値を決定することと、
エッジサブブロックのための複数のクロマ重みに従ってエッジサブブロックのクロマ値を決定することと
を更に含む、条項5~10の何れか一項に記載の方法。
12.複数のクロマ重みのうち、クロマ重みは、クロマ重みに対応する2×2ブロックの左上角のためのルマ重みに基づいて決定される、条項11に記載の方法。
13.第1のブロックのサイズ、ターゲット分割方式の角度の値及びターゲット分割方式の距離の値に基づいて、第1のオフセット及び第2のオフセットを決定することと、
第1のオフセット及び第2のオフセットを使用して、第1のブロック内のルマサンプルのための複数の混合重みを生成することと
を更に含む、条項4に記載の方法。
14.第1のオフセット及び第2のオフセットは、以下の式:
第1のオフセット
Figure 2022544350000054
第2のオフセット
Figure 2022544350000055
を使用して決定され、ここで、Wは、第1のブロックの幅を表し、Hは、第1のブロックの高さを表し、Aは、ターゲット分割方式の角度の値を表し、及びDは、ターゲット分割方式の距離の値を表す、条項13に記載の方法。
15.第3の指示信号に従い、第1のブロックが複合インター及びイントラ予測(CIIP)モードを使用してコード化されるかどうかを決定する前に、
第1のブロックのサイズが所与の条件を満たすかどうかを決定することと、
第1のブロックのサイズが所与の条件を満たすという決定に応答して、第3の指示信号を生成すること、又は
ブロックのサイズが所与の条件を満たさないという決定に応答して、ブロックがCIIPモードを使用してコード化されると決定することと
を更に含む、条項3~14の何れか一項に記載の方法。
16.所与の条件は、
第1のブロックの幅及び高さがそれぞれ8以上であることと、
幅と高さとの間のより大きい値と、幅と高さとの間のより小さい値との比率が4以下であることと
を含む、条項15に記載の方法。
17.映像コンテンツを処理するためのシステムであって、
1組の命令を記憶するメモリと、
少なくとも1つのプロセッサとを含み、少なくとも1つのプロセッサは、システムに、
ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、
第1の区画のための第1の予測信号及び第2の区画のための第2の予測信号を生成するために、複数のブロックに対してインター予測を行うことと、
分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することと
を行わせるように、1組の命令を実行するように構成される、
システム。
18.複数のブロックを分割エッジに沿って分割することにおいて、少なくとも1つのプロセッサは、システムに、
複数のブロックの分割モードを決定することと、
分割モードに基づいて複数のブロックを分割することと
を更に行わせるように、1組の命令を実行するように構成される、条項17に記載のシステム。
19.複数のブロックは、第1のブロックのサブブロックであり、及び複数のブロックのための分割モードを決定することにおいて、少なくとも1つのプロセッサは、システムに、
第1の指示信号に従い、第1のブロックがサブブロックマージモードを使用してコード化されるかどうかを決定することと、
第1のブロックがサブブロックマージモードを使用してコード化されないという決定に応答して、第2の指示信号に従い、第1のブロックが通常モード又はMMVD(merge mode with motion vector differences)のいずれか1つを使用してコード化されるかどうかを決定することと、
第1のブロックが通常モード又はMMVDのいずれか1つを使用してコード化されないという決定に応答して、第3の指示信号に従い、第1のブロックが複合インター及びイントラ予測(CIIP)モードを使用してコード化されるかどうかを決定することと、
第1のブロックがCIIPモードを使用してコード化されないという決定に応答して、複数のブロックの分割モードが三角形分割モード又は幾何学的分割モードのいずれか1つであると決定することと
を更に行わせるように、1組の命令を実行するように構成される、条項18に記載のシステム。
20.コンピュータシステムの少なくとも1つのプロセッサによって実行可能な命令を記憶する非一時的コンピュータ可読媒体であって、命令の実行は、
ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、
第1の区画のための第1の予測信号及び第2の区画のための第2の予測信号を生成するために、複数のブロックに対してインター予測を行うことと、
分割エッジに関連するエッジブロックのために第1の予測信号及び第2の予測信号を混合することと
を含む方法をコンピュータシステムに行わせる、非一時的コンピュータ可読媒体。
[285] 本明細書の「第1の」及び「第2の」等の関係語は、あるエンティティ又は操作を別のエンティティ又は操作と区別するために使用されるに過ぎず、それらのエンティティ又は操作間のいかなる実際の関係又は順序も必要としないか又は含意しないことに留意すべきである。更に、「含む」、「有する」、「含有する」及び「包含する」並びに他の同様の形式の用語は、意味の点で均等であることを意図し、これらの用語の何れか1つの後に続くアイテムがかかるアイテムの網羅的列挙であることを意図していないか、又は列挙するアイテムのみに限定されることを意図していない点で非限定的であることを意図する。
[286] 本明細書で使用するとき、別段の定めがない限り、「又は」という語は、実行不可能な場合を除いて、あり得る全ての組み合わせを包含する。例えば、あるデータベースがA又はBを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、そのデータベースは、A若しくはB又はA及びBを含むことができる。第2の例として、あるデータベースがA、B又はCを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、そのデータベースは、A、若しくはB、若しくはC、又はA及びB、又はA及びC、又はB及びC、又はA、及びB、及びCを含むことができる。
[287] 上記で説明した実施形態は、ハードウェア若しくはソフトウェア(プログラムコード)又はハードウェアとソフトウェアとの組み合わせによって実装できることが理解されるであろう。ソフトウェアによって実装される場合、ソフトウェアは、上記のコンピュータ可読媒体に記憶することができる。ソフトウェアは、プロセッサによって実行されるとき、開示した方法を実行することができる。本開示で説明した計算ユニット及び他の機能ユニットは、ハードウェア若しくはソフトウェア又はハードウェアとソフトウェアとの組み合わせによって実装することができる。上記のモジュール/ユニットの複数を1つのモジュール/ユニットとして組み合わせることができ、上記のモジュール/ユニットのそれぞれを複数のサブモジュール/サブユニットに更に分割できることも当業者であれば理解するであろう。
[288] 上記の本明細書では、実装形態ごとに変わり得る多数の具体的な詳細に関して実施形態を説明してきた。記載した実施形態に対する一定の適応形態及び修正形態がなされ得る。本明細書を検討し、本明細書で開示した本発明を実践することで他の実施形態が当業者に明らかになり得る。本明細書及び例は、専ら例示として検討され、本開示の真の範囲及び趣旨は、添付の特許請求の範囲によって示されることを意図する。図中に示すステップの順序は、例示目的に過ぎず、特定のステップの順序に限定されることを意図しない。そのため、それらのステップは、同じ方法を実装しながら異なる順序で実行できることを当業者であれば理解することができる。
[289] 図面及び本明細書で例示的実施形態を開示してきた。しかし、それらの実施形態に対する多くの改変形態及び修正形態がなされ得る。従って、特定の用語を使用したが、それらの用語は、限定目的ではなく、全般的及び説明的な意味で使用されたものに過ぎない。

Claims (20)

  1. 映像コンテンツを処理するための方法であって、
    ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、
    前記第1の区画のための第1の予測信号及び前記第2の区画のための第2の予測信号を生成するために、前記複数のブロックに対してインター予測を行うことと、
    前記分割エッジに関連するエッジブロックのために前記第1の予測信号及び前記第2の予測信号を混合することと
    を含む方法。
  2. 前記複数のブロックを前記分割エッジに沿って分割することは、
    前記複数のブロックの分割モードを決定することと、
    前記分割モードに基づいて前記複数のブロックを分割することと
    を更に含む、請求項1に記載の方法。
  3. 前記複数のブロックは、第1のブロックのサブブロックであり、及び前記複数のブロックのための前記分割モードを決定することは、
    第1の指示信号に従い、前記第1のブロックがサブブロックマージモードを使用してコード化されるかどうかを決定することと、
    前記第1のブロックが前記サブブロックマージモードを使用してコード化されないという前記決定に応答して、第2の指示信号に従い、前記第1のブロックが通常モード又はMMVD(merge mode with motion vector differences)のいずれか1つを使用してコード化されるかどうかを決定することと、
    前記第1のブロックが前記通常モード又は前記MMVDのいずれか1つを使用してコード化されないという前記決定に応答して、第3の指示信号に従い、前記第1のブロックが複合インター及びイントラ予測(CIIP)モードを使用してコード化されるかどうかを決定することと、
    前記第1のブロックが前記CIIPモードを使用してコード化されないという前記決定に応答して、前記複数のブロックの前記分割モードが三角形分割モード又は幾何学的分割モードのいずれか1つであると決定することと
    を更に含む、請求項2に記載の方法。
  4. 前記複数のブロックを前記分割エッジに沿って分割することは、
    分割モードインデックス、角度インデックス又は距離インデックスに従ってターゲット分割方式を決定することと、
    前記ターゲット分割方式に対応する前記分割エッジを決定することと
    を更に含む、請求項2に記載の方法。
  5. マスクの組を生成することと、
    前記第1のブロックのサイズ、前記ターゲット分割方式の角度の値及び前記ターゲット分割方式の距離の値に基づいて、第1のオフセット及び第2のオフセットを決定することと、
    前記第1のオフセット及び前記第2のオフセットを使用して、前記マスクの組に基づいて複数の混合重みを生成することと
    を更に含む、請求項4に記載の方法。
  6. 前記マスクの組の数は、幾何学的分割モード内でサポートされる角度の数に基づいて決定され、前記ターゲット分割方式の前記角度の値は、前記分割モードインデックスと、前記幾何学的分割モード内でサポートされる前記角度の数とに基づいて決定され、及び前記ターゲット分割方式の前記距離の値は、前記分割モードインデックスと、前記幾何学的分割モード内でサポートされる前記角度の数とに基づいて決定される、請求項5に記載の方法。
  7. 前記分割モードインデックス、前記角度インデックス又は前記距離インデックスに従って前記ターゲット分割方式を決定することは、
    参照表に従って前記ターゲット分割方式を決定することであって、前記参照表は、複数の分割方式に関連する複数の分割モードインデックス、複数の角度インデックス及び複数の距離インデックスを含む、決定すること
    を更に含む、請求項5に記載の方法。
  8. 前記マスクの組の数は、前記参照表の角度インデックスの数に基づいて決定され、前記ターゲット分割方式の前記角度の値は、前記ターゲット分割方式に対応する前記参照表の角度インデックスに基づいて決定され、及び前記ターゲット分割方式の前記距離の値は、前記ターゲット分割方式に対応する前記参照表の距離インデックスに基づいて決定される、請求項7に記載の方法。
  9. 前記参照表は、前記複数の分割方式のうち、第1の分割モードインデックスに関連する第1の分割方式及び第2の分割モードインデックスに関連する第2の分割方式を含み、前記第1の分割方式及び前記第2の分割方式は、三角形分割モードに対応する、請求項7に記載の方法。
  10. 前記第1の分割モードインデックスは、10に等しく、且つ前記第1の分割モードインデックスに関連する前記第1の分割方式は、前記ブロックの左上角から右下角へと前記ブロックを分けることに対応し、及び前記第2の分割モードインデックスは、24に等しく、且つ前記第2の分割モードインデックスに関連する前記第2の分割方式は、前記ブロックの右上角から左下角へと前記ブロックを分けることに対応する、請求項9に記載の方法。
  11. 前記複数の混合重みは、前記エッジブロックのための複数のルマ重み及び前記エッジブロックのための複数のクロマ重みを含み、及び前記分割エッジに関連する前記エッジブロックのために前記第1の予測信号及び前記第2の予測信号を混合することは、
    前記エッジサブブロックのための前記複数のルマ重みに従って前記エッジブロックのルマ値を決定することと、
    前記エッジサブブロックのための前記複数のクロマ重みに従って前記エッジサブブロックのクロマ値を決定することと
    を更に含む、請求項5に記載の方法。
  12. 前記複数のクロマ重みのうちのクロマ重みは、前記クロマ重みに対応する2×2ブロックの左上角のためのルマ重みに基づいて決定される、請求項11に記載の方法。
  13. 前記第1のブロックのサイズ、前記ターゲット分割方式の角度の値及び前記ターゲット分割方式の距離の値に基づいて、第1のオフセット及び第2のオフセットを決定することと、
    前記第1のオフセット及び前記第2のオフセットを使用して、前記第1のブロック内のルマサンプルのための複数の混合重みを生成することと
    を更に含む、請求項4に記載の方法。
  14. 前記第1のオフセット及び前記第2のオフセットは、以下の式:
    前記第1のオフセット
    Figure 2022544350000056
    前記第2のオフセット
    Figure 2022544350000057
    を使用して決定され、ここで、「W」は、前記第1のブロックの幅を表し、「H」は、前記第1のブロックの高さを表し、「A」は、前記ターゲット分割方式の前記角度の値を表し、及び「D」は、前記ターゲット分割方式の前記距離の値を表す、請求項13に記載の方法。
  15. 前記第3の指示信号に従い、前記第1のブロックが複合インター及びイントラ予測(CIIP)モードを使用してコード化されるかどうかを決定する前に、
    前記第1のブロックのサイズが所与の条件を満たすかどうかを決定することと、
    前記第1のブロックの前記サイズが前記所与の条件を満たすという前記決定に応答して、前記第3の指示信号を生成すること、又は
    前記ブロックの前記サイズが前記所与の条件を満たさないという前記決定に応答して、前記ブロックが前記CIIPモードを使用してコード化されると決定することと
    を更に含む、請求項3に記載の方法。
  16. 前記所与の条件は、
    前記第1のブロックの幅及び高さがそれぞれ8以上であることと、
    前記幅と前記高さとの間のより大きい値と、前記幅と前記高さとの間のより小さい値との比率が4以下であることと
    を含む、請求項15に記載の方法。
  17. 映像コンテンツを処理するためのシステムであって、
    1組の命令を記憶するメモリと、
    少なくとも1つのプロセッサとを含み、
    前記少なくとも1つのプロセッサは、前記システムに、
    ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、
    前記第1の区画のための第1の予測信号及び前記第2の区画のための第2の予測信号を生成するために、前記複数のブロックに対してインター予測を行うことと、
    前記分割エッジに関連するエッジブロックのために前記第1の予測信号及び前記第2の予測信号を混合することと
    を行わせるように、前記1組の命令を実行するように構成される、システム。
  18. 前記複数のブロックを前記分割エッジに沿って分割することにおいて、前記少なくとも1つのプロセッサは、前記システムに、
    前記複数のブロックの分割モードを決定することと、
    前記分割モードに基づいて前記複数のブロックを分割することと
    を更に行わせるように、前記1組の命令を実行するように構成される、請求項17に記載のシステム。
  19. 前記複数のブロックは、第1のブロックのサブブロックであり、及び前記複数のブロックのための前記分割モードを決定することにおいて、前記少なくとも1つのプロセッサは、前記システムに、
    第1の指示信号に従い、前記第1のブロックがサブブロックマージモードを使用してコード化されるかどうかを決定することと、
    前記第1のブロックが前記サブブロックマージモードを使用してコード化されないという前記決定に応答して、第2の指示信号に従い、前記第1のブロックが通常モード又はMMVD(merge mode with motion vector differences)のいずれか1つを使用してコード化されるかどうかを決定することと、
    前記第1のブロックが前記通常モード又は前記MMVDのいずれか1つを使用してコード化されないという前記決定に応答して、第3の指示信号に従い、前記第1のブロックが複合インター及びイントラ予測(CIIP)モードを使用してコード化されるかどうかを決定することと、
    前記第1のブロックが前記CIIPモードを使用してコード化されないという前記決定に応答して、前記複数のブロックの前記分割モードが三角形分割モード又は幾何学的分割モードのいずれか1つであると決定することと
    を更に行わせるように、前記1組の命令を実行するように構成される、請求項18に記載のシステム。
  20. コンピュータシステムの少なくとも1つのプロセッサによって実行可能な命令を記憶する非一時的コンピュータ可読媒体であって、前記命令の実行は、
    ピクチャに関連する複数のブロックを分割エッジに沿って第1の区画及び第2の区画に分割することと、
    前記第1の区画のための第1の予測信号及び前記第2の区画のための第2の予測信号を生成するために、前記複数のブロックに対してインター予測を行うことと、
    前記分割エッジに関連するエッジブロックのために前記第1の予測信号及び前記第2の予測信号を混合することと
    を含む方法を前記コンピュータシステムに行わせる、非一時的コンピュータ可読媒体。
JP2021576628A 2019-08-15 2020-07-22 映像コード化のためのブロック分割方法 Pending JP2022544350A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962887039P 2019-08-15 2019-08-15
US62/887,039 2019-08-15
US201962903970P 2019-09-23 2019-09-23
US62/903,970 2019-09-23
PCT/US2020/043143 WO2021030019A1 (en) 2019-08-15 2020-07-22 Block partitioning methods for video coding

Publications (2)

Publication Number Publication Date
JP2022544350A true JP2022544350A (ja) 2022-10-18
JPWO2021030019A5 JPWO2021030019A5 (ja) 2023-07-27

Family

ID=74568459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021576628A Pending JP2022544350A (ja) 2019-08-15 2020-07-22 映像コード化のためのブロック分割方法

Country Status (6)

Country Link
US (2) US11356677B2 (ja)
EP (1) EP3987795A4 (ja)
JP (1) JP2022544350A (ja)
KR (1) KR20220044754A (ja)
CN (1) CN114208197A (ja)
WO (1) WO2021030019A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020094050A1 (en) 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Using inter prediction with geometric partitioning for video processing
CN113170166B (zh) 2018-12-30 2023-06-09 北京字节跳动网络技术有限公司 具有几何分割的帧间预测在视频处理中有条件的应用
US11611759B2 (en) * 2019-05-24 2023-03-21 Qualcomm Incorporated Merge mode coding for video coding
CN113055683B (zh) * 2019-06-24 2022-11-01 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CA3152030A1 (en) * 2019-08-26 2021-03-04 Huawei Technologies Co., Ltd. Method and apparatus for motion information storage
MX2022002916A (es) 2019-09-19 2022-04-06 Beijing Bytedance Network Tech Co Ltd Derivacion de posiciones de muestra de referencia en codificacion de video.
JP7324940B2 (ja) 2019-09-19 2023-08-10 北京字節跳動網絡技術有限公司 ビデオコーディングにおけるスケーリングウインドウ
WO2021063419A1 (en) 2019-10-05 2021-04-08 Beijing Bytedance Network Technology Co., Ltd. Downsampling filter type for chroma blending mask generation
WO2021068955A1 (en) 2019-10-12 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Use and signaling of refining video coding tools
MX2022004200A (es) 2019-10-13 2022-05-02 Beijing Bytedance Network Tech Co Ltd Interaccion entre remuestreo de imagen de referencia y herramientas de codificacion de video.
US11363299B2 (en) 2019-12-12 2022-06-14 Panasonic Intellectual Property Corporation Of America Encoding and decoding with merge mode and block partition index
WO2021129866A1 (en) 2019-12-27 2021-07-01 Beijing Bytedance Network Technology Co., Ltd. Signaling of slice types in video pictures headers
WO2023280311A1 (en) * 2021-07-08 2023-01-12 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
EP4378164A1 (en) * 2021-07-26 2024-06-05 Beijing Dajia Internet Information Technology Co., Ltd. Video coding using multi-direction intra prediction
TW202339504A (zh) * 2022-03-18 2023-10-01 聯發科技股份有限公司 幾何分割模式及合併候選重排
US20230388484A1 (en) * 2022-05-24 2023-11-30 Tencent America LLC Method and apparatus for asymmetric blending of predictions of partitioned pictures
US20230396762A1 (en) * 2022-06-02 2023-12-07 Tencent America LLC Systems and methods for partition-based predictions
KR20230174182A (ko) * 2022-06-20 2023-12-27 현대자동차주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2024080849A1 (ko) * 2022-10-14 2024-04-18 현대자동차주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2024099334A1 (en) * 2022-11-08 2024-05-16 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing
WO2024111964A1 (ko) * 2022-11-21 2024-05-30 현대자동차주식회사 기하학적 분할 모드에서 적응적으로 블렌딩 영역을 결정하는 비디오 코딩을 위한 방법 및 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2942960A1 (en) * 2009-12-01 2015-11-11 HUMAX Holdings Co., Ltd. Apparatus for decoding high-resolution images
EP4161078A1 (en) 2011-11-11 2023-04-05 GE Video Compression, LLC Effective wedgelet partition coding using spatial prediction
EP2942961A1 (en) 2011-11-23 2015-11-11 HUMAX Holdings Co., Ltd. Methods for encoding/decoding of video using common merging candidate set of asymmetric partitions
KR20180040517A (ko) 2015-09-10 2018-04-20 삼성전자주식회사 비디오 부호화, 복호화 방법 및 장치
WO2020017423A1 (en) * 2018-07-17 2020-01-23 Panasonic Intellectual Property Corporation Of America Motion vector prediction for video coding
US11032574B2 (en) * 2018-12-31 2021-06-08 Tencent America LLC Method and apparatus for video coding
US11025951B2 (en) 2019-01-13 2021-06-01 Tencent America LLC Method and apparatus for video coding
US10742972B1 (en) * 2019-03-08 2020-08-11 Tencent America LLC Merge list construction in triangular prediction

Also Published As

Publication number Publication date
US20210051335A1 (en) 2021-02-18
KR20220044754A (ko) 2022-04-11
EP3987795A1 (en) 2022-04-27
US11949888B2 (en) 2024-04-02
CN114208197A (zh) 2022-03-18
US11356677B2 (en) 2022-06-07
EP3987795A4 (en) 2023-02-08
WO2021030019A1 (en) 2021-02-18
US20220272359A1 (en) 2022-08-25

Similar Documents

Publication Publication Date Title
JP2022544350A (ja) 映像コード化のためのブロック分割方法
RU2683165C1 (ru) Внутреннее предсказание блочного копирования с асимметричными разделами и схемами поиска на стороне кодера, диапазоны поиска и подходы к разделению
US20210314596A1 (en) Enhanced decoder side motion vector refinement
US11838541B2 (en) Matrix weighted intra prediction of video signals
JP2022548825A (ja) 映像処理における量子化パラメータのシグナリング
JP7271675B2 (ja) ビデオ復号の方法および装置、並びにプログラム
JP2022538747A (ja) ルマ及びクロマ信号を処理するための方法及びシステム
US20220417511A1 (en) Methods and systems for performing combined inter and intra prediction
KR20220160038A (ko) 비디오 코딩 데이터를 시그널링하기 위한 방법들
EP4074042A1 (en) Methods for performing wrap-around motion compensation
US20220141459A1 (en) Offset-based refinement of intra prediction (orip) of video coding
CN115280770B (zh) 用于对视频进行编码或解码的方法和装置
KR20220057620A (ko) 변환-스킵 모드에서 비디오 데이터를 코딩하기 위한 방법 및 장치
US20230217026A1 (en) Fusion of video prediction modes
US20230090025A1 (en) Methods and systems for performing combined inter and intra prediction
WO2021195584A1 (en) Method and apparatus for deriving temporal motion information
CN118402232A (en) Method and apparatus for decoder-side intra mode derivation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230718

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230718

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240719