JP2024010156A - イントラコーディングにおけるサブパーティショニング - Google Patents

イントラコーディングにおけるサブパーティショニング Download PDF

Info

Publication number
JP2024010156A
JP2024010156A JP2023188074A JP2023188074A JP2024010156A JP 2024010156 A JP2024010156 A JP 2024010156A JP 2023188074 A JP2023188074 A JP 2023188074A JP 2023188074 A JP2023188074 A JP 2023188074A JP 2024010156 A JP2024010156 A JP 2024010156A
Authority
JP
Japan
Prior art keywords
video block
current video
sub
block
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023188074A
Other languages
English (en)
Inventor
ザン,カイ
Kai Zhang
ザン,リー
Li Zhang
リュウ,ホンビン
Hongbin Liu
デン,ジピン
Zhipin Deng
ザン,ナー
Na Zhang
ワン,ユエ
Yue Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of JP2024010156A publication Critical patent/JP2024010156A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】ビデオブロックの符号化又は復号にイントラサブパーティションモードを使用するビデオ処理方法、装置及びシステムを提供する。【解決手段】ビデオ処理方法は、イントラサブブロックパーティショニング(ISP)モードを使用して、ビデオの現在のピクチャのブロックとビデオのコーディングされた表現との間の変換を実行することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。ブロックは、ブロックの左上コーナー位置と同じ左上コーナー位置を有する最初のサブパーティションを含む複数のサブパーティションにパーティショニングされる。【選択図】図6

Description

この出願は、2022年2月25日に出願された特許出願第2022-513061号に基づいており、この特許出願は、2020年8月31日出願された国際特許出願第PCT/CN2020/112425号の国内段階であり、この国際特許出願は、2019年8月30日に出願された国際特許出願第PCT/CN2019/103762号の優先権および利益を主張する。前述の出願の開示全体は、この出願の開示の一部として参照により組み込まれる。
本特許文書はビデオコーディングおよび復号に関係する。
ビデオ圧縮の進歩にもかかわらず、デジタルビデオは、依然として、インターネットおよび他のデジタル通信ネットワークにおける最大の帯域幅使用を占めている。ビデオを受信および表示することが可能な接続ユーザデバイスの数が増加するにつれて、デジタルビデオの利用に対する帯域幅需要は増加し続けることが予想される。
デジタルビデオビデオコーディング、特にビデオおよび画像のコーディングおよび復号に関係するデバイス、システムおよび方法であって、ビデオブロックのコーディングまたは復号にイントラサブパーティションモードが使用される。
1つの例示的な態様において、ビデオ処理の方法が開示される。方法は、イントラサブブロックパーティショニング(ISP)モードを使用して、ビデオの現在のピクチャのブロックとビデオのコーディングされた表現との間の変換を実行することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。ブロックは、ブロックの左上コーナー位置と同じ左上コーナー位置を有する最初のサブパーティションを含む複数のサブパーティションにパーティショニングされる。
さらに別の態様において、ビデオ処理の方法が開示される。方法は、ビデオのブロックとビデオのコーディングされた表現との間の変換に対して、広角イントラ予測モードマッピングが規則に基づいて有効であるかどうかを判定することを含む。広角イントラ予測モードは、参照サンプルおよび予測されるサンプルが左上方向に関して鈍角を形成するモードである。規則は、コーディングツールがブロックの変換に対して有効である場合に、判定のために予測ユニットの寸法を使用することを指定する。方法はまた、判定に基づいて変換を実行することを含む。
さらに別の態様において、ビデオ処理の方法が開示される。方法は、ビデオのビデオ領域のコーディングユニットとビデオのコーディングされた表現との間の変換を実行することを含む。コーディングユニットは、1つ以上のパーティションにパーティショニングされ、コーディングユニットは、1つ以上のパーティションの各々のイントラ予測プロセスによって取得された量子化残差信号を使用して、コーディングされた表現にコーディングされる。コーディングされた表現は、量子化に使用される量子化パラメータを示す構文要素を含む。構文要素は、コーディングされた表現に、コーディングユニットに対して多くても一度だけ含まれ、量子化パラメータの値とビデオの以前に処理されたコーディングユニットに基づく別の量子化値の差異を示す。
さらに別の態様において、ビデオ処理の方法が開示される。方法は、イントラサブブロックパーティショニング(ISP)モードを使用する、1つ以上のパーティションを含むビデオのブロックとビデオのコーディングされた表現との間の変換に対して、ブロックまたはISPモードの特性に基づいて、符号化中にトランスフォーム動作がスキップされるか、復号中に逆トランスフォーム動作がスキップされるかを判定することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。方法はまた、判定に基づいて変換を実行することを含む。
さらに別の態様において、ビデオ処理の方法が開示される。方法は、1つ以上のパーティションを含むビデオのブロックと、ビデオのコーディングされた表現との間の変換に対して、変換にイントラサブブロックパーティショニング(ISP)モードが使用されるかどうかに基づいて、変換中に使用されるトランスフォームのタイプを判定することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。変換は、符号化中にコーディングされた表現に符号化する前にトランスフォームを適用することか、またはブロックのサンプル値を再構成する前に、コーディングされた表現から解析された係数値にトランスフォームの逆トランスフォームを適用することを含む。方法はまた、判定に基づいて変換を実行することを含む。
さらに別の態様において、ビデオ処理の方法が開示される。方法は、1つ以上のパーティションを含むビデオのブロックと、ビデオのコーディングされた表現との間の変換に対して、ブロックに可逆コーディングプロセスが適用されるかどうかに基づいて、イントラサブブロックパーティショニング(ISP)モードに対する制限を判定することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。方法はまた、判定に基づいて変換を実行することを含む。
さらに別の態様において、ビデオ処理の方法が開示される。方法は、規則に従って、ビデオのビデオ領域のコーディングユニットとビデオのコーディングされた表現との間の変換を実行することを含む。コーディングユニットは、複数のトランスフォームユニットに分割される。規則は、コーディングユニットに対する量子化パラメータ(QP)と、複数のトランスフォームユニットのうちの1つ以上の量子化パラメータとの間の関係を指定する。
さらに別の態様において、ビデオ処理の方法が開示される。方法は、ビデオ領域と、ビデオ領域のコーディングされた表現との間の変換に対して、エッジに関係するトランスフォームユニットの量子化パラメータ(QP)に基づいて、エッジにブロック解除フィルタを適用するかどうか、および/または、どのように適用するかを判定することを含む。ビデオ領域は、1つ以上のコーディングユニットおよび1つ以上のトランスフォームユニットを含む。方法はまた、判定に基づいて変換を実行することを含む。
さらに別の態様において、ビデオ処理の方法が開示される。方法は、1つ以上のサブパーティションを含むビデオユニットと、ビデオユニットのコーディングされた表現との間の変換に対して、変換がイントラサブブロックパーティショニングモードを使用することを判定することと、判定に基づいて、変換を実行して、1つ以上のサブパーティションの各々の変換にイントラ予測プロセスが使用されるようにすることと、を含む。
さらに別の例示的な態様において、ビデオ処理の別の方法が開示される。方法は、ビデオブロックのコーディングユニットサイズを使用することなく、コーディングツールおよび/またはビデオブロックの予測ユニットのサイズの適用可能性に基づいて、ビデオブロックとビデオブロックのコーディングされた表現との間の変換中に広角イントラ予測マッピングが使用されるかどうかを判定することと、判定の結果に基づいて変換を実行することと、を含む。
さらに別の例示的な態様において、ビデオ処理の別の方法が開示される。本方法は、コーディングユニットを含むビデオ領域であって、コーディングユニットがイントラサブブロックパーティションを含むビデオ領域と、ビデオ領域のコーディングされた表現との間の変換に対して、コーディングユニットのすべてのイントラサブブロックパーティションの変換に適用可能なデルタ量子化パラメータ(デルタQP)を判定することと、デルタQPを使用して変換を実行することとを含み、デルタQPは、コーディングされた表現においてコーディングユニットに対してシグナリングされる。
さらに別の例示的な態様において、ビデオ処理の別の方法が開示される。方法は、ビデオ領域とビデオ領域のコーディングされた表現との間の変換に対して、ビデオ領域においてトランスフォームユニット(TU)のQPに基づいたビデオ領域におけるコーディングユニット(CU)の変換に使用される量子化パラメータ(QP)を判定することと、TUのQPおよび/またはCUのQPを使用して変換を実行することと、を含む。
さらに別の例示的な態様において、ビデオ処理の別の方法が開示される。本方法は、1つ以上のコーディングユニットを含むビデオ領域と1つ以上のトランスフォームユニットとの間の変換に対して、エッジが属するトランスフォームユニットに基づいた適用に対してビデオブロックのエッジに保護解除フィルタを適用するかどうかについて判定することと、判定に基づいて変換を実行することと、を含む。
さらに別の例示的な態様において、ビデオ処理の別の方法が開示される。本方法は、イントラサブパーティショニングモードを使用する、ビデオブロックとビデオブロックのコーディングされた表現との間の変換に対して、トランスフォーム動作が、コーディングブロック、予測ブロック、またはトランスフォームの寸法に基づいてスキップされるかどうかを判定することと、判定に基づいて変換を実行することと、を含む。
さらに別の例示的な態様において、ビデオ処理の別の方法が開示される。方法は、ビデオブロックとビデオブロックのコーディングされた表現との間の変換に対して、イントラサブパーティショニングモードまたは可逆コーディングモードが使用されるのかどうかに基づいて適用されるトランスフォームのタイプを判定することと、判定に基づいて変換を実行することと、を含む。
さらに別の例示的な態様において、ビデオ処理の別の方法が開示される。方法は、変換に可逆コーディングモードが使用されるか、変換にイントラサブパーティショニングモードが使用されるかのいずれかによる排他性の規則で、ビデオブロックとビデオブロックのコーディングされた表現との間の変換を実行することを含み、コーディングされた表現は、可逆コーディングモードが使用されるか、イントラサブパーティショニングモードが使用されるかの表示を含む。
さらに別の代表的な態様では、上述の方法は、プロセッサ実行可能コードの形態で具体化され、コンピュータ可読プログラム媒体に記憶される。
さらに別の代表的な態様では、上述の方法を実行するように構成されているか、または動作可能なデバイスが開示される。デバイスは、この方法を実装するようにプログラムされたプロセッサを含んでもよい。
さらに別の代表的な態様では、ビデオ復号器装置は、本明細書に記載される方法を実装してもよい。
開示された技術の上記および他の態様および特徴は、図面、明細書および特許請求の範囲により詳細に記載されている。
サブパーティショニングの一例を示すブロック図である。
サブパーティショニングの一例を示すブロック図である。
ビデオ処理のためのハードウェアプラットフォームの例示的な実装のブロック図である。
ビデオ処理のための例示的な方法のフローチャートである。
開示された技法が実装され得る例示的なビデオ処理システムのブロック図である。
本技術によるビデオ処理のための方法のフローチャート表現である。
本技術によるビデオ処理のための別の方法のフローチャート表現である。
本技術によるビデオ処理のための別の方法のフローチャート表現である。
本技術によるビデオ処理のための別の方法のフローチャート表現である。
本技術によるビデオ処理のための別の方法のフローチャート表現である。
本技術によるビデオ処理のための別の方法のフローチャート表現である。
本技術によるビデオ処理のための別の方法のフローチャート表現である。
本技術によるビデオ処理のためのさらに別の方法のフローチャート表現である。
本文書は、ビデオコーディング技術に関係する。具体的には、これはビデオコーディングにおけるイントラサブパーティショニング予測に関係する。これは、HEVCのような既存のビデオ/画像コーディング規格、または最終化される規格(Versatile Video Coding)に適用されることがある。これは、将来のビデオコーディング規格またはビデオコーデックにも適用可能である。
開示された技術の実施形態は、圧縮性能を改善するために、既存のビデオコーディング規格(例えば、HEVC、H.265)および将来の規格に適用されてもよい。本文書では、明細書の可読性を改善するためにセクション見出しを使用しているが、説明または実施形態(および/または実装)をそれぞれのセクションのみに限定するものでは決してない。
1. 最初の議論
ビデオコーディング規格は、主に、周知のITU-TおよびISO/IEC規格の開発を通じて発展してきた。ITU-TはH.261とH.263を、ISO/IECはMPEG-1とMPEG-4 Visualを、2つの組織はH.262/MPEG-2 VideoおよびH.264/MPEG-4 AVC(Advanced Video Coding)とH.265/HEVC規格を共同で作成した。H.262から、ビデオコーディング規格は、時間的予測にトランスフォームコーディングを加えたものが利用されるハイブリッドビデオコーディング構造に基づいている。HEVCを越えた将来のビデオコーディング技術を探求するため、2015年にVCEGとMPEGによって共同でJVET(Joint Video Exploration Team)が設立された。それ以来、JVETによって多くの新しい方法が採用され、JEM(Joint Exploration Model)と名付けられた参照ソフトウェアに入れられた。2018年4月には、VCEG(Q6/16)とISO/IEC JTC1 SC29/WG11(MPEG)とのJVET(Joint Video Expert Team)が発足され、HEVCに対して50%のビットレート低減を目指すVVC規格に取り組んだ。
1.1 イントラサブパーティション(ISP)の例示的な実施形態
いくつかの実施形態において、ISPツールは、表1に示すように、ブロックサイズの寸法に依存して、ルマイントラ予測ブロックを垂直方向または水平方向に2つまたは4つのサブパーティションに分割する。図1および図2は、2つの可能性の例を示す。図1は、4×8および8×4ブロックの分割の一例を示す。図2は、4×8、8×4および4×4を除くすべてのブロックの分割の一例を示す。すべてのサブパーティションは、少なくとも16のサンプルを有することの条件を満たす。
Figure 2024010156000002
これらのサブパーティションの各々に対して、符号化器によって送信された係数をエントロピー復号し、次いでそれらを逆量子化し、逆トランスフォームすることによって、残差信号が生成される。次いで、サブパーティションがイントラ予測され、最後に、残差信号を予測信号に追加することによって対応する再構成されたサンプルが取得される。したがって、各サブパーティションの再構成された値は、次のサブパーティションの予測を生成するために利用可能であり、これはプロセスを繰り返す、などである。すべてのサブパーティションは同じイントラモードを共有する。
イントラモードおよび利用されるスプリットに基づいて、2つの異なるクラスの処理順序が使用され、それらは正規順序および逆順序と呼ばれる。正規順序において、最初に処理されるサブパーティションは、CUの左上のサンプルを含み、続いて下向き(水平スプリット)または右向き(垂直スプリット)に続くものである。その結果、サブパーティション予測信号を生成するために使用される基準サンプルは、ラインの左方および上方にのみ位置する。一方、逆順序は、CUの左下のサンプルを含むサブパーティションで開始し、上向きに続くものであるか、またはCUの右上のサンプルを含むサブパーティションで開始、左向きに続くものである。
例示的なISP関係の構文、意味、プロセスを以下に提示する。
Figure 2024010156000003
Figure 2024010156000004
Figure 2024010156000005
Figure 2024010156000006
Figure 2024010156000007
Figure 2024010156000008
Figure 2024010156000009
Figure 2024010156000010
Figure 2024010156000011
Figure 2024010156000012
Figure 2024010156000013
[外1]
Figure 2024010156000014
Figure 2024010156000015
8.4.5 イントラブロックに対する復号処理
8.4.5.1 イントラブロックに対する一般的な復号処理
このプロセスへの入力は、以下のようである。
- 現在のピクチャの左上のサンプルに対する現在のトランスフォームブロックの左上のサンプルを指定するサンプル位置(xTb0,yTb0)
- 現在のトランスフォームブロックの幅を指定する変数nTbW
- 現在のトランスフォームブロックの高さを指定する変数nTbH
- イントラ予測モードを指定する変数predModeIntra
- 現在のブロックの色コンポーネントを指定する変数cIdx
このプロセスの出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
最大トランスフォームブロック幅maxTbWidthと高さmaxTbHeightは、以下のように導出される。
Figure 2024010156000016
ルマサンプルの位置は、以下のように導出される。
Figure 2024010156000017
maxTbSizeに依存して、以下が適用される。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITに等しく、nTbWがmaxTbWidthよりも大きいか、またはnTbHがmaxTbHeightよりも大きい場合、以下の順序付されたステップが適用される。
1. 変数newTbWとnewTbHは、以下のように導出される。
Figure 2024010156000018
2. この項において指定されているイントラブロックに対する一般的な復号処理は、位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
3. nTbWがmaxTbWidthよりも大きい場合、この項において指定されているイントラブロックに対する一般的な復号処理は、(xTb0+newTbW,yTb0)に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
4. nTbHがmaxTbHeightよりも大きい場合、この項において指定されているイントラブロックに対する一般的な復号処理は、(xTb0,yTb0+newTbH)に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
5.nTbWがmaxTbWidthよりも大きく、nTbHがmaxTbHeightよりも大きい場合、この項において指定されているイントラブロックに対する一般的な復号処理は、(xTb0+newTbW,yTb0+newTbH)に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
- それ以外の場合、以下の順序付されたステップが適用される。
[外2]
Figure 2024010156000019
3. 8.7.2項において指定されているスケーリングおよびトランスフォーム処理は、(xTbY+nW*xPartIdx,yTbY+nH*yPartIdx)に等しくセットされたルマ位置(xTbY,yTbY)、変数cIdx、nWおよびnHに等しくセットされたトランスフォーム幅nTbWおよびトランスフォーム高さnTbHを入力として呼び出され、出力は、(nW)x(nH)配列resSamplesである。
4. 8.7.5項において指定されている色コンポーネントのピクチャ再構成処理は、(xTb0+nW*xPartIdx,yTb0+nH*yPartIdx)に等しくセットされたトランスフォームブロック位置(xTbComp,yTbComp)、nWおよびnHに等しくセットされたトランスフォームブロック幅nTbWおよびトランスフォームブロック高さnTbH、x=xPartPbIdx*nW..(xPartPbIdx+1)*nW-1,y=0..nH-1である(nW)x(nH)配列predSamples[x][y]、ならびに(nW)x(nH)配列resSamplesを入力して呼びサンプルを入力として再構成し、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
8.4.5.2.5 一般的なイントラサンプル予測
このプロセスへの入力は、以下のようである。
- 現在のピクチャの左上のサンプルに対する現在のトランスフォームブロックの左上のサンプルを指定するサンプル位置(xTbCmp,yTbCmp)
- イントラ予測モードを指定する変数predModeIntra
- トランスフォームブロック幅を指定する変数nTbW
- トランスフォームブロックの高さを指定する変数nTbH
- コーディングブロック幅を指定する変数nCbW
- コーディングブロック高さを指定する変数nCbH
- 現在のブロックの色コンポーネントを指定する変数cIdx
このプロセスの出力は、x=0..nTbW-1、y=0..nTbH-1の予測されたサンプルpredSamples[x][y]である。
[外3]
Figure 2024010156000020
内部予測参照線インデックスを指定する変数refIdxは、以下のように導出される。
Figure 2024010156000021
8.4.5.2.6項において指定されている広角イントラ予測モードマッピング処理は、preModeIntra、nTbW、nTbH、およびcIdxを入力として呼び出され、修正されたpredModeIntraを出力とする。
変数refFilterFlagは、以下のように導出される。
- predModeIntraが0、-14、-12、-10、-6、2、34、66、72、76、78、80の値の1つに等しい場合、refFilterFlagは、1に等しくセットされる。
- それ以外の場合、refFilterFlagは、0にセットされる。
x=-1-refIdx,y=-1-refIdx..refH-1、およびx=-refIdx..refW-1,y=-1-refIdxである参照サンプルp[x][y]に対して、以下の順序付けされたステップが適用される。
1. 8.4.5.2.7項において指定されている参照サンプル可用性マーキング処理は、サンプル位置(xTbCmp,yTbCmp)、イントラ予測参照ラインインデックスrefIdx、参照サンプル幅refW、参照サンプル高さrefH、色コンポーネントインデックスcIdxを入力として呼び出され、x=-1-refIdx,y=-1-refIdx..refH-1、およびx=-refIdx..refW-1,y=-1-refIdxである参照サンプルrefUnfilt[x][y]を出力とする。
2. x=-1-refIdx,y=-1-refIdx..refH-1、およびx=-refIdx..refW-1,y=-1-refIdxである少なくとも1つのサンプルrefUnfilt[x][y]が、「イントラ予測に利用可能でない」とマークされるときに、8.4.5.2.8項において指定されている参照サンプル代入プロセスは、イントラ予測参照ラインインデックスrefIdx、参照サンプル幅refW、参照サンプル高さrefH、x=-1-refIdx,y=-1-refIdx..refH-1、およびx=-refIdx..refW-1,y=-1-refIdxである参照サンプルrefUnfilt[x][y]、ならびに色コンポーネントインデックスcIdxを入力として呼び出され、x=-1-refIdx,y=-1-refIdx..refH-1、およびx=-refIdx..refW-1,y=-1-refIdxである修正された参照サンプルrefUnfilt[x][y]を出力とする。
3. 8.4.5.2.9項において指定されている参照サンプルフィルタリング処理は、イントラ予測参照ラインインデックスrefIdx、トランスフォームブロック幅nTbWおよび高さnTbH、参照サンプル幅refW、参照サンプル高さrefH、参照フィルタフラグrefFilterFlag、x=-1-refIdx,y=-1-refIdx..refH-1、およびx=-refIdx..refW-1,y=-1-refIdxである非フィルタリングサンプルrefUnfilt[x][y]、ならびに色コンポーネントインデックスcIdxを入力として呼び出され、参照サンプルx=-1-refIdx,y=-1-refIdx..refH-1、およびx=-refIdx..refW-1,y=-1-refIdxである参照サンプルp[x][y]を出力とする。
predModeIntraによるイントラサンプル予測プロセスは、以下のように適用される。
- predModeIntraがINTRA_PLANARに等しい場合、8.4.5.2.10項において指定されている対応するイントラ予測モードプロセスが、トランスフォームブロック幅nTbW、トランスフォームブロック高さnTbH、および参照サンプルアレイpを入力として呼び出され、出力は、予測されたサンプルアレイpredSamplesである。
- それ以外の場合、predModeIntraがINTRA_DCに等しい場合、8.4.5.2.11項において指定されている対応するイントラ予測モードプロセスが、トランスフォームブロック幅nTbW、トランスフォームブロック高さnTbH、イントラ予測参照ラインインデックスrefIdx、および参照サンプルアレイpを入力として呼び出され、出力は、予測サンプルアレイpredSamplesである。
- それ以外の場合、predModeIntraがINTRA_LT_CCLM、INTRA_L_CCLM、またはINTRA_T_CCLMに等しい場合、8.4.5.2.13項において指定されている対応するイントラ予測モードプロセスが、イントラ予測モードpredModeIntra、(xTbCmp,yTbCmp)に等しくセットされたサンプル位置(xTbC,yTbC)、トランスフォームブロック幅nTbWおよび高さnTbH、色コンポーネントインデックスcIdx、および参照サンプルアレイpを入力として呼び出され、出力は、予測されたサンプルアレイpredSamplesである。
- それ以外の場合、8.4.5.2.12項において指定されている対応するイントラ予測モードプロセスは、イントラ予測モードpredModeIntra、イントラ予測参照ラインインデックスrefIdx、トランスフォームブロック幅nTbW、トランスフォームブロック高さnTbH、参照サンプル幅refW、参照サンプル高さrefH、コーディングブロック幅nCbWおよび高さnCbH、参照フィルタフラグrefFilterFlag、色コンポーネントインデックスcIdx、および参照サンプルアレイpを入力して呼び出され、予測されたサンプルアレイpredSamplesを出力とする。
以下の条件がすべて満たされるときに、8.4.5.2.14項において指定される位置依存予測サンプルフィルタリングプロセスが、イントラ予測モードpredModeIntra、トランスフォームブロック幅nTbW、トランスフォームブロック高さnTbH、x=0..nTbW-1,y=0..nTbH-1である予測されたサンプルpredSamples[x][y]、参照サンプル幅refW、参照サンプル高さrefH、x=-1,y=-1..refH-1、およびx=0..refW-1,y=-1である参照サンプルp[x][y]、色コンポーネントインデックスcIdxを入力として呼び出され、出力は、修正され、予測されたサンプル配列predSamplesである。
- nTbWが4以上であり、かつnTbHが4以上であり、またはcIdxが0以下である。
- refIdxが0に等しいか、またはcIdxが0に等しくない。
- BdpcmFlag[xTbCmp][xTbCmp]が0に等しい。
- 以下の条件のうちの1つが真である。
- preModeIntraがINTRA_PLANARに等しい。
- preModeIntraがINTRA_DCに等しい。
- preModeIntraがINTRA_ANGULAR18以下である。
- preModeIntraがINTRA_ANGULAR50以下である。
8.4.5.2.6 広角イントラ予測モードマッピング処理
このプロセスへの入力は、以下のようである。
- イントラ予測モードを指定する変数predModeIntra
- トランスフォームブロックの幅を指定する変数nTbW
- トランスフォームブロックの高さを指定する変数nTbH
- 現在のブロックの色コンポーネントを指定する変数cIdx
この処理の出力は、修正されたイントラ予測モードpredModeIntraである。
この処理の出力は、修正されたイントラ予測モードpredModeIntraである。
変数nWとnHは、以下のように導出される。
[外4]
Figure 2024010156000022
変数whRatioはAbs(Log2(nW/nH))に等しくセットされる。
非正方形ブロック(nWがnHに等しくない)の場合、イントラ予測モードpredModeIntraは、以下のように修正される。
- 次の条件のすべてが満たされる場合、predModeIntraは(predModeIntra+65)に等しくセットされる。
- nWがnHよりも大きい。
- preModeIntraが2以上である。
- predModeIntraが(whRatio>1)?(8+2*whRatio):8である。
- それ以外の場合、次の条件のすべてが真である場合、predModeIntraは、(predModeIntra-67)に等しくセットされる。
- nHがnWよりも大きい。
- predModeIntraが66以下である。
- predModeIntraが(whRatio>1)?(60-2*whRatio):60よりも大きい。
8.7.4 スケーリングされたトランスフォーム係数に対するトランスフォーム処理
8.7.4.1 一般
このプロセスへの入力は、以下のようである。
- 現在のピクチャの左上のルマサンプルに対する現在のトランスフォームブロックの左上のサンプルを指定するルマ位置(xTbY,yTbY)
- 現在のトランスフォームブロックの幅を指定する変数nTbW
- 現在のトランスフォームブロックの高さを指定する変数nTbH
- 現在のブロックの色コンポーネントを指定する変数cIdx
- x=0..nTbW-1,y=0..nTbH-1であるスケーリングされたトランスフォーム係数の(nTbW)x(nTbH)配列[x][y]
このプロセスの出力は、x=0..nTbW-1,y=0..nTbH-1である残差サンプルの(nTbW)x(nTbH)配列r[x][y]である。
lfnst_idx[xTbY][yTbY]が0に等しくなく、nTbWとnTbHの両方とも4以上の場合、以下が適用される。
- 変数predModeIntra、nLfnstOutSize、log2LfnstSize、nLfnstSize、およびnonZeroSizeは、以下のように導出される。
Figure 2024010156000023
- intra_mip_flag[xTbComp][yTbComp]が1に等しく、cIdxが0に等しいときに、predModeIntraは、INTRA_PLANARに等しくセットされる。
- predModeIntraがINTRA_LT_CCLM、INTRA_L_CCLM、またはINTRA_T_CCLMのいずれかに等しいときに、predModeIntraは、IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]に等しくセットされる。
- 8.4.5.2.6項において指定されている広角イントラ予測モードマッピング処理は、preModeIntra、nTbW、nTbH、およびcIdxを入力として呼び出され、修正されたpredModeIntraを出力とする。
- x=0..nonZeroSize-1であるリストu[x]の値は、以下のように導出される。
Figure 2024010156000024
- 8.7.4.2項において指定されている1次元低周波分離不可能トランスフォーム処理は、スケーリングされたトランスフォーム係数の入力長さnZeroSize、nLfnstOutSizeに等しくセットされたトランスフォーム出力長さnTrS、x=0..nonZeroSize-1であるスケーリングされた非ゼロトランスフォーム係数のリストu[x]、LFNSTセット選択に対するイントラ予測モードpredModeIntra、おより選択されたLFNSTセットにおけるトランスフォーム選択に対するLFNSTインデックスlfnst_idx[xTbY][yTbY]を入力として呼び出され、x=0..nLfnstOutSize-1であるリストv[x]を出力とする。
- x=0..nLfnstSize-1,y=0..nLfnstSize-1である配列d[x][y]は、以下のように導出される。
- predModeIntraが34以下である場合、以下が適用される。
Figure 2024010156000025
- それ以外の場合、以下が適用される。
Figure 2024010156000026
変数implicitMtsEnabledは、以下のように導出される。
- sps_mts_enabled_flagが1に等しく、次の条件のうちの1つがが真である場合、implicitMtsEnabledが1にセットされる。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITに等しくない。
- cu_sbt_flagが1に等しく、Max(nTbW,nTbH)が32以下である。
- sps_explicit_mts_intra_enabled_flagが0に等しく、CuPredMode[0][xTbY][yTbY]がMODE_INTRAに等しく、lfnst_idx[x0][y0]が0に等しく、intra_mip_flag[x0][y0]が0に等しい。
- それ以外の場合、implicitMtsEnabledが0に等しくセットされる。
水平トランスフォームカーネルを指定する変数trTypeHorと垂直トランスフォームカーネルを指定する変数trTypeVerは、以下のように導出される。
- cIdxが0よりも大きい場合、trTypeHorとtrTypeVerは0に等しくセットされる。
- それ以外の場合、implicitMtsEnabledが1に等しい場合、以下が適用される。
[外5]
Figure 2024010156000027
- それ以外の場合(cu_sbt_flagが1に等しい)、trTypeHorとtrTypeVerは、cu_sbt_horizontal_flagとcu_sbt_pos_flagに依存して表8-15において指定される。
- それ以外の場合、trTypeHorとtrTypeVerは、tu_mts_idx[xTbY][yTbY]に依存して表8-14において指定される。変数nonZeroWとnonZeroHは、以下のように導出される。
- lfnst_idx[xTbY][yTbY]が0に等しくなく、nTbWが4以上であり、nTbHが4以上である場合、以下が適用される。
Figure 2024010156000028
- それ以外の場合、以下が適用される。
Figure 2024010156000029
残差サンプルの(nTbW)x(nTbH)配列rは、以下のように導出される。
1. nTbHが1よりも大きいときに、x=0..nonZeroW-1,y=0..nonZeroH-1であるスケーリングされたトランスフォーム係数d[x][y]の各(垂直)列は、x=0..nonZeroW-1,y=0..nTbH-1であるe[x][y]にトランスフォームされるが、これは、各列x=0..nonZeroW-1に対して、8.7.4.4項において指定されている1次元トランスフォーム処理を呼び出すことによって行われ、この処理は、トランスフォームブロックの高さnTbH、スケーリングされたトランスフォーム係数の非ゼロ高さnonZeroH、y=0..nonZeroH-1であるリストd[x][y]、およびtrTypeVerに等しくセットされたトランスフォームタイプ変数trTypeを入力とし、出力は、y=0..nTbH-1であるリストe[x][y]である。
2. nTbHとnTbWが両方とも1よりも大きいときに、x=0..nonZeroW-1,y=0..nTbH-1である中間サンプル値g[x][y]は、以下のように導出される
Figure 2024010156000030
3. nTbWが1よりも大きいときに、x=0..nonZeroW-1,y=0..nTbH-1である、結果の配列g[x][y]の各(水平)行は、x=0..nTbW-1,y=0..nTbH-1であるr[x][y]にトランスフォームされ、これは、各行y=0..nTbH-1に対して、8.7.4.4項において指定されている1次元トランスフォーム処理を呼び出すことによって行われ、この処理は、トランスフォームブロックの幅nTbW、結果の配列g[x][y]の非ゼロ幅nonZeroW、x=0..nonZeroW-1であるリストg[x][y]、およびtrTypeHorに等しくセットランスフォームタイプ変数trTypeを入力とし、出力は、x=0..nTbW-1であるリストr[x][y]である。
4. nTbWが1に等しいときに、x=0..nTbW-1,y=0..nTbH-1に対してr[x][y]は、e[x][y]に等しくセットされる。
Figure 2024010156000031
Figure 2024010156000032
2. 本文書において提供されている技術的解決策によって解決される技術的問題の例
いくつかの例示的な問題は、以下のようにリストされる。
(1) いくつかのシナリオにおいて、xPartIdxとyPartIdxは、最初のTUに対するイントラサンプル予測プロセスを呼び出す前に、xPardIncとyPartIncによって増加される。
したがって、ISPが適用される、例えばxPartIncまたはyPartIncがゼロに等しくないときに、CUの最初の部分は適切に予測することができない。
(2) 広角イントラ予測モードマッピングは、ISPが適用されるときに、TU寸法の代わりにCU寸法に従って実行される。
(3) デルタQPは、ISPでコーディングされるCUに対してシグナリングされる。
しかし、デルタQPがISPの最初のTUにおいてシグナリングされない遅延があり得る。
(4) トランスフォームスキップはISPコーディングされるブロックに対しては許可されない。
(5) 現在のブロックがISPコーディングされるかどうかに依存して、イントラ予測参照サンプルがフェッチされる。
(6) 暗黙のトランスフォーム選択アプローチは、ISPが適用されるときに、TUが予測ユニットではない場合を考慮しない。
(7) ブロック解除フィルタは、エッジでサンプルをカバーするコーディングブロックを符号化/復号するのに使用されるQPにアクセスする必要がある。
しかし、1つのCUが複数のTUを含むとき(例えば、ISPが有効であるとき)に、コーディングブロック(例えば、CU)のQPは未定義である。
3. 例示的な実施形態および技法のリスト
以下のリストは、一般的な概念を説明するための例として考慮されるべきである。
これらの項目は、狭義に解釈されるべきではない。
さらに、これらの項目は、任意の方式で組み合わせることができる。
以下の記載において、「ISP」という用語は狭義に解釈されないことがある。1つのCUを複数のTU/PUにスプリットし得る任意の種類のツールも、ISPとして扱われてもよい。
1. ISPが使用されるときに、現在のCUと同じ左上の位置を有する最初のサブパーティションを含む各サブパーティションに対して、イントラ予測プロセスを適用すべきである。
a. 一例では、(VVC規格の)8.4.5.1項で定義されている変数xPartIdx、yPartIdxおよびxPartPbIdxは、イントラ予測処理および/またはスケーリング/トランスフォーム処理および/または再構成プロセスの後に更新されてもよい。
2. 特定のコーディングツールが適用されるときに、広角イントラ予測モードマッピングは、CU寸法の代わりに、予測ユニット寸法に依存して実行される。
a. 代替的には、特定のコーディングツールが適用されるときに、広角イントラ予測が適用されない。
i. 一例において、特定のコーディングツールが適用されるときに、広角イントラ予測マッピングは、呼び出されない。
ii. 一例において、特定のコーディングツールが適用されるときに、広角イントラ予測マッピングは、同一のマッピングであり、例えば、任意のモードMは、マッピング後もMで保持される。
b. 一例において、特定のコーディングツールはISPであってもよい。
3. ISPが適用されるときに、デルタQPは、CU全体に対して1回だけシグナリングされてもよい。
a. 一例において、それは、最初のTUにおいてシグナリングされてもよい。
b. 代替的には、ISPが適用されるときに、デルタQPは、常に最後のTUにおいてシグナリングされる。
c. 代替的には、ISPが適用されるときに、デルタQPは、シグナリングされない。
d. 一例において、デルタQPは、それが非ゼロ係数(ルマブロックまたは複数のルマおよびクロマブロック)を含むどうかにかかわらず、特定のTU(最初/最後)と共にシグナリングされる。
i.代替的には、デルタQPは、それが非ゼロ係数(ルマブロックまたは複数のルマおよびクロマブロック)を含むときにのみ、特定のTU(最初/最後)と共にシグナリングされる。
1)代替的には、さらに、非ゼロ係数が存在しない場合、デルタQPは0と推論される。
4. CUのQPを、CU内のTUに関連するQPとして定義することが提案される。
a. 一例において、CUのQPは、CUにおける最初/最後のTUに関連するQPとして定義されてもよい。
b. 代替的には、CUのQPは、現在のCUにおける異なるTUに対してデルタQPを追加する前のQPとして定義されてもよい。
c. 代替的には、CUのQPは、デルタQPを適用した複数のTUのQPの関数(例えば、平均)から導出されるQPとして定義されてもよい。
d. 一例において、ブロック解除フィルタをどのように適用するかは、上記の定義されたCUのQPを使用してもよい。
5. ブロック解除フィルタを適用するかどうか/どのように適用するか(例えばルマ/クロマブロックエッジの決定)は、コーディングユニットの代わりに、対応するサンプルをカバーするトランスフォームブロック/トランスフォームユニットに使用されるQPに依存してもよい。
a. 代替的には、1つのブロックがISPモードでコーディングされるときに、CUのQPのチェックは、TUのQPをチェックするために修正されてもよい。
b. 代替的には、1つのブロックがVPDU/最大トランスフォームブロックサイズよりも大きいときに、CUのQPのチェックは、TUのQPをチェックするために修正されてもよい。
6. ISPガ適用されるときに、トランスフォームスキップが使用されてもよい。
a. 一例において、ISPが適用されるときにトランスフォームスキップが使用されるかどうかは、コーディングブロック/予測ブロック/トランスフォームブロックの寸法に依存してもよい。
b. 一例において、ISPが適用されるときにトランスフォームスキップが使用されるかどうかは、垂直ISPが適用されるか水平ISPが適用されるかに依存してもよい。
7. 現在のブロックがISPコーディングされるかどうかに関わらず、同じイントラ予測参照サンプルがフェッチされる。
a. 一例において、現在のトランスフォームブロックの幅と高さがそれぞれWとHであり、次いで、現在のブロックがISPコーディングされるときに、2×Wの上方の近隣サンプルと2×Hの左方の近隣サンプルがフェッチされると仮定する。
8. 暗黙のトランスフォーム選択は、ISPが使用されるか、使用されないかに依存して異なる方法で実行される。
a. 一例において、水平トランスフォームおよび/または垂直トランスフォームは、トランスフォームブロック幅がKよりも大きいかどうかに依存して選択されてもよく、Kは、1または2などの整数である。
9. 水平トランスフォームおよび/または垂直トランスフォームは、トランスフォームブロック高さがKよりも大きいかどうかに依存して選択されてもよく、Kは、1または2などの整数である。可逆コーディングが適用されるときに、特定のトランスフォームはISPコーディングされるブロックについて制限されてもよい。
a. 可逆コーディングが適用されるときに、4×4トランスフォームはISPコーディングされるブロックについて制限されてもよい。
b. 一例において、可逆コーディングが適用されるときに、トランスフォームサイズ制限が、4×4のようなP×Qにトランスフォームサイズに強制的にされるISPコーディングされるブロックに適用されてもよい。
i. 一例において、M×NブロックがISPモードによって4つのM/4×Nサブパーティションに垂直にスプリットされる場合、各サブパーティションに対して、M/4×Nブロックは、4×4トランスフォームブロックにされ、トランスフォームおよび量子化を実行してもよい。
c. 一例において、可逆コーディングが適用されるときに、コーディングブロックサイズ限定がISPブロックに適用されてもよい。
i. 一例において、各ISPサブパーティションの幅は4より小さくなくてもよい。
ii. 一例において、各ISPサブパーティションの高さは4より小さくなくてもよい。
d. 一例において、可逆コーディングが適用されるときに、(intra_subpartitions_split_flagなどの)ISPスプリットフラグは、コーディングブロック寸法に依存してもよい。
i. 一例において、ISPサブパーティションの幅または高さを4よりも小さくするスプリット方向(水平または垂直)は許容されない。
ii. 一例において、8×16のISPコーディングされるブロックに対して、スプリットフラグが水平にスプリットされると推論されてもよく、したがって、(intra_subpartitions_split_flagなどの)ISPスプリットフラグはシグナリングされず、推論される。
10. 可逆コーディングが適用されるときに、ISPは、無効であってもよい。
a. 代替的には、ISPコーディングされるブロックにおいて、可逆コーディングは無効であってもよい。
b. 一例において、CU/CTU/VPDU/スライス/ピクチャ/シーケンスレベルトランスクオントバイパス(trans-quant bypass)有効フラグが真であるときに、ISPは、現在のビデオユニット(現在のCU/CTU/VPDU/スライス/ピクチャ/シーケンスなど)に対して許可されなくてもよい。
11. ISPによってスプリットされるTUのいずれも、非ゼロ係数を有さないことが許容される。
a. ISPによってスプリットされるTUのいずれも、ゼロ係数のみを有することが許容される。
b. Cbfフラグは、ISPによってスプリットされるすべてのTUに対してシグナリングされてもよい。
4. 追加の例示的な実施形態
次の例では、新たに追加された部分は太字のイタリック体のフォントで示されており、削除された部分は[[]]の間に示される。
4.1 イントラブロックに対する一般的な復号プロセスの例示的な修正
8.4.5.1 イントラブロックに対する一般的な復号処理
このプロセスへの入力は、以下のようである。
- 現在のピクチャの左上のサンプルに対する現在のトランスフォームブロックの左上のサンプルを指定するサンプル位置(xTb0,yTb0)
- 現在のトランスフォームブロックの幅を指定する変数nTbW
- 現在のトランスフォームブロックの高さを指定する変数nTbH
- イントラ予測モードを指定する変数predModeIntra
- 現在のブロックの色コンポーネントを指定する変数cIdx
このプロセスの出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
最大トランスフォームブロック幅maxTbWidthと高さmaxTbHeightは、以下のように導出される。
Figure 2024010156000033
ルマサンプルの位置は、以下のように導出される。
Figure 2024010156000034
maxTbSizeに依存して、以下が適用される。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITに等しく、nTbWがmaxTbWidthよりも大きいか、またはnTbHがmaxTbHeightよりも大きい場合、以下の順序付されたステップが適用される。
1. 変数newTbWとnewTbHは、以下のように導出される。
Figure 2024010156000035
2. この項において指定されているイントラブロックに対する一般的な復号処理は、位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
3. nTbWがmaxTbWidthよりも大きい場合、この項において指定されているイントラブロックに対する一般的な復号処理は、(xTb0+newTbW,yTb0)に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
4. nTbHがmaxTbHeightより大きい場合、この項において指定されたイントラブロックに対する一般的な復号処理は、(xTb0,yTb0+newTbH )に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
5. nTbWがmaxTbWidthよりも大きく、nTbHがmaxTbHeightよりも大きい場合、この項において指定されているイントラブロックに対する一般的な復号処理は、(xTb0+newTbW,yTb0+newTbH)に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
- それ以外の場合、以下の順序付されたステップが適用される。
- 変数nW、nH、nPbW、pbFactor、xPartInc、およびyPartIncは、以下のように導出される。
Figure 2024010156000036
- 変数xPartPbIdx、xPartIdxおよびyPartIdxは、0に等しくセットされる。
- i=0..NumIntraSubPartitions-1に対して、以下が適用される。
[[1. 変数xPartIdxとyPartIdxは、以下のように更新される。
Figure 2024010156000037
1. xPartPbIdxが0に等しい場合、8.4.5.2項において指定されているイントラサンプル予測処理は、(xTb0+nW*xPartIdx,yTb0+nH*yPartIdx)に等しくセットされた位置(xTbCmp,yTbCmp)、イントラ予測モードpredModeIntra、nPbWおよびnHに等しく設定されたトランスフォームブロック幅nTbWおよび高さnTbH、nTbWおよびnTbHに等しくセットされたコーディングブロック幅nCbWおよび高さnCbH、ならびに変数cIdxを入力として呼び出され、出力は、(nPbW)x(nH)配列predSamplesである。
2. 8.7.2項において指定されているスケーリングおよびトランスフォーム処理は、(xTbY+nW*xPartIdx,yTbY+nH*yPartIdx)に等しくセットされたルマ位置(xTbY,yTbY)、変数cIdx、nWおよびnHに等しくセットされたトランスフォーム幅nTbWおよびトランスフォーム高さnTbHを入力として呼び出され、出力は、(nW)x(nH)配列resSamplesである。
3. 8.7.5項において指定されている色コンポーネントのピクチャ再構成処理は、(xTb0+nW*xPartIdx,yTb0+nH*yPartIdx)に等しくセットされたトランスフォームブロック位置(xTbComp,yTbComp)、nWおよびnHに等しくセットされたトランスフォームブロック幅nTbWおよびトランスフォームブロック高さnTbH、x=xPartPbIdx*nW..(xPartPbIdx+1)*nW-1,y=0..nH-1である(nW)x(nH)配列predSamples[x][y]、ならびに(nW)x(nH)配列resSamplesを入力して呼びサンプルを入力として再構成し、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
[外6]
Figure 2024010156000038
4.2 イントラブロックに対する広角イントラ予測マッピングでの例示的な修正
広角イントラ予測モードマッピング処理
このプロセスへの入力は、以下のようである。
- イントラ予測モードを指定する変数predModeIntra
- トランスフォームブロック幅を指定する変数nTbW
- トランスフォームブロック高さを指定する変数nTbH
- 現在のブロックの色コンポーネントを指定する変数cIdx
この処理の出力は、修正されたイントラ予測モードpredModeIntraである。
この処理の出力は、修正されたイントラ予測モードpredModeIntraである。
変数nWとnHは、以下のように導出される。
- [[IntraSubPartitionsSplitTypeがISP_NO_SPLITに等しい場合、またはcIdxが0に等しくない場合、以下が適用される。]]
Figure 2024010156000039
- [[それ以外の場合(IntraSubPartitionsSplitTypeがISP_NO_SPLITに等しくなく、cIdxが0に等しい)、以下が適用される。
Figure 2024010156000040
変数whRatioはAbs(Log2(nW/nH))に等しくセットされる。
非正方形ブロック(nWがnHに等しくない)の場合、イントラ予測モードpredModeIntraは、以下のように修正される。
- 次の条件のすべてが満たされる場合、predModeIntraは(predModeIntra+65)に等しくセットされる。
- nWがnHよりも大きい。
- preModeIntraが2以上である。
- predModeIntraが(whRatio>1)?(8+2*whRatio):8である。
- それ以外の場合、次の条件のすべてが真である場合、predModeIntraは、(predModeIntra-67)に等しくセットされる。
- nHがnWよりも大きい。
- predModeIntraが66以下である。
predModeIntraが(whRatio>1)?(60-2*whRatio):60よりも大きい。
8.7.4 スケーリングされたトランスフォーム係数に対するトランスフォーム処理
8.7.4.1 一般
このプロセスへの入力は、以下のようである。
- 現在のピクチャの左上のルマサンプルに対する現在のトランスフォームブロックの左上のサンプルを指定するルマ位置(xTbY,yTbY)
- 現在のトランスフォームブロックの幅を指定する変数nTbW
- 現在のトランスフォームブロックの高さを指定する変数nTbH
- 現在のブロックの色コンポーネントを指定する変数cIdx
- x=0..nTbW-1,y=0..nTbH-1であるスケーリングされたトランスフォーム係数の(nTbW)x(nTbH)配列[x][y]
[外7]
Figure 2024010156000041
このプロセスの出力は、x=0..nTbW-1,y=0..nTbH-1である残差サンプルの(nTbW)x(nTbH)配列r[x][y]である。
lfnst_idx[xTbY][yTbY]が0に等しくなく、nTbWとnTbHの両方とも4以上の場合、以下が適用される。
- 変数predModeIntra、nLfnstOutSize、log2LfnstSize、nLfnstSize、およびnonZeroSizeは、以下のように導出される。
Figure 2024010156000042
- intra_mip_flag[xTbComp][yTbComp]が1に等しく、cIdxが0に等しいときに、predModeIntraは、INTRA_PLANARに等しくセットされる。
- predModeIntraがINTRA_LT_CCLM、INTRA_L_CCLM、またはINTRA_T_CCLMのいずれかに等しいときに、predModeIntraは、IntraPredModeY[xTbY+nTbW/2][yTbY+nTbH/2]に等しくセットされる。
- 8.4.5.2.6項において指定されている広角イントラ予測モードマッピングプロセスは、predModeIntra、
[外8]
Figure 2024010156000043
およびcIdxを入力として呼び出され、修正されたpredModeIntraを出力とする。
- ...
8.4.5.1 イントラブロックに対する一般的な復号処理
このプロセスへの入力は、以下のようである。
- 現在のピクチャの左上のサンプルに対する現在のトランスフォームブロックの左上のサンプルを指定するサンプル位置(xTb0,yTb0)
- 現在のトランスフォームブロックの幅を指定する変数nTbW
- 現在のトランスフォームブロックの高さを指定する変数nTbH
- イントラ予測モードを指定する変数predModeIntra
- 現在のブロックの色コンポーネントを指定する変数cIdx
このプロセスの出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
最大トランスフォームブロック幅maxTbWidthと高さmaxTbHeightは、以下のように導出される。
Figure 2024010156000044
ルマサンプルの位置は、以下のように導出される。
Figure 2024010156000045
maxTbSizeに依存して、以下が適用される。
- IntraSubPartitionsSplitTypeがISP_NO_SPLITに等しく、nTbWがmaxTbWidthよりも大きいか、またはnTbHがmaxTbHeightよりも大きい場合、以下の順序付されたステップが適用される。
1. 変数newTbWとnewTbHは、以下のように導出される。
Figure 2024010156000046
2. この項において指定されているイントラブロックに対する一般的な復号処理は、位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
3. nTbWがmaxTbWidthよりも大きい場合、この項において指定されているイントラブロックに対する一般的な復号処理は、(xTb0+newTbW,yTb0)に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
4. nTbHがmaxTbHeightより大きい場合、この項において指定されているイントラブロックに対する一般的な復号処理は、(xTb0,yTb0+newTbH)に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
5. nTbWがmaxTbWidthよりも大きく、nTbHがmaxTbHeightよりも大きい場合、この項において指定されているイントラブロックに対する一般的な復号処理は、(xTb0+newTbW,yTb0+newTbH)に等しくセットされた位置(xTb0,yTb0)、newTbWに等しくセットされたトランスフォームブロック幅nTbW、およびnewTbHに等しくセットされた高さnTbH、イントラ予測モードpredModeIntra、ならびに変数cIdxを入力として呼び出され、出力は、ループ内フィルタリング前の修正され、再構成されたピクチャである。
- それ以外の場合、以下の順序付されたステップが適用される。
- 変数nW、nH、nPbW、pbFactor、xPartInc、およびyPartIncは、以下のように導出される。
Figure 2024010156000047
- 変数xPartIdxおよびyPartIdxは、0に等しくセットされる。
- i=0..NumIntraSubPartitions-1に対して、以下が適用される。
[[1.変数xPartIdxとyPartIdxは、以下のように更新される。
Figure 2024010156000048
1. xPartPbIdxが0に等しい場合、8.4.5.2項において指定されているイントラサンプル予測処理は、(xTb0+nW*xPartIdx,yTb0+nH*yPartIdx)に等しくセットされた位置(xTbCmp,yTbCmp)、イントラ予測モードpredModeIntra、nPbWおよびnHに等しく設定されたトランスフォームブロック幅nTbWおよび高さnTbH、nTbWおよびnTbHに等しくセットされたコーディングブロック幅nCbWおよび高さnCbH、ならびに変数cIdxを入力として呼び出され、出力は、(nPbW)x(nH)配列predSamplesである。
2. 8.7.2項において指定されているスケーリングおよびトランスフォーム処理は、(xTbY+nW*xPartIdx,yTbY+nH*yPartIdx)に等しくセットされたルマ位置(xTbY,yTbY)、変数cIdx、nWおよびnHに等しくセットされたトランスフォーム幅nTbWおよびトランスフォーム高さnTbHを入力として呼び出され、出力は、(nW)x(nH)配列resSamplesである。
3. 8.7.5項において指定されている色コンポーネントに対するピクチャ再構成処理は、(xTb0+nW*xPartIdx,yTb0+nH*yPartIdx)に等しいとセットされたトランスフォームブロック位置(xTbComp,yTbComp)、nWおよびnHに等しくセットされたトランスフォームブロック幅nTbWおよびトランスフォームブロック高さnTbH、
[外9]
Figure 2024010156000049
変数cIdx、x=xPartPbIdx*nW..(xPartPbIdx+1)*nW-1,y=0..nH-1である(nW)x(nH)配列predSamples[x][y]、ならびに(nW)x(nH)配列resSamplesを入力として呼び出され、出力は、ループ内フィルタリングにおける修正され、再構成されたピクチャである。
[外10]
Figure 2024010156000050
4.3 デルタQPについての例示的な修正
Figure 2024010156000051
Figure 2024010156000052
Figure 2024010156000053
Figure 2024010156000054
4.4 例示的な修正されたブロック解除フィルタ
ルマブロックエッジに対する決定処理
この処理への入力は、以下のようである。
- ピクチャサンプル配列recPicture
- 現在のピクチャの左上のルマサンプルに対する現在のコーディングブロックの左上のサンプルを指定する位置(xCb,yCb)
- 現在のコーディングの左上のルマサンプルに対する現在のブロックの左上のサンプルを指定する位置(xBl,yBl)
- 垂直(EDGE_VER)をフィルタリングするか、または水平(EDGE_HOR)をフィルタリングするかを指定する変数edgeType
- 境界フィルタリング強度を指定する変数bS
- 最大フィルタ長さを指定する変数maxFilterLengthP
- 最大フィルタ長さを指定する変数maxFilterLengthQ
この処理の出力は、以下のようである。
- 決定を含む変数dE、dEpおよびdEq
- 修正されたフィルタ長さ変数maxFilterLengthPおよびmaxFilterLengthQ
- 変数t
i=0..maxFilterLengthP,j=0..maxFilterLengthQおよびk=0,3であるサンプル値pi,k、qj,kは、以下のように導出される。
- edgeTypeがEDGE_VERに等しい場合、以下が適用される。
Figure 2024010156000055
- それ以外の場合(edgeTypeがEDGE_HORに等しい)、以下が適用される。
Figure 2024010156000056
変数qpOffsetは、以下のように導出される。
- sps_ladf_enabled_flagが1に等しい場合、以下が適用される。
- 再構成されたルマレベルの変数lumaLevelは、以下のように導出される。
Figure 2024010156000057
- 変数qpOffsetがsps_ladf_lowest_interval_qp_offsetに等しくセットされ、以下のように修正される。
Figure 2024010156000058
- それ以外の場合、0に等しくセットされる。
変数QpおよびQpは、それぞれq0,0およびp0,0を含むコーディングブロックを含む
[外11]
Figure 2024010156000059
[[コーディング]]ユニットのQpに等しくセットされる。
変数qPは、以下のように導出される。
Figure 2024010156000060
変数β′の値は、以下のように導出される量子化パラメータQに基づいて表8-18において指定されるように判定される。
Figure 2024010156000061
ここで、slice_beta_offset_div2は、サンプルq0,0を含むスライスに対する構文要素slice_beta_offset_div2の値である。
...
クロマブロックエッジに対する決定処理
この処理は、ChromaArrayTypeが0に等しくないときにのみ呼び出される。
この処理への入力は、以下のようである。
- クロマピクチャサンプル配列recPicture
- 現在のピクチャの左上のクロマサンプルに対する現在のクロマコーディングブロックの左上のサンプルを指定するクロマ位置(xCb,yCb)
- 現在のクロマコーディングの左上のサンプルに対する現在のクロマブロックの左上のサンプルを指定するクロマ位置(xBl,yBl)
- 垂直(EDGE_VER)をフィルタリングするか、または水平(EDGE_HOR)をフィルタリングするかを指定する変数edgeType
- 色コンポーネントインデックスを指定する変数cIdx
- ピクチャレベルのクロマ量子化パラメータオフセットを指定する変数cQpPicOffset
- 境界フィルタリング強度を指定する変数bS
- 変数maxFilterLengthCbCr
この処理の出力は、以下のようである。
- 修正された変数maxFilterLengthCbCr
- 変数t
変数maxKは、以下のように導出される。
- edgeTypeがEDGE_VERに等しい場合、以下が適用される。
Figure 2024010156000062
- それ以外の場合(edgeTypeがEDGE_HORに等しい)、以下が適用される。
Figure 2024010156000063
i=0..maxFilterLengthCbCrおよびk=0..maxKである値pおよびqは、以下のように導出される。
- edgeTypeがEDGE_VERに等しい場合、以下が適用される。
Figure 2024010156000064
- それ以外の場合(edgeTypeがEDGE_HORに等しい)、以下が適用される。
Figure 2024010156000065
変数QpおよびQpは、それぞれq0,0およびp0,0を含むコーディングブロックを含む
[外12]
Figure 2024010156000066
[[コーディング]]ユニットのQpに等しくセットされる。
変数Qpは、以下のように導出される。
Figure 2024010156000067
注-変数cQpPicOffsetは、フィルタリングされたクロマコンポーネントがCbか、Crコンポーネントかに従って、pps_cb_qp_offsetまたはpps_cr_qp_offsetの値に対する調整を提供する。しかし、ピクチャ内の調整量を変更する必要を避けるために、フィルタリング処理は、slice_cb_qp_offsetまたはslice_cr_qp_offsetの値に対する調整を含まず、(cu_croma_qp_offset_enabled_flagが1に等しいときに)CuQpOffsetCb、CuQpOffsetCr、またはCuQpOffsetCbCrの値に対する調整を含まない。
変数β′の値は、以下のように導出される量子化パラメータQに基づいて表8-18において指定されるように判定される。
Figure 2024010156000068
ここで、slice_beta_offset_div2は、サンプルq0,0を含むスライスに対する構文要素slice_beta_offset_div2の値である。
図3は、ビデオ処理装置300のブロック図である。装置300は、本明細書に記載される方法のうちの1つ以上を実装するために使用されてもよい。装置300は、スマートフォン、タブレット、コンピュータ、モノのインターネット(IoT)受信機などで具体化されてもよい。装置300は、1つ以上のプロセッサ302、1つ以上のメモリ304、およびビデオ処理ハードウェア306を含んでもよい。プロセッサ302は、本文書に記載される1つ以上の方法を実装するように構成されてもよい。メモリ(複数のメモリ)304は、本明細書に記載される方法および技法を実装するために使用されるデータおよびコードを記憶するために使用されてもよい。ビデオ処理ハードウェア306は、ハードウェア回路において、本文書に記載されるいくつかの技法を実装するために使用されてもよい。いくつかの実施形態において、ハードウェア306は、少なくとも部分的にプロセッサ302内、例えばグラフィックコプロセッサ内にあってもよい。
以下の解決策は、いくつかの実施形態において好ましい解決策として実装されてもよい。
以下の解決策は、前のセクション(例えば、項目1)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策1. ビデオ処理の方法(例えば、図4に示す方法400)であって、1つ以上のサブパーティションを含むビデオユニットとビデオユニットのコーディングされた表現との間の変換に対して、変換がイントラサブブロックパーティショニングモードを使用することを判定すること(402)と、判定に基づいて、変換を実行して、1つ以上のサブパーティションの各々の変換にイントラ予測プロセスが使用されるようにすること(404)と、を含む、方法。
解決策2. イントラ予測プロセスは、イントラ予測プロセスの終了時に、xパーティションインデックス変数およびyパーティションインデックス変数を更新することを含む、解決策1に記載の方法。
以下の解決策は、前のセクション(例えば、項目2)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策3.ビデオ処理の方法であって、ビデオブロックのコーディングユニットサイズを使用することなく、コーディングツールおよび/またはビデオブロックの予測ユニットのサイズの適用可能性に基づいて、ビデオブロックとビデオブロックのコーディングされた表現との間の変換中に広角イントラ予測マッピングが使用されるかどうかを判定することと、判定の結果に基づいて変換を実行することと、を含む、方法。
解決策4.判定は、コーディングツールが特定のコーディングツールであることにより、広角イントラ予測マッピングが無効であるように実行される、解決策3に記載の方法。
解決策5.判定は、コーディングツールが特定のコーディングツールであることにより、広角イントラ予測マッピングが同一マッピングであるように実行される、解決策3に記載の方法。
解決策6.特定のコーディングツールが、イントラサブパーティショニングツールである、解決策4~5に記載の方法。
以下の解決策は、前のセクション(例えば、項目3)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策7.ビデオ処理の方法であって、コーディングユニットを含むビデオ領域であって、コーディングユニットがイントラサブブロックパーティションを含むビデオ領域と、ビデオ領域のコーディングされた表現との間の変換に対して、コーディングユニットのすべてのイントラサブブロックパーティションの変換に適用可能なデルタ量子化パラメータ(デルタQP)を判定することと、デルタQPを使用して変換を実行することと、を含み、デルタQPは、コーディングされた表現においてコーディングユニットに対してシグナリングされる、方法。
解決策8.デルタQPが、ビデオ領域の最初のトランスフォームユニットと共にシグナリングされる、解決策7に記載の方法。
解決策9.デルタQPが、ビデオ領域の最後のトランスフォームユニットと共にシグナリングされる、解決策7に記載の方法。
解決策10.デルタQPは、ビデオ領域内の予め定義された位置を有するトランスフォームユニットと共にシグナリングされる、解決策7に記載の方法。
以下の解決策は、前のセクション(例えば、項目4)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策11.ビデオ処理の方法であって、ビデオ領域とビデオ領域のコーディングされた表現との間の変換に対して、ビデオ領域においてトランスフォームユニット(TU)のQPに基づいたビデオ領域におけるコーディングユニット(CU)の変換に使用される量子化パラメータ(QP)を判定することと、TUのQPおよび/またはCUのQPを使用して変換を実行することと、を含む。
解決策12.CUに対するQPは、ビデオ領域の最後または最初のTUであるTUのQPに等しいと判定される、解決策11に記載の方法。
解決策13.TUのQPにデルタQPを追加する前に、CUのQPがTUのQPと判定される、解決策11~12のいずれかに記載の方法。
解決策14.変換を実行することは、CUのQPに基づいて、変換中にビデオ領域にブロック解除フィルタを選択的に適用することをさらに含む、解決策11~13のいずれかに記載の方法。
以下の解決策は、前のセクション(例えば、項目5)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策15.ビデオ処理の方法であって、1つ以上のコーディングユニットを含むビデオ領域と1つ以上のトランスフォームユニットとの間の変換に対して、エッジが属するトランスフォームユニットに基づいた適用に対してビデオブロックのエッジに保護解除フィルタを適用するかどうかについて判定することと、判定に基づいて変換を実行することと、を含む方法。
解決策16.さらに、ビデオブロックの変換に対するイントラサブパーティションモードを使用することを含み、トランスフォームユニットに基づく判定は、トランスフォームユニットの量子化パラメータをチェックすることによって実行される、解決策15に記載の方法。
解決策17.ビデオブロックが仮想パイプラインデータユニットまたは最大トランスフォームブロックサイズおよびベースよりも大きいサイズであることにより、判定することは、エッジが属するコーディングユニットの量子化パラメータに基づいてさらに判定することを含む、解決策15に記載の方法。
以下の解決策は、前のセクション(例えば、項目6)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策18.ビデオ処理の方法であって、イントラサブパーティショニングモードを使用する、ビデオブロックとビデオブロックのコーディングされた表現との間の変換に対して、トランスフォーム動作が、コーディングブロック、予測ブロック、またはトランスフォームの寸法に基づいてスキップされるかどうかを判定することと、判定に基づいて変換を実行することと、を含む方法。
解決策19.イントラサブパーティショニングモードが、垂直イントラサブパーティショニングモードである、解決策18に記載の方法。
解決策20.イントラサブパーティショニングモードが、水平イントラサブパーティショニングモードである、解決策18に記載の方法。
以下の解決策は、前のセクション(例えば、項目7)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策21.イントラサブパーティショニングモードを使用する変換が、WxHトランスフォームブロックサイズに対する変換のために、2*Wの上方の近隣サンプルおよび2*Hの左方の近隣サンプルを使用することを含む、解決策1~20のいずれかに記載の方法。
以下の解決策は、前のセクション(例えば、項目8および9)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策22.ビデオ処理の方法であって、ビデオブロックとビデオブロックのコーディングされた表現との間の変換に対して、イントラサブパーティショニングモードまたは可逆コーディングモードが使用されるのかどうかに基づいて適用されるトランスフォームのタイプを判定することと、判定に基づいて変換を実行することと、を含む方法。
解決策23.判定することが、トランスフォームのタイプを判定する際にトランスフォームブロック幅をさらに使用する、解決策22に記載の方法。
解決策24.トランスフォームのタイプが水平トランスフォームまたは垂直トランスフォームである、解決策22~23のいずれかに記載の方法。
解決策25.可逆コーディングモードが使用される場合に、トランスフォームのタイプを判定することは、4×4トランスフォームを使用することを判定することを含む、解決策22~24のいずれかに記載の方法。
解決策26.サブパーティション内モードおよび可逆コーディングモードが使用される場合、判定することは、トランスフォームのタイプをPxQトランスフォームであると判定することを含み、Pおよび/またはQは、ビデオブロックのサイズに依存する整数である、解決策22~24のいずれかに記載の方法。
以下の解決策は、前のセクション(例えば、項目10)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策27.ビデオ処理方法であって、変換のために可逆コーディングモードが使用されるか、変換のためにイントラサブパーティショニングモードが使用されるかのいずれかによる排他性の規則で、ビデオブロックとビデオブロックのコーディングされた表現との間の変換を実行することを含み、コーディングされた表現は、可逆コーディングモードが使用されるか、イントラサブパーティショニングモードが使用されるかの表示を含む方法。
解決策28.排他性の規則は、ビデオブロックがコーディングユニット、コーディングツリーユニット、仮想パイプラインデータユニット、スライス、ピクチャまたはシーケンスレベルバイパス有効フラグモードに属することにより、可逆コーディングモードが無効化されることをさらに定義する、解決策27に記載の方法。
以下の解決策は、前のセクション(例えば、項目11)に列挙されている項目に記載された追加の技法と共に実装されてもよい。
解決策29.イントラサブパーティショニングツールにおけるパーティショニングによりスプリットされる所与のトランスフォームユニットは、すべてゼロ係数を有することが許容されない、解決策1~28のいずれかに記載の方法。
解決策30.変換することが、ビデオをコーディングされた表現に符号化することを含む、解決策1~29のいずれかに記載の方法。
解決策31.変換することが、ビデオの画素値を生成するために、コーディングされた表現を復号することを含む、解決策1~29のいずれかに記載の方法。
解決策32.解決策1~31のうちの1つ以上に規定された方法を実装するように構成されているプロセッサを含む、ビデオ復号装置。
解決策33.解決策1~31のうちの1つ以上に規定された方法を実装するように構成されているプロセッサを含む、ビデオ符号化装置。
解決策34.コンピュータコードを記憶したコンピュータプログラム製品であって、コードは、プロセッサによって実行されるときに、プロセッサに、解決策1~31のいずれか一項に記載の方法を実装させる、コンピュータプログラム製品。
解決策35.本文書に記載された方法、装置またはシステム。
上記の解決策において、変換を実行することは、変換結果に到達するために、符号化または復号動作中の以前の決定ステップの結果を使用することを含む。
図5は、本明細書に開示される様々な技法を実装することができる例示的なビデオ処理システム500を示すブロック図である。様々な実装は、システム500のコンポーネントの一部または全部を含んでもよい。システム500は、ビデオコンテンツを受信するための入力502を含んでもよい。ビデオコンテンツは、生または圧縮されていないフォーマット、例えば、8または10ビットのマルチコンポーネント画素値で受信されてもよいし、圧縮されたか、または符号化されたフォーマットであってもよい。入力502は、ネットワークインターフェース、周辺バスインターフェース、または記憶インターフェースを表してもよい。ネットワークインターフェースの例は、Ethernet(登録商標)、PON(passiveopticalnetwork)などの有線インターフェース、およびWi-Fi(登録商標)またはセルラーインターフェースなどの無線インターフェースを含む。
システム500は、本文書に記載されている様々なコーディングまたは符号化方法を実装し得るコーディングコンポーネント504を含んでもよい。コーディングコンポーネント504は、ビデオのコーディングされた表現を生成するために、入力502からコーディングコンポーネント504の出力へのビデオの平均ビットレートを低減してもよい。従って、コーディング技法は、ビデオ圧縮またはビデオトランスコーディング技法と呼ばれることがある。コーディングコンポーネント504の出力は、コンポーネント506によって表されるように、記憶されるか、または接続された通信を介して送信されてもよい。入力502で受信されたビデオの記憶されたか、または通信されたビットストリーム(またはコーディングされた)表現は、ディスプレイインターフェース510に送信される画素値または表示可能なビデオを生成するために、コンポーネント508によって使用されてもよい。ビットストリーム表現からユーザが見ることができるビデオを生成するプロセスは、ビデオ解凍と呼ばれることがある。さらに、特定のビデオ処理動作は、「コーディング」動作またはツールと称されるが、コーディングツールもしくは動作は、符号化器で使用されるか、またはコーディングの結果を反転する、対応する復号ツールもしくは動作は、復号器によって実行されることが理解されるであろう。
周辺バスインターフェースまたはディスプレイインターフェースの例としては、USB(universal serial bus)、HDMI(登録商標)(high definition multimedia interface)またはディスプレイポートなどを含む。記憶インターフェースの例としては、SATA(serial advanced technology attachment)、PCI、IDEインターフェースなどを含む。本明細書に記載されている技法は、携帯電話、ラップトップ、スマートフォン、またはデジタルデータ処理および/またはビデオディスプレイを実行することが可能な他のデバイスなどの様々な電子デバイスに具体化されてもよい。
図6は、本技術によるビデオ処理のための方法600のフローチャート表現である。方法600は、動作610で、イントラサブブロックパーティショニング(ISP)モードを使用して、ビデオの現在のピクチャのブロックとビデオのコーディングされた表現との間の変換を実行することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。ブロックは、ブロックの左上コーナー位置と同じ左上コーナー位置を有する最初のサブパーティションを含む複数のサブパーティションにパーティショニングされる。いくつかの実施形態において、再構成プロセスが1つのサブパーティションに対して呼び出された後に、xパーティションインデックス変数およびyパーティションインデックス変数が更新される。
図7は、本技術によるビデオ処理のための方法700のフローチャート表現である。方法700は、動作710で、ビデオのブロックとビデオのコーディングされた表現との間のトランスフォームに対して、広角イントラ予測モードマッピングが規則に基づいて有効であるかどうかを判定することを含む。広角イントラ予測モードは、参照サンプルおよび予測されるサンプルが左上方向に関して鈍角を形成するモードである。規則は、コーディングツールがブロックの変換に対して有効である場合に、判定のために予測ユニットの寸法を使用することを指定する。方法700はまた、動作720で、判定に基づいて変換を実行することを含む。
いくつかの実施形態において、広角イントラ予測モードマッピングは、コーディングツールがブロックの変換に対して有効である場合に、使用されない。いくつかの実施形態において、広角イントラ予測マッピングは、コーディングツールがブロックの変換に対して有効である場合に、同一マッピングである。いくつかの実施形態において、コーディングツールは、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定されるイントラサブブロックパーティショニング(ISP)モードを含む。
図8は、本技術によるビデオ処理のための方法800のフローチャート表現である。方法800は、動作810で、ビデオのビデオ領域のコーディングユニットとビデオのコーディングされた表現との間の変換を実行することを含む。コーディングユニットは、1つ以上のパーティションにパーティショニングされ、コーディングユニットは、1つ以上のパーティションの各々のイントラ予測プロセスによって取得された量子化残差信号を使用して、コーディングされた表現にコーディングされる。コーディングされた表現は、量子化に使用される量子化パラメータを示す構文要素を含む。構文要素は、コーディングされた表現に、コーディングユニットに対して多くても一度だけ含まれ、構文要素は、量子化パラメータの値とビデオの以前に処理されたコーディングユニットに基づく別の量子化値の差異を示す。
いくつかの実施形態において、量子化パラメータの値の差異は、1つ以上のパーティションに基づくイントラサブブロックパーティショニングプロセスが使用される場合に、コーディングされた表現において省略される。いくつかの実施形態において、量子化パラメータの値の差異は、ビデオ領域の最初のトランスフォームユニットと共にシグナリングされる。いくつかの実施形態において、量子化パラメータの値の差異は、ビデオ領域の最後のトランスフォームユニットと共にシグナリングされる。
いくつかの実施形態において、量子化パラメータの値の差異は、特定のトランスフォームユニットが非ゼロ係数を含むかどうかにかかわらず、特定のトランスフォームユニットと共にシグナリングされる。いくつかの実施形態において、量子化パラメータの値の差異は、特定のトランスフォームユニットが非ゼロ係数を含む場合に、特定のトランスフォームユニットと共にシグナリングされる。いくつかの実施形態において、量子化パラメータの値の差異は、特定のトランスフォームユニットがゼロ係数のみを含む場合に、デフォルトで0にされる。いくつかの実施形態において、特定のトランスフォームユニットは、ビデオ領域の最初または最後のトランスフォームユニットを含む。
図9は、本技術によるビデオ処理のための方法900のフローチャート表現である。方法900は、動作910で、イントラサブブロックパーティショニング(ISP)モードを使用する、1つ以上のパーティションを含むビデオのブロックとビデオのコーディングされた表現との間の変換に対して、ブロックまたはISPモードの特性に基づいて、符号化中にトランスフォーム動作がスキップされるか、復号中に逆トランスフォーム動作がスキップされるかを判定することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。方法900はまた、動作920で、判定に基づいて変換を実行することを含む。
いくつかの実施形態において、ブロックの特性は、ブロックの寸法を含む。いくつかの実施形態において、ブロックが、コーディングブロック、予測ブロック、またはトランスフォームブロックを含む。いくつかの実施形態において、ISPモードの特性は、ISPが適用される方向を含み、方向は、垂直方向または水平方向を含む。いくつかの実施形態において、ISPモードが使用されるかどうかかかわらず、変換に同じ参照サンプルが使用される。いくつかの実施形態において、ブロックは、幅Wおよび高さHを有するトランスフォームブロックを含み、ブロックの変換に、ブロックの上方の2×Wの近隣サンプルおよびブロックの左方の2×Hの近隣サンプルが使用される。
図10は、本技術によるビデオ処理のための方法1000のフローチャート表現である。方法1000は、動作1010で、1つ以上のパーティションを含むビデオのブロックとビデオのコーディングされた表現との間の変換に対して、変換にイントラサブブロックパーティショニング(ISP)モードが使用されるかどうかに基づいて、変換中に使用されるトランスフォームのタイプを判定することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。変換は、符号化中にコーディングされた表現に符号化する前にトランスフォームを適用することか、またはブロックのサンプル値を再構成する前に、コーディングされた表現から解析された係数値にトランスフォームの逆トランスフォームを適用することを含む。方法1000はまた、動作1020で、判定に基づいて変換を実行することを含む。
いくつかの実施形態において、トランスフォームのタイプは、水平トランスフォームまたは垂直トランスフォームを含む。いくつかの実施形態において、判定することは、トランスフォームブロックの幅が閾値Kよりも大きいかどうかにさらに基づき、Kは、1または2の整数である。いくつかの実施形態において、判定することは、トランスフォームブロックの高さが閾値Kよりも大きいかどうかにさらに基づき、Kは、1または2の整数である。
図11は、本技術によるビデオ処理のための方法1100のフローチャート表現である。方法1100は、動作1110で、1つ以上のパーティションを含むビデオのブロックとビデオのコーディングされた表現との間の変換に対して、ブロックに可逆コーディングプロセスが適用されるかどうかに基づいて、イントラサブブロックパーティショニング(ISP)モードに対する制限を判定することを含む。ISPモードを使用して、予測が、現在のピクチャにおけるサンプルに基づいたイントラ予測プロセスを使用して、各サブパーティションに対して判定される。方法1100はまた、動作1120で、判定に基づいて変換を実行することを含む。
いくつかの実施形態において、可逆コーディングモードがブロックに適用される場合に、制限は、ISPモードを使用してコーディングされるブロックに対するトランスフォームサイズ限定を強制することを含む。いくつかの実施形態において、トランスフォームサイズ限定は、4×4トランスフォームサイズを含む。いくつかの実施形態において、ブロックは、M×Nの寸法を有し、各々が(M/4)×Nの寸法を有する4つのパーティションを含み、各パーティションは、トランスフォーム動作および/または量子化動作を実行するために4×4トランスフォームブロックにスプリットされる。いくつかの実施形態において、可逆コーディングモードがブロックに適用される場合に、制限は、ISPモードを使用してコーディングされるブロックに対するコーディングブロックサイズ限定を強制することを含む。いくつかの実施形態において、ブロックは、1つ以上のパーティションを含み、1つ以上のパーティションの各々の幅は、4以上である。ブロックは、1つ以上のパーティションを含み、1つ以上のパーティションの各々の高さは、4以上である。
いくつかの実施形態において、可逆コーディングモードがブロックに適用される場合に、制限は、コーディングされた表現における構文要素のシグナリングが、個々のパーティションの寸法に依存することを指定する。構文要素は、ブロックが1つ以上のパーティションにスプリットされる方向を指定する。いくつかの実施形態において、構文要素によって指定される方向は、個々のパーティションの幅または高さが4よりも小さい場合に、許可されない。いくつかの実施形態において、構文要素のシグナリングは、コーディングされた表現において省略され、構文要素の値は、ブロックの形状に基づいて導出される。
いくつかの実施形態において、制限は、可逆コーディングプロセスがブロックに適用される場合に、ISPモードが無効であることを指定する。いくつかの実施形態において、制限は、可逆コーディングプロセスがブロックに適用されない場合に、ISPモードが有効であることを指定する。いくつかの実施形態において、コーディングされた表現におけるトランスクオントバイパス有効の構文フラグが、可逆コーディングプロセスがビデオユニットレベルで有効であることを示す場合に、ISPモードは、ビデオユニットに対して無効である。ビデオユニットは、コーディングユニット、コーディングツリーユニット、仮想パイプラインデータユニット、スライス、ピクチャ、またはシーケンスを含む。いくつかの実施形態において、ISPモードを使用して判定されたトランスフォームユニットのいずれも非ゼロ係数を含まない。いくつかの実施形態において、ISPモードを使用して判定されたすべてのトランスフォームユニットはゼロ係数のみを含む。いくつかの実施形態において、非ゼロトランスフォーム係数を示すすべてのトランスフォームユニットに対する構文フラグは、コーディングされた表現においてシグナリングされる。
図12は、本技術によるビデオ処理のための方法1200のフローチャート表現である。方法1200は、動作1210で、規則に従って、ビデオのビデオ領域のコーディングユニットとビデオのコーディングされた表現との間の変換を実行することを含む。コーディングユニットは、複数のトランスフォームユニットに分割される。規則は、コーディングユニットに対する量子化パラメータ(QP)と、複数のトランスフォームユニットのうちの1つ以上の量子化パラメータとの間の関係を指定する。
いくつかの実施形態において、コーディングユニットのQPは、コーディングユニットの最初のトランスフォームユニットまたは最後のトランスフォームユニットのQPに等しい。いくつかの実施形態において、コーディングユニットのQPは、量子化パラメータの値とビデオの以前に処理されたコーディングユニットに基づく別の量子化値の差異が加算される前に、コーディングユニット内の少なくとも1つのトランスフォームユニットのQPであると判定される。いくつかの実施形態において、コーディングユニットのQPは、少なくとも1つのデルタQPが適用された1つ以上のトランスフォームユニットのQPの関数を使用して導出され、デルタQPは、量子化パラメータの値とビデオの以前に処理されたコーディングユニットに基づく別の量子化値の差異である。いくつかの実施形態において、変換を実行することは、コーディングユニットのQPに基づく変換中、コーディングユニットにブロック解除フィルタを選択的に適用することをさらに含む。
図13は、本技術によるビデオ処理のための方法1300のフローチャート表現である。方法1300は、動作1310で、1つ以上のコーディングユニットおよび1つ以上のトランスフォームユニットを含むビデオ領域とビデオ領域のコーディングされた表現との間の変換に対して、エッジに関係するトランスフォームユニットの量子化パラメータ(QP)に基づいて、エッジにブロック解除フィルタを適用するかどうか、および/またはどのように適用するかを判定することを含む。方法1300はまた、動作1320で、判定に基づいて変換を実行することを含む。
いくつかの実施態様において、ビデオ領域の変換にイントラサブブロックパーティショニングプロセスが使用される場合に、トランスフォームユニットに対するQPが使用される。いくつかの実施態様において、ビデオ領域のサイズが仮想パイプラインデータユニットまたは最大トランスフォームブロックサイズよりも大きい場合に、トランスフォームユニットに対するQPが、コーディングユニットのQPの代わりに使用される。
いくつかの実施形態において、変換は、ビデオをコーディングされた表現に符号化することを含む。いくつかの実施態様において、変換は、ビデオの画素値を生成するためにコーディングされた表現を復号することを含む。
開示された技術のいくつかの実施形態は、ビデオ処理ツールまたはモードを有効にする決定または判定を行うことを含む。一例では、ビデオ処理ツールまたはモードが有効にされるときに、符号化器は、ビデオのブロックの処理においてツールまたはモードを使用または実装するが、必ずしもツールまたはモードの使用に基づいて結果として生じるビットストリームを修正しないことがある。すなわち、ビデオのブロックからビデオのビットストリーム表現への変換は、決定または判定に基づいて有効にされるときに、ビデオ処理ツールまたはモードを使用する。別の例では、ビデオ処理ツールまたはモードが有効にされるときに、復号器は、ビットストリームがビデオ処理ツールまたはモードに基づいて修正されたことを知って、ビットストリームを処理する。すなわち、ビデオのビットストリーム表現からビデオのブロックへの変換は、決定または判定に基づいて有効にされたビデオ処理ツールまたはモードを使用して実行される。
開示された技術のいくつかの実施形態は、ビデオ処理ツールまたはモードを無効にする決定または判定を行うことを含む。一例では、ビデオ処理ツールまたはモードが無効にされるときに、符号化器は、ビデオのブロックをビデオのビットストリーム表現に変換する際に、ツールまたはモードを使用しない。別の例では、ビデオ処理ツールまたはモードが無効にされるときに、復号器は、ビットストリームが、決定または判定に基づいて有効にされたビデオ処理ツールまたはモードを使用して修正されていないことを知って、ビットストリームを処理する。
開示された、および他の解決策、例、実施形態、モジュールならびにこの文書に記載された機能動作は、この文書に開示される構造およびそれらの構造的等価物を含む、デジタル電子回路、もしくはコンピュータソフトウェア、ファームウェア、もしくはハードウェアにおいて、またはそれらのうちの1つ以上の組み合わせにおいて実装することができる。開示された、および他の実施形態は、1つ以上のコンピュータプログラム製品、例えば、データ処理装置による、またはデータ処理装置の動作を制御するための、コンピュータ可読媒体に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実装することができる。コンピュータ可読媒体は、機械可読記憶デバイス、機械可読記憶基板、メモリデバイス、機械可読伝搬信号に影響を与える組成物、またはそれらのうちの1つ以上の組み合わせとすることができる。用語「データ処理装置」は、例として、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサもしくはコンピュータを含む、データを処理するためのすべての装置、デバイス、および機械を包含する。装置は、ハードウェアに加えて、問題のコンピュータプログラムの実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはそれらのうちの1つ以上の組み合わせを構成するコードを含むことができる。伝搬信号は、人工的に生成された信号、例えば、好適な受信機装置に送信するための情報を符号化するために生成される機械生成電気信号、光信号、または電磁信号である。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとしても知られる)は、コンパイル型またはインタープリタ型言語を含む、任意の形式のプログラミング言語で書くことができ、それは、スタンドアロン・プログラムとして、またはコンピューティング環境における使用に好適なモジュール、コンポーネント、サブルーチン、または他のユニットとしてのものを含む、任意の形式で展開することができる。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応しない。プログラムは、他のプログラムまたはデータを保持するファイルの一部分(例えば、マークアップ言語文書に記憶される1つ以上のスクリプト)、問題のプログラム専用の単一ファイル、または複数の調整されたファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部分を記憶するファイル)に記憶することができる。コンピュータプログラムは、1つのコンピュータまたは1つのサイトに配置されるか、または複数のサイトに分散され、通信ネットワークによって相互接続される複数のコンピュータで実行されるように展開することができる。
本文書に記載されるプロセスおよび論理フローは、入力データ上で動作し、出力を生成することによって機能を実行するために、1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサによって実行することができる。プロセスおよび論理フローはまた、特別目的論理回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって実行することができ、装置は、これらとして実装することができる。
コンピュータプログラムの実行に好適なプロセッサは、例として、汎用および専用マイクロプロセッサの両方、および任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサを含む。一般的に、プロセッサは、読み出し専用メモリまたはランダムアクセスメモリまたはその両方から命令およびデータを受信するだろう。コンピュータの必須要素は、命令を実行するためのプロセッサと、命令およびデータを記憶するための1つ以上のメモリデバイスである。一般的に、コンピュータはまた、データを記憶するための1つ以上の大容量記憶デバイス、例えば、磁気ディスク、光磁気ディスク、または光ディスクからデータを受信したり、これらにデータを転送したり、またはその両方を行うことを含むか、それらを行うように動作可能に結合されるだろう。しかし、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するのに好適なコンピュータ可読媒体は、例として、EPROM、EEPROM、およびフラッシュメモリデバイスである半導体メモリデバイス、例えば、内部ハードディスクまたはリムーバブルディスクである磁気ディスク、光磁気ディスク、ならびにCD ROMディスクおよびDVD-ROMディスクを含む、すべての形態の不揮発性メモリ、媒体およびメモリデバイスを含む。プロセッサおよびメモリは、特別目的論理回路によって補足されるか、またはこれに組み込むことができる。
この特許文書は多くの詳細が含むが、これらは、いずれかの主題の範囲または請求項に記載され得るものに対する限定ではなく、特定の技法の特定の実施形態に固有であり得る特徴の記載として解釈されるべきである。別々の実施形態のコンテキストでこの特許文書に記載されている特定の特徴はまた、単一の実施形態で組み合わせて実装することができる。逆に、単一の実施形態のコンテキストで記載される様々な特徴はまた、複数の実施形態において別々に、または任意の好適なサブコンビネーションで実装することができる。さらに、特徴は、特定の組み合わせにおいて作用するものとして上述され、最初にそれ自体請求項に記載されてもよいが、請求項に記載された組み合わせからの1つ以上の特徴は、場合によっては、組み合わせから削除することができ、請求項に記載された組み合わせは、サブコンビネーションまたはサブコンビネーションの変形を対象としてもよい。
同様に、図面には特定の順序で動作が示されているが、これは、所望の結果を達成するために、このような動作を特定の順序でまたは順次に実行すること、または、示されたすべての動作を実行することを要求するものとして理解されるべきではない。さらに、この特許文書に記載されている実施形態における様々なシステムコンポーネントの分離は、すべての実施形態においてこのような分離を必要とするものとして理解されるべきではない。
少数の実装および例が記載されているに過ぎず、この特許文書に記載され、示されているものに基づいて、他の実装、拡張および変形を行うことができる。

Claims (12)

  1. ビデオデータを処理するための方法であって、
    ビデオの現在のビデオブロックと前記ビデオのビットストリームとの間の変換のために、前記現在のビデオブロックに対してパーティショニングモードが使用されているかどうかを判定することと、
    前記現在のビデオブロックに対して前記パーティショニングモードが使用されている場合、前記現在のビデオブロックを複数のサブ領域にパーティショニングすることと、
    前記複数のサブ領域に基づいて前記変換を実行することと、
    前記複数のサブ領域は、同じイントラ予測モードを共有し、前記複数のサブ領域は、前記現在のビデオブロックと同じ左上コーナー位置を有する最初のサブ領域を含む、方法。
  2. 前記現在のビデオブロックに対して前記パーティショニングモードが使用されており、前記現在のビデオブロックがルマ変換ブロックである場合、前記現在のビデオブロックの幅及び前記現在のビデオブロックの高さに基づいて、幅と高さの比を示す変数が導出され、
    前記変数は、前記複数のサブ領域の各々に対して広角イントラ予測モードマッピング処理におけるイントラ予測モードを導出するために使用され、
    前記広角イントラ予測モードは、参照サンプルと予測されるサンプルが左上方向に対して鈍角を形成するモードである、請求項1に記載の方法。
  3. 前記現在のビデオブロックに対して前記パーティショニングモードが使用されていない場合、前記変数は、前記現在のビデオブロックの前記幅および前記現在のビデオブロックの前記高さに基づいて導出される、請求項1に記載の方法。
  4. 前記現在のビデオブロックに対して前記パーティショニングモードが使用される場合、非ゼロ係数を含むサブ領域のための構文要素が前記ビットストリームに含まれ、
    前記構文要素は、前記サブ領域の量子化パラメータとその予測との差異の絶対値を示す、請求項1に記載の方法。
  5. 前記現在のビデオブロックに対して前記パーティショニングモードが使用される場合、前記パーティショニングすることは、前記現在のビデオブロックの次元に依存する、請求項1に記載の方法。
  6. 前記サブ領域の幅または高さを予め定義された値よりも小さくするパーティショニングが、許可されない、請求項1に記載の方法。
  7. 前記現在のビデオブロックがM×2Mのサイズを有する場合、前記現在のビデオブロックのパーティションは、M×2Mとは異なるサイズを有するビデオブロックのパーティションとは異なると推論され
    Mは、予め定義された整数である、請求項1に記載の方法。
  8. 前記変換は、前記現在のビデオブロックを前記ビットストリームに符号化することを含む、請求項1~7のいずれか一項に記載の方法。
  9. 前記変換は、前記ビットストリームから前記現在のビデオブロックを復号することを含む、請求項1~7のいずれか一項に記載の方法。
  10. ビデオデータを処理するための装置であって、前記装置は、プロセッサと、命令を有する非一時的メモリと、を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、
    ビデオの現在のビデオブロックと前記ビデオのビットストリームとの間の変換のために、前記現在のビデオブロックに対してパーティショニングモードが使用されているかどうかを判定することと、
    前記現在のビデオブロックに対して前記パーティショニングモードが使用されている場合、前記現在のビデオブロックを複数のサブ領域にパーティショニングすることと、
    前記複数のサブ領域に基づいて前記変換を実行することと、を行わせ、
    前記複数のサブ領域は、同じイントラ予測モードを共有し、前記複数のサブ領域は、前記現在のビデオブロックと同じ左上コーナー位置を有する最初のサブ領域を含む、装置。
  11. 命令を記憶する非一時的なコンピュータ可読記憶媒体であって、プロセッサに、
    ビデオの現在のビデオブロックと前記ビデオのビットストリームとの間の変換のために、前記現在のビデオブロックに対してパーティショニングモードが使用されているかどうかを判定することと、
    前記現在のビデオブロックに対して前記パーティショニングモードが使用されている場合、前記現在のビデオブロックを複数のサブ領域にパーティショニングすることと、
    前記複数のサブ領域に基づいて前記変換を実行することと、を行わせ、
    前記複数のサブ領域は、同じイントラ予測モードを共有し、前記複数のサブ領域は、前記現在のビデオブロックと同じ左上コーナー位置を有する最初のサブ領域を含む、非一時的なコンピュータ可読記憶媒体。
  12. ビデオのビットストリームを記憶するための方法であって、
    ビデオの現在のビデオブロックに対してパーティショニングモードが使用されているかどうかを判定することと、
    前記現在のビデオブロックに対して前記パーティショニングモードが使用されている場合、前記現在のビデオブロックを複数のサブ領域にパーティショニングすることと、
    前記複数のサブ領域に基づいて前記ビットストリームを生成することと、
    前記ビットストリームを非一時的なコンピュータ可読記録媒体に記憶することと、を含み、
    前記複数のサブ領域は、同じイントラ予測モードを共有し、前記複数のサブ領域は、前記現在のビデオブロックと同じ左上コーナー位置を有する最初のサブ領域を含む、方法。
JP2023188074A 2019-08-30 2023-11-02 イントラコーディングにおけるサブパーティショニング Pending JP2024010156A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/103762 2019-08-30
CN2019103762 2019-08-30
JP2022513061A JP7381720B2 (ja) 2019-08-30 2020-08-31 イントラコーディングにおけるサブパーティショニング
PCT/CN2020/112425 WO2021037258A1 (en) 2019-08-30 2020-08-31 Sub-partitioning in intra coding

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2022513061A Division JP7381720B2 (ja) 2019-08-30 2020-08-31 イントラコーディングにおけるサブパーティショニング

Publications (1)

Publication Number Publication Date
JP2024010156A true JP2024010156A (ja) 2024-01-23

Family

ID=74684261

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022513061A Active JP7381720B2 (ja) 2019-08-30 2020-08-31 イントラコーディングにおけるサブパーティショニング
JP2023188074A Pending JP2024010156A (ja) 2019-08-30 2023-11-02 イントラコーディングにおけるサブパーティショニング

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2022513061A Active JP7381720B2 (ja) 2019-08-30 2020-08-31 イントラコーディングにおけるサブパーティショニング

Country Status (5)

Country Link
US (2) US11924422B2 (ja)
JP (2) JP7381720B2 (ja)
KR (1) KR20220051340A (ja)
CN (2) CN114303383A (ja)
WO (1) WO2021037258A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024005547A1 (ko) * 2022-06-29 2024-01-04 엘지전자 주식회사 Isp 모드에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2147558A2 (en) 2007-04-17 2010-01-27 Nokia Corporation Feedback based scalable video coding
US20120189052A1 (en) * 2011-01-24 2012-07-26 Qualcomm Incorporated Signaling quantization parameter changes for coded units in high efficiency video coding (hevc)
US9525861B2 (en) 2012-03-14 2016-12-20 Qualcomm Incorporated Disparity vector prediction in video coding
JP6215344B2 (ja) 2012-12-14 2017-10-18 クゥアルコム・インコーポレイテッドQualcomm Incorporated 非対称空間解像度を有するテクスチャビューコンポーネントおよび深度ビューコンポーネントの中での内部ビュー動き予測
US9615090B2 (en) 2012-12-28 2017-04-04 Qualcomm Incorporated Parsing syntax elements in three-dimensional video coding
US9516306B2 (en) 2013-03-27 2016-12-06 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC
US9369708B2 (en) 2013-03-27 2016-06-14 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC
WO2016123792A1 (en) 2015-02-06 2016-08-11 Microsoft Technology Licensing, Llc Skipping evaluation stages during media encoding
CN114786009A (zh) * 2016-03-16 2022-07-22 寰发股份有限公司 视频编码中限制块尺寸的视频数据处理方法与装置
WO2017192995A1 (en) 2016-05-06 2017-11-09 Vid Scale, Inc. Method and system for decoder-side intra mode derivation for block-based video coding
WO2019009590A1 (ko) * 2017-07-03 2019-01-10 김기백 추가 영역을 포함하는 분할 단위를 이용한 영상 복호화 방법 및 장치
US10666943B2 (en) * 2017-09-15 2020-05-26 Futurewei Technologies, Inc. Block partition structure in video compression
JP7187566B2 (ja) * 2018-02-09 2022-12-12 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン パーティションベースのイントラ符号化概念
CN114598875B (zh) * 2018-09-21 2023-03-24 华为技术有限公司 用于进行量化/反量化的装置和方法及编码/解码装置
CN113545088A (zh) * 2019-02-11 2021-10-22 北京达佳互联信息技术有限公司 用于帧内子分区编码模式的方法和设备
SG11202110724WA (en) * 2019-03-28 2021-10-28 Huawei Tech Co Ltd Method and apparatus for intra smoothing
EP3723368A1 (en) * 2019-04-12 2020-10-14 InterDigital VC Holdings, Inc. Wide angle intra prediction with sub-partitions

Also Published As

Publication number Publication date
CN117676167A (zh) 2024-03-08
JP2022546395A (ja) 2022-11-04
US11924422B2 (en) 2024-03-05
US20240129466A1 (en) 2024-04-18
CN114303383A (zh) 2022-04-08
JP7381720B2 (ja) 2023-11-15
WO2021037258A1 (en) 2021-03-04
KR20220051340A (ko) 2022-04-26
US20220191490A1 (en) 2022-06-16

Similar Documents

Publication Publication Date Title
CN113812154B (zh) 用于视频处理的多个二次变换矩阵
TWI818063B (zh) 雙邊濾波器的映射改進
JP2022526991A (ja) ビデオ処理方法、装置、記憶媒体、及び記録媒体
WO2020216282A1 (en) Context modeling and selection of multiple transform matrix
WO2020228663A1 (en) Interactions among multiple intra coding methods
WO2020228717A1 (en) Block dimension settings of transform skip mode
KR20220016844A (ko) 비디오 비트스트림들에서 감축된 2차 변환의 조건부 시그널링
WO2020228718A1 (en) Interaction between transform skip mode and other coding tools
JP2024010156A (ja) イントラコーディングにおけるサブパーティショニング

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231113