JP7451731B2 - クロマ成分のためのデブロッキングパラメータ - Google Patents

クロマ成分のためのデブロッキングパラメータ Download PDF

Info

Publication number
JP7451731B2
JP7451731B2 JP2022547711A JP2022547711A JP7451731B2 JP 7451731 B2 JP7451731 B2 JP 7451731B2 JP 2022547711 A JP2022547711 A JP 2022547711A JP 2022547711 A JP2022547711 A JP 2022547711A JP 7451731 B2 JP7451731 B2 JP 7451731B2
Authority
JP
Japan
Prior art keywords
video
offset
flag
value
chroma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022547711A
Other languages
English (en)
Other versions
JP2023513519A (ja
Inventor
シュイ,ジィジォン
ザン,リー
ワン,イェ-クイ
ザン,カイ
ズゥー,ウェイジア
ワン,ユエ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of JP2023513519A publication Critical patent/JP2023513519A/ja
Application granted granted Critical
Publication of JP7451731B2 publication Critical patent/JP7451731B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compounds Of Unknown Constitution (AREA)

Description

[関連出願の相互参照]
出願は、2020年2月5日に出願された国際特許出願第PCT/CN2020/074316号の優先権及び利益を主張する、2021年2月5日に出願された国際特許出願第PCT/CN2021/075443号の国内段階である。法に基づく全ての目的のために、前述の出願の開示全体が、本出願の開示の一部として参照により組み込まれる。
[技術分野]
本特許文献は、画像及びビデオのコーディング及び復号に関する。
デジタルビデオは、インターネット及び他のデジタル通信ネットワークにおける最大の帯域幅使用を占めている。ビデオを受信及び表示することができる接続ユーザデバイスの数が増加すると、デジタルビデオ使用に対する帯域幅需要は増大し続けることが予想される。
本文献は、ビデオの表現のために代表的なサンプル値のパレットが使用されるパレットモード(palette mode)を使用するビデオ処理のためのビデオエンコーダ及びデコーダにより使用可能な手法を開示する。
一例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのクロマ成分のためのデブロッキングオフセットを識別するシンタックス要素がビデオ領域レベルに含まれるかどうかが、ビデオの色フォーマットに基づいて決定されることを指定するルールに従って、ビデオのブロックとビデオのビットストリームとの間のコンバージョンを実行するステップを含む。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのクロマ成分のためのデブロッキングオフセットを識別するシンタックス要素がビデオ領域レベルに含まれるかどうかが、異なる色成分を別個に処理するコーディングツールが有効にされるかどうかを示すシンタックスフラグに基づいて決定されることを指定するルールに従って、ビデオのブロックとビデオのビットストリームとの間のコンバージョンを実行するステップを含む。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのクロマ成分のためのデブロッキングオフセットを識別するシンタックス要素がビデオ領域レベルに含まれるかどうかが、クロマ成分のためのコーディングツールのパラメータがビットストリームに存在するかどうかを指定するシンタックスフラグに基づいて決定されることを指定するルールに従って、ビデオのブロックとビデオのビットストリームとの間のコンバージョンを実行するステップを含む。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、クロマ量子化パラメータオフセットがコンバージョンのために処理されるかどうかを示すシンタックスフラグが、ビデオのクロマ成分のためのデブロッキングオフセットが存在し又はコンバージョンのために処理されるかどうかをさらに示すことを指定するルールに従って、ビデオのブロックとビデオのビットストリームとの間のコンバージョンを実行するステップを含む。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのビデオブロックとビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、ビデオブロックのコーディングされた表現にパレットモードが使用され、ビデオブロックのサンプルは代表的な色値のパレットを使用して表され、パレットの外部のサンプルは、エスケープシンボルと、ルールにより決定される最小許容値及び最大許容値の間の範囲内である量子化パラメータを使用して量子化された値とを使用してコーディングされる。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのビデオブロックとビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、ビデオブロックのコーディングされた表現にパレットモードが使用され、ビデオブロックのサンプルは代表的な色値のパレットを使用して表され、パレットのサイズは、ビデオブロックとコーディングされた表現との間のコンバージョンにローカルデュアルツリーが使用されるかどうかに関するルールに依存する。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのビデオブロックとビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、ビデオブロックのコーディングされた表現にパレットモードが使用され、ビデオブロックのサンプルは代表的な色値のパレットを使用して表され、パレット予測子のサイズは、ビデオブロックとコーディングされた表現との間のコンバージョンにローカルデュアルツリーが使用されるかどうかに関するルールに依存する。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのビデオ領域のビデオブロックとビデオのコーディングされた表現との間のコンバージョンについて、コーディング条件に基づいて、ビデオのクロマ成分のためのデブロッキングオフセットを識別するシンタックス要素がビデオ領域レベルでコーディングされた表現に含まれるかどうかを決定するステップと、決定に基づいてコンバージョンを実行するステップと、を含み、デブロッキングオフセットは、ビデオブロックに対するデブロッキング動作を選択的に有効にするために使用される。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのビデオ領域のビデオブロックとビデオのコーディングされた表現との間のコンバージョンについて、コーディング条件に基づいて、クロマコーディングツールの使用を識別するシンタックス要素がビデオ領域レベルでコーディングされた表現に含まれるかどうかを決定するステップと、決定に基づいてコンバージョンを実行するステップと、を含み、デブロッキングオフセットは、ビデオブロックに対するデブロッキング動作を選択的に有効にするために使用される。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのビデオ領域のビデオブロックとビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、コーディングされた表現はフォーマットに適合し、フォーマットは、ビデオのクロマ成分のためのデブロッキングオフセットを示す第1のフラグがコーディングされた表現に含まれるかどうかが、クロマ成分の量子化パラメータオフセットを示す第2のフラグがコーディングされた表現に含まれるかどうかに基づくことを指定する。
別の例示的な態様において、ビデオ処理方法が開示される。この方法は、ビデオのビデオ領域のビデオブロックとビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、コーディングされた表現はフォーマットルールに適合し、フォーマットルールは、コーディングされた表現におけるシンタックス要素が、1つ以上のクロマコーディングツールの適用可能性を示す1つ以上のパラメータがビデオ領域又はビデオブロックレベルでコーディングされた表現に含まれるかどうかを制御することを指定する。
さらに別の例示的な態様において、ビデオエンコーダ装置が開示される。ビデオエンコーダは、上述の方法を実施するように構成されたプロセッサを含む。
さらに別の例示的な態様において、ビデオデコーダ装置が開示される。ビデオデコーダは、上述の方法を実施するように構成されたプロセッサを含む。
さらに別の例示的な態様において、コードを記憶させたコンピュータ読取可能媒体が開示される。コードは、プロセッサ実行可能コードの形式で本明細書に記載される方法の1つを具現化する。
これら及び他の特徴が本文献を通して説明される。
パレットモードでコーディングされたブロックの一例を示す。 パレットエントリをシグナリングするためのパレット予測子の使用を示す。 水平及び垂直トラバース走査の例を示す。 パレットインデックスの一例示的なコーディングを示す。 最小クロマインター予測ユニット(SCIPU)の一例を示す。 最小クロマインター予測ユニット(SCIPU)の別の例を示す。 ACTを用いた復号プロセスの一例示である。 一例示的なビデオ処理システムのブロック図である。 ビデオ処理装置のブロック図である。 ビデオ処理の一例示的な方法のフローチャートである。 本開示のいくつかの実施形態によるビデオコーディングシステムを示すブロック図である。 本開示のいくつかの実施形態によるエンコーダを示すブロック図である。 本開示のいくつかの実施形態によるデコーダを示すブロック図である。 本技術によるビデオ処理の方法のフローチャート表現である。 本技術によるビデオ処理の別の方法のフローチャート表現である。 本技術によるビデオ処理の別の方法のフローチャート表現である。 本技術によるビデオ処理のさらに別の方法のフローチャート表現である。
セクション見出しは、本文献において理解を容易にするために用いられており、各セクションで開示される手法及び実施形態の適用可能性をそのセクションのみに限定するわけではない。さらに、H.266用語は、いくつかの説明において理解を容易にするためにのみ用いられており、開示される手法の範囲を限定するためのものではない。したがって、本明細書に記載される手法は、他のビデオコーデックプロトコル及び設計にも適用可能である。
1. 概要
本文献は、ビデオコーディング技術に関する。具体的には、本文献は、パレットコーディング及びクロマフォーマットシグナリングにおけるインデックス及びエスケープシンボルに関する。これは、HEVCなどの既存のビデオコーディング標準、又は完成される標準(汎用ビデオコーディング(Versatile Video Coding))に適用されてもよい。これは、将来のビデオコーディング標準又はビデオコーデックにも適用可能であり得る。
2. ビデオコーディング標準
ビデオコーディング標準は、主に、周知のITU-T及びISO/IEC標準の開発を通じて発展してきた。ITU-Tは、H.261とH.263を作成し、ISO/IECは、MPEG-1とMPEG-4 Visualを作成し、この2つの組織は、H.262/MPEG-2 Video及びH.264/MPEG-4 Advanced Video Coding(AVC)及びH.265/HEVC標準を合同で作成した。H.262から、ビデオコーディング標準は、時間的予測に変換コーディングを加えたものが利用されるハイブリッドビデオコーディング構造に基づいている。HEVCを越える将来のビデオコーディング技術を探求するため、2015年にVCEGとMPEGにより合同で合同ビデオ探求チーム(Joint Video Exploration Team、JVET)が設立された。それ以来、多くの新しい方法がJVETにより採用され、合同探求モデル(JEM)と命名された参照ソフトウェアに入れられている。2018年4月には、HEVCと比較して50%のビットレート低減を目指すVVC標準に取り組むために、VCEG(Q6/16)とISO/IEC JTC1 SC29/WG11(MPEG)との間の合同ビデオエキスパートチーム(Joint Video Expert Team、JVET)が作成された。
2.1 HEVCスクリーンコンテンツコーディング拡張(HEVC Screen Content Coding extensions、HEVC-SCC)におけるパレットモード
2.1.1 パレットモードの概念
パレットモードの背後にある基本的な考え方は、CU内の画素が代表的な色値の小さいセットにより表現されるということである。このセットが、パレットと呼ばれる。また、(可能性として量子化された)成分値が後に続くエスケープシンボルをシグナリングすることにより、パレットの外部であるサンプルを示すことも可能である。この種類の画素は、エスケープ画素と呼ばれる。図1に、パレットモードを示す。図1に示すように、3つのコロック(coloc)成分(ルマ、及び2つのクロマ成分)を有する各画素について、パレットに対するインデックスが作成され、パレット内の作成された値に基づいてブロックを再構成することができる。
2.1.2 パレットエントリのコーディング
パレットエントリのコーディングのために、パレット予測子(palette predictor)が維持される。パレットの最大サイズとパレット予測子は、SPSにおいてシグナリングされる。HEVC-SCCでは、palette_predictor_initializer_present_flagがPPSに導入されている。このフラグが1であるとき、パレット予測子を初期化するためのエントリがビットストリームにおいてシグナリングされる。パレット予測子は、各CTU行、各スライス、及び各タイルの始めで初期化される。palette_predictor_initializer_present_flagの値に応じて、パレット予測子は0にリセットされ、あるいはPPSにおいてシグナリングされたパレット予測子イニシャライザエントリを使用して初期化される。HEVC-SCCでは、PPSレベルにおけるパレット予測子初期化の明示的な無効化を可能にするために、サイズ0のパレット予測子イニシャライザが有効にされた。
パレット予測子内の各エントリについて、それが現在のパレットの一部であるかどうかを示すために、再使用フラグがシグナリングされる。これを、図2に示す。再使用フラグは、ゼロのランレングスコーディングを使用して送信される。この後、新しいパレットエントリの数が、次数0の指数ゴロム(Exponential Golomb、EG)符号、すなわちEG-0を用いてシグナリングされる。最後、新しいパレットエントリの成分値がシグナリングされる。
2.1.3 パレットインデックスのコーディング
パレットインデックスは、図3に示すように、水平及び垂直トラバース走査を用いてコーディングされる。走査順序は、palette_transpose_flagを使用してビットストリームにおいて明示的にシグナリングされる。サブセクションの残りについては、走査は水平であると仮定される。
パレットインデックスは、2つのパレットサンプルモード、すなわち‘COPY_LEFT’及び‘COPY_ABOVE’を使用してコーディングされる。‘COPY_LEFT’モードでは、パレットインデックスは復号されたインデックスに割り当てられる。‘COPY_ABOVE’モードでは、上の行内のサンプルのパレットインデックスがコピーされる。‘COPY_LEFT’モード及び‘COPY_ABOVE’モードの双方について、同じモードを使用してさらにコーディングされている後続サンプルの数を指定するラン値(run value)がシグナリングされる。
パレットモードにおいて、エスケープシンボルのためのインデックスの値は、パレットエントリの数である。また、エスケープシンボルが‘COPY_LEFT’又は‘COPY_ABOVE’モードにおけるランの一部であるとき、エスケープ成分値は、エスケープシンボルごとにシグナリングされる。図4に、パレットインデックスのコーディングを示す。
このシンタックス順序は、以下のように達成される。まず、CUのインデックス値の数がシグナリングされる。この後に、トランケーテッドバイナリコーディング(truncated binary coding)を使用するCU全体の実際のインデックス値のシグナリングが続く。インデックスの数とインデックス値の双方が、バイパスモードでコーディングされる。これは、インデックス関連のバイパスbinを一緒にグループ化する。次いで、パレットサンプルモード(必要な場合)及びランが、インターリーブ方式でシグナリングされる。最後、CU全体のエスケープシンボルに対応する成分エスケープ値が一緒にグループ化され、バイパスモードでコーディングされる。エスケープシンボルの2値化は、3次のEGコーディング、すなわちEG-3である。
インデックス値をシグナリングした後、さらなるシンタックス要素last_run_type_flagがシグナリングされる。このシンタックス要素は、インデックスの数と関連し、ブロック内の最後のランに対応するラン値をシグナリングする必要をなくす。
HEVC-SCCにおいて、パレットモードは、4:2:2、4:2:0、及びモノクロームクロフォーマットに対しても有効にされる。パレットエントリ及びパレットインデックスのシグナリングは、全てのクロマフォーマットに対してほぼ同一である。非モノクロームフォーマットの場合、各パレットエントリは3つの成分で構成される。モノクロームフォーマットでは、各パレットエントリは単一の成分で構成される。サブサンプリングされたクロマ方向では、クロマサンプルは、2で割り切れるルマサンプルインデックスに関連づけられる。CUのパレットインデックスを再構成した後、サンプルが、それに関連づけられた単一の成分のみを有する場合、パレットエントリの最初の成分のみが使用される。シグナリングにおける唯一の差は、エスケープ成分値に関する。各エスケープシンボルについて、シグナリングされるエスケープ成分値の数は、そのシンボルに関連づけられた成分の数に応じて異なり得る。
図4は、パレットインデックスの一例示的なコーディングを示す。
さらに、パレットインデックスコーディングにはインデックス調整プロセスがある。パレットインデックスをシグナリングするとき、左の近隣インデックス又は上の近隣インデックスは、現在のインデックスとは異なるべきである。したがって、現在のパレットインデックスの範囲は、1つの可能性を除去することにより1だけ減らすことができる。その後、インデックスは、トランケーテッドバイナリ(TB)二値化でシグナリングされる。
この部分に関連するテキストを以下に示す。ここで、CurrPaletteIndexは現在のパレットインデックスであり、adjustedRefPaletteIndexは予測インデックスである。
変数PaletteIndexMap[xC][yC]は、パレットインデックスを指定し、これは、CurrentPaletteEntriesで表される配列へのインデックスである。配列インデックスxC、yCは、ピクチャの左上ルマサンプルに対するサンプルの場所(xC,yC)を指定する。PaletteIndexMap[xC][yC]の値は、始めと終わりを含む(inclusive)0~MaxPaletteIndexの範囲内であるものとする。
変数adjustedRefPaletteIndexは以下のように導出される。
Figure 0007451731000001
CopyAboveIndicesFlag[xC][yC]が0に等しいとき、変数CurrPaletteIndexは以下のように導出される。
if( CurrPaletteIndex >= adjustedRefPaletteIndex )
CurrPaletteIndex++
さらに、パレットモードにおけるランレングス要素がコンテキストコーディングされる(context coded)。JVET-O2011-vEに記載される関連コンテキスト導出プロセスを以下に示す。
Figure 0007451731000002
2.2 VVCにおけるパレットモード
2.2.1 デュアルツリーにおけるパレット
VVCでは、デュアルツリー(dual tree)コーディング構造がイントラスライスのコーディングに使用されるため、ルマ成分と2つのクロマ成分は、異なるパレット及びパレットインデックスを有し得る。さらに、2つのクロマ成分は、同じパレット及びパレットインデックスを共有する。
2.2.2 別個のモードとしてのパレット
いくつかの実施形態において、コーディングユニットの予測モードは、MODE_INTRA、MODE_INTER、MODE_IBC、及びMODE_PLTとすることができる。このことに応じて、予測モードの二値化が変更される。
IBCがオフにされているとき、Iタイル上で、最初の1つのbinが、現在の予測モードがMODE_PLTであるか否かを示すために利用される。一方でP/Bタイル上では、最初のbinは、現在の予測モードがMODE_INTRAであるか否かを示すために利用される。そうでない場合、1つのさらなるbinが、現在の予測モードがMODE_PLT又はMODE_INTERであることを示すために利用される。
IBCがオンにされているとき、Iタイル上で、最初のbinは、現在の予測モードがMODE_IBCであるか否かを示すために利用される。そうでない場合、2番目のbinが、現在の予測モードがMODE_PLTかMODE_INTRAかを示すために利用される。一方でP/Bタイル上では、最初のbinは、現在の予測モードがMODE_INTRAであるか否かを示すために利用される。それがイントラモードである場合、2番目のbinが、現在の予測モードがMODE_PLTかMODE_INTRAかを示すために利用される。そうでない場合、2番目のbinは、現在の予測モードがMODE_IBC又はMODE_INTERであることを示すために利用される。
例示的なテキストを以下に示す。
Figure 0007451731000003
2.2.3 パレットモードシンタックス
Figure 0007451731000004
Figure 0007451731000005
Figure 0007451731000006
Figure 0007451731000007
2.2.4 パレットモードセマンティクス
以下のセマンティクスにおいて、配列インデックスx0、y0は、ピクチャの左上ルマサンプルに対する、考慮されるコーディングブロックの左上ルマサンプルの場所(x0,y0)を指定する。配列インデックスxC、yCは、ピクチャの左上ルマサンプルに対するサンプルの場所(xC,yC)を指定する。配列インデックスstartCompは、現在のパレットテーブルの最初の色成分を指定する。0に等しいstartCompはY成分を示し、1に等しいstartCompはCb成分を示し、2に等しいstartCompはCr成分を示す。numCompsは、現在のパレットテーブル内の色成分の数を指定する。
予測子パレットは、現在のパレット内のエントリを予測するために使用される、前のコーディングユニットからのパレットエントリで構成される。
変数PredictorPaletteSize[startComp]は、現在のパレットテーブルの最初の色成分startCompのための予測パレットのサイズを指定する。PredictorPaletteSizeは、節8.4.5.3に規定されるように導出される。
1に等しい変数PalettePredictorEntryReuseFlags[i]は、予測子パレット内のi番目のエントリが現在のパレットで再使用されることを指定する。0に等しいPalettePredictorEntryReuseFlags[i]は、予測子パレット内のi番目のエントリが現在のパレット内のエントリでないことを指定する。配列PalettePredictorEntryReuseFlags[i]の全ての要素が、0に初期化される。
palette_predictor_runは、配列PalettePredictorEntryReuseFlags内の非ゼロのエントリの前にあるゼロの数を決定するために使用される。
palette_predictor_runの値が、始めと終わりを含む0~(PredictorPaletteSize-predictorEntryIdx)の範囲内であるものとすることは、ビットストリーム適合の要件であり、ここで、predictorEntryIdxは、配列PalettePredictorEntryReuseFlagsにおける現在の位置に対応する。変数NumPredictedPaletteEntriesは、予測子パレットから再使用される現在のパレット内のエントリ数を指定する。NumPredictedPaletteEntriesの値は、始めと終わりを含む0~palette_max_sizeの範囲内であるものとする。
num_signalled_palette_entriesは、現在のパレットテーブルの最初の色成分startCompのために明示的にシグナリングされる、現在のパレット内のエントリの数を指定する。
num_signalled_palette_entriesが存在しないとき、それは0に等しいように推論される。
変数CurrentPaletteSize[startComp]は、現在のパレットテーブルの最初の色成分startCompのための現在のパレットのサイズを指定し、以下のように導出される。
CurrentPaletteSize[startComp] = NumPredictedPaletteEntries + num_signalled_palette_entries (7-155)
CurrentPaletteSize[startComp]の値は、始めと終わりを含む0~palette_max_sizeの範囲内であるものとする。
Figure 0007451731000008
Figure 0007451731000009
Figure 0007451731000010
Figure 0007451731000011
Figure 0007451731000012
2.2.5 ラインベースのCGパレットモード
VVCにはラインベースのCGパレットモードが採用された。この方法では、パレットモードの各CUは、トラバース走査モードに基づいてm個のサンプル(このテストではm=16)の複数のセグメントに分割される。各セグメントにおけるパレットランコーディングの符号化順序は、以下のとおりである。各画素について、1つのコンテキストコーディングされたbin run_copy_flag=0がシグナリングされ、画素が前の画素と同じモードのものであるか、すなわち、前の走査画素と現在の画素が双方ともランタイプ(run type)COPY_ABOVEであるか、又は前の走査画素と現在の画素が双方ともランタイプINDEXのものであり同じインデックス値のものであるかを示す。そうでない場合、run_copy_flag=1がシグナリングされる。画素と前の画素とが異なるモードのものである場合、1つのコンテキストコーディングされたbin copy_above_palette_indices_flagがシグナリングされ、画素のランタイプ、すなわち、INDEX又はCOPY_ABOVEを示す。VTM6.0におけるパレットモードと同様に、デコーダは、サンプルが最初の行内(水平トラバース走査)又は最初の列内(垂直トラバース走査)にある場合、INDEXモードがデフォルトで使用されるため、ランタイプをパースする(parse)必要がない。さらに、デコーダは、前にパースされたランタイプがCOPY_ABOVEである場合、ランタイプをパースする必要はない。1つのセグメントにおける画素のパレットランコーディングの後、インデックス値(INDEXモードのための)及び量子化されたエスケープ色は、各ラインCG内のスループットを改善するために、コンテキストコーディングされたbinの符号化/パースとは別にバイパスコーディングされ、グループ化される。インデックス値はここで、VTMでのようにパレットランコーディングの前に処理されるのでなくランコーディングの後にコーディング/パースされるため、エンコーダは、インデックス値の数num_palette_indices_minus1と最後のランタイプcopy_above_indices_for_final_run_flagをシグナリングする必要はない。
いくつかの実施形態におけるラインベースのCGパレットモードのテキストを以下に示す。
Figure 0007451731000013
Figure 0007451731000014
Figure 0007451731000015
Figure 0007451731000016
Figure 0007451731000017
Figure 0007451731000018
Figure 0007451731000019
Figure 0007451731000020
2.3 VVCにおけるローカルデュアルツリー
典型的なハードウェアビデオエンコーダ及びデコーダでは、近隣イントラブロック間のサンプル処理データ依存性のため、ピクチャがより多くの小さいイントラブロックを有するとき、処理スループットが低下する。イントラブロックの予測子生成は、近隣ブロックからの上及び左の境界の再構成サンプルを必要とする。したがって、イントラ予測は、ブロック毎に順次処理される必要がある。
HEVCでは、最小イントラCUは8×8ルマサンプルである。最小イントラCUのルマ成分は、4つの4×4ルマイントラ予測ユニット(PU)にさらに分割できるが、最小イントラCUのクロマ成分は、さらに分割することはできない。したがって、4×4クロマイントラブロック又は4×4ルマイントラブロックが処理されるとき、最悪ケースのハードウェア処理スループットが発生する。
VTM5.0では、シングルコーディングツリーにおいて、クロマパーティションは常にルマに従い、最小イントラCUは4×4ルマサンプルであるため、最小クロマイントラCBは2×2である。したがって、VTM5.0では、シングルコーディングツリーにおける最小クロマイントラCBは2×2である。VVC復号のための最悪ケースのハードウェア処理スループットは、HEVC復号のそれの1/4だけである。さらに、クロマイントラCBの再構成プロセスは、クロスコンポーネント線形モデル(cross-component linear model、CCLM)、4タップ補間フィルタ、位置依存イントラ予測結合(position-dependent intra prediction combination、PDPC)、及び組み合わせインターイントラ予測(combined inter intra prediction、CIIP)を含むツールを採用した後、HEVCのそれより一層複雑になる。ハードウェアデコーダにおいて高い処理スループットを達成することは、チャレンジングである。このセクションでは、最悪ケースのハードウェア処理スループットを改善する方法を提案する。
この方法の目標は、クロマイントラCBのパーティション化を制限することにより、16クロマサンプルより小さいクロマイントラCBを禁じる(disallow)ことである。
シングルコーディングツリーでは、SCIPUは、そのクロマブロックサイズがTHクロマサンプル以上であり、4THルマサンプルより小さい少なくとも1つの子ルマブロックを有する、コーディングツリーノードとして定義され、ここで、THは、この寄与では16に設定される。各SCIPUにおいて、全てのCBがインターであるか、又は全てのCBが非インターである、すなわち、イントラ又はIBCのいずれかであることが要求される。非インターSCIPUの場合、さらに、非インターSCIPUのクロマはさらに分割されないものとし、SCIPUのルマはさらに分割されることを許容されることが要求される。このようにして、最小クロマイントラCBサイズは16クロマサンプルであり、2×2、2×4、及び4×2クロマCBが除去される。さらに、クロマスケーリングは、非インターSCIPUの場合には適用されない。さらに、ルマブロックがさらに分割され、クロマブロックが分割されないとき、ローカルデュアルツリー(local dual tree)コーディング構造が構築される。
図5A~図5Bに、2つのSCIPUの例を示す。図5Aでは、8×4のクロマサンプルの1つのクロマCBと3つのルマCB(4×8、8×8、4×8のルマCB)が1つのSCIPUを形成しており、なぜならば、8×4クロマサンプルからの三分木(ternary tree、TT)分割が、16クロマサンプルより小さいクロマCBを結果としてもたらすためである。図5Bでは、4×4クロマサンプルの1つのクロマCB(8×4クロマサンプルの左側)と3つのルマCB(8×4、4×4、4×4のルマCB)が1つのSCIPUを形成しており、4×4サンプルの他方の1つのクロマCB(8×4のクロマサンプルの右側)と2つのルマCB(8×4、8×4のルマCB)が1つのSCIPUを形成しており、なぜならば、4×4クロマサンプルからの二分木(binary tree、BT)分割が、16クロマサンプルより小さいクロマCBを結果としてもたらすためである。
提案される方法では、SCIPUのタイプは、現在のスライスがIスライスであるか、又は現在のSCIPUが1回のさらなる分割の後にその中に4×4ルマパーティションを有する場合、非インターであるように推論され(なぜならば、VVCではインター4×4は許容されないため)、そうでない場合、SCIPUのタイプ(インター又は非インター)は、SCIPU内のCUをパースする前に1つのシグナリングされたフラグにより示される。
上記の方法を適用することにより、最悪ケースのハードウェア処理スループットは、2×2のクロマブロックの代わりに4×4、2×8、又は8×2のクロマブロックが処理されるとき、発生する。最悪ケースのハードウェア処理スループットは、HEVCにおけるものと同じであり、VTM5.0におけるものの4Xである。
2.4 変換スキップ(TS)
HEVCと同様に、ブロックの残差は、変換スキップモードでコーディングすることができる。シンタックスコーディングの冗長性を避けるために、CUレベルMTS_CU_flagがゼロに等しくないとき、変換スキップフラグはシグナリングされない。変換スキップのブロックサイズ制限は、JEM4におけるMTSのものと同じであり、これは、ブロックの幅及び高さの双方が32以下であるとき、変換スキップがCUに適用可能であることを示す。現在のCUに対してLFNST又はMIPがアクティブ化されているとき、暗黙的なMTS変換がDCT2に設定されることに留意する。また、インターコーディングブロックに対してMTSが有効にされるとき、暗黙的なMTSを依然として有効にすることができる。
さらに、変換スキップブロックでは、最小許容量子化パラメータ(QP)は、6*(internalBitDepth - inputBitDepth) + 4として定義される。
2.5 代替ルマハーフペル補間フィルタ
いくつかの実施形態において、代替ハーフペル(half-pel)補間フィルタが提案される。
ハーフペルルマ補間フィルタの切り替えは、動きベクトル精度に依存して行われる。既存のクォーターペル(quarter-pel)、フルペル(full-pel)、及び4ペルAMVRモードに追加で、新しいハーフペル精度AMVRモードが導入される。ハーフペル動きベクトル精度の場合のみ、代替ハーフペルルマ補間フィルタを選択することができる。
ハーフペル動きベクトル精度(すなわち、ハーフペルAMVRモード)を使用する非アフィン非マージインターコーディングCUでは、HEVC/VVCハーフペルルマ補間フィルタと1つ以上の代替ハーフペル補間との間の切り替えが、新しいシンタックス要素hpelIfIdxの値に基づいて行われる。シンタックス要素hpelIfIdxは、ハーフペルAMVRモードの場合にのみシグナリングされる。空間マージ候補を使用するスキップ/マージモードの場合、シンタックス要素hpelIfIdxの値は近隣ブロックから継承される。
2.6 適応色変換(ACT)
図6は、ACTが適用される復号フローチャートを示す。図6に示すように、色空間コンバージョンは、残差ドメインで実行される。具体的には、1つのさらなる復号モジュール、すなわち逆ACTが、YCgCoドメインから元のドメインに戻すようにコンバートするために、逆変換の後に導入される。
VVCでは、最大変換サイズが1つのコーディングユニット(CU)の幅又は高さより小さくない限り、1つのCUリーフノードが変換処理のユニットとしても使用される。したがって、提案される実装では、ACTフラグは、1つのCUに対して、その残差をコーディングするための色空間を選択するためにシグナリングされる。さらに、HEVC ACT設計に従い、インター及びIBC CUでは、ACTは、CU内に少なくとも1つの非ゼロ係数があるときにのみ有効にされる。イントラCUでは、ACTは、クロマ成分がルマ成分の同じイントラ予測モード、すなわちDMモードを選択するときにのみ、有効にされる。
色空間コンバージョンに使用されるコア変換は、HEVCに使用されるものと同じに保たれる。具体的には、以下に記載されるように、以下の順方向及び逆方向のYCgCo色変換行列が適用される。
Figure 0007451731000021
さらに、色変換前後の残差信号のダイナミックレンジ変化を補償するために、(-5,-5,-3)のQP調整が変換残差に適用される。
一方、順方向及び逆方向の色変換は、全ての3つの成分の残差にアクセスする必要がある。対応して、提案される実装では、ACTは、3つの成分の全ての残差が利用可能なわけではない以下の2つのシナリオでは無効にされる。
1. セパレートツリーパーティション:セパレートツリー(separate-tree)が適用されるとき、1つのCTU内のルマ及びクロマサンプルは、異なる構造によりパーティション化される。これは、ルマツリー内のCUがルマ成分のみを含み、クロマツリー内のCUが2つのクロマ成分のみを含む結果をもたらす。
2. イントラサブパーティション予測(Intra sub-partition prediction、ISP):ISPサブパーティションはルマにのみ適用され、一方で、クロマ信号は分割することなくコーディングされる。現在のISP設計では、最後のISPサブパーティションを除いて、他のサブパーティションはルマ成分のみを含む。
2.7 EG(k)を用いたエスケープ値の二値化
エスケープ値の二値化にEG(k)を使用するとき、ベースQpが十分に大きい(又は、コーディングされるシンボルが十分に小さい)とき、EG(k)のビット長はそれ以上減らすことができない。例えば、ベースQp>=23のとき、EG(5)では、ビット長は、EG5の最小ビット長である6に達する。同様に、ベースQp>=35のとき、ビット長はEG3の最小値に達する。ベースQp>=29のとき、ビット長はEG4の最小値に達する。このような場合、Qpをさらに増加させることでビットレートを減らすことはできないが、歪みを増加させる。それはビットの無駄である。
3 本明細書に記載される技術的解決策により解決される例示的な技術的問題
(1) エスケープ値の二値化方法としてのEG(k)は、Qpが閾値より大きいときにビットを無駄にする可能性がある。
(2) パレットサイズが、ローカルデュアルツリーに対して大きすぎる可能性がある。
(3) クロマパラメータは、クロマツールが適用されないときにシグナリングされる必要はない。
4 例示的な実施形態及び手法
以下の項目の列挙は、一般的な概念を説明するための例として考慮されるべきである。これらの項目は、狭義に解釈されるべきではない。さらに、これらの項目は、任意の方法で組み合わせることができる。
以下の例は、VVCにおけるパレットスキーム及び全ての他のパレット関連スキームに適用され得る。
1. エスケープ値再構成のためのQpは、最大及び/又は最小許容値を有し得る。
a. 一例において、QPは、最大許容値より大きくない、及び/又は最小許容値より小さくないようにクリッピングされてもよい。
b. 一例において、エスケープ値再構成のための最大許容Qpは、二値化方法に依存してもよい。
c. 一例において、エスケープ値再構成のための最大許容Qpは(T+B)でもよく、ここで、Bはビット深度に基づく。
i. 一例において、Tは定数でもよい。
1. 一例において、Tは23でもよい。
2. 一例において、Tは23未満の数でもよい。
3. 一例において、Tは35でもよい。
4. 一例において、Tは35未満の数でもよい。
5. 一例において、Tは29でもよい。
6. 一例において、Tは29未満の数でもよい。
ii. 一例において、Tは、ビデオ領域(例えば、シーケンス、ピクチャ、スライス/タイル/サブピクチャ)内で示されてもよい。
1. 一例において、Tは、VPS/SPS/PPS/PH/SHにおいて示されてもよい。
iii. 一例において、Bは、QpBdOffset(例えば、6 * bit_depth_minus8)に設定されてもよい。
d. 一例において、エスケープ値再構成のための最大許容Qpは、(23 + QpBdOffset)でもよい。
i. 代替的に、さらに、EG5がエスケープ値をコーディングするために使用される。
ii. 代替的に、エスケープ値再構成のための最大許容Qpは、(K + QpBdOffset)でもよく、ここで、Kは、23未満の数である。
e. 一例において、エスケープ値再構成のための最大許容Qpは、(35 + QpBdOffset)でもよい。
i. 代替的に、さらに、EG3がエスケープ値をコーディングするために使用される。
ii. 代替的に、エスケープ値再構成のための最大許容Qpは、(K + QpBdOffset)でもよく、ここで、Kは35未満の数である。
f. 代替的に、エスケープ値再構成のための最大許容Qpは(29 + QpBdOffset)でもよい。
i. 代替的に、さらに、EG4がエスケープ値をコーディングするために使用される。
ii. 代替的に、エスケープ値再構成のための最大許容Qpは、(K + QpBdOffset)でもよく、ここで、Kは29未満の数である。
パレットサイズ関連
2. パレットサイズは、ローカルデュアルツリーが適用されるとき又はそうでないとき、異なり得ることが提案される。
a. 一例において、ローカルデュアルツリーでは、パレットサイズが縮小されてもよいことが提案される。
b. 一例において、ルマCU及びクロマCUのパレットサイズは、ローカルデュアルツリーが適用されるときに異なってもよい。
c. 一例において、クロマCUのパレットサイズは、ローカルデュアルツリー内のルマCUのパレットサイズと比較して、又はローカルデュアルツリーが適用されないときのパレットサイズと比較して、縮小されてもよい。
i. 一例において、クロマのパレットサイズは半分に縮小されてもよい。
3. パレット予測子サイズは、ローカルデュアルツリーが適用されるとき又はそうでないとき、異なり得ることが提案される。
a. 一例において、ローカルデュアルツリーでは、パレット予測子サイズが縮小されてもよいことが提案される。
b. 一例において、ルマCU及びクロマCUのパレット予測子サイズは、ローカルデュアルツリーが適用されるときに異なってもよい。
c. 一例において、クロマCUのパレット予測子サイズは、ローカルデュアルツリー内のルマCUのパレット予測子サイズと比較して、又はローカルデュアルツリーが適用されないときのパレット予測子サイズと比較して、縮小されてもよい。
i. 一例において、クロマのパレット予測子サイズは半分に縮小されてもよい。
クロマデブロッキング関連
4. スライスレベル及び/又はより高いレベル(すなわち、領域サイズがスライスより大きい)で(例えば、PPS又はピクチャヘッダにおいて)クロマデブロッキングオフセットをシグナリング/パースするかどうかは、色フォーマット、及び/又はセパレートプレーンコーディング(separate plane coding)有効化フラグ、及び/又はChromaArrayType、及び/又はクロマデブロッキングオフセットが存在するかどうかを示すフラグ、及び/又はクロマデブロッキングオフセット又は何らかの他のクロマツールパラメータが存在するかどうかを示すフラグに依存し得る。
a. 一例において、スライスレベル及び/又はより高いレベル(すなわち、領域サイズがスライスより大きい)におけるクロマデブロッキングオフセットのシグナリング/パースは、ChromaArrayTypeが0に等しいか、又は色フォーマットが4:0:0であるか、又はセパレートプレーンコーディングが適用されるか、又はクロマデブロッキングオフセットが存在しないことをフラグが示すとき、常にスキップされてもよい。
b. 一例において、pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2のシグナリング/パースは、ChromaArrayTypeが0に等しいか、又は色フォーマットが4:0:0であるか、又はセパレートプレーンコーディングが適用されるか、又はクロマデブロッキングオフセットが存在しないことをフラグが示すとき、常にスキップされてもよい。
c. 一例において、ph_cb_beta_offset_div2、ph_cb_tc_offset_div2、ph_cr_beta_offset_div2、ph_cr_tc_offset_div2のシグナリング/パースは、ChromaArrayTypeが0に等しいか、又は色フォーマットが4:0:0であるか、又はセパレートプレーンコーディングが適用されるか、又はクロマデブロッキングオフセットが存在しないことをフラグが示すとき、常にスキップされてもよい。
d. 一例において、slice_cb_beta_offset_div2、slice_cb_tc_offset_div2、slice_cr_beta_offset_div2、slice_cr_tc_offset_div2のシグナリング/パースは、ChromaArrayTypeが0に等しいか、又は色フォーマットが4:0:0であるか、又はセパレートプレーンコーディングが適用されるか、又はクロマデブロッキングオフセットが存在しないことをフラグが示すとき、常にスキップされてもよい。
e. 代替的に、適合ビットストリームは、ChromaArrayTypeが0に等しいか、又は色フォーマットが4:0:0であるか、又はセパレートプレーンコーディングが適用されるとき、pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2が0に等しいものとすることを満たすものとする。
f. 一例において、pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2のシグナリング/パースは、chroma_format_idcが0に等しいか、又はseparate_colour_plane_flagが1に等しくないか、又はクロマデブロッキングオフセットが存在しないことをフラグが示すとき、常にスキップされてもよい。
g. 一例において、pps_cb_beta_offset_div2、ph_cb_tc_offset_div2、ph_cr_beta_offset_div2、ph_cr_tc_offset_div2のシグナリング/パースは、chroma_format_idcが0に等しいか、又はseparate_colour_plane_flagが1に等しくないか、又はクロマデブロッキングオフセットが存在しないことをフラグが示すとき、常にスキップされてもよい。
h. 一例において、slice_cb_beta_offset_div2、slice_cb_tc_offset_div2、slice_cr_beta_offset_div2、slice_cr_tc_offset_div2のシグナリング/パースは、chroma_format_idcが0に等しいか、又はseparate_colour_plane_flagが1に等しくないか、又はクロマデブロッキングオフセットが存在しないことをフラグが示すとき、常にスキップされてもよい。
i. 代替的に、さらに、シンタックス要素のシグナリングがスキップされるとき、そのシンタックス要素の値は0に等しいと推論される。
5. 色フォーマット、及び/又はセパレートプレーンコーディング有効化フラグ、及び/又はChromaArrayType、及び/又はクロマデブロッキングオフセットが存在するかどうかを示すフラグ、及び/又はクロマデブロッキングオフセット又は何らかの他のクロマツールパラメータが存在するかどうかを示すフラグ(例えば、pps_chroma_tool_params_present_flag)が、PPS及び/又はSPS及び/又はAPSにおいて示され得る。
a. 一例において、pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2のシグナリング/パースは、ChromaArrayTypeが0に等しい、又は色フォーマットが4:0:0である、及び/又は上記フラグが偽であるとき、常にスキップされてもよい。
b. 一例において、pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2のシグナリング/パースは、ChromaArrayTypeが0に等しい、又は色フォーマットが4:0:0である、及び/又は上記フラグが偽であるとき、常にスキップされてもよい。
c. 一例において、クロマツールオフセット関連シンタックス要素(例えば、pps_cb_qp_offset、pps_cr_qp_offset、pps_joint_cbcr_qp_offset_present_flag、pps_slice_chroma_qp_offsets_present_flag、pps_cu_chroma_qp_offset_list_enabled_flag)は、ChromaArrayTypeが0に等しくない、及び/又は上記フラグが偽であるという条件チェックの下でシグナリングされる。
d. 適合ビットストリームでは、PPSにおいてシグナリングされる色フォーマット及び/又はセパレートプレーンコーディング有効化フラグ及び/又はChromaArrayTypeは、関連するSPSにおいてシグナリングされる対応する情報と同一であるべきであることが要求される。
6. クロマqpオフセットがシグナリング/パースされるべきかを制御するフラグが、クロマデブロッキングオフセットがシグナリング/パースされるべきかをさらに制御し得ることが提案される。
a. 一例において、フラグpps_chroma_tool_params_present_flagを使用して、クロマQpオフセットがシグナリングされパースされるべきかどうか、及びクロマデブロッキングオフセットがシグナリングされ/パースされるべきかどうかを(例えば、実施形態3に示すように)制御してもよい。代替的に、既存のフラグpps_chroma_tool_offsets_present_flagを使用して、クロマQpオフセットがシグナリングされパースされるべきかどうか、及びクロマデブロッキングオフセットがシグナリングされ/パースされるべきかどうかを制御することができる。
7. 制御フラグ、例えばpps_chroma_deblocking_params_present_flagが、クロマデブロッキングオフセットがシグナリングされる/パースされるべきかどうかを制御するために、PPSにおいて追加され得る。
a. 一例において、フラグが0に等しいとき、pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、pps_cr_tc_offset_div2のシグナリング/パースは常にスキップされてもよい。
b. 一例において、フラグが0に等しいとき、ph_cb_beta_offset_div2、ph_cb_tc_offset_div2、ph_cr_beta_offset_div2、ph_cr_tc_offset_div2のシグナリング/パースは常にスキップされてもよい。
c. 一例において、フラグが0に等しいとき、slice_cb_beta_offset_div2、slice_cb_tc_offset_div2、slice_cr_beta_offset_div2、slice_cr_tc_offset_div2のシグナリング/パースは常にスキップされてもよい。
d.代替的に、さらに、適合ビットストリームにおいて、ChromaArrayTypeが0に等しいときにフラグが0に等しいものとすることが要求される。
APSにおけるクロマツール関連パラメータ
8. 制御フラグ、例えばaps_chroma_tool_params_present_flagが、クロマツール関連パラメータがAPSにおいてシグナリングされる/パースされるべきかどうかを制御するために、APSにおいて追加され得る。
a. 一例において、aps_chroma_tool_params_present_flagが0に等しいとき、alf_chroma_filter_signal_flag、alf_cc_cb_filter_signal_flag、及びalf_cc_cr_filter_signal_flagは常にスキップされ、0に等しいように推論されてもよい。
b. 一例において、aps_chroma_tool_params_present_flagが0に等しいとき、scaling_list_chroma_present_flagは常にスキップされ、0に等しいように推論されてもよい。
ピクチャヘッダにおける他のクロマツール関連パラメータ
9. 一例において、ph_log2_diff_min_qt_min_cb_intra_slice_lumaのシグナリング/パースは、ChromaArrayTypeが0に等しいか、又は色フォーマットが4:0:0であるか、又はセパレートプレーンコーディングが適用されるか、又はこのシンタックス要素(及び、可能性としてさらに他のシンタックス要素)が存在しないことをフラグが示すとき、常にスキップされ得る。
10. 一例において、ph_log2_diff_min_qt_min_cb_intra_slice_chromaのシグナリング/パースは、ChromaArrayTypeが0に等しいか、又は色フォーマットが4:0:0であるか、又はセパレートプレーンコーディングが適用されるか、又はこのシンタックス要素(及び、可能性としてさらに他のシンタックス要素)が存在しないことをフラグが示すとき、常にスキップされ得る。
11. 一例において、ph_log2_diff_min_qt_min_cb_inter_sliceのシグナリング/パースは、ChromaArrayTypeが0に等しいか、又は色フォーマットが4:0:0であるか、又はセパレートプレーンコーディングが適用されるか、又はこのシンタックス要素(及び、可能性としてさらに他のシンタックス要素)が存在しないことをフラグが示すとき、常にスキップされ得る。
一般的な特徴
12. 上記方法を適用するかどうか、及び/又はどのように適用するかは、以下に基づき得る:
a. ビデオコンテンツ(例えば、スクリーンコンテンツ又は自然コンテンツ)
b. DPS/SPS/VPS/PPS/APS/ピクチャヘッダ/スライスヘッダ/タイルグループヘッダ/最大コーディングユニット(Largest coding unit、LCU)/コーディングユニット(Coding unit、CU)/LCU行/LCUのグループ/TU/PUブロック/ビデオコーディングユニットにおいてシグナリングされたメッセージ
c. CU/PU/TU/ブロック/ビデオコーディングユニットの位置
d. 現在のブロック及び/又はその近隣ブロックのブロックの大きさ
e. 現在のブロック及び/又はその近隣ブロックのブロック形状
f. 現在のブロックの量子化パラメータ
g. 色フォーマットの指標(4:2:0、4:4:4、RGB、又はYUVなど)
h. コーディングツリー構造(デュアルツリー又はシングルツリーなど)
i. スライス/タイルグループタイプ、及び/又はピクチャタイプ
j. 色成分(例えば、ルマ成分及び/又はクロマ成分にのみ適用され得る)
k. 時間レイヤID
l. 標準のプロファイル/レベル/ティア(Tiers)
m. 現在のブロックが1つのエスケープサンプルを有するか否か
i. 一例において、上記方法は、現在のブロックが少なくとも1つのエスケープサンプルを有するときにのみ適用されてもよい。
n. 現在のブロックがロスレスモードでコーディングされるか否か(例えば、cu_transquant_bypass_flag)
ii. 一例において、上記方法は、現在のブロックがロスレスモードでコーディングされないときにのみ適用されてもよい。
o. ロスレスコーディングが有効にされるか否か(例えば、transquant_bypass_enabled、cu_transquant_bypass_flag)
5 実施形態
以下の実施形態では、追加された部分は、太字、下線、及びイタリック体のテキストとしてマークされている。削除される部分は、[[]]内にマークされている。
5.1 実施形態#1
Figure 0007451731000022
5.2 実施形態#2
Figure 0007451731000023
Figure 0007451731000024
Figure 0007451731000025
5.3 実施形態#3
Figure 0007451731000026
Figure 0007451731000027
Figure 0007451731000028
Figure 0007451731000029
Figure 0007451731000030
Figure 0007451731000031
Figure 0007451731000032
Figure 0007451731000033
Figure 0007451731000034
Figure 0007451731000035
5.4 実施形態#4
Figure 0007451731000036
Figure 0007451731000037
Figure 0007451731000038
Figure 0007451731000039
図7は、本明細書に開示される様々な手法が実装され得る一例示的なビデオ処理システム1900を示すブロック図である。様々な実装が、システム1900のコンポーネントの一部又は全部を含んでもよい。システム1900は、ビデオコンテンツを受信する入力1902を含み得る。ビデオコンテンツは、未加工(raw)又は非圧縮のフォーマット、例えば、8又は10ビットのマルチ成分画素値で受け取ることができ、あるいは圧縮又は符号化されたフォーマットでもよい。入力1902は、ネットワークインターフェース、周辺バスインターフェース、又はストレージインターフェースを表すことができる。ネットワークインターフェースの例には、イーサネット、受動光ネットワーク(passive optical network、PON)などの有線インターフェース、及びWi-Fi又はセルラーインターフェースなどの無線インターフェースが含まれる。
システム1900は、本文献に記載される様々なコーディング又は符号化方法を実施することができるコーディングコンポーネント(coding component)1904を含み得る。コーディングコンポーネント1904は、入力1902からコーディングコンポーネント1904の出力へのビデオの平均ビットレートを低減して、ビデオのコーディングされた表現を生成することができる。したがって、このコーディング手法は、ビデオ圧縮又はビデオトランスコーディング手法と時に呼ばれる。コーディングコンポーネント1904の出力は、コンポーネント1906により表されるように、記憶されるか、又は接続された通信を介して送信されてもよい。入力1902で受信したビデオの、記憶され又は通信されたビットストリーム(又は、コーディングされた)表現は、画素値、又はディスプレイインターフェース1910に送られる表示可能なビデオを生成するために、コンポーネント1908により使用することができる。ビットストリーム表現からユーザが見ることができるビデオを生成するプロセスは、ビデオ解凍と時に呼ばれる。さらに、特定のビデオ処理動作は「コーディング」動作又はツールと呼ばれるが、コーディングツール又は動作はエンコーダで使用され、コーディングの結果を逆にする対応する復号ツール又は動作はデコーダにより実行されることが理解されるであろう。
周辺バスインターフェース又はディスプレイインターフェースの例には、ユニバーサルシリアルバス(USB)又は高精細マルチメディアインターフェース(high definition multimedia interface、HDMI(登録商標))又はDisplayportなどを含んでもよい。ストレージインターフェースの例には、SATA(シリアルアドバンストテクノロジーアタッチメント(serial advanced technology attachment))、PCI、IDEインターフェースなどが含まれる。本文献に記載される手法は、携帯電話、ラップトップ、スマートフォン、又はデジタルデータ処理及び/又はビデオ表示を実行することができる他のデバイスなどの様々な電子デバイスにおいて具現化することができる。
図8は、ビデオ処理装置3600のブロック図である。装置3600は、本明細書に記載される方法の1つ以上を実施するために使用することができる。装置3600は、スマートフォン、タブレット、コンピュータ、モノのインターネット(Internet of Things、IoT)の受信機などにおいて具現化されてもよい。装置3600は、1つ以上のプロセッサ3602、1つ以上のメモリ3604、及びビデオ処理ハードウェア3606を含むことができる。プロセッサ3602は、本文献に記載される1つ以上の方法を実施するように構成され得る。メモリ(複数のメモリ)3604は、本明細書に記載される方法及び手法を実施するために使用されるデータ及びコードを記憶するために使用され得る。ビデオ処理ハードウェア3606は、本文献に記載されるいくつかの手法をハードウェア回路に実装するために使用され得る。
図10は、本開示の手法を利用し得る一例示的なビデオコーディングシステム100を示すブロック図である。
図10に示すように、ビデオコーディングシステム100は、ソースデバイス110及び宛先デバイス120を含み得る。ソースデバイス110は、符号化されたビデオデータを生成し、これは、ビデオ符号化デバイスとして参照され得る。宛先デバイス120は、ソースデバイス110により生成された符号化ビデオデータを復号することができ、これは、ビデオ復号デバイスとして参照され得る。
ソースデバイス110は、ビデオソース112、ビデオエンコーダ114、及び入力/出力(I/O)インターフェース116を含むことができる。
ビデオソース112は、ビデオ捕捉デバイス、ビデオコンテンツプロバイダからビデオデータを受信するインターフェース、及び/又はビデオデータを生成するためのコンピュータグラフィックスシステムなどのソース、又はそのようなソースの組み合わせを含んでもよい。ビデオデータは、1つ以上のピクチャを含んでもよい。ビデオエンコーダ114は、ビデオソース112からのビデオデータを符号化してビットストリームを生成する。ビットストリームは、ビデオデータのコーディングされた表現を形成するビットシーケンスを含んでもよい。ビットストリームは、コーディングピクチャ及び関連データを含んでもよい。コーディングピクチャは、ピクチャのコーディングされた表現である。関連データは、シーケンスパラメータセット、ピクチャパラメータセット、及び他のシンタックス構造を含んでもよい。I/Oインターフェース116は、変調器/復調器(モデム)及び/又は送信器を含んでもよい。符号化されたビデオデータは、I/Oインターフェース116を介してネットワーク130aを通じて宛先デバイス120に直接送信され得る。符号化されたビデオデータは、さらに、宛先デバイス120によるアクセスのために記憶媒体/サーバ130b上に記憶されてもよい。
宛先デバイス120は、I/Oインターフェース126、ビデオデコーダ124、及びディスプレイデバイス122を含んでもよい。
I/Oインターフェース126は、受信器及び/又はモデムを含んでもよい。I/Oインターフェース126は、ソースデバイス110又は記憶媒体/サーバ130bから符号化ビデオデータを取得することができる。ビデオデコーダ124は、符号化ビデオデータを復号することができる。ディスプレイデバイス122は、復号されたビデオデータをユーザに表示することができる。ディスプレイデバイス122は、宛先デバイス120と統合されてもよく、あるいは外部ディスプレイデバイスとインターフェースするように構成された宛先デバイス120の外部にあってもよい。
ビデオエンコーダ114及びビデオデコーダ124は、高効率ビデオコーディング(HEVC)標準、汎用ビデオコーディング(VVM)標準、及び他の現在及び/又はさらなる標準などのビデオ圧縮標準に従って動作することができる。
図11は、ビデオエンコーダ200の一例を示すブロック図であり、これは、図10に示すシステム100内のビデオエンコーダ114でもよい。
ビデオエンコーダ200は、本開示の手法のいずれか又は全てを実行するように構成され得る。図11の例において、ビデオエンコーダ200は、複数の機能コンポーネントを含む。本開示に記載される手法は、ビデオエンコーダ200の様々なコンポーネント間で分担されてもよい。いくつかの例において、プロセッサは、本開示に記載される手法のいずれか又は全てを実行するように構成されてもよい。
ビデオエンコーダ200の機能コンポーネントは、パーティション化ユニット201と、モード選択ユニット203、動き推定ユニット204、動き補償ユニット205、及びイントラ予測ユニット206を含み得るプレディケーションユニット(predication unit)202と、残差生成ユニット207と、変換ユニット208と、量子化ユニット209と、逆量子化ユニット210と、逆変換ユニット211と、再構成ユニット212と、バッファ213と、エントロピー符号化ユニット214とを含んでもよい。
他の例において、ビデオエンコーダ200は、より多くの、より少ない、又は異なる機能コンポーネントを含んでもよい。一例において、プレディケーションユニット202は、イントラブロックコピー(IBC)ユニットを含んでもよい。IBCユニットは、プレディケーションをIBCモードで実行することができ、これにおいて、少なくとも1つの参照ピクチャは、現在の(current)ビデオブロックが位置するピクチャである。
さらに、動き推定ユニット204及び動き補償ユニット205などのいくつかのコンポーネントが高度に統合されてもよいが、図11の例では説明の目的で別個に示されている。
パーティション化ユニット201は、ピクチャを1つ以上のビデオブロックにパーティション化することができる。ビデオエンコーダ200及びビデオデコーダ300は、様々なビデオブロックサイズをサポートすることができる。
モード選択ユニット203は、例えば誤差結果に基づいて、コーディングモードのうちの1つ、イントラ又はインターを選択し、結果として生じるイントラ又はインターコーディングされたブロックを、残差ブロックデータを生成する残差生成ユニット207に、及び、参照ピクチャとしての使用のための符号化ブロックを再構成する再構成ユニット212に提供することができる。いくつかの例において、モード選択ユニット203は、イントラ及びインタープレディケーションの組み合わせ(combination of intra and inter predication、CIIP)モードを選択することができ、これにおいて、プレディケーションは、インタープレディケーション信号及びイントラプレディケーション信号に基づく。モード選択ユニット203は、さらに、インタープレディケーションの場合に、ブロックのための動きベクトルの解像度(例えば、サブピクセル又は整数ピクセル精度)を選択してもよい。
現在のビデオブロックに対してインター予測を実行するために、動き推定ユニット204は、バッファ213からの1つ以上の参照フレームを現在のビデオブロックと比較することにより、現在のビデオブロックの動き情報を生成することができる。動き補償ユニット205は、動き情報と、バッファ213からの、現在のビデオブロックに関連づけられたピクチャ以外のピクチャの復号されたサンプルとに基づいて、現在のビデオブロックの予測ビデオブロックを決定することができる。
動き推定ユニット204と動き補償ユニット205は、例えば、現在のビデオブロックがIスライス内にあるか、Pスライス内にあるか、又はBスライス内にあるかに依存して、現在のビデオブロックに対して異なる動作を実行することができる。
いくつかの例において、動き推定ユニット204は、現在のビデオブロックに対して一方向の予測を実行することができ、動き推定ユニット204は、現在のビデオブロックのための参照ビデオブロックについて、リスト0又はリスト1の参照ピクチャを検索することができる。次いで、動き推定ユニット204は、参照ビデオブロックを含むリスト0又はリスト1内の参照ピクチャを示す参照インデックスと、現在のビデオブロックと参照ビデオブロックとの間の空間的変位を示す動きベクトルとを生成することができる。動き推定ユニット204は、現在のビデオブロックの動き情報として、参照インデックス、予測方向インジケータ、及び動きベクトルを出力することができる。動き補償ユニット205は、現在のビデオブロックの動き情報により示される参照ビデオブロックに基づいて、現在のブロックの予測ビデオブロックを生成することができる。
他の例において、動き推定ユニット204は、現在のビデオブロックに対して双方向の予測を実行することができ、動き推定ユニット204は、現在のビデオブロックのための参照ビデオブロックについて、リスト0内の参照ピクチャを検索することができ、現在のビデオブロックのための別の参照ビデオブロックについて、リスト1内の参照ピクチャを検索することもできる。次いで、動き推定ユニット204は、参照ビデオブロックを含むリスト0及びリスト1内の参照ピクチャを示す参照インデックスと、参照ビデオブロックと現在のビデオブロックとの間の空間的変位を示すと動きベクトルとを生成することができる。動き推定ユニット204は、現在のビデオブロックの動き情報として、現在のビデオブロックの参照インデックス及び動きベクトルを出力することができる。動き補償ユニット205は、現在のビデオブロックの動き情報により示される参照ビデオブロックに基づいて、現在のビデオブロックの予測ビデオブロックを生成することができる。
いくつかの例において、動き推定ユニット204は、デコーダの復号処理のための動き情報のフルセットを出力することができる。
いくつかの例において、動き推定ユニット204は、現在のビデオのための動き情報のフルセットを出力しなくてもよい。むしろ、動き推定ユニット204は、別のビデオブロックの動き情報を参照して、現在のビデオブロックの動き情報をシグナリングしてもよい。例えば、動き推定ユニット204は、現在のビデオブロックの動き情報が近隣のビデオブロックの動き情報と十分に類似していると決定することができる。
一例において、動き推定ユニット204は、現在のビデオブロックに関連づけられたシンタックス構造において、現在のビデオブロックが別のビデオブロックと同じ動き情報を有することをビデオデコーダ300に示す値を示すことができる。
別の例において、動き推定ユニット204は、現在のビデオブロックに関連づけられたシンタックス構造において、別のビデオブロック及び動きベクトル差分(motion vector difference、MVD)を識別することができる。動きベクトル差分は、現在のビデオブロックの動きベクトルと、示されたビデオブロックの動きベクトルとの間の差を示す。ビデオデコーダ300は、示されたビデオブロックの動きベクトルと動きベクトル差分とを使用して、現在のビデオブロックの動きベクトルを決定することができる。
上記で論じたように、ビデオエンコーダ200は、動きベクトルを予測的にシグナリングすることができる。ビデオエンコーダ200により実施され得る予測シグナリング手法の2つの例には、高度動きベクトルプレディケーション(advanced motion vector predication、AMVP)及びマージモードのシグナリングが含まれる。
イントラ予測ユニット206は、現在のビデオブロックに対してイントラ予測を実行することができる。イントラ予測ユニット206が現在のビデオブロックに対してイントラ予測を実行するとき、イントラ予測ユニット206は、同じピクチャ内の他のビデオブロックの復号されたサンプルに基づいて、現在のビデオブロックのための予測データを生成することができる。現在のビデオブロックのための予測データは、予測されたビデオブロックと様々なシンタックス要素を含むことができる。
残差生成ユニット207は、現在のビデオブロックから現在のビデオブロックの予測ビデオブロックを減算することにより(例えば、マイナス記号により示される)、現在のビデオブロックのための残差データを生成することができる。現在のビデオブロックの残差データは、現在のビデオブロック内のサンプルの異なるサンプル成分に対応する残差ビデオブロックを含むことができる。
他の例において、例えばスキップモードでは、現在のビデオブロックについて、現在のビデオブロックのための残差データが存在しない場合があり、残差生成ユニット207は、減算動作を実行しない場合がある。
変換処理ユニット208は、現在のビデオブロックに関連づけられた残差ビデオブロックに1つ以上の変換を適用することにより、現在のビデオブロックのための1つ以上の変換係数ビデオブロックを生成することができる。
変換処理ユニット208が、現在のビデオブロックに関連づけられた変換係数ビデオブロックを生成した後、量子化ユニット209は、現在のビデオブロックに関連づけられた1つ以上の量子化パラメータ(QP)値に基づいて、現在のビデオブロックに関連づけられた変換係数ビデオブロックを量子化することができる。
逆量子化ユニット210及び逆変換ユニット211は、変換係数ビデオブロックから残差ビデオブロックを再構成するために、変換係数ビデオブロックに逆量子化及び逆変換をそれぞれ適用することができる。再構成ユニット212は、再構成された残差ビデオブロックを、プレディケーションユニット202により生成された1つ以上の予測ビデオブロックからの対応するサンプルに加算して、バッファ213における記憶のために、現在のブロックに関連づけられた再構成ビデオブロックを作成することができる。
再構成ユニット212がビデオブロックを再構成した後、ループフィルタリング動作を実行して、ビデオブロック内のビデオブロッキングアーチファクトを低減してもよい。
エントロピー符号化ユニット214は、ビデオエンコーダ200の他の機能コンポーネントからデータを受信することができる。エントロピー符号化ユニット214がデータを受け取ると、エントロピー符号化ユニット214は、1つ以上のエントロピー符号化動作を実行してエントロピー符号化データを生成し、エントロピー符号化データを含むビットストリームを出力することができる。
図12は、ビデオデコーダ300の一例を示すブロック図であり、これは、図10に示すシステム100内のビデオデコーダ114でもよい。
ビデオデコーダ300は、本開示の手法のいずれか又は全てを実行するように構成され得る。図12の例において、ビデオデコーダ300は、複数の機能コンポーネントを含む。本開示に記載される手法は、ビデオデコーダ300の様々なコンポーネント間で分担されてもよい。いくつかの例において、プロセッサは、本開示に記載される手法のいずれか又は全てを実行するように構成されてもよい。
図12の例において、ビデオデコーダ300は、エントロピー復号ユニット301、動き補償ユニット302、イントラ予測ユニット303、逆量子化ユニット304、逆変換ユニット305、再構成ユニット306、及びバッファ307を含む。ビデオデコーダ300は、いくつかの例において、ビデオエンコーダ200(図11)に関して説明した符号化パスと一般に逆の復号パスを実行することができる。
エントロピー復号ユニット301は、符号化されたビットストリームを取り出すことができる。この符号化ビットストリームは、エントロピーコーディングビデオデータ(例えば、ビデオデータの符号化されたブロック)を含むことができる。エントロピー復号ユニット301は、エントロピーコーディングビデオデータを復号することができ、エントロピー復号ビデオデータから、動き補償ユニット302は、動きベクトル、動きベクトル精度、参照ピクチャリストインデックス、及び他の動き情報を含む動き情報を決定することができる。動き補償ユニット302は、例えば、AMVP及びマージモードを実行することにより、そのような情報を決定することができる。
動き補償ユニット302は、可能性として補間フィルタに基づいて補間を実行し、動き補償ブロックを作成することができる。サブピクセル精度で使用されるべき補間フィルタの識別子が、シンタックス要素に含まれてもよい。
動き補償ユニット302は、ビデオブロックの符号化の間にビデオエンコーダ20により使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセル(sub-integer pixels)のための補間値を計算することができる。動き補償ユニット302は、受け取ったシンタックス情報に従ってビデオエンコーダ200により使用される補間フィルタを決定し、補間フィルタを使用して予測ブロックを作成することができる。
動き補償ユニット302は、シンタックス情報の一部を使用して、符号化されたビデオシーケンスのフレーム及び/又はスライスを符号化するために使用されたブロックのサイズ、符号化されたビデオシーケンスのピクチャの各マクロブロックがどのようにパーティション化されるかを記述するパーティション情報、各パーティションがどのように符号化されているかを示すモード、各インター符号化ブロックのための1つ以上の参照フレーム(及び、参照フレームリスト)、及び符号化されたビデオシーケンスを復号するための他の情報を決定することができる。
イントラ予測ユニット303は、例えばビットストリームにおいて受け取ったイントラ予測モードを使用して、空間的に隣接するブロックから予測ブロックを形成することができる。逆量子化ユニット303は、ビットストリームにおいて提供され、エントロピー復号ユニット301により復号された量子化ビデオブロック係数を逆量子化し、すなわち量子化解除する(de-quantizes)。逆変換ユニット303は、逆変換を適用する。
再構成ユニット306は、残差ブロックを、動き補償ユニット202又はイントラ予測ユニット303により生成された対応する予測ブロックと合計して、復号されたブロックを形成することができる。所望であれば、デブロッキングフィルタをさらに適用して復号ブロックをフィルタリングして、ブロック性アーチファクト(blockiness artifact)を除去してもよい。次いで、復号されたビデオブロックはバッファ307に記憶され、バッファ307は、後続の動き補償/イントラプレディケーションのための参照ブロックを提供し、さらに、ディスプレイデバイスにおける提示のための復号されたビデオを生ずる。
次に、いくつかの実施形態で好適な解決策のリストを提供する。
以下の解決策は、前のセクション(例えば、項目1)で論じられた手法の例示的な実施形態を示す。
1. ビデオ処理の方法(例えば、図9に示す方法900)であって、ビデオのビデオブロックと前記ビデオのコーディングされた表現(coded representation)との間のコンバージョンを実行するステップ(902)、を含み、前記ビデオブロックの前記コーディングされた表現にパレットモードが使用され、前記ビデオブロックのサンプルは代表的な色値のパレットを使用して表され、前記パレットの外部のサンプルは、エスケープシンボルと、ルールにより決定される最小許容値及び最大許容値の間の範囲内である量子化パラメータを使用して量子化された値とを使用してコーディングされる、方法。
2. 前記最大許容値は、前記ビデオブロックの前記コーディングされた表現に使用される二値化方法に依存する、解決策1に記載の方法。
3. 前記最大許容値はT+Bとして表され、Bは前記ビデオブロックのサンプルのビット深度の表現に基づく数であり、Tは予め定義された数である、解決策1に記載の方法。
以下の解決策は、前のセクション(例えば、項目2)で論じられた手法の例示的な実施形態を示す。
4. ビデオ処理の方法であって、ビデオのビデオブロックと前記ビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、前記ビデオブロックの前記コーディングされた表現にパレットモードが使用され、前記ビデオブロックのサンプルは代表的な色値のパレットを使用して表され、前記パレットのサイズは、前記ビデオブロックと前記コーディングされた表現との間の前記コンバージョンにローカルデュアルツリーが使用されるかどうかに関するルールに依存する、方法。
5. 前記パレットのサイズは、前記ローカルデュアルツリーの使用に起因して、前記ビデオの色成分に依存する、解決策4に記載の方法。
6. 前記ルールは、前記ビデオブロックがクロマブロックである場合に、前記ビデオブロックがルマブロックである場合よりもより小さいパレットサイズを使用することを指定する、解決策5に記載の方法。
以下の解決策は、前のセクション(例えば、項目3)で論じられた手法の例示的な実施形態を示す。
7. ビデオ処理の方法であって、ビデオのビデオブロックと前記ビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、前記ビデオブロックの前記コーディングされた表現にパレットモードが使用され、前記ビデオブロックのサンプルは代表的な色値のパレットを使用して表され、前記パレット予測子のサイズは、前記ビデオブロックと前記コーディングされた表現との間の前記コンバージョンにローカルデュアルツリーが使用されるかどうかに関するルールに依存する、方法。
8. 前記パレット予測子のサイズは、前記ローカルデュアルツリーの使用に起因して、前記ビデオブロックの色成分に依存する、解決策7に記載の方法。
9. 前記ルールは、前記ビデオブロックがクロマブロックである場合に、前記ビデオブロックがルマブロックである場合よりもより小さいパレットサイズを使用することを指定する、解決策8に記載の方法。
以下の解決策は、前のセクション(例えば、項目4)で論じられた手法の例示的な実施形態を示す。
10. ビデオ処理の方法であって、ビデオのビデオ領域のビデオブロックと前記ビデオのコーディングされた表現との間のコンバージョンについて、コーディング条件に基づいて、前記ビデオのクロマ成分のためのデブロッキングオフセットを識別するシンタックス要素が前記ビデオ領域レベルで前記コーディングされた表現に含まれるかどうかを決定するステップと、前記決定に基づいて前記コンバージョンを実行するステップと、を含み、前記デブロッキングオフセットは、前記ビデオブロックに対するデブロッキング動作を選択的に有効にするために使用される、方法。
11. 前記ビデオ領域は、ビデオスライス又はビデオピクチャである、解決策10に記載の方法。
12. 前記コーディング条件は、前記ビデオの色フォーマットを含む、解決策10乃至11のうちいずれか1項に記載の方法。
13. 前記コーディング条件は、前記コンバージョンに対してセパレートプレーンコーディングが有効にされるかどうかに基づく、解決策10乃至12のうちいずれか1項に記載の方法。
14. 前記コーディング条件は、前記コーディングされた表現にクロマアレイタイプが含まれるかどうかに基づく、解決策10乃至13のうちいずれか1項に記載の方法。
以下の解決策は、前のセクション(例えば、項目5)で論じられた手法の例示的な実施形態を示す。
15. ビデオ処理の方法であって、ビデオのビデオ領域のビデオブロックと前記ビデオのコーディングされた表現との間のコンバージョンについて、コーディング条件に基づいて、クロマコーディングツールの使用を識別するシンタックス要素が前記ビデオ領域レベルで前記コーディングされた表現に含まれるかどうかを決定するステップと、前記決定に基づいて前記コンバージョンを実行するステップと、を含み、前記デブロッキングオフセットは、前記ビデオブロックに対するデブロッキング動作を選択的に有効にするために使用される、方法。
16. 前記ビデオ領域は、ビデオスライス又はビデオピクチャである、解決策15に記載の方法。
17. 前記コーディング条件は、適応パラメータセットにおけるシンタックス要素の包含に対応する、解決策15乃至16のうちいずれか1項に記載の方法。
以下の解決策は、前のセクション(例えば、項目6、7)で論じられた手法の例示的な実施形態を示す。
18. ビデオ処理の方法であって、ビデオのビデオ領域のビデオブロックと前記ビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、前記コーディングされた表現はフォーマットに適合し、前記フォーマットは、前記ビデオのクロマ成分のためのデブロッキングオフセットを示す第1のフラグが前記コーディングされた表現に含まれるかどうかが、前記クロマ成分の量子化パラメータオフセットを示す第2のフラグが前記コーディングされた表現に含まれるかどうかに基づくことを指定する、方法。
19. 前記フォーマットルールは、前記コーディングされた表現が、前記第1のフラグ及び前記第2のフラグが前記コーディングされた表現に含まれるかどうかを示す第3のフラグを含むことを指定する、解決策18に記載の方法。
20. 前記第3のフラグは、ピクチャパラメータセット内の前記コーディングされた表現に含まれる、解決策18乃至19のうちいずれか1項に記載の方法。
以下の解決策は、前のセクション(例えば、項目8~12)で論じられた手法の例示的な実施形態を示す。
21. ビデオ処理の方法であって、ビデオのビデオ領域のビデオブロックと前記ビデオのコーディングされた表現との間のコンバージョンを実行するステップ、を含み、前記コーディングされた表現はフォーマットルールに適合し、前記フォーマットルールは、前記コーディングされた表現におけるシンタックス要素が、1つ以上のクロマコーディングツールの適用可能性を示す1つ以上のパラメータが前記ビデオ領域又は前記ビデオブロックレベルで前記コーディングされた表現に含まれるかどうかを制御することを指定する、方法。
22. 前記シンタックス要素は、適応パラメータセットに含まれる、解決策21に記載の方法。
23. 前記フォーマットルールは、前記シンタックス要素の第1の値が、前記1つ以上のパラメータが前記コーディングされた表現から除外され、前記コーディングされた表現のパースの間にスキップされることを示すことを指定する、解決策21乃至22のうちいずれか1項に記載の方法。
24. 前記コンバージョンは、前記ビデオが条件を満たすことに起因して前記方法を使用する、上記解決策のうちいずれか1項に記載の方法。
25. 前記条件は、ビデオコンテンツのタイプ、又は前記コーディングされた表現により使用されるプロファイル若しくはティア若しくはレベルを含む、解決策24に記載の方法。
26. 前記条件は、前記ビデオブロック及び/又は近隣ビデオブロックのブロックの大きさ、又は前記ビデオの色フォーマット、又は前記ビデオブロックのコンバージョンに使用されるコーディングツリー構造、又は前記ビデオ領域のタイプを含む、上記解決策のうちいずれか1項に記載の方法。
27. 前記コンバージョンは、前記ビデオを前記コーディングされた表現に符号化することを含む、解決策1乃至26のうちいずれか1項に記載の方法。
28. 前記コンバージョンは、前記コーディングされた表現を復号して前記ビデオの画素値を生成することを含む、解決策1乃至26のうちいずれか1項に記載の方法。
29. 解決策1乃至28のうちの1つ以上に記載の方法を実施するように構成されたプロセッサを含むビデオ復号装置。
30. 解決策1乃至28のうちの1つ以上に記載の方法を実装するように構成されたプロセッサを含むビデオ符号化装置。
31. コンピュータコードを記憶させたコンピュータプログラム製品であって、前記コードは、プロセッサにより実行されると、前記プロセッサに解決策1乃至28のうちいずれか1項に記載の方法を実施させる、コンピュータプログラム製品。
32. 本文献に記載された方法、装置、又はシステム。
図13は、本技術によるビデオ処理の方法1300のフローチャート表現である。方法1300は、動作1310において、ビデオのクロマ成分のためのデブロッキングオフセットを識別するシンタックス要素がビデオ領域レベルに含まれるかどうかが、ビデオの色フォーマットに基づいて決定されることを指定するルールに従って、ビデオのブロックとビデオのビットストリームとの間のコンバージョンを実行することを含む。いくつかの実施形態において、このシンタックス要素は、ビデオの色フォーマットが4:0:0である場合に省略される。いくつかの実施形態において、色フォーマットは、パラメータChromaArrayTypeに基づいて決定される。
図14は、本技術によるビデオ処理の方法1400のフローチャート表現である。方法1400は、動作1410において、ビデオのクロマ成分のためのデブロッキングオフセットを識別するシンタックス要素がビデオ領域レベルに含まれるかどうかが、異なる色成分を別個に処理するコーディングツールが有効にされるかどうかを示すシンタックスフラグに基づいて決定されることを指定するルールに従って、ビデオのブロックとビデオのビットストリームとの間のコンバージョンを実行することを含む。いくつかの実施形態において、このシンタックス要素は、ブロックのルマ及びクロマサンプルが分離されない場合、省略される。
図15は、本技術によるビデオ処理の方法1500のフローチャート表現である。方法1500は、動作1510において、ビデオのクロマ成分のためのデブロッキングオフセットを識別するシンタックス要素がビデオ領域レベルに含まれるかどうかが、クロマ成分のためのコーディングツールのパラメータがビットストリームに存在するかどうかを指定するシンタックスフラグに基づいて決定されることを指定するルールに従って、ビデオのブロックとビデオのビットストリームとの間のコンバージョンを実行することを含む。いくつかの実施形態において、このシンタックス要素は、シンタックスフラグが、クロマ成分のためのコーディングツールのデブロッキングオフセットがビットストリームから省略されることを指定する場合、省略される。
いくつかの実施形態において、デブロッキングオフセットは、シンタックス要素がシグナリングから省略される場合、0であるように推論される。いくつかの実施形態において、ビデオ領域レベルで適用可能なデブロッキングオフセットは:Cb成分に適用される、(2で除算された)βのための第1のデブロッキングパラメータオフセットであり、第1のデブロックパラメータはcb_beta_offset_div2として示される、第1のデブロッキングパラメータオフセット;Cb成分に適用される、(2で除算された)tCのための第2のデブロッキングパラメータオフセットであり、第2のデブロッキングパラメータはcb_tc_offset_div2で示される、第2のデブロッキングパラメータオフセット;Cr成分に適用される、(2で除算された)βのための第3のデブロッキングパラメータオフセットであり、第3のデブロッキングパラメータはcr_beta_offset_div2で示される、第3のデブロッキングパラメータオフセット;又は、Cr成分に適用される、(2で除算された)tCのための第4のデブロッキングパラメータオフセットであり、第4のデブロッキングパラメータはcr_tc_offset_div2で示される、第4のデブロッキングパラメータオフセット;のうちの少なくとも1つを含む。
いくつかの実施形態において、ビデオ領域レベルはピクチャパラメータセットを含む。いくつかの実施形態において、ビデオ領域レベルはピクチャヘッダを含む。いくつかの実施形態において、ビデオ領域はスライスを含む。いくつかの実施形態において、クロマ成分のためのコーディングツールのパラメータがビットストリームに存在するかどうかを指定するシンタックスフラグは、クロマ量子化パラメータオフセットがビットストリームに存在するかどうかをさらに決定する。
図16は、本技術によるビデオ処理の方法1600のフローチャート表現である。方法1600は、動作1610において、クロマ量子化パラメータオフセットがコンバージョンのために処理されるかどうかを示すシンタックスフラグが、ビデオのクロマ成分のためのデブロッキングオフセットがコンバージョンのために処理されるかどうかをさらに示すことを指定するルールに従って、ビデオのブロックとビデオのビットストリームとの間のコンバージョンを実行することを含む。
いくつかの実施形態において、シンタックスフラグはpps_chroma_tool_params_present_flagを含む。いくつかの実施形態において、シンタックスフラグはpps_chroma_tool_offsets_present_flagを含む。
いくつかの実施形態において、コンバージョンは、ビデオをビットストリームに符号化することを含む。いくつかの実施形態において、コンバージョンは、ビットストリームからビデオを復号することを含む。
本文献において、用語「ビデオ処理」は、ビデオ符号化、ビデオ復号、ビデオ圧縮、又はビデオ解凍を指すことがある。例えば、ビデオ圧縮アルゴリズムは、ビデオの画素表現から対応するビットストリーム表現へのコンバージョンの間に適用されることがあり、あるいは逆もまた同様である。現在のビデオブロックのビットストリーム表現は、例えば、シンタックスにより定義されるように、ビットストリーム内の異なる場所にコロケートされ(co-located)又は拡散されたビットに対応し得る。例えば、マクロブロックは、変換及びコーディングされた誤差残差値の観点から、及び、ビットストリーム内のヘッダ及び他のフィールド内のビットをさらに使用して、符号化されてもよい。
本文献に記載される開示された及び他の解決策、例、実施形態、モジュール、及び機能動作は、デジタル電子回路で、あるいは本文献に開示された構造及びそれらの構造的同等物を含むコンピュータソフトウェア、ファームウェア、又はハードウェアで、あるいはそれらのうち1つ以上の組み合わせで実施することができる。開示された及び他の実施形態は、1つ以上のコンピュータプログラム製品、すなわち、データ処理装置による実行のため、又はデータ処理装置の動作を制御するための、コンピュータ読取可能媒体上に符号化されたコンピュータプログラム命令の1つ以上のモジュールとして実施することができる。コンピュータ読取可能媒体は、マシン読取可能記憶装置、マシン読取可能記憶基板、メモリ装置、マシン読取可能伝搬信号に影響を与える物質の組成、又は1つ以上のこれらの組み合わせとすることができる。用語「データ処理装置」は、例としてプログラマブルプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータを含む、データを処理するための全ての装置、デバイス、及びマシンを包含する。装置は、ハードウェアに加えて、問題のコンピュータプログラムの実行環境を作成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はそれらの1つ以上の組み合わせを構成するコードを含むことができる。伝搬信号は、適切な受信機装置への送信のために情報を符号化するように生成される人工的に生成された信号、例えば、マシンにより生成された電気的、光学的、又は電磁的な信号である。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる)は、コンパイル型又は解釈型言語を含む任意の形式のプログラミング言語で書くことができ、それは、スタンドアロンプログラムとして、又はコンピューティング環境での使用に適したモジュール、コンポーネント、サブルーチン、又は他のユニットとしてを含む、任意の形態でデプロイすることができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するものではない。プログラムは、他のプログラム又はデータを保持するファイルの一部分(例えば、マークアップ言語文書に記憶された1つ以上のスクリプト)に、問題のプログラム専用の単一ファイルに、又は複数の調整されたファイル(例えば、1つ以上のモジュール、サブプログラム、又はコードの部分を記憶するファイル)に記憶することができる。コンピュータプログラムは、1つのコンピュータ上で、又は、1つのサイトに配置され若しくは複数のサイトにわたり分散されて通信ネットワークにより相互接続される複数のコンピュータ上で、実行されるようにデプロイすることができる。
本文献に記載されるプロセス及び論理フローは、入力データに対して動作し出力を生成することにより機能を実行するために1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサにより実行することができる。プロセス及び論理フローは、専用論理回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)又はASIC(特定用途向け集積回路)により実行することもでき、装置もまた、これらとして実施することができる。
コンピュータプログラムの実行に適したプロセッサには、例として、汎用及び専用双方のマイクロプロセッサ、及び任意の種類のデジタルコンピュータの任意の1つ以上のプロセッサが含まれる。一般に、プロセッサは、読取専用メモリ又はランダムアクセスメモリ又は双方から命令及びデータを受け取る。コンピュータの必須要素は、命令を実行するプロセッサと、命令及びデータを記憶する1つ以上のメモリデバイスである。一般に、コンピュータはまた、データを記憶する1つ以上の大容量記憶デバイス、例えば、磁気、磁気光ディスク、又は光ディスクを含み、あるいはこれらからデータを受け取り、又はこれらにデータを転送し、又は双方を行うために動作上結合される。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令及びデータを記憶するのに適したコンピュータ読取可能媒体には、例として、半導体メモリデバイス、例えば、EPROM、EEPROM、及びフラッシュメモリデバイス;磁気ディスク、例えば、内部ハードディスク又はリムーバブルディスク;磁気光ディスク;並びにCD ROM及びDVD-ROMディスクを含む、全ての形態の不揮発性メモリ、媒体、及びメモリデバイスが含まれる。プロセッサ及びメモリは、専用論理回路により補足し、又は専用論理回路に組み込むことができる。
本特許文献は多くの詳細を含むが、これらは、いずれかの対象事項又は請求され得るものの範囲に対する限定とみなされるべきではなく、むしろ、特定の手法の特定の実施形態に特有であり得る特徴の説明とみなされるべきである。別個の実施形態の文脈において本特許文献に記載されている特定の特徴は、単一の実施形態で組み合わせて実施することもできる。逆に、単一の実施形態の文脈において記載されている様々な特徴は、複数の実施形態において別個に、又は任意の適切なサブコンビネーションで実施することもできる。さらに、特徴は、特定の組み合わせにおいて作用するものとして上述され、そのようなものとして最初に請求されることさえあるが、請求された組み合わせからの1つ以上の特徴を、いくつかの場合、組み合わせから切り出すことができ、請求される組み合わせは、サブコンビネーション、又はサブコンビネーションのバリエーションに向けられ得る。
同様に、動作は図面において特定の順序で示されているが、これは、所望の結果を達成するために、そのような動作が図示される特定の順序で又は順番に実行されること、又は全ての例示された動作が実行されることを要求するものとして理解されるべきではない。さらに、本特許文献に記載されている実施形態における様々なシステムコンポーネントの分離は、全ての実施形態においてそのような分離を要求するものとして理解されるべきではない。
少数の実装及び例のみが記載されており、本特許文献に記載及び例示されているものに基づいて他の実装、拡張、及びバリエーションがなされ得る。

Claims (20)

  1. ビデオデータを処理する方法であって、
    ルールに従ってビデオと前記ビデオのビットストリームとの間のコンバージョンを実行するステップ、を含み、
    前記ルールは、クロマ成分のためのコーディングツールオフセットに関する第1のフラグが前記ビットストリームにおけるピクチャパラメータセット(PPS)に含まれることを指定し、
    前記ルールはさらに、第1のクロマデブロッキングパラメータオフセットを指定する第1のシンタックス要素セットが前記ビットストリームにおける前記PPSに含まれるかどうかが、前記第1のフラグの値に基づいて決定されることを指定し、
    前記ルールはさらに、前記ビデオのビデオピクチャのための第2のクロマデブロッキングパラメータオフセットを指定する第2のシンタックス要素セットが前記PPSを参照するピクチャヘッダに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定し、
    前記ルールはさらに、前記ビデオピクチャのスライスのための第3のクロマデブロッキングパラメータオフセットを指定する第3のシンタックス要素セットが前記PPSを参照するスライスヘッダに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定し、
    前記第1のフラグの前記値は、前記ビデオピクチャの色フォーマットに関する、方法。
  2. 前記ルールはさらに、前記第3のクロマデブロッキングパラメータオフセットをスライスレベルにおいてシグナリング又はパースするか、又はより高いレベルにおいてシグナリング又はパースするかが、前記第1のフラグの前記値に基づいて決定されることを指定する、請求項1に記載の方法。
  3. 前記ルールはさらに、前記第3のクロマデブロッキングパラメータオフセットをスライスレベルにおいてシグナリング又はパースするか、又はピクチャレベルにおいてシグナリング又はパースするかが、前記第1のフラグの前記値に基づいて決定されることを指定する、請求項1又は請求項2に記載の方法。
  4. 前記ルールはさらに、前記第1のフラグが第1の値を有し、前記第3のシンタックス要素セットが存在しないとき、前記第3のクロマデブロッキングパラメータオフセットがピクチャレベルにおいてシグナリング又はパースされることを指定する、請求項1乃至3のうちいずれか1項に記載の方法。
  5. 前記ルールはさらに、前記第1のフラグが第2の値を有するとき、前記第1のシンタックス要素セット、前記第2のシンタックス要素セット、及び前記第3のシンタックス要素セットが存在しないことを指定する、請求項1乃至4のうちいずれか1項に記載の方法。
  6. 前記第1のフラグが前記第2の値を有するとき、前記ビデオピクチャのための前記第2のクロマデブロッキングパラメータオフセット及び前記スライスのための前記第3のクロマデブロッキングパラメータオフセットをより高いレベルにおいてシグナリング又はパースすることは禁じられる、請求項5に記載の方法。
  7. 前記第1のフラグが前記第2の値を有するとき、前記ビデオピクチャのための前記第2のクロマデブロッキングパラメータオフセットをPPSレベルにおいてシグナリング又はパースすることは禁じられ、前記スライスのための前記第3のクロマデブロッキングパラメータオフセットをピクチャレベルにおいてシグナリング又はパースすることは禁じられる、請求項5又は請求項6に記載の方法。
  8. 前記第1のフラグが前記第2の値を有するとき、前記ビデオピクチャのための前記第2のクロマデブロッキングパラメータオフセットはピクチャレベルにおいてシグナリング又はパースされ、前記スライスのための前記第3のクロマデブロッキングパラメータオフセットはスライスレベルにおいてシグナリング又はパースされる、請求項5乃至7のうちいずれか1項に記載の方法。
  9. 前記ルールはさらに、前記第1のシンタックス要素セット、前記第2のシンタックス要素セット、及び前記第3のシンタックス要素セットが前記ビットストリームに含まれるかどうが、デブロッキングフィルタの適用に関する第2のフラグの値にさらに基づくことを指定し、
    前記ルールはさらに、第1のルマデブロッキングパラメータオフセットを指定する第1のシンタックス要素が、前記第2のフラグの前記値に基づいて前記PPSに条件付きで含まれることを指定し、
    前記ルールはさらに、前記ビデオピクチャのための第2のルマデブロッキングパラメータオフセットを指定する第2のシンタックス要素が、前記第2のフラグの前記値に基づいて、前記PPSを参照する前記ピクチャヘッダに条件付きで含まれることを指定し、
    前記ルールはさらに、前記スライスのための第3のルマデブロッキングパラメータオフセットを指定する第3のシンタックス要素が、前記第2のフラグの前記値に基づいて、前記PPSを参照する前記スライスヘッダに条件付きで含まれることを指定する、請求項5乃至8のうちいずれか1項に記載の方法。
  10. 前記第1のフラグが前記第2の値を有するとき、前記ビデオピクチャのための前記第2のクロマデブロッキングパラメータオフセットは、前記ビデオピクチャのための前記第2のルマデブロッキングパラメータオフセットを指定する前記第2のシンタックス要素に基づいてシグナリング又はパースされ、前記スライスのための前記第3のクロマデブロッキングパラメータオフセットは、前記スライスのための前記第3のルマデブロッキングパラメータオフセットを指定する前記第3のシンタックス要素に基づいてシグナリング又はパースされる、請求項9に記載の方法。
  11. 前記第1のシンタックス要素セットは、pps_cb_beta_offset_div2、pps_cb_tc_offset_div2、pps_cr_beta_offset_div2、又はpps_cr_tc_offset_div2のうちの少なくとも1つを含み、
    前記第2のシンタックス要素セットは、ph_cb_beta_offset_div2、ph_cb_tc_offset_div2、ph_cr_beta_offset_div2、又はph_cr_tc_offset_div2のうちの少なくとも1つを含み、
    前記第3のシンタックス要素セットは、sh_cb_beta_offset_div2、sh_cb_tc_offset_div2、sh_cr_beta_offset_div2、又はsh_cr_tc_offset_div2のうちの少なくとも1つを含む、請求項1乃至10のうちいずれか1項に記載の方法。
  12. 前記第1のシンタックス要素セット、前記第2のシンタックス要素セット、及び前記第3のシンタックス要素セットは、前記ビデオピクチャの前記色フォーマットが4:0:0であるとき、前記ビットストリームから省略される、請求項1乃至11のうちいずれか1項に記載の方法。
  13. 前記ルールはさらに、クロマ量子化パラメータに関するオフセットを指定する第4のシンタックス要素セットが前記ビットストリームの前記PPSに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定する、請求項1乃至12のうちいずれか1項に記載の方法。
  14. 前記ルールはさらに、前記第4のシンタックス要素セットが存在しないとき、前記第4のシンタックス要素セットの値が0に等しいように推論されることを指定する、請求項13に記載の方法。
  15. 前記ビデオピクチャの前記色フォーマットが4:0:0であるとき、前記第4のシンタックス要素セットは前記ビットストリームに存在しない、請求項13又は請求項14に記載の方法。
  16. 前記コンバージョンは、前記ビデオを前記ビットストリームに符号化することを含む、請求項1乃至15のうちいずれか1項に記載の方法。
  17. 前記コンバージョンは、前記ビットストリームから前記ビデオを復号することを含む、請求項1乃至15のうちいずれか1項に記載の方法。
  18. プロセッサと、命令を有する非一時的メモリとを含む、ビデオデータを処理する装置であって、前記命令は、前記プロセッサにより実行されると、前記プロセッサに、
    ルールに従ってビデオと前記ビデオのビットストリームとの間のコンバージョンを実行させ、
    前記ルールは、クロマ成分のためのコーディングツールオフセットに関する第1のフラグが前記ビットストリームにおけるピクチャパラメータセット(PPS)に含まれることを指定し、
    前記ルールはさらに、第1のクロマデブロッキングパラメータオフセットを指定する第1のシンタックス要素セットが前記ビットストリームにおける前記PPSに含まれるかどうかが、前記第1のフラグの値に基づいて決定されることを指定し、
    前記ルールはさらに、前記ビデオのビデオピクチャのための第2のクロマデブロッキングパラメータオフセットを指定する第2のシンタックス要素セットが前記PPSを参照するピクチャヘッダに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定し、
    前記ルールはさらに、前記ビデオピクチャのスライスのための第3のクロマデブロッキングパラメータオフセットを指定する第3のシンタックス要素セットが前記PPSを参照するスライスヘッダに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定し、
    前記第1のフラグの前記値は、前記ビデオピクチャの色フォーマットに関する、装置。
  19. 命令を記憶する非一時的コンピュータ読取可能記憶媒体であって、前記命令はプロセッサに、
    ルールに従ってビデオと前記ビデオのビットストリームとの間のコンバージョンを実行させ、
    前記ルールは、クロマ成分のためのコーディングツールオフセットに関する第1のフラグが前記ビットストリームにおけるピクチャパラメータセット(PPS)に含まれることを指定し、
    前記ルールはさらに、第1のクロマデブロッキングパラメータオフセットを指定する第1のシンタックス要素セットが前記ビットストリームにおける前記PPSに含まれるかどうかが、前記第1のフラグの値に基づいて決定されることを指定し、
    前記ルールはさらに、前記ビデオのビデオピクチャのための第2のクロマデブロッキングパラメータオフセットを指定する第2のシンタックス要素セットが前記PPSを参照するピクチャヘッダに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定し、
    前記ルールはさらに、前記ビデオピクチャのスライスのための第3のクロマデブロッキングパラメータオフセットを指定する第3のシンタックス要素セットが前記PPSを参照するスライスヘッダに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定し、
    前記第1のフラグの前記値は、前記ビデオピクチャの色フォーマットに関する、非一時的コンピュータ読取可能記憶媒体。
  20. デオのビットストリームを保管する方法であって、
    ールに従って前記ビデオのビットストリームを生成するステップ
    前記ビットストリームを非一時的コンピュータ読取可能記憶媒体に保管するステップと、を含み、
    前記ルールは、クロマ成分のためのコーディングツールオフセットに関する第1のフラグが前記ビットストリームにおけるピクチャパラメータセット(PPS)に含まれることを指定し、
    前記ルールはさらに、第1のクロマデブロッキングパラメータオフセットを指定する第1のシンタックス要素セットが前記ビットストリームにおける前記PPSに含まれるかどうかが、前記第1のフラグの値に基づいて決定されることを指定し、
    前記ルールはさらに、前記ビデオのビデオピクチャのための第2のクロマデブロッキングパラメータオフセットを指定する第2のシンタックス要素セットが前記PPSを参照するピクチャヘッダに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定し、
    前記ルールはさらに、前記ビデオピクチャのスライスのための第3のクロマデブロッキングパラメータオフセットを指定する第3のシンタックス要素セットが前記PPSを参照するスライスヘッダに含まれるかどうかが、前記第1のフラグの前記値に基づいて決定されることを指定し、
    前記第1のフラグの前記値は、前記ビデオピクチャの色フォーマットに関する、
    方法
JP2022547711A 2020-02-05 2021-02-05 クロマ成分のためのデブロッキングパラメータ Active JP7451731B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2020074316 2020-02-05
CNPCT/CN2020/074316 2020-02-05
PCT/CN2021/075443 WO2021155834A1 (en) 2020-02-05 2021-02-05 Deblocking parameters for chroma component

Publications (2)

Publication Number Publication Date
JP2023513519A JP2023513519A (ja) 2023-03-31
JP7451731B2 true JP7451731B2 (ja) 2024-03-18

Family

ID=77200586

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022547711A Active JP7451731B2 (ja) 2020-02-05 2021-02-05 クロマ成分のためのデブロッキングパラメータ

Country Status (6)

Country Link
US (1) US11800155B2 (ja)
EP (1) EP4088464A4 (ja)
JP (1) JP7451731B2 (ja)
KR (1) KR20220131250A (ja)
CN (1) CN115152221A (ja)
WO (1) WO2021155834A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021167830A1 (en) * 2020-02-21 2021-08-26 Alibaba Group Holding Limited Methods for processing chroma signals
US20230087875A1 (en) * 2020-02-26 2023-03-23 Hfi Innovation Inc. Methods and Apparatuses of Loop Filter Parameter Signaling in Image or Video Processing System
US20230134652A1 (en) * 2020-03-18 2023-05-04 Sharp Kabushiki Kaisha Systems and methods for applying deblocking filters in video coding
JP2021158633A (ja) * 2020-03-30 2021-10-07 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
EP4131971A4 (en) * 2020-04-02 2024-04-17 LG Electronics, Inc. IMAGE CODING METHODS BASED ON CHROMA DEBLOCKING PARAMETER INFORMATION FOR SINGLE COLOR FORMAT IN A VIDEO OR IMAGE CODING SYSTEM

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9451258B2 (en) * 2012-04-03 2016-09-20 Qualcomm Incorporated Chroma slice-level QP offset and deblocking
US9756327B2 (en) * 2012-04-03 2017-09-05 Qualcomm Incorporated Quantization matrix and deblocking filter adjustments for video coding
US11330297B2 (en) 2014-08-19 2022-05-10 Qualcomm Incorporated Methods incorporating extensions to copy-above mode for palette mode coding
US20160234498A1 (en) 2015-02-05 2016-08-11 Sharp Laboratories Of America, Inc. Methods and systems for palette table coding
WO2019216710A1 (ko) 2018-05-10 2019-11-14 삼성전자주식회사 영상의 부호화 및 복호화를 위한 영상의 분할 방법 및 장치
KR102627814B1 (ko) 2018-06-29 2024-01-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 룩업 테이블의 업데이트: fifo, 제약된 fifo
CN110662063B (zh) 2018-06-29 2020-12-15 北京字节跳动网络技术有限公司 视频处理方法、装置和计算机可读存储介质
TWI752331B (zh) 2018-06-29 2022-01-11 大陸商北京字節跳動網絡技術有限公司 當向Merge/AMVP添加HMVP候選時的部分/完全修剪
WO2020016745A2 (en) 2018-07-14 2020-01-23 Beijing Bytedance Network Technology Co., Ltd. Extension of look-up table based motion vector prediction with temporal information
US10848787B2 (en) 2018-08-28 2020-11-24 Google Llc Lossy image compression using palettization of locally mixed colors
US11025905B2 (en) 2018-09-14 2021-06-01 Tencent America LLC Method and device for decoding with palette mode
AU2020224256A1 (en) 2019-02-24 2021-09-09 Beijing Bytedance Network Technology Co., Ltd. Independent coding of palette mode usage indication
WO2020182113A1 (en) 2019-03-10 2020-09-17 Beijing Bytedance Network Technology Co., Ltd. Combined screen content coding mode
JP2023510535A (ja) * 2020-01-10 2023-03-14 サムスン エレクトロニクス カンパニー リミテッド 量子化パラメータを獲得するためのビデオ復号方法及びその装置、量子化パラメータを伝送するためのビデオ符号化方法及びその装置
US11184632B2 (en) 2020-01-20 2021-11-23 Tencent America LLC Method and apparatus for palette based coding mode under local dual tree structure

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Hai Wei Sun, et al.,"AHG9: On signaling of deblocking parameters for coding monochrome pictures",Document: JVET-R0078, [online],JVET-R0078 (version 1),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2020年04月02日,Pages 1-6,[令和6年1月29日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=9722> and <URL: https://jvet-experts.org/doc_end_user/documents/18_Alpbach/wg11/JVET-R0078-v1.zip>.,(See document file "JVET-R0078.docx" in the zip file "JVET-R0078-v1.zip".)
Jizheng Xu, et al.,"Chroma deblocking parameters based on chroma coding tools",Document: JVET-R0077-v1, [online],JVET-R0077 (version 1),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2020年04月02日,Pages 1-3,[令和6年1月29日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=9721> and <URL: https://jvet-experts.org/doc_end_user/documents/18_Alpbach/wg11/JVET-R0077-v1.zip>.,(See document file "JVET-R0077-v1.docx" in the zip file "JVET-R0077-v1.zip".)
Ling Li, et al.,"AHG12: Signaling of chroma presence in PPS and APS",Document: JVET-Q0420-v1, [online],JVET-Q0420 (version 1),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2020年01月01日,Pages 1-3,[令和6年1月29日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=9245> and <URL: https://jvet-experts.org/doc_end_user/documents/17_Brussels/wg11/JVET-Q0420-v1.zip>.,(See document file "JVET-Q0420-v1.docx" in the zip file "JVET-Q0420-v1.zip".)
Ye-Kui Wang,"AHG9: A summary of proposals on chroma deblocking tc and β offsets signalling",Document: JVET-R0338-v3, [online],JVET-R0338 (version 3),Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,2020年04月04日,Pages 1-5,[令和6年1月29日検索], インターネット, <URL: https://jvet-experts.org/doc_end_user/current_document.php?id=9982> and <URL: https://jvet-experts.org/doc_end_user/documents/18_Alpbach/wg11/JVET-R0338-v3.zip>.,(See document file "JVET-R0338-v3.docx" in the zip file "JVET-R0338-v3.zip".)

Also Published As

Publication number Publication date
JP2023513519A (ja) 2023-03-31
KR20220131250A (ko) 2022-09-27
CN115152221A (zh) 2022-10-04
WO2021155834A1 (en) 2021-08-12
EP4088464A1 (en) 2022-11-16
US11800155B2 (en) 2023-10-24
EP4088464A4 (en) 2023-06-07
US20220400293A1 (en) 2022-12-15

Similar Documents

Publication Publication Date Title
JP7494289B2 (ja) 異なるパーティション構造をもつパレット・モード
JP7451731B2 (ja) クロマ成分のためのデブロッキングパラメータ
US11503344B2 (en) Entropy coding for palette escape symbol
KR20220115965A (ko) 비디오 코딩을 위한 일반적인 제약 정보
US11563946B2 (en) Quantization parameter derivation for palette mode
US20240107037A1 (en) Palette Mode For Local Dual Tree
WO2021108787A1 (en) Dictionary based coding of video data
CN114424545B (zh) 用于调色板模式的量化参数推导
JP2024096202A (ja) パレット・モードのための量子化パラメータ導出

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220816

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240306

R150 Certificate of patent or registration of utility model

Ref document number: 7451731

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150