JP2022525961A - ビデオ・データを符号化又は復号化する方法、装置及びコンピュータ・プログラム - Google Patents

ビデオ・データを符号化又は復号化する方法、装置及びコンピュータ・プログラム Download PDF

Info

Publication number
JP2022525961A
JP2022525961A JP2021556786A JP2021556786A JP2022525961A JP 2022525961 A JP2022525961 A JP 2022525961A JP 2021556786 A JP2021556786 A JP 2021556786A JP 2021556786 A JP2021556786 A JP 2021556786A JP 2022525961 A JP2022525961 A JP 2022525961A
Authority
JP
Japan
Prior art keywords
slice
type
syntax element
coded
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021556786A
Other languages
English (en)
Other versions
JP7329066B2 (ja
Inventor
リ,リン
シュイ,シアオジョォン
チョイ,ビョンドゥ
リ,シアン
ウェンジャー,ステファン
リィウ,シャン
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2022525961A publication Critical patent/JP2022525961A/ja
Priority to JP2023088324A priority Critical patent/JP7551841B2/ja
Application granted granted Critical
Publication of JP7329066B2 publication Critical patent/JP7329066B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビデオ・データを符号化又は復号化する方法、コンピュータ・プログラム、及びコンピュータ・システムは、コーディングされるピクチャのすべてのスライスに対するスライスのタイプを、シンタックス要素を用いて指示し、シンタックス要素は符号なし整数を用いてコーディングされる。

Description

関連出願の相互参照
本願は、2019年12月19日付で出願された米国仮特許出願第62/950,453号、及び2020年9月21日付で出願された米国特許出願第17/026,748号に基づく優先権を主張しており、それらの全体が本願に援用される。
技術分野
本開示は一般に符号化/復号化に関連し、概して、HEVC (High Efficiency Video Coding)を越える次世代ビデオ・コーディング技術、例えば、多用途ビデオ・コーディング (Versatile Video Coding,VVC)を説明している。より具体的には、本開示は一般にピクチャ・ヘッダ処理に関する方法及び装置に関連する。
背景技術
提案されるVVCドラフト7は、ピクチャ・ヘッダと呼ばれるハイ・レベル・シンタックス (High Level Syntax,HLS)を含んでおり、これは、例えば、ピクチャのすべてのスライスに対して同じ値を有するように制約されているスライス・ヘッダにおいてシンタックス要素にシグナリングすることを回避するために、コーディングされるピクチャのすべてのスライスに適用するシンタックス要素を含む。
ピクチャ・パラメータ・セット
HLSは、下位レベルのコーディング・ツールに適用できるシンタックス要素を指定する。例えば、コーディング・ツリー・ユニット(Coding Tree Unit,CTU)サイズは、シーケンス・レベル、又はシーケンス・パラメータ・セット (Sequence Parameter Set,SPS)で指定されてもよく、一般に、ピクチャ毎には変化しない。典型的なHLSは、SPS、ピクチャ・パラメータ・セット (Picture Parameter Set,PPS)、ピクチャ・ヘッダ (Picture Header,PH)、スライス・ヘッダ (Slice Header,SH)、及び適応パラメータ・セット (Adaptive Parameter Set,APS)を含む。
様々なHLSはアプリケーションのレベルを含み、その結果、一般に使用されるシンタックス要素は繰り返してコーディングされることを要としない。例えば、SPSは、シーケンス・レベルに適用可能なジェネラル・シンタックス要素を指定する。PHはコーディングされるピクチャに適用可能なジェネラル・シンタックス要素を指定し、そのピクチャは1つ以上のスライスで構成されることが可能である。
VVCドラフト7のPPSに含まれるシンタックス要素は次のように記述される:
表1:VVCドラフト7のPPSに含まれるシンタックス要素
Figure 2022525961000002

Figure 2022525961000003

Figure 2022525961000004
上記の表1に示されるように、num_slices_in_pic_minus1プラス1は、PPSを参照する各ピクチャの矩形スライスの数を指定する。num_slices_in_pic_minus1の値は、両端を含む0からMaxSlicesPerPicture-1のレンジ内にある。no_pic_partition_flagが1に等しい場合、num_slices_in_pic_minus1の値は0に等しいと推測されることが可能である。
上記表1に示されるように、0に等しいpps_mvd_l1_zero_idcは、シンタックス要素mvd_l1_zero_flagが、PPSを参照するPHに存在することを指定する。また、1又は2に等しいpps_mvd_l1_zero_idcは、mvd_l1_zero_flagが、PPSを参照するPHに存在しないことを指定する。更に、3に等しいpps_mvd_l1_zero_idcは、ITU-T|ISO/IECによる将来の使用のために予約されている。
上記表1に示されるように、0に等しいpps_collocated_from_l0は、シンタックス要素collocated_from_10_flagが、PPSを参照するスライスのスライス・ヘッダに存在することを指定する。また、1又は2に等しいpps_collocated_from_l0_idcは、シンタックス要素collocated_from_10_flagが、PPSを参照するスライスのスライス・ヘッダに存在しないことを指定する。更に、3に等しいpps_collocated_from_l0_idcは、ITU-T|ISO/IECによる将来の使用のために予約されている。
上記表1に示されるように、0に等しいpps_six_minus_max_num_merge_cand_plus1は、pic_six_minus_max_num_merge_candが、PPS を参照するPHS に存在することを指定する。また、0より大きいpps_six_minus_max_num_merge_cand_plus1は、pic_six_minus_max_num_merge_candが、PPS を参照するPHS に存在しないことを指定する。pps_six_minus_max_num_merge_cand_plus1の値は、両端を含む0から6のレンジ内にある。
上記表1に示されるように、0に等しいpps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は、pic_max_num_merge_cand_minus_max_num_triangle_cand
が、PPSを参照するスライスのPHに存在することを指定する。また、0より大きいpps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は、pic_max_num_merge_cand_minus_max_num_triangle_cand
が、PPSを参照するPHに存在しないことを指定する。pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1の値は、0からMaxNumMergeCand-1のレンジ内にある。
スライス・レイヤRBSP
スライス・レイヤRBSPは、スライス・ヘッダ及びスライス・データから構成されることが可能である。
表2:スライス・レイヤRBSP
Figure 2022525961000005
ピクチャ・ヘッダ及びスライス・ヘッダ
PPSにおいてコーディングされる、現在のピクチャが参照するシンタックス要素は、PPSを参照するPHにおけるpic_deblocking_filter_override_flag又はPPSを参照するSHにおけるslice_deblocking_filter_override_flagが設定されるように、PH及びSHにおいて上書きされる可能性がある。PHに存在しないこれらのシンタックス要素は、代わりにSHに存在してもよい。例えば、PHにおいて、SAO関連のシンタックス要素の存在を指定している、pic_sao_enabled_present_flagの値が0である場合、slice_sao_luma_flag及びslice_sao_croma_flagは、ルマ及びクロマにおけるSAOの使用を示すために、SHにおいてコーディングされてもよい。
PHを使用すると、シグナリング・オーバーヘッドを回避するために、特にピクチャ内に少数のスライスしか存在しない場合に、ピクチャのすべてのスライスで同じになるように既に制約されるシンタックス要素が、ピクチャごとにPHで送信されることが可能である。それでもなお、しばしばスライスごとに異なるシンタックス要素が、柔軟性を提供するためにSHで伝達されることが可能である。
VVCドラフト7のPH及びSHに含まれるシンタックス要素は、以下の表3及び表5に記述される。
表3:ジェネラル・スライス・ヘッダ・シンタックス
Figure 2022525961000006

Figure 2022525961000007

Figure 2022525961000008

Figure 2022525961000009

Figure 2022525961000010

Figure 2022525961000011

Figure 2022525961000012

Figure 2022525961000013
上記及び下記に示されるように、スライス・タイプは以下の表4に従ってスライスのコーディング・タイプを指定することが可能である:
表4: slice_type
Figure 2022525961000014
アクセス・ユニット・デリミタ
アクセス・ユニット(Access Unit,AU)デリミタは、AUデリミタ・ネットワーク抽象レイヤ(Network
Abstraction Layer,NAL)ユニットを含むAU内のコーディングされたピクチャに存在するスライスのタイプとAUの開始を示すために使用される。現在、AUデリミタに関連する規範的な復号化プロセスは存在しない。
pic_typeは、AUデリミタNALユニットを含むAU内のコーディングされたピクチャのすべてのスライスに対するslice_typeの値が、pic_typeの所与の値に対する表4にリストされたセットのメンバであることを示す。pic_typeの値はビットストリームで0、1、又は2に等しい可能性がある。pic_typeの他の値は、ITU-T|ISO/IECによる将来の使用のために予約されている。このバージョンに準拠するデコーダは、pic_typeの予約値を無視することが可能である。
表5:pic_typeの解釈
Figure 2022525961000015
非特許文献[1](「NPL 1」)は、カバーされた低レベル・コーディング・レイヤに対して一群のパラメータが必要とされることを示すために、ハイ・レベル制御フラグを提案している。
NPL 1は、少なくとも1つのインター・コーディングされるスライスが存在する場合、又はピクチャ内にサブ・パーティションが存在する場合にのみ、すべてのインター予測関連のシンタックス要素又はパラメータがシグナリングされることを必要とする方法を述べている。そうでない場合、これらのシンタックス要素又はパラメータはシグナリングされない。
NPL 1に記載されている一実施形態では、ピクチャ内のすべてのスライス(又はこのピクチャの任意の種類のサブ・パーティション)が、イントラ予測(又は非インター関連予測)のみを有するかどうかを示すために、pic_intra_only_flagと呼ばれるピクチャ・ヘッダ内の制御フラグがシグナリングされる。このフラグが真である場合、イントラ・コーディング関連シンタックス要素又はパラメータのみが、ピクチャ・ヘッダで後にシグナリングされる。そうではなく、このフラグが偽である場合、インター予測関連シンタックス要素又はパラメータがシグナリングされる。この実施形態を反映するシンタックス・テーブルは以下のように与えられる:
表6:NPL 1の第1実施形態
Figure 2022525961000016

Figure 2022525961000017
NPL 1の別の方法では、イントラ・スライス又はイントラ・サブ・パーティションのみに使用されるすべての関連するシンタックス要素又はパラメータは、インター・コーディングされるスライスが存在しない場合、又はサブ・パーティションがピクチャ内に存在する場合にシグナリングされることを必要とする。そうでない場合、これらのシンタックス要素又はパラメータはシグナリングされない。
NPL 1の別の実施形態では、ピクチャ内のすべてのスライス(又はこのピクチャの任意の種類のサブ・パーティション)が、インター予測(又は非イントラ関連予測)を有するかどうかを示すために、pic_inter_only_flagと呼ばれるピクチャ・ヘッダ内の制御フラグがシグナリングされる。このフラグが真である場合、イントラ・スライス関連シンタックス要素又はパラメータは、ピクチャ・ヘッダで後にシグナリングされない。そうでない場合、このフラグが偽である場合、イントラ・スライスが、ピクチャ内のスライス又はサブ・パーティションのうちの少なくとも1つで 使用されることが可能である。イントラ・スライス又はサブ・パーティションの関連するシンタックス要素又はパラメータは、シグナリングされるであろう。この実施形態を反映するシンタックス・テーブルは以下に与えられる:
表7:NPL 1の第2実施形態
Figure 2022525961000018
NPL 1に記載されている上記の方法では、ピクチャが、イントラ・ピクチャ又はインター・ピクチャであるような自身のタイプを有する場合には、上記の制御フラグpic_intra_only_flag及びpic_inter_only_flagはシグナリングされることを必要とせず、それらの値はピクチャ・タイプから導出することが可能である。
また、現在のピクチャがイントラ・オンリー・ピクチャのようなピクチャ・タイプを有する場合(ピクチャ内のすべてのスライスがIスライスである場合)、pic_intra_only_flagはtrueとして推測されることが可能である。別の例では、現在のピクチャがピクチャ・タイプをインター・オンリー・ピクチャのようなピクチャ・タイプを有する場合(ピクチャ内のすべてのスライスがP又はBスライスである場合)、pic_inter_only_flagはtrueとして推論されることが可能である。NPL 1の更に別の例では、現在のピクチャが、イントラ・スライス及びインター・スライス両方がピクチャ内で可能であることを示すピクチャ・タイプを有する場合、pic_intra_only_flag及びpic_inter_only_flag双方がfalseとして推測されることが可能である。
問題点
ピクチャ内のスライスに共通するシンタックス要素をシグナリングすることを回避するためにピクチャ毎に1回だけPHがシグナリングされるかもしれないが、このシグナリングは、イントラ・スライス(Iスライス)又はインター・スライス(B,Pスライス)に対してのみ使用されるシンタックス要素を考慮することなく、むしろオーバーヘッドを導入する可能性がある。
実施形態は、ビデオ符号化/復号化のための方法、システム、及びコンピュータ読み取り可能な媒体、より具体的にはピクチャ・ヘッダ処理に関連する。
これら及び他の目的、特徴及び利点は、添付図面に関連して読める例示的な実施形態の以下の詳細な説明から明らかになるであろう。図面の種々の特徴は、図面が、詳細な説明に関連して当業者の理解を促す際に明確化を図るためのものであるので、正確なスケールではない。
実施形態による通信システムの簡略化されたブロック図の概略図である。
実施形態による通信システムの簡略化されたブロック図の概略図である。
実施形態によるコンピュータ・システムの概略図である。
図1は、本開示の実施形態による通信システム(100)の簡略化されたブロック図を示す。システム(100)は、ネットワーク(150)を介して相互接続された少なくとも2つの端末(110-120)を含んでもよい。データの一方向伝送のために、第1端末(110)は、ネットワーク(150)を介する他方の端末(120)への伝送のために、ローカルな位置でビデオ・データをコーディングすることができる。第2端末(120)は、他方の端末のコーディングされたビデオ・データをネットワーク(150)から受信し、コーディングされたデータを復号化し、復元されたビデオ・データを表示することができる。一方向性データ伝送は、媒体サービング・アプリケーション等において一般的である。
図1は、例えば、ビデオカンファレンス中に生じる可能性のあるコーディングされたビデオの双方向伝送をサポートするために提供される第2ペアの端末(130,140)を示す。データの双方向伝送のために、各端末(130,140)は、ローカルな位置でキャプチャされたビデオ・データを、ネットワーク(150)を介して他方の端末へ伝送するためにコーディングすることができる。各端末(130,140)はまた、他方の端末によって送信されたコーディングされたビデオ・データを受信することが可能であり、コーディングされたデータを復号することが可能であり、復元されたビデオ・データをローカル表示デバイスで表示することが可能である。
図1において、端末(110-140)は、サーバー、パーソナル・コンピュータ及びスマート・フォンとして図示されているかもしれないが、本開示の原理はそれに限定されなくてよい。本開示の実施形態は、ラップトップ・コンピュータ、タブレット・コンピュータ、メディア・プレーヤ、及び/又は専用のビデオ会議装置を伴う応用を見出している。ネットワーク(150)は、例えば、有線及び/又は無線通信ネットワークを含む、コーディングされたビデオ・データを端末(110-140)間で運ぶ任意数のネットワークを表す。通信ネットワーク(150)は、回線交換及び/又はパケット交換チャネル内のデータを交換することができる。代表的なネットワークは、通信ネットワーク、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク及び/又はインターネットを含む。本説明の目的のために、ネットワーク(150)のアーキテクチャ及びトポロジーは、以下に説明しない限り、本開示の動作には重要ではない可能性がある。
図2は、開示される対象事項の適用例として、ストリーミング環境におけるビデオ・エンコーダ及びデコーダの配置を示す。開示される対象事項は、例えば、ビデオ会議、デジタルTV、CD、DVD、メモリ・スティック等を含むデジタル・メディアにおける圧縮ビデオの記憶などを含む、他のビデオ対応アプリケーションに等しく適用可能であるとすることが可能である。
ストリーミング・システムは、例えば非圧縮ビデオ・サンプル・ストリーム(202)を生成する、例えばデジタル・カメラのようなビデオ・ソース(201)を含むことが可能なキャプチャ・サブシステム(213)を含んでもよい。このサンプル・ストリーム(202)は、符号化されたビデオ・ビットストリームと比較した場合に、多くのデータ量を強調するための太いラインとして示されており、これはカメラ(201)に結合されたエンコーダ(203)によって処理されることが可能である。エンコーダ(203)は、ハードウェア、ソフトウェア、又はそれらの組み合わせを含み、以下でより詳細に説明されるように、開示される対象事項の態様を動作可能にする又は実現することが可能である。サンプル・ストリームと比較した場合、より少ないデータ量を強調するために細いラインとして示される符号化されたビデオ・ビットストリーム(204)は、将来の使用のためにストリーミング・サーバー(205)に格納されることが可能である。1つ以上のストリーミング・クライアント(206,208)は、ストリーミング・サーバー(205)にアクセスして、符号化されたビデオ・ビットストリーム(204)のコピー(207,209)を取り出すことができる。クライアント(206)はビデオ・デコーダ(210)を含むことが可能であり、ビデオ・デコーダは、符号化されたビデオ・ビットストリーム(207)の到来するコピーを復号化し、ディスプレイ(212)又は他のレンダリング・デバイス(図示せず)上でレンダリングされることが可能な出力ビデオ・サンプル・ストリーム(211)を生成する。幾つかのストリーミング・システムでは、ビデオ・ビットストリーム(204,207,209)は、特定のビデオ・コーディング/圧縮規格に従って符号化されることが可能である。これらの規格の例は、ITU-T勧告H.265を含む。開発中のものは、多用途ビデオ・コーディング(VVC)として非公式に知られているビデオ・コーディング規格である。開示される対象事項は、VVCの文脈で使用することができる。
実施形態において、シンタックス要素pic_type_idcは、コーディングされたピクチャのすべてのスライスに対するスライス・タイプを示すために使用されることが可能である。
実施形態において、pic_type_idcは、符号なし整数0次Exp-Golombコーディングされたシンタックス要素(左ビットが先頭)を用いて、コーディングされることが可能である。ここで、pic_type_idcは、3つの値0、1、及び2の値と、Iスライスのみ、B、P、Iスライス、及びB、Pスライスの3つのステータスを有することが可能である。値は、任意の順序でステータスにマッピングされることが可能である。以下の表8は、可能なpic_type_idcセマンティクスの例を示す。
表8:可能なpic_type_idcセマンティクスの例
Figure 2022525961000019
実施形態において、pic_type_idcは、2ビットを用いる符号なし整数を用いてコーディングされてもよい。ここで、pic_type_idcは、3つの値0、1、及び2と、3つのステータス:Iスライスのみ、B、P、Iスライス、及びB、Pスライスとを有することが可能であるが、必ずしもこれらに限定されない。pic_type_idcの他の値は、更なる定義のために予約されてもよい。
表9:可能なpic_type_idcセマンティクスの例
Figure 2022525961000020
実施形態において、予約されたpic_type_idc値3は、コーディングされたピクチャに存在するP、Iスライスのみを示すことが可能である。
一例において、pic_type_idcは、例えば2ビットを用いる符号なし整数を用いてコーディングされてもよい。また、pic_type_idcは、4つの値0、1、2及び3と、4つのステータス:Iスライスのみ、B、P、Iスライス、Bスライス、Pスライスとを有することが可能である。
表10:可能なpic_type_idcセマンティクスの例
Figure 2022525961000021
関連するシンタックス要素のみがコーディングされ又は存在してシグナリング・オーバーヘッドを削減するように、HLSでpic_type_idcをシグナリングすることが提案される。例えば、pic_type_idcがピクチャはイントラのみであることを示している場合、インター関連シンタックス要素はシグナリングされない。
一例において、pic_type_idcは、それがPPSを参照するコーディングされる各ピクチャのすべてのスライスに対するスライス・タイプを指定するように、PPSにおいてシグナリングされてもよい。詳細なシンタックス及びセマンティクスは以下に与えられる。以下の表及び本開示における他のテーブルにおいて、VVCドラフト7と比較した場合の変更箇所は、イタリック体にされている。
表11:詳細なシンタックス及びセマンティクス
Figure 2022525961000022

Figure 2022525961000023

Figure 2022525961000024

Figure 2022525961000025
ここで、pic_type_idcは、PPSを参照する各コーディングされるピクチャのすべてのスライスに対するスライス・タイプを指定する。
一実施形態において、1に等しく設定されるpic_type_idcは、PPSを参照する各コーディングされるピクチャが、1つ以上のIスライスのみを有することを示す。このような場合、シンタックス要素pps_mvd_l1_zero_idc,pps_collocated_from_l0_idc, pps_six_minus_max_num_merge_cand_plus1及び pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1に関連するインター・スライス(B,Pスライス)は、0に等しいと推測される。
ここで、0に等しいpps_mvd_l1_zero_idcは、シンタックス要素mvd_l1_zero_flagが、PPSを参照するPHに存在することを指定する。また、1又は2に等しいpps_mvd_l1_zero_idcは、mvd_l1_zero_flagが、PPSを参照するPHに存在しないことを指定する。更に、3に等しいpps_mvd_l1_zero_idcは、ITU-T|ISO/IECによる将来の使用のために予約される。存在しない場合、pps_mvd_l1_zero_idcは0であると推測されてもよい。
更に、0に等しいpps_collocated_from_l0_idcは、シンタックス要素collocated_from_l0_flagが、PPSを参照するスライスのスライス・ヘッダに存在することを指定する。また、1又は2に等しいpps_collocated_from_l0_idcは、シンタックス要素pps_collocated_from_l0_flagが、PPSを参照するスライスのスライス・ヘッダに存在しないことを指定する。3に等しいpps_collocated_from_l0_idcは、ITU-T|ISO/IECによる将来の使用のために予約される。存在しない場合、pps_collocated_from_l0_idcは0に等しいと推測されてもよい。
また、0に等しいpps_six_minus_max_num_merge_cand_plus1は、pic_six_minus_max_num_merge_candが、PPSを参照するPHに存在することを指定する。更に、0に等しいpps_six_minus_max_num_merge_cand_plus1は、pic_six_minus_max_num_merge_candが、PPSを参照するPHに存在しないことを指定する。pps_six_minus_max_num_merge_cand_plus1の値は0から6のレンジ内にある。存在しない場合、pps_six_minus_max_num_merge_cand_plus1は0に等しいと推測することが可能である。
示されているように、0に等しいpps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は、pic_max_num_merge_cand_minus_max_num_triangle_candが、PPSを参照するスライスのPHに存在することを指定する。また、0より大きなpps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は、pic_max_num_merge_cand_minus_max_num_triangle_candが、PPSを参照するスライスのPHに存在しないことを指定する。pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1の値は、0からMaxNumMergeCand-1のレンジ内にある。存在しない場合、pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は、0に等しいと推測することが可能である。
表12:提案されるピクチャ・ヘッダRBSPシンタックス
Figure 2022525961000026

Figure 2022525961000027

Figure 2022525961000028

Figure 2022525961000029

Figure 2022525961000030

Figure 2022525961000031
PPSを参照する各コーディングされるピクチャに対して、pic_type_idcは、イントラ・スライス(Iスライス)及びインター・スライス(B,Pスライス)に関連するシンタックス要素を解析するかどうかを決定するために使用される。例えば、イントラ・スライス関連シンタックス要素pic_log2_diff_min_qt_min_cb_intra_slice_luma,
pic_max_mtt_hierarchy_depth_intra_slice_luma,
pic_log2_diff_max_bt_min_qt_intra_slice_luma,
pic_log2_diff_max_tt_min_qt_intra_slice_luma,
pic_log2_diff_min_qt_min_cb_intra_slice_chroma,
pic_max_mtt_hierarchy_depth_intra_slice_chroma,
pic_log2_diff_max_bt_min_qt_intra_slice_chroma及び
pic_log2_diff_max_tt_min_qt_intra_slice_chromaは、PHに関連するIスライスのみが存在する場合に限って常に復号化される。一方、インター・スライス関連シンタックス要素は、インター・スライスが存在する場合は常に復号化される。
一例において、pic_type_idc は、それがPH に関連付けられるコーディングされるピクチャのすべてのスライスに対するスライス・タイプを指定するように、PH でシグナリングされる。詳細なシンタックス及びセマンティクスは以下に与えられる。VVCドラフト7と比較した場合の変更箇所は、イタリック体にされている。
表13:提案されるピクチャ・ヘッダRBSPシンタックス
Figure 2022525961000032

Figure 2022525961000033

Figure 2022525961000034

Figure 2022525961000035

Figure 2022525961000036

Figure 2022525961000037
各コーディングされるピクチャに関し、pic_type_idcは、イントラ・スライス(Iスライス)及びインター・スライス(B,Pスライス)に関連するシンタックス要素を解析するかどうかを決定するために使用される。例えば、イントラ・スライス関連シンタックス要素pic_log2_diff_min_qt_min_cb_intra_slice_luma,
pic_max_mtt_hierarchy_depth_intra_slice_luma,pic_log2_diff_max_bt_min_qt_intra_slice_luma,pic_log2_diff_max_tt_min_qt_intra_slice_luma,pic_log2_diff_min_qt_min_cb_intra_slice_chroma,pic_max_mtt_hierarchy_depth_intra_slice_chroma,pic_log2_diff_max_bt_min_qt_intra_slice_chroma及び
pic_log2_diff_max_tt_min_qt_intra_slice_chromaは、PHに関連するIスライスのみが存在する場合に限って常に復号化される。一方、インター・スライス関連シンタックス要素は、インター・スライスが存在する場合は常に復号化される。
一実施形態において、pic_type_idcは、PPSを参照するPPS及びPH双方においてそれぞれpps_pic_type_idc及びph_pic_type_idcとして存在する可能性がある。
表14:提案されるピクチャ・パラメータ・セットRBSPシンタックス
Figure 2022525961000038

Figure 2022525961000039

Figure 2022525961000040

Figure 2022525961000041
ここで、pps_pic_type_idcは、PPSを参照する各コーディングされるピクチャのすべてのスライスに対するスライス・タイプを指定する。
また、0に等しいpps_mvd_l1_zero_idcは、シンタックス要素mvd_l1_zero_flagが、PPSを参照するPHに存在することを指定する。更に、1又は2に等しいpps_mvd_l1_zero_idcは、mvd_l1_zero_flagが、PPSを参照するPHに存在しないことを指定する。更に、3に等しいpps_mvd_l1_zero_idcは、ITU-T|ISO/IECによる将来の使用のために予約される。存在しない場合、pps_mvd_l1_zero_idcは0に等しいと推測されてもよい。
また、0に等しいpps_collocated_from_l0_idcは、シンタックス要素collocated_from_l0_flagが、PPSを参照するスライスのスライス・ヘッダに存在することを指定する。更に、1又は2に等しいpps_collocated_from_l0_idcは、シンタックス要素collocated_from_l0_flagが、PPSを参照するスライスのスライス・ヘッダに存在しないことを指定する。更に、3に等しいpps_collocated_from_l0_idcは、ITU-T|ISO/IECによる将来の使用のために予約される。存在しない場合、pps_collocated_from_l0_idcは0に等しいと推測されてもよい。
また、0に等しいpps_six_minus_max_num_merge_cand_plus1は、pic_six_minus_max_num_merge_candが、PPSを参照するPHに存在することを指定する。更に、0より大きいpps_six_minus_max_num_merge_cand_plus1は、pic_six_minus_max_num_merge_candが、PPSを参照するPHに存在しないことを指定する。pps_six_minus_max_num_merge_cand_plus1の値は、0から6のレンジ内にあるものとする。存在しない場合、pps_six_minus_max_num_merge_cand_plus1は0に等しいと推測されてもよい。
また、0に等しいpps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は、pic_max_num_merge_cand_minus_max_num_triangle_candが、PPSを参照するスライスのPHに存在することを指定する。更に、0より大きいpps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は、pic_max_num_merge_cand_minus_max_num_triangle_candが、PPSを参照するスライスのPHに存在しないことを指定する。pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1の値は、0からMaxNumMergeCand-1のレンジ内にあるものとする。存在しない場合、pps_max_num_merge_cand_minus_max_num_triangle_cand_plus1は0に等しいと推測することが可能である。
pps_pic_type_idcの値が1つのタイプのスライス(表10の値1、2、3のようなI又はB又はPスライス)の存在を示す場合、pps_pic_type_idcの値はpps_pic_type_idcの値から推測されてもよい。
表15:提案されるピクチャ・ヘッダRBSPシンタックス
Figure 2022525961000042

Figure 2022525961000043

Figure 2022525961000044

Figure 2022525961000045

Figure 2022525961000046

Figure 2022525961000047
ここでは、ph_pic_type_idcは、PHに関連付けられた各コーディングされるピクチャのすべてのスライスに対するスライス・タイプを指定する。
一実施形態において、1に等しいph_pic_type_idcは、PHに関連付けられる各コーディングされるピクチャが1つ以上のIスライスのみを有することを示す。
表16:可能なpic_type_idcセマンティクスの例
Figure 2022525961000048
pps_pic_type_idc が0に等しい場合(表10でのようなB,P,Iスライス)、ph_pic_type_idcの値は、両端を含む0から2のレンジを有する。そうではない場合、ph_pic_type_idcの値はpps_pic_type_idcから推測することが可能である(例えば,同一のもの)。この場合、ph_pic_type_idcの値がpps_pic_type_idc.のものに等しいということが、ビットストリーム適合性の要件である。
一例において、シンタックスph_pic_type_idcのシグナリングは、pps_pic_type_idcの値に依存する(例えば、それによって制約される)。pps_pic_type_idcの値が、コーディングされたピクチャ内にイントラ・スライス(Iスライス)及びインター・スライス(B,Pスライス)の両方の存在を示す場合、ph_pic_type_idcは、ピクチャ・ヘッダに関連付けられるそのピクチャに存在するスライス・タイプを示すために、シグナリングされる/解析されることを必要とする可能性がある。それ以外の場合、pps_pic_type_idcが1つのスライス・タイプのみの存在を示す場合、ph_pic_type_idcはシグナリング/解析されず、それはpps_pic_type_idcのスライス・タイプに等しい(例えば、同じものを有する)と推測される。この場合、ph_pic_type_idcのレンジはpps_pic_type_idcのレンジより大きくないということが、ビットストリーム適合性の要件である。
表17:提案されるピクチャ・ヘッダRBSPシンタックス
Figure 2022525961000049

Figure 2022525961000050

Figure 2022525961000051

Figure 2022525961000052

Figure 2022525961000053

Figure 2022525961000054
ここで、ph_pic_type_idcは、PHに関連付けられた各コーディングされるピクチャのすべてのスライスに対するスライス・タイプを指定する。また、pps_pic_type_idcが0に等しい場合、ph_pic_type_idcのみがビットストリームに存在する可能性がある。
更に、1に等しいph_pic_type_idcは、PHに関連付けられた各コーディングされたピクチャが1つ以上のIスライスのみを有することを示す。pps_pic_type_idcが0に等しい場合(表8でのようなB,P,Iスライス)、ph_pic_type_idcの値は両端を含む0から2のレンジを有する。そうではない場合、ph_pic_type_idcが存在しない場合、それは表8でのようにpps_ph_type_idcに等しいと推測される。
一実施形態では、PH関連シンタックス要素は、スライス・レイヤRBSP NALユニットに含まれ、ph_present_flagは、スライス・レイヤRBSP NALユニットにおけるPH関連シンタックスの存在を示すために使用される。PH関連シンタックス・シグナリングの繰り返しは、エラー・レジリエンス及びエラー・リカバリの利点を有する可能性がある。何らかの種類のネットワークにおける伝送中にPH NALユニットが破壊されると、スライス・レイヤRBSP NALユニットは、スライス・レイヤRBSP NALユニットにPHが存在することにより、エラーから復元することができる。VVCドラフト7との比較における変更箇所は、イタリック体にされている。
表18:提案されるスライス・レイヤRBSPシンタックス
Figure 2022525961000055
ここで、ph_present_flagは、スライス・レイヤRBSPにおけるPH関連シンタックスの存在を指定するために使用することができる。ph_present_flagが1に等しい場合、PH関連シンタックスが存在する。ph_present_flagが0に等しい場合、PH関連シンタックスはスライス・レイヤRBSPには存在しない。
一実施形態では、上述のようにAUデリミタにおいて復号化されるpic_typeが存在する場合、pic_type_idc、HLSにおけるシグナリングは、pic_type値から推測されるか、又はそれによって制約される可能性がある。
一実施形態において、pic_typeが表5での0に等しい場合(それはIスライスを示す)、pic_type_idcの値が、各ピクチャにイントラ・スライスのみが存在することを指定することは、ビットストリーム適合性の要件である。例えば、pic_type_idcが1であることに従う場合、イントラ・スライスのみが存在する。
一例において、pic_type_idcがpic_typeの値に制約される場合、pic_type_idcの値のレンジは、pic_typeの値に依存する可能性がある。例えば、pic_type_idcは、表10に記述される値を有し、pic_typeが1に等しい場合、pic_type_idcの値は、1又は3である可能性がある。別の場合において、pic_typieが2に等しい場合、pic_type_idcの値は0から3のレンジ内にある。
一実施形態において、pic_type_idcがHLSでシグナリングされる場合、上記の方法により、slice_typeが推測されることが可能である。
一例において、pic_type_idcが、イントラ・スライスのみが存在することを示す値を有する場合、slice_typeは2であると推測されることが可能である。
一例において、pic_type_idcが、インター・スライスのみが存在することを示す値を有する場合、slice_type の値は、両端を含む0から1のレンジを有する。例えば、pic_type_idcが2の値を有する場合(B,Pスライス)、slice_typeの可能な値は0及び1である。
一実施形態において、slice_typeの値は、値pic_type_idc及びnum_slices_in_pic_minus1から推測されることが可能である。
pic_type_idcの値がイントラ・スライス及びインター・スライスの両方が存在することを示す場合、num_slices_in_pic_minus1の値が1以上であることは、ビットストリーム適合性の要件である。
pic_type_idc の値が、イントラ・スライス及びインター・スライスの両方が、コーディングされたピクチャに存在することを示し、num_slices_in_pic_minus1 の値が1 以上である場合があり得る。
以前にコーディングされたすべてのスライスがインター・スライスである場合、最後のスライスは、2に等しいslice_type (Iスライス)のイントラ・スライスである可能性がある。
以前にコーディングされたすべてのスライスがイントラ・スライスである場合、最後のスライスは、両端を含む0から1のレンジ内のslice_type値を有するインター・スライスである可能性がある。
上記の提案される方法は処理回路(例えば、1つ以上のプロセッサ、又は1つ以上の集積回路)により実現されることが可能である。一例において、1つ以上のプロセッサは、1つ以上の提案される方法を実行するために、非一時的なコンピュータ読み取り可能な媒体に記憶されるプログラムを実行する。
上述した技術は、コンピュータ読み取り可能な命令を用いてコンピュータ・ソフトウェアとして実装することが可能であり、1つ以上のコンピュータ読み取り可能な媒体に物理的に記憶することが可能である。例えば、図3は、開示される対象事項の特定の実施形態を実現するのに適したコンピュータ・システム300を示す。
コンピュータ・ソフトウェアは、アセンブリ、コンパイル、リンク、又は類似のメカニズムの対象となり得る任意の適切なマシン・コード又はコンピュータ言語を使用してコーディングされて、コンピュータ中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)等によって、直接的に実行されることが可能な命令、又は解釈やマイクロコード実行などを経由する命令、を含むコードを作成することが可能である。
命令は、例えば、パーソナル・コンピュータ、タブレット・コンピュータ、サーバー、スマート・フォン、ゲーム・デバイス、モノのインターネット・デバイス等を含む、種々のタイプのコンピュータ又はそのコンポーネント上で実行されることが可能である。
コンピュータ・システム300について図3に示されるコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実現するコンピュータ・ソフトウェアの使用範囲又は機能性に関する如何なる制限も示唆するようには意図されていない。また、コンポーネントの構成は、コンピュータ・システム300の例示的な実施形態に示されたコンポーネントの任意の1つ又は組み合わせに関する何らかの従属性や要件を有するものとして解釈されるべきではない。
コンピュータ・システム300は、特定のヒューマン・インターフェース入力デバイスを含むことが可能である。このようなヒューマン・インターフェース入力デバイスは、例えば、触覚入力(例えば、キーストローク、スワイプ、データ・グローブの動き)、聴覚的な入力(例えば、声、拍手)、視覚的な入力(例えば、ジェスチャ)、嗅覚的な入力(図示されていない)を介して、1人以上の人間ユーザーによる入力に応答することが可能である。また、ヒューマン・インターフェース・デバイスは、オーディオ(例えば、会話、音楽、周囲音)、画像(例えば、スキャンされた画像、静止画像カメラから得られる写真画像)、ビデオ(例えば、2次元ビデオ、立体視ビデオを含む3次元ビデオ)のような、人間による意識的な入力に必ずしも直接的に関係しない特定のメディアを捕捉するために使用することが可能である。
入力ヒューマン・インターフェース・デバイスは、キーボード301、マウス302、トラックパッド303、タッチ・スクリーン310、関連するグラフィックス・アダプタ350、データ・グローブ、ジョイスティック305、マイクロホン306、スキャナ307、カメラ308のうちの1つ以上を(描かれているものはそれぞれ唯1つであるが)含む可能性がある。
コンピュータ・システム300は、特定のヒューマン・インターフェース出力デバイスを含むことも可能である。このようなヒューマン・インターフェース出力デバイスは、例えば、触覚出力、音、光、及び臭/味を通じて、1人以上の人間ユーザーの感覚を刺激することが可能である。このようなヒューマン・インターフェース出力デバイスは、触覚出力デバイス(例えば、タッチ・スクリーン310、データ・グローブ、ジョイスティック305による触覚フィードバックであるが、入力デバイスとして役立たない触覚フィードバック・デバイスが存在する可能性もある)、聴覚的な出力デバイス(例えば、スピーカー309、ヘッドフォン(不図示せず))、視覚的な出力デバイス(例えば、陰極線管(CRT)スクリーン、液晶ディスプレイ(LCD)スクリーン、プラズマ・スクリーン、有機発光ダイオード(OLED)スクリーンを含むスクリーン310であり、各々はタッチ・スクリーン入力機能を備えるか又は備えておらず、各々は触覚フィードバック機能を備えるか又は備えておらず、それらのうちの幾つかは、二次元的な視覚的な出力、立体視出力のような手段による三次元以上の出力を出力することが可能であってもよい;仮想現実メガネ(図示せず)、ホログラフィック・ディスプレイ、及びスモーク・タンク(図示せず))、及びプリンタ(図示せず)を含むことが可能である。
コンピュータ・システム300はまた、CD/DVD等の媒体321を使うCD/DVD ROM/RW_920を含む光媒体321、サム・ドライブ322、リムーバブル・ハード・ドライブ又はソリッド・ステート・ドライブ323、テープ及びフロッピー・ディスク等のレガシー磁気媒体(不図示)、セキュリティ・ドングル(不図示)等の特殊化されたROM/ASIC/PLDベースのデバイスのような、人間がアクセス可能な記憶デバイス及びそれらに関連する媒体を含むことも可能である。
当業者は、ここで開示される対象事項に関連して使用される用語「コンピュータ読み取り可能な媒体」は、伝送媒体、搬送波、又はその他の過渡的な信号を包含しないことも理解するはずである。
コンピュータ・システム300は、1つ以上の通信ネットワークへのインターフェースも含むことが可能である。ネットワークは、例えば、無線、有線、光であるとすることが可能である。ネットワークは、更に、ローカル、ワイド・エリア、メトロポリタン、車両及び産業、リアルタイム、遅延耐性などに関するものであるとすることが可能である。ネットワークの例は、イーサーネット、無線LAN、セルラー・ネットワーク(移動通信用グローバル・システム(GSM)、第3世代(3G)、第4世代(4G)、第5世代(5G)、ロング・ターム・エボリューション(LTE)等を含む)、TVの有線又は無線ワイド・エリア・デジタル・ネットワーク(ケーブルTV、衛星TV、及び地上放送TVを含む)、CANBusを含む車両及び産業などを含む。特定のネットワークは、一般に、特定の汎用データ・ポート又は周辺バス(349)に取り付けられる外部ネットワーク・インターフェース・アダプタ(354)を必要とする(例えば、コンピュータ・システム300のユニバーサル・シリアル・バス(USB)ポート);その他は、一般に、以下に説明するようなシステム・バスに取り付けることによって、コンピュータ・システム300のコアに共通に統合される(例えば、イーサーネット・インターフェースはPCコンピュータ・システム内に、セルラー・ネットワーク・インターフェースはスマートフォン・コンピュータ・システム内に統合される)。一例として、ネットワーク355はネットワーク・インターフェース354を利用して周辺バス349に接続されてもよい。これらのうちの任意のネットワークを使用して、コンピュータ・システム300は、他のエンティティと通信することが可能である。このような通信は、片方向受信専用(例えば、放送テレビ)、片方向送信専用(例えば、特定のCANbusデバイスに対するCANbus)、又は双方向、例えばローカル又はワイド・エリア・デジタル・ネットワークを使用する他のコンピュータ・システムに対するものであるとすることが可能である。特定のプロトコル及びプロトコル・スタックは、上述のように、それらのネットワーク及びネットワーク・インターフェースの各々で使用されることが可能である。
前述のヒューマン・インターフェース・デバイス、ヒューマン・アクセシブル・ストレージ・デバイス、及びネットワーク・インターフェースは、コンピュータ・システム300のコア340に取り付けられることが可能である。
コア340は、1つ以上の中央処理ユニット(CPU)341、グラフィックス処理デバイス(GPU)342、フィールド・プログラマブル・ゲート・エリア(FPGA)343の形式における特殊プログラマブル処理デバイス、特定のタスク用のハードウェア・アクセラレータ344等を含むことが可能である。これらのデバイスは、リード・オンリー・メモリ(ROM)345、ランダム・アクセス・メモリ346、内部大容量ストレージ・デバイス(例えば、内的な非ユーザー・アクセシブル・ハード・ドライブ、ソリッド・ステート・ドライブ(SSD)等)347と共に、システム・バス348を介して接続されることが可能である。幾つかのコンピュータ・システムでは、システム・バス348は、追加のCPU、GPU等による拡張を可能にするために、1つ以上の物理的プラグの形態でアクセス可能である可能性がある。周辺デバイスは、コアのシステム・バス348に直接取り付けられるか、又は周辺バス349を介して取り付けられることが可能である。周辺バスのアーキテクチャは、ペリフェラル・コンポーネント相互接続(PCI)、USB等を含む。
CPU341、GPU342、FPGA343、及びアクセラレータ344は、組み合わされて、前述のコンピュータ・コードを構成することが可能な特定の命令を実行することが可能である。コンピュータ・コードは、ROM345又はRAM346に格納されることが可能である。一時的なデータはRAM346に格納されることが可能である一方、永続的なデータは例えば内的な大容量ストレージ347に格納されることが可能である。任意のメモリ・デバイスに対する高速な記憶及び検索は、キャッシュ・メモリを利用することで可能になる可能性があり、キャッシュ・メモリは、1つ以上のCPU341、GPU342、大容量ストレージ347、ROM345、RAM346等と密接に関連付けることが可能である。
コンピュータ読み取り可能な媒体は、様々なコンピュータ実装済み動作を実行するためのコンピュータ・コードをその上に有することが可能である。媒体及びコンピュータ・コードは、本開示の目的のために特別に設計及び構築されたものであるとすることが可能であり、又はそれらは、コンピュータ・ソフトウェアの分野における当業者にとって周知であり且つ入手可能な種類のものであるとすることが可能である。
例示として、限定ではなく、アーキテクチャ300、具体的にはコア340を有するコンピュータ・システムは、プロセッサ(CPU、GPU、FPGA、アクセラレータ等を含む)の結果として、1つ以上の有形のコンピュータ読み取り可能な媒体に具現化されたソフトウェアを実行する機能を提供することが可能である。そのようなコンピュータ読み取り可能な媒体は、コア内部の大容量ストレージ347又はROM345のような非一時的な性質のコア340の特定のストレージと同様に、上述したようなユーザー・アクセシブル大容量ストレージに関連するメディアであるとすることが可能である。本開示の様々な実施形態を実現するソフトウェアは、そのようなデバイスに記憶され、コア340によって実行されることが可能である。コンピュータ読み取り可能な媒体は、特定のニーズに応じて、1つ以上のメモリ・デバイス又はチップを含むことが可能である。ソフトウェアは、RAM346に記憶されたデータ構造を定めること、及びソフトウェアによって定められたプロセスに従ってそのようなデータ構造を修正することを含む、本願で説明された特定のプロセス又は特定のプロセスの特定の部分を、コア340及び特にその中のプロセッサ(CPU、GPU、FPGA等を含む)に実行させることが可能である。更に又は代替として、コンピュータ・システムは、回路(例えば、アクセラレータ344)内に配線された又は他の方法で具現化されたロジックの結果として機能を提供することが可能であり、その回路は、本願で説明された特定のプロセス又は特定のプロセスの特定の部分を実行することを、ソフトウェアの代わりに又はそれと共に実行することが可能である。ソフトウェアに対する言及はロジックを含み、必要に応じて、その逆も可能である。コンピュータ読み取り可能な媒体に対する言及は、実行のためのソフトウェアを記憶する(集積回路(IC)のような)回路、実行のためのロジックを具体化する回路、又は適切な場合にはその両方を包含することが可能である。本開示はハードウェア及びソフトウェアの適切な任意の組み合わせを包含する。
本開示は、幾つかの例示的な実施形態を説明してきたが、本開示の範囲内に該当する、変更、置換、及び種々の代替的な均等物が存在する。従って、当業者は、本願で明示的には図示も説明もされていないが、本開示の原理を具体化し、従ってその精神及び範囲内にある多くのシステム及び方法を考え出すことが可能であることは理解されるであろう。
IDF_10092019_high level syntax control for video coding_v2
頭字語のリスト
HLS: High
level syntax
HEVC:
High Efficiency Video Coding
VVC:
Versatile Video Coding
CTU:
Coding Tree Unit
SPS:
Sequence Parameter Set
PPS:
Picture Parameter Set
APS:
Adaptive Parameter Set
PH:
Picture Header
SH:
Slice Header
SAO:
Sample Adaptive Offset2
AU:
Access Unit
NAL:
Network Abstraction Layer
RBSP:
Raw Byte Sequence Payload

Claims (21)

  1. ビデオ・データを復号化する方法であって、前記方法は、少なくとも1つのプロセッサにより実行され:
    コーディングされるピクチャのすべてのスライスに対するスライスのタイプを、シンタックス要素を用いて指示するステップであって、前記シンタックス要素は符号なし整数を用いてコーディングされる、ステップと、
    前記シンタックス要素により指示される前記スライスのタイプに基づいて、前記ビデオ・データを復号化するステップと
    を含む方法。
  2. 前記コーディングされるピクチャについて関連するシンタックス要素のみがコーディングされる、請求項1に記載の方法。
  3. 前記コーディングされるピクチャのすべてのスライスがイントラ予測を含むように指示される場合、インター予測シンタックス要素はコーディングされない、請求項2に記載の方法。
  4. ピクチャ・ヘッダ関連シンタックス要素が、スライス・レイヤ未処理バイト・シーケンス・ペイロード・ネットワーク抽象化レイヤ・ユニットに含まれており、前記スライス・レイヤ未処理バイト・シーケンス・ペイロード・ネットワーク抽象化レイヤ・ユニットにおいて前記ピクチャ・ヘッダ関連シンタックス要素の存在を指示するためにフラグが使用される、請求項1-3のうちの何れか1項に記載の方法。
  5. 前記スライスのタイプは、復号化されたアクセス・ユニット・デリミタ値から推測されることが可能である、請求項1-4のうちの何れか1項に記載の方法。
  6. 前記スライスのタイプは、ハイ・レベル・シンタックスでシグナリングされる場合に推測されることが可能である、請求項1-4のうちの何れか1項に記載の方法。
  7. 前記スライスのタイプは、前記コーディングされるピクチャにおける矩形スライスの数に基づいて推測されることが可能である、請求項1-4のうちの何れか1項に記載の方法。
  8. 前記シンタックス要素は、0次Exp-Golombコーディングされたシンタックス要素である、請求項1-7のうちの何れか1項に記載の方法。
  9. 前記シンタックス要素は、3つのステータスで設定可能な2ビット・シンタックス要素である、請求項1-7のうちの何れか1項に記載の方法。
  10. 前記シンタックス要素は、4つのステータスで設定可能な2ビット・シンタックス要素である、請求項1-7のうちの何れか1項に記載の方法。
  11. ビデオ・データを復号化する装置であって、
    コンピュータ・プログラム・コードを記憶するように構成された少なくとも1つのメモリと、
    前記少なくとも1つのメモリにアクセスし、前記コンピュータ・プログラム・コードに従って動作するように構成された少なくとも1つのプロセッサと
    を含み、前記コンピュータ・プログラム・コードは、
    コーディングされるピクチャのすべてのスライスに対するスライスのタイプを、シンタックス要素により指示するステップであって、前記シンタックス要素は符号なし整数を用いてコーディングされる、ステップを、前記少なくとも1つのプロセッサに実行させるように構成された指示コードと、
    前記シンタックス要素により指示される前記スライスのタイプに基づいて、前記ビデオ・データを復号化するように構成された復号化コードと
    を含む、装置。
  12. 前記指示コードは、前記コーディングされるピクチャについて関連するシンタックス要素のみがコーディングされるように、前記スライスのタイプを指示するように構成されている、請求項11に記載の装置。
  13. 前記コーディングされるピクチャのすべてのスライスがイントラ予測を含むように指示される場合、インター予測シンタックス要素はコーディングされないように、前記指示コードは、前記スライスのタイプを指示するように構成されている、請求項12に記載の装置。
  14. ピクチャ・ヘッダ関連シンタックス要素が、スライス・レイヤ未処理バイト・シーケンス・ペイロード・ネットワーク抽象化レイヤ・ユニットに含まれており、前記スライス・レイヤ未処理バイト・シーケンス・ペイロード・ネットワーク抽象化レイヤ・ユニットにおいて前記ピクチャ・ヘッダ関連シンタックス要素の存在を指示するためにフラグが使用されるように、前記指示コードは、前記スライスのタイプを指示するように構成されている、請求項11-13のうちの何れか1項に記載の装置。
  15. 前記スライスのタイプは、復号化されたアクセス・ユニット・デリミタ値から推測されることが可能であるように、前記指示コードは、前記スライスのタイプを指示するように構成されている、請求項11-14のうちの何れか1項に記載の装置。
  16. 前記スライスのタイプは、ハイ・レベル・シンタックスでシグナリングされる場合に推測されることが可能であるように、前記指示コードは、前記スライスのタイプを指示するように構成されている、請求項11-14のうちの何れか1項に記載の装置。
  17. 前記スライスのタイプは、前記コーディングされるピクチャにおける矩形スライスの数に基づいて推測されることが可能であるように、前記指示コードは、前記スライスのタイプを指示するように構成されている、請求項11-14のうちの何れか1項に記載の装置。
  18. 前記シンタックス要素は、0次Exp-Golombコーディングされたシンタックス要素であるように、前記指示コードは構成されている、請求項11-17のうちの何れか1項に記載の装置。
  19. 前記シンタックス要素は、3つのステータスで設定可能な2ビット・シンタックス要素であるように、前記指示コードは構成されている、請求項11-17のうちの何れか1項に記載の装置。
  20. 少なくとも1つのプロセッサに、
    コーディングされるピクチャのすべてのスライスに対するスライスのタイプを、シンタックス要素を用いて指示するステップであって、前記シンタックス要素は符号なし整数を用いてコーディングされる、ステップと、
    前記シンタックス要素により指示される前記スライスのタイプに基づいて、ビデオ・データを復号化するステップと
    を実行させるコンピュータ・プログラム。
  21. ビデオ・データを符号化する方法であって、前記方法は、少なくとも1つのプロセッサにより実行され:
    コーディングされるピクチャのすべてのスライスに対するスライスのタイプを、シンタックス要素を用いて指示するステップであって、前記シンタックス要素は符号なし整数を用いてコーディングされる、ステップと、
    前記シンタックス要素により指示される前記スライスのタイプに基づいて、前記ビデオ・データを符号化するステップと
    を含む方法。

JP2021556786A 2019-12-19 2020-12-18 ビデオ・データを復号化する方法、装置及びコンピュータ・プログラム Active JP7329066B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023088324A JP7551841B2 (ja) 2019-12-19 2023-05-30 ビデオ・データを符号化する方法、装置及びコンピュータ・プログラム

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962950453P 2019-12-19 2019-12-19
US62/950,453 2019-12-19
US17/026,748 2020-09-21
US17/026,748 US11902584B2 (en) 2019-12-19 2020-09-21 Signaling of picture header parameters
PCT/US2020/065899 WO2021127365A1 (en) 2019-12-19 2020-12-18 Signaling of picture header parameters

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023088324A Division JP7551841B2 (ja) 2019-12-19 2023-05-30 ビデオ・データを符号化する方法、装置及びコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2022525961A true JP2022525961A (ja) 2022-05-20
JP7329066B2 JP7329066B2 (ja) 2023-08-17

Family

ID=76438666

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021556786A Active JP7329066B2 (ja) 2019-12-19 2020-12-18 ビデオ・データを復号化する方法、装置及びコンピュータ・プログラム
JP2023088324A Active JP7551841B2 (ja) 2019-12-19 2023-05-30 ビデオ・データを符号化する方法、装置及びコンピュータ・プログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023088324A Active JP7551841B2 (ja) 2019-12-19 2023-05-30 ビデオ・データを符号化する方法、装置及びコンピュータ・プログラム

Country Status (9)

Country Link
US (2) US11902584B2 (ja)
EP (1) EP4078946A4 (ja)
JP (2) JP7329066B2 (ja)
KR (1) KR102707540B1 (ja)
CN (2) CN118450129A (ja)
AU (1) AU2020407109B2 (ja)
CA (1) CA3137363A1 (ja)
SG (1) SG11202111260RA (ja)
WO (1) WO2021127365A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023504964A (ja) * 2019-12-20 2023-02-08 キヤノン株式会社 ビデオの符号化及び復号のための高レベルシンタックス

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220097511A (ko) 2019-12-20 2022-07-07 엘지전자 주식회사 예측 가중 테이블 기반 영상/비디오 코딩 방법 및 장치
EP4107962A4 (en) * 2020-02-21 2023-07-26 Alibaba Group Holding Limited METHODS OF PROCESSING CHROMA SIGNALS
US11601657B2 (en) * 2020-04-02 2023-03-07 Qualcomm Incorporated LUMA mapping with chroma scaling (LMCS) in video coding
CN118743220A (zh) * 2021-12-07 2024-10-01 抖音视界有限公司 用于视频处理的方法、装置和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120189053A1 (en) * 2011-01-22 2012-07-26 Qualcomm Incorporated Combined reference picture list construction for video coding
US20140036999A1 (en) * 2012-06-29 2014-02-06 Vid Scale Inc. Frame prioritization based on prediction information
US20140198181A1 (en) * 2013-01-17 2014-07-17 Qualcomm Incorporated Disabling inter-view prediction for reference picture list in video coding

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2810443B1 (en) 2012-02-01 2021-03-31 Nokia Technologies Oy Method and apparatus for video coding
EP2869560A4 (en) 2012-06-29 2016-09-07 Sony Corp DEVICE AND METHOD OF ENCODING
EP2713616A1 (en) * 2012-09-27 2014-04-02 British Telecommunications public limited company Perceptually driven error correction for video transmission
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
US20180103271A1 (en) * 2016-10-10 2018-04-12 Qualcomm Incorporated Systems and methods for signaling missing or corrupted video data
US20190208225A1 (en) * 2018-01-02 2019-07-04 Qualcomm Incorporated Sign prediction in video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120189053A1 (en) * 2011-01-22 2012-07-26 Qualcomm Incorporated Combined reference picture list construction for video coding
US20140036999A1 (en) * 2012-06-29 2014-02-06 Vid Scale Inc. Frame prioritization based on prediction information
US20140198181A1 (en) * 2013-01-17 2014-07-17 Qualcomm Incorporated Disabling inter-view prediction for reference picture list in video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HENDRY, AND Y.-K. WANG: "AHG17: On access unit delimiter and picture header", JVET-P0120_SPECTEXT.DOCX, JPN6022040199, September 2019 (2019-09-01), pages 40 - 46, ISSN: 0004890066 *
X. XU, ET AL.: "AHG 9: Picture header syntax cleanups", JVET-Q0428-OPT2-TEXT-V1.DOCX, JPN6022040197, January 2020 (2020-01-01), pages 1 - 4, ISSN: 0004890067 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023504964A (ja) * 2019-12-20 2023-02-08 キヤノン株式会社 ビデオの符号化及び復号のための高レベルシンタックス
JP7457791B2 (ja) 2019-12-20 2024-03-28 キヤノン株式会社 ビデオの符号化及び復号のための高レベルシンタックス

Also Published As

Publication number Publication date
AU2023208177A1 (en) 2023-08-17
AU2020407109A1 (en) 2021-10-28
AU2020407109B2 (en) 2023-05-18
CN113826396B (zh) 2024-05-07
JP7551841B2 (ja) 2024-09-17
CN113826396A (zh) 2021-12-21
US20210195247A1 (en) 2021-06-24
EP4078946A1 (en) 2022-10-26
US11902584B2 (en) 2024-02-13
CN118450129A (zh) 2024-08-06
EP4078946A4 (en) 2023-12-27
JP2023109977A (ja) 2023-08-08
US20240114173A1 (en) 2024-04-04
WO2021127365A1 (en) 2021-06-24
KR102707540B1 (ko) 2024-09-19
CA3137363A1 (en) 2021-06-24
SG11202111260RA (en) 2021-11-29
KR20210118160A (ko) 2021-09-29
JP7329066B2 (ja) 2023-08-17

Similar Documents

Publication Publication Date Title
JP7329066B2 (ja) ビデオ・データを復号化する方法、装置及びコンピュータ・プログラム
JP7068501B2 (ja) イントラモード符号化のための方法、装置及びコンピュータプログラム
CN113545091B (zh) 对视频序列执行最大变换大小控制的解码方法和装置
CN113785593A (zh) 用于概括的trisoup几何编码的技术和装置
CN112385216A (zh) 用于多行帧内预测的帧内插值滤波器
JP2021521720A (ja) 簡略化された最確モードリスト生成スキーム
CN114258681B (zh) 视频编解码的方法和解码装置
CN112292859A (zh) 在解码中使用带外流结尾nal单元的方法和装置
CN113348666A (zh) 用于图块组识别的方法
JP2022526005A (ja) コード化ピクチャにおける混合nalユニット・タイプをサポートする方法、システム及びコンピュータ・プログラム
JP2022521519A (ja) ビデオビットストリームにおけるインターレイヤ予測のシグナリング
CN113273152B (zh) 媒体解码的方法、装置与计算机可读介质
JP2022177230A (ja) マルチラインイントラ予測のためのモードリストを生成する方法、並びにその装置及びコンピュータプログラム
JP2022524106A (ja) ビデオビットストリームにおけるピクチャサイズおよび分割情報の効率的なシグナリングのための方法、装置、およびコンピュータプログラム
JP2022518894A (ja) 点群符号化のためのパラメータセット設計の方法並びにその装置及びプログラム
US11546637B2 (en) Method for signaling dependent and independent picture header
CN112118453B (zh) 视频解码方法和设备、计算机设备以及存储介质
RU2780809C1 (ru) Сигнализация параметров заголовка изображения
EP3903477B1 (en) Method for syntax controlled decoded picture buffer management
AU2023208177B2 (en) Method and apparatus for encoding or decoding video data, and computer-readable storage medium
RU2775489C1 (ru) Способ сигнализации разделителя блоков доступа
RU2775390C1 (ru) Сигнализация адаптивного размера изображения в битовом потоке видео
CN110324616B (zh) 用于基于运动场的树拆分的方法和设备
CN113785495A (zh) 灵活的图片分割

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230613

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230804

R150 Certificate of patent or registration of utility model

Ref document number: 7329066

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150