JP7473656B2 - ピクチャヘッダ存在 - Google Patents

ピクチャヘッダ存在 Download PDF

Info

Publication number
JP7473656B2
JP7473656B2 JP2022541628A JP2022541628A JP7473656B2 JP 7473656 B2 JP7473656 B2 JP 7473656B2 JP 2022541628 A JP2022541628 A JP 2022541628A JP 2022541628 A JP2022541628 A JP 2022541628A JP 7473656 B2 JP7473656 B2 JP 7473656B2
Authority
JP
Japan
Prior art keywords
picture
header
slice
value
nal unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022541628A
Other languages
English (en)
Other versions
JP2023514662A (ja
Inventor
リキャルド ショバーリ,
ミトラ ダムガニアン,
マルティン ペッテション,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority claimed from PCT/EP2020/076815 external-priority patent/WO2021139905A1/en
Publication of JP2023514662A publication Critical patent/JP2023514662A/ja
Application granted granted Critical
Publication of JP7473656B2 publication Critical patent/JP7473656B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission

Description

本開示は、一般に、ビデオエンコーディングおよび復号のための方法および装置に関する。
高効率ビデオコーディング(HEVC)は、時間予測と空間予測の両方を利用する、ITU-T(国際電気通信連合電気通信標準化部門)およびMPEG(Moving Pictures Expert Group)によって規格化されたブロックベースビデオコーデックである。空間予測は、現在ピクチャ内からのイントラ(I)予測を使用して達成される。時間予測は、前に復号された参照ピクチャから、ブロックレベルでの単方向(P)予測または双方向インター(B)予測を使用して達成される。エンコーダでは、残差と呼ばれる、元のピクセルデータと予測されたピクセルデータとの間の差は、周波数ドメインに変換され、量子化され、次いで、同じくエントロピーコーディングされる、予測モードおよび動きベクトルなど、必要な予測パラメータとともに送信される前に、エントロピーコーディングされる。デコーダは、エントロピー復号と、逆量子化と、逆方向変換とを実施して残差を取得し、次いで、その残差をイントラ予測またはインター予測に追加してピクチャを再構築する。
MPEGおよびITU-Tは、ジョイントビデオエキスプロラトリチーム(JVET:Joint Video Exploratory Team)内でHEVCの後継に取り組んでいる。開発中のこのビデオコーデックの名前は、多用途ビデオコーディング(VVC)である。本出願の出願時におけるVVC仕様の現在のバージョンは、JVET-Q0041-v2_DraftText.docxである。
NALユニット
HEVCとVVCの両方が、ネットワークアブストラクションレイヤ(NAL)を規定する。HEVCおよびVVCにおけるすべてのデータ、すなわち、ビデオコーディングレイヤ(VCL)データまたは非VCLデータの両方が、NALユニット中にカプセル化される。VCL NALユニットは、ピクチャサンプル値を表すデータを含んでいる。非VCL NALユニットは、パラメータセットおよび補足エンハンスメント情報(SEI:supplemental enhancement information)メッセージなど、追加の関連するデータを含んでいる。HEVCにおけるNALユニットは、どんなタイプのデータがNALユニット中で搬送されるかを識別するNALユニットのNALユニットタイプ、NALユニットが属するレイヤIDおよび時間IDを指定するヘッダで始まる。NALユニットタイプは、NALユニットヘッダ中のnal_unit_typeコードワード中で送信され、そのタイプは、NALユニットがどのようにパースおよび復号されるべきであるかを指示し、規定する。NALユニットのバイトの残りは、NALユニットタイプによって指示されるタイプのペイロードである。ビットストリームは、一連の連結されたNALユニットからなる。ビットストリームは、一連の連結されたNALユニットからなる。
HEVC NALユニットおよびNALユニットヘッダについてのシンタックスが表1に示されている。
Figure 0007473656000001
現在のVVCドラフトのNALユニットタイプが表2に示されている。
復号順序は、ビットストリーム内のNALユニットの順序と同じである、NALユニットが復号されるものとする順序である。復号順序は出力順序とは異なり得、出力順序は、復号されたピクチャがデコーダによって表示などのために出力されるべきである順序である。
Figure 0007473656000002
HEVCにおけるシングルレイヤコーディングの場合、アクセスユニット(AU)は、いくつかのビデオコーディングレイヤ(VCL)NALユニットならびに非VCL NALユニットからなり得る、ピクチャのコード化表現である。HEVCにおけるコード化ビデオシーケンス(CVS)は、イントラランダムアクセスポイント(IRAP)アクセスユニットにおいて開始し、復号順序における次のIRAPアクセスユニットまでの、ただし次のIRAPアクセスユニットを含まない、一連のアクセスユニットである。復号順序は、ビットストリーム内のNALユニットの順序と同じである、NALユニットが復号されるものとする順序である。復号順序は出力順序とは異なり得、出力順序は、復号されたピクチャがデコーダによって表示などのために出力されるべきである順序である。
非VCL NALユニットは、たとえば、パラメータセットなどのコード化サンプル値を直接搬送しないNALユニットである。VVCとHEVCの両方が、それぞれ、ピクチャまたはシーケンスについて有効なパラメータを含んでいる、ピクチャパラメータセット(PPS)とシーケンスパラメータセット(SPS)とを規定する。HEVCでは、別のパラメータセット、すなわち、いくつかのレイヤについて有効な情報を含んでいるビデオパラメータセット(VPS)がある。新しいVPSが、新しいCVSの開始時にのみアクティブにされ得る。VVCがファイナライズされるとき、VVCは、VPSまたは同様のものを含むことも含まないこともある。
VVCおよびHEVCにおける各NALユニットの第1のバイトが、nal_unit_typeシンタックスエレメントを含んでいる。デコーダまたはビットストリームパーサは、第1のバイトを見た後にNALユニットがどのようにハンドリング、たとえばパースおよび復号されるべきであるかを結論付けることができる。
時間レイヤ
HEVCでは、およびVVCの現在のバージョンでは、すべてのピクチャが、ピクチャがどの時間レイヤに属するかを指定したTemporalId値に関連付けられる。TemporalId値は、NALユニットヘッダ中のnuh_temporal_id_plus1シンタックスエレメントから復号される。HEVCでは、エンコーダは、より高い時間レイヤが廃棄されるとき、下位レイヤに属するピクチャが完全に復号可能であるように、TemporalId値をセットすることが必要とされる。たとえば、エンコーダが、時間レイヤ0、1および2を使用してビットストリームを出力したと仮定する。その場合、すべてのレイヤ2のNALユニットを除去すること、またはすべてのレイヤ1および2のNALユニットを除去することが、問題なしに復号され得るビットストリームを生じることになる。これは、エンコーダが準拠しなければならないHEVC/VVC仕様における制限によって保証される。たとえば、時間レイヤのピクチャが、より高い時間レイヤのピクチャを参照することが可能にされない。
レイヤ、依存するおよび独立したレイヤ
レイヤは、VVCでは、すべて、nuh_layer_idの特定の値と、関連する非VCL NALユニットとを有する、VCL NALユニットのセットとして規定される。
VVCにおけるレイヤアクセスユニットは、VCL NALユニットがすべて、nuh_layer_idの特定の値を有する、NALユニットのセットとして規定され、これは、指定された分類ルールに従って互いに関連し、復号順序において連続しており、ちょうど1つのコード化ピクチャを含んでいる。
VVCの現在のバージョンにおけるコード化レイヤビデオシーケンス(CLVS)は、復号順序において、CLVSレイヤアクセスユニットと、その後に続く、CLVSレイヤアクセスユニットである後続のレイヤアクセスユニットまでの、ただしその後続のレイヤアクセスユニットを含まない、すべての後続のレイヤアクセスユニットを含む、CLVSレイヤアクセスユニットでない0またはそれ以上のレイヤアクセスユニットとからなる、レイヤアクセスユニットのシーケンスとして規定される。レイヤアクセスユニットとコード化レイヤビデオシーケンスとの間の関係が図1に示されている。VVCの現在のバージョンでは、レイヤが、互いから独立して、または互いに依存してコーディングされ得る。レイヤが独立してコーディングされるとき、たとえば、nuh_layer_id 0をもつレイヤが、たとえば、nuh_layer_id 1をもつ別のレイヤからビデオデータを予測しないことがある。VVCの現在のバージョンでは、SNR、空間およびビュースケーラビリティを用いたスケーラブルコーディングのサポートを可能にする、レイヤ間の依存するコーディングが使用され得る。
ピクチャヘッダ
現在のVVCドラフトは、PH_NUTに等しいnal_unit_typeを有するNALユニットである、ピクチャヘッダを含む。ピクチャヘッダは、スライスヘッダと同様であるが、ピクチャヘッダ中のシンタックスエレメントの値が、1つのピクチャのすべてのスライスを復号するために使用される。VVCにおける各ピクチャが、1つのピクチャヘッダNALユニットと、その後に続く、各コード化スライスが1つのコード化スライスNALユニット中で伝達される、ピクチャのすべてのコード化スライスとからなる。
VVCブロック構造
ドラフトVVCビデオコーディング規格は、4分木プラス2分木プラス3分木ブロック構造(QTBT+TT)と呼ばれるブロック構造を使用し、ここで、各ピクチャが、最初に、コーディングツリーユニット(CTU)と呼ばれる正方形ブロックに区分される。すべてのCTUのサイズは同等であり、区分が、区分を制御するシンタックスなしに行われる。各CTUが、正方形形状または長方形形状のいずれかを有することができるコーディングユニット(CU)にさらに区分される。CTUは、最初に、4分木構造によって区分され、次いで、CTUは、バイナリ構造において垂直方向にまたは水平方向にのいずれかで等しいサイズの区分でさらに区分されて、コーディングユニット(CU)を形成し得る。したがって、ブロックが、正方形形状または長方形形状のいずれかを有することができる。4分木および2分木の深度が、ビットストリームにおいてエンコーダによってセットされ得る。QTBTを使用してCTUを分割することの一例が、図1Aおよび図1Bに示されている。3分木(TT)部分は、CUを、2つの等しいサイズの区分ではなく3つの区分に分割する可能性を追加し、これは、ピクチャ中のコンテンツ構造により良く合うブロック構造を使用する可能性を増加させる。
パラメータセット
HEVCは、3つのタイプのパラメータセット、すなわち、ピクチャパラメータセット(PPS)と、シーケンスパラメータセット(SPS)と、ビデオパラメータセット(VPS)とを指定する。PPSは、ピクチャ全体について共通であるデータを含んでおり、SPSは、コード化ビデオシーケンス(CVS)について共通であるデータを含んでおり、VPSは、複数のCVSについて共通であるデータを含んでいる。
VVCも、これらのパラメータセットタイプを使用する。VVCでは、適応パラメータセット(APS)および復号パラメータセット(DPS)もある。APSは、複数のスライスのために使用され得る情報を含んでいることがあり、同じピクチャの2つのスライスが、異なるAPSを使用することができる。DPSは、デコーダがビットストリーム全体中で遭遇することになるプロファイルおよびレベルに関して「ワーストケース」を指定する情報からなる。
スライス
HEVCにおけるスライスの概念は、ピクチャを独立してコーディングされたスライスに分割し、ここで、ピクチャ中の1つのスライスの復号は、同じピクチャの他のスライスから独立している。異なるコーディングタイプが同じピクチャのスライスのために使用され得る、すなわち、スライスは、Iスライス、Pスライス、またはBスライスのいずれかであり得る。スライスの1つの目的は、データ損失の場合に再同期を可能にすることである。HEVCでは、スライスは、CTUのセットである。
VVCの現在のバージョンでは、ピクチャが、ラスタ走査スライスまたは矩形スライスのいずれかに区分され得る。ラスタ走査スライスは、ラスタ走査順序におけるいくつかの完全なタイルからなる。矩形スライスは、ピクチャ中の矩形領域、または1つのタイルの内部の連続する数のCTU行を一緒に占有する、タイルのグループからなる。各スライスは、スライスヘッダとコード化スライスデータとを備える。それは、シンタックスエレメントを備えるスライスヘッダを有する。これらのシンタックスエレメントからの復号されたスライスヘッダ値が、スライスを復号するときに使用される。各スライスは、1つのVCL NALユニット中で搬送される。
VVCドラフト仕様の前のバージョンでは、スライスは、タイルグループと呼ばれた。
タイル
ドラフトVVCビデオコーディング規格は、ピクチャを矩形の空間的に独立した領域に分割する、タイルと呼ばれる技法を含む。ドラフトVVCコーディング規格におけるタイルは、HEVCにおいて使用されるタイルとまったく同様である。タイルを使用して、VVCにおけるピクチャがサンプルの行および列に区分され得、ここで、タイルは行と列との交差部である。以下の図2は、ピクチャのための合計20個のタイルを生じる、4つのタイル行と5つのタイル列とを使用するタイル区分の一例を示す。
タイル構造は、行の厚さと列の幅とを指定することによって、ピクチャパラメータセット(PPS)中でシグナリングされる。個々の行および列は、異なるサイズを有することができるが、区分は、常に、それぞれ左から右に、および上から下に、ピクチャ全体にわたってスパンする。
同じピクチャのタイル間に復号依存性はない。これは、イントラ予測と、エントロピーコーディングのためのコンテキスト選択と、動きベクトル予測とを含む。1つの例外は、ループ内フィルタ処理依存性が概してタイル間で許容されることである。
VVCにおける矩形スライスモードでは、タイルは、さらに、各スライスが、1つのタイルの内部の連続する数のCTU行からなる、複数のスライスにスプリットされ得る。図3は、VVCにおけるタイル区分およびタイル区分を使用した矩形スライス区分の一例を示す。
ピクチャヘッダとスライスヘッダとをマージすること
VET入力寄与文書JVET-Q0255-v1.zipおよびJVET-Q0426-v2.zipは両方とも、ピクチャヘッダとスライスヘッダとをマージすることを提案する。両方の寄与文書は、ピクチャヘッダ(PH)を随意にすることを提案し、BDR節約を主張しており、それらの寄与文書は両方とも、PHが存在しないとき、単一のVCL NALユニット中でPHのシンタックス、スライスヘッダおよびスライスデータを搬送することを提案する。JVET-Q0255とJVET-Q0426との間の設計差は、以下のように要約され得る。PHとスライスヘッダの両方を含んでいる新しいVCL NALユニットについて現在予約済みのNALユニットタイプを使用する(JVET-Q0255)かまたは追加されたフラグをもつ現在のVCL NALユニットタイプを使用する(JVET-Q0426)、すべてのピクチャについてPHを使用するかまたはどのピクチャについてもPHを使用しないかのいずれかを行うようにCLVSを制限する(JVET-Q0426)かあるいは混合を可能にする(JVET-Q0255)、PHが存在しないときに1つのスライスからなるように各ピクチャを制限する(JVET-Q0255)かまたはPHなしの複数のスライスを可能にする(JVET-Q0426)。
JVET-Q0255-v1.zip寄与文書は、新しいNALユニットタイプ中で以下のコンテンツを提案する。
Figure 0007473656000003
pic_nal_typeは、ピクチャの対応するNalユニットタイプを指示する。
NalTypeの値は、以下のように導出される。
NalType=(nal_unit_type==CODED_PIC) ? pic_nal_type:nal_unit_type
JVET-Q0426-v2.zip寄与文書は、スライスヘッダについて以下を提案する。
Figure 0007473656000004
本開示のさらなる理解を提供するために含まれ、本出願に組み込まれ、本出願の一部をなす、添付の図面は、発明概念のいくつかの非限定的な実施形態を示す。
いくつかの実施形態による、レイヤアクセスユニットとコード化レイヤビデオシーケンスとの間の関係を示す図である。 QTBTを使用してCTUをCUに区分することの一例の図である。 QTBTを使用してCTUをCUに区分することの一例の図である。 ピクチャのタイル区分の一例の図である。 VVCにおけるタイル区分およびタイル区分を使用した矩形スライス区分の一例の図である。 発明概念のいくつかの実施形態による、動作環境を示すブロック図である。 発明概念のいくつかの実施形態による、エンコーダを示すブロック図である。 発明概念のいくつかの実施形態による、デコーダを示すブロック図である。 発明概念のいくつかの実施形態による、デコーダの動作を示すフローチャートである。 発明概念のいくつかの実施形態による、デコーダの動作を示すフローチャートである。 発明概念のいくつかの実施形態による、デコーダの動作を示すフローチャートである。 発明概念のいくつかの実施形態による、デコーダの動作を示すフローチャートである。 発明概念のいくつかの実施形態による、デコーダの動作を示すフローチャートである。 発明概念のいくつかの実施形態による、エンコーダの動作を示すフローチャートである。
次に、発明概念の実施形態の例が示されている添付の図面を参照しながら、発明概念が以下でより十分に説明される。しかしながら、発明概念は、多くの異なる形態で具現され得、本明細書に記載される実施形態に限定されるものとして解釈されるべきではない。むしろ、これらの実施形態は、本開示が徹底的かつ完全であり、本発明概念の範囲を当業者に十分に伝達するように提供される。これらの実施形態は相互排他的でないことにも留意されたい。一実施形態からの構成要素が、別の実施形態において存在する/使用されると暗に仮定され得る。
以下の説明は、開示される主題の様々な実施形態を提示する。これらの実施形態は、教示例として提示され、開示される主題の範囲を限定するものと解釈されるべきではない。たとえば、説明される実施形態のいくらかの詳細は、説明される主題の範囲から逸脱することなく、修正、省略、または拡大され得る。
図5は、本明細書で説明されるようにビットストリームを符号化するために使用され得る、エンコーダ500の動作環境の一例を示す。エンコーダ500は、ネットワーク502からおよび/またはストレージ504からメディアを受信し、以下で説明されるようにメディアをビットストリームに符号化し、符号化されたメディアをネットワーク508を介してデコーダ506に送信する。ストレージデバイス504は、ストアまたはストリーミングビデオサービスのストレージリポジトリなど、ビデオのストレージデポジトリ、別個のストレージ構成要素、モバイルデバイスの構成要素などの一部であり得る。デコーダ506は、ディスプレイ512を有するデバイス510の一部であり得る。デバイス510は、モバイルデバイス、セットトップデバイス、ヘッドマウントディスプレイなどであり得る。
図6は、発明概念のいくつかの実施形態による、ビデオフレームを符号化するように設定されたエンコーダ500のエレメントを示すブロック図である。図示のように、エンコーダ500は、他のデバイス/エンティティ/機能/などとの通信を提供するように設定された(ネットワークインターフェースとも呼ばれる)ネットワークインターフェース回路605を含み得る。エンコーダ500は、ネットワークインターフェース回路605に結合された(プロセッサとも呼ばれる)プロセッサ回路601と、プロセッサ回路に結合された(メモリとも呼ばれる)メモリ回路603とをも含み得る。メモリ回路603は、プロセッサ回路601によって実行されたとき、プロセッサ回路に、本明細書で開示される実施形態による動作を実施させる、コンピュータ可読プログラムコードを含み得る。
他の実施形態によれば、プロセッサ回路601は、別個のメモリ回路が必要とされないようなメモリを含むように規定され得る。本明細書で説明されるように、エンコーダ500の動作は、プロセッサ601および/またはネットワークインターフェース605によって実施され得る。たとえば、プロセッサ601は、デコーダ506に通信を送信し、および/または他のエンコーダノード、デポジトリサーバなど、1つまたは複数の他のネットワークノード/エンティティ/サーバからネットワークインターフェース605を通して通信を受信するように、ネットワークインターフェース605を制御し得る。その上、モジュールがメモリ603に記憶され得、これらのモジュールは、モジュールの命令がプロセッサ601によって実行されたとき、プロセッサ601がそれぞれの動作を実施するような命令を提供し得る。
図7は、発明概念のいくつかの実施形態による、ビデオフレームを復号するように設定されたデコーダ506のエレメントのエレメントを示すブロック図である。図示のように、デコーダ506は、他のデバイス/エンティティ/機能などとの通信を提供するように設定された(ネットワークインターフェースとも呼ばれる)ネットワークインターフェース回路705を含み得る。デコーダ506は、ネットワークインターフェース回路705に結合された(プロセッサとも呼ばれる)プロセッサ回路701と、プロセッサ回路に結合された(メモリとも呼ばれる)メモリ回路703とをも含み得る。メモリ回路703は、プロセッサ回路701によって実行されたとき、プロセッサ回路に、本明細書で開示される実施形態による動作を実施させる、コンピュータ可読プログラムコードを含み得る。
他の実施形態によれば、プロセッサ回路701は、別個のメモリ回路が必要とされないようなメモリを含むように規定され得る。本明細書で説明されるように、デコーダ506の動作は、プロセッサ701および/またはネットワークインターフェース705によって実施され得る。たとえば、プロセッサ701は、エンコーダ500から通信を受信するようにネットワークインターフェース705を制御し得る。その上、モジュールがメモリ703に記憶され得、これらのモジュールは、モジュールの命令がプロセッサ701によって実行されたとき、プロセッサ701がそれぞれの動作を実施するような命令を提供し得る。
JVET-Q0255ソリューションに関する問題は、JVET-Q0255ソリューションが、貴重なリソースであるNALユニットタイプを使用することを提案することである。さらに、JVET-Q0255は、NALユニット中で搬送されるピクチャについてのnal_unit_typeの必要な部分を搬送するためにコードワードpic_nal_typeを導入する。シンタックスエレメントのコストは、ピクチャごとに4ビットであり、これは、多く思われないことがあるが、100kbps 50fpsビデオストリームの場合、ピクチャごとの4ビットは、0.2%のシェアと等価である。0.2%のシェアはかなりのものである。0.2%さらにはそれ未満のビット節約に基づいて行われたビデオコーディング規格化中に行われる多数の設計判断がある。
JVET-Q0255に関する別の問題は、JVET-Q0255がピクチャごとの複数のスライスをサポートしないことであり、これは、不要な制限である。JVET-Q0255に関するまた別の問題は、JVET-Q0255が、ピクチャ境界の検出がデコーダによってどのように行われ得るかについて説明しないことである。
JVET-Q0426における設計は、sps_picture_header_enabled_flagの値が、ピクチャパラメータセット(PPS)を識別し、次いで、識別されたピクチャパラメータセットのシンタックスエレメント値からシーケンスパラメータセット(SPS)を識別するために、スライスを必要とすることである。これに関する問題は、ピクチャパラメータセット(slice_pic_parameter_set_id)を識別するシンタックスエレメントが、sps_picture_header_enabled_flagの値が使用された後に来ることと、そのシンタックスエレメントがsps_picture_header_enabled_flagの値を条件とすることとである。可能なソリューションは、無条件にスライスヘッダ中に最初にslice_pic_parameter_set_idを入れることであり得る。しかしながら、スライスを含んでいるピクチャについてビットストリーム中にピクチャヘッダがあるとき、ピクチャパラメータセットは、ピクチャヘッダ中のシンタックスエレメントから識別され、ピクチャヘッダとスライスヘッダの両方中に同じシンタックスエレメントを有することは、かなりのビットコストが伴う。
発明概念のいくつかの実施形態では、状態シンタックスエレメントがスライスヘッダに追加される。状態シンタックスエレメントの1つの値は、スライスを備えるピクチャについてのピクチャヘッダがあることを指定する。状態シンタックスエレメントの1つの他の値が、スライスを備えるピクチャについてのピクチャヘッダがないことを指定する。状態シンタックスエレメントは、1ビットのシンタックスエレメントフラグであり得る。
発明概念の一実施形態では、スライスを備えるピクチャについて存在するピクチャヘッダがないことを指定する値は、ピクチャが1つの単一のスライスからなることをさらに指定し、これは、そのピクチャについての複数のスライスが可能にされないことを意味する。
発明概念の一実施形態では、コード化ビデオストリーム(CVS)内のフラグの値をコード化レイヤビデオシーケンス(CLVS)に混合することが可能にされ得る。これは、第1のCVSまたはCLVS中に第1のピクチャについての1つのピクチャヘッダがあり得、次いで、第1のCVSまたはCLVS中に、ピクチャヘッダがない第2のピクチャがあり得ることを意味する。
発明概念の一実施形態では、混合が可能にされない。この実施形態では、パラメータセット中の別の別個の状態シンタックスエレメントと、スライスヘッダ中の状態シンタックスエレメントの値が、パラメータセット中の状態シンタックスエレメントの値の意味を表す(または繰り返す)ものとするという要件とがある。
発明概念の一実施形態では、ビットストリーム中のコード化ピクチャの開始の検出が、ピクチャヘッダを見つけること、またはスライスを備えるピクチャについてのピクチャヘッダがないことを指定する値を有する状態シンタックスエレメントをもつNALユニットを見つけることから決定される。
発明概念の一実施形態では、状態シンタックスエレメントの1つの値が、スライスを備えるピクチャについて存在するピクチャヘッダがあることもないこともあることを指定する。
発明概念の一実施形態では、スライスヘッダ中に存在する状態シンタックスエレメントがない。代わりに、状態値が、ピクチャについてのピクチャヘッダの存在から導出される。スライスが復号またはパースされたとき、ピクチャについて検出されたピクチャヘッダがない場合、状態は、スライスを備えるピクチャについてのピクチャヘッダがないことを指定する値に等しくセットされる。スライスが復号またはパースされる前に、ピクチャについて検出されたピクチャヘッダがある場合、状態は、スライスを備えるピクチャについてのピクチャヘッダがあることを指定する値に等しくセットされる。
発明概念の上記の実施形態を使用することの利点は、追加のNALユニットタイプが使用されないことである。また、pic_nal_typeシンタックスエレメントが必要とされず、これは、4ビットを節約する。JVET-Q0426と比較して、発明概念の実施形態は、上記で説明された問題のうちの1つまたは複数を解決し得る。
以下で説明される発明概念の実施形態では、スライスは、それ自体のNALユニット中でシグナリングされるピクチャのコード化部分である。スライスは、両方が同じNALユニット中でシグナリングされる、コード化スライスデータとスライスヘッダとを備える。1つのスライスが、ピクチャ全体をカバーすることもカバーしないこともある。
発明概念の1つのバージョンでは、スライスは、単一のNALユニット中に排他的に含まれている整数個の完全なタイルまたはピクチャのタイル内の整数個の連続する完全なCTU行と呼ばれる(VVCドラフトからとられる)。
以下の発明概念の実施形態において使用される「共通シンタックスエレメントのセット」という用語は、ピクチャヘッダ中でまたはスライスヘッダ中でのいずれかでシグナリングされ得る1つまたは複数のシンタックスエレメントのセットである。
以下で説明される発明概念の実施形態では、「ピクチャについて」という用語は、データ、パラメータ、ピクチャヘッダなどが、説明されているピクチャに属するという意味で使用される。たとえば、「ピクチャについてのピクチャヘッダ」は、特定のピクチャに関連するピクチャヘッダである。ピクチャヘッダは、この場合、好ましくは、ピクチャのコード化データに先行する。
発明概念の第1の実施形態では、状態シンタックスエレメントがスライスヘッダに追加される。状態シンタックスエレメントは、スライスを備えるピクチャについてピクチャヘッダがあるか否かを指定する。状態シンタックスエレメントは、1ビットのシンタックスエレメントフラグであり得る。第1の実施形態の一実施形態では、そのフラグがスライスヘッダ中に早期に入れられることが好ましい。発明概念のこの実施形態の代替ソリューションでは、そのフラグは、代わりに、APSなどのパラメータセット中に入れられ得る。
発明概念のこの第1の実施形態では、共通シンタックスエレメントのセットが使用される。現在ピクチャの現在スライスについてのピクチャヘッダと共通シンタックスエレメントのセットとの存在およびロケーションに基づく以下のルールのうちの1つまたは複数が使用され得る。
ルール1。現在スライス中の状態シンタックスエレメント値(状態値)が第1の値に等しい場合、現在ピクチャについてのピクチャヘッダがないものとし、共通シンタックスエレメントのセットは、現在スライスのスライスヘッダ中に含まれるものとする。
ルール2。現在スライス中の状態値が第2の値に等しい場合、現在ピクチャについてのピクチャヘッダがあるものとする。ピクチャヘッダは、共通シンタックスエレメントのセットを含むものとし、共通シンタックスエレメントのセット中のシンタックスエレメントが現在スライス中に存在しないものとする。
ルール3。現在ピクチャについてのピクチャヘッダがある場合、ピクチャヘッダは、現在スライスと同じアクセスユニットまたはレイヤアクセスユニット中の現在スライスの前に位置し得る。
発明概念の第1の実施形態の変形態では、2つ以上のスライスが現在ピクチャ中にある場合、現在ピクチャ中のすべてのスライス中の状態シンタックスエレメントが同じ状態値を有するものとする。デコーダがピクチャについての複数のスライスを受信し、状態値が、ピクチャ中のすべてのスライスについて等しくない場合、デコーダは、ビットストリームがコーデック仕様に準拠しないと結論付け、それを、ビット誤り、データの損失あるいは非準拠ビットストリームまたはエンコーダとして解釈し得る。デコーダは、ビットストリームが準拠しないという知識に基づいて、誤りを報告し、誤り隠蔽を実施し、または他のアクションをとり得る。
デコーダが、この実施形態を使用してビットストリームから現在ピクチャを復号するための以下のステップの全部またはサブセットを実施し得る。
ステップ1.デコーダは、現在ピクチャの現在スライスのスライスヘッダ中の状態シンタックスエレメントから状態値を復号し、これは、現在ピクチャについてピクチャヘッダが使用されるか否かを指定する。
ステップ2.状態値が第1の値に等しい場合、デコーダは、現在ピクチャについてのピクチャヘッダがないと推論する。デコーダは、現在スライスを復号するとき、スライスヘッダからシンタックスエレメントのセットSを復号し、セットSの復号された値を使用する。
ステップ3.状態値が第2の値に等しい場合、デコーダは、現在ピクチャについてのピクチャヘッダがあるものとすると推論する。デコーダは、現在スライスを復号するとき、現在ピクチャについてのピクチャヘッダからシンタックスエレメントのセットTを復号し、シンタックスエレメントのセットT(別名、PHシンタックス構造、またはピクチャシンタックスエレメントのセット)の復号された値を使用し、ここで、ピクチャシンタックスエレメントのセットTは、セットSと同じシンタックスエレメントを含んでいる(すなわち、シンタックスエレメントのセットSもPHシンタックス構造(ピクチャシンタックスエレメントのセット)である)。
ステップ4.随意に、現在ピクチャについてのピクチャヘッダは、現在スライスNALユニットとは別個のピクチャヘッダNALユニットから復号され、ピクチャヘッダNALユニットは、復号順序において現在スライスNALユニットに先行し、ピクチャヘッダNALユニットと現在スライスNALユニットとは、同じアクセスユニットまたはピクチャユニットに属する。
発明概念の第2の実施形態では、複数のスライスが使用されない。
発明概念のこの第2の実施形態では、スライスを備えるピクチャについて存在するピクチャヘッダがないことを指定する値は、ピクチャが1つの単一のスライスからなることをさらに指定し、これは、そのピクチャについての複数のスライスが可能にされないことを意味する。
デコーダが、この実施形態を使用してビットストリームから現在ピクチャを復号するための以下のステップの全部またはサブセットを実施し得る。
ステップ1.デコーダは、現在ピクチャの現在スライスのスライスヘッダ中の状態シンタックスエレメントから状態値を復号し、これは、現在ピクチャについてピクチャヘッダが使用されるか否かを指定する。
ステップ2.状態値が第1の値に等しい場合、デコーダは、現在ピクチャについてのピクチャヘッダがないと推論する。デコーダは、ピクチャが1つの単一のスライスを備えるとさらに推論する。デコーダは、現在スライスを復号するとき、スライスヘッダからシンタックスエレメントのセットSを復号し、セットSの復号された値を使用する。
ステップ3.状態値が第2の値に等しい場合、デコーダは、現在ピクチャについてのピクチャヘッダがあるものとすると推論する。デコーダは、現在スライスを復号するとき、現在ピクチャについてのピクチャヘッダからシンタックスエレメントのセットTを復号し、セットTの復号された値を使用し、ここで、セットTは、セットSと同じシンタックスエレメントを含んでいる。
ステップ4.随意に、現在ピクチャについてのピクチャヘッダは、現在スライスNALユニットとは別個のピクチャヘッダNALユニットから復号され、ピクチャヘッダNALユニットは、復号順序において現在スライスNALユニットに先行し、ピクチャヘッダNALユニットと現在スライスNALユニットとは、同じアクセスユニットまたはピクチャユニットに属する。
状態値が第1の値に等しく、デコーダが、ピクチャについての複数のスライスを受信する場合、デコーダは、ビットストリームがコーデック仕様に準拠しないと結論付け得、それを、ビット誤り、データの損失あるいは非準拠ビットストリームまたはエンコーダとして解釈し得る。デコーダは、ビットストリームが準拠しないという知識に基づいて、誤りを報告し、誤り隠蔽を実施し、または他のアクションをとり得る。
発明概念の第3の実施形態では、ピクチャヘッダをもつアクセスユニットとピクチャヘッダをもたないアクセスユニットとの混合が使用される。
第3の実施形態の一実施形態では、CVSまたはCLVS内の(状態シンタックスエレメントを表す)フラグの値を混合することが可能にされる。これは、第1のCVSまたはCLVS中に第1のピクチャについての1つのピクチャヘッダがあり得、次いで、第1のCVSまたはCLVS中に、ピクチャヘッダがない第2のピクチャがあり得ることを意味する。
発明概念の第4の実施形態では、CVSまたはCLVS中のレイヤアクセスユニットまたはレイヤ化アクセスユニットが、すべてピクチャヘッダを有するかまたはいずれもピクチャヘッダを有しないかのいずれかに制限され得る。
発明概念の第4の実施形態の一実施形態では、第3の実施形態からのCVSまたはCLVS内のフラグ値の混合が可能にされない。これは、現在のCVSまたはCLVS中で、これらの2つの記述、すなわち、
1)現在のCVSまたはCLVS中にすべてのピクチャについてのピクチャヘッダがある、
2)現在のCVSまたはCLVS中にピクチャヘッダがない
のうちの1つが真であるものとすることを意味する。
この実施形態では、パラメータセット、たとえば、DPS、SPS、PPSまたはAPS中の別の別個の状態シンタックスエレメントと、スライスヘッダ中の状態シンタックスエレメントの値が、パラメータセット中の状態シンタックスエレメントの値の意味を表す(または繰り返す)ものとするという要件とがあり得る。
状態シンタックスエレメントはバイナリフラグであり得る。
デコーダが、この実施形態を使用してビットストリームから現在ピクチャを復号するための以下のステップの全部またはサブセットを実施し得る。
ステップ1.デコーダは、ビットストリーム中のパラメータセット中の状態シンタックスエレメントSから状態値Vを復号し、値Vは、ビットストリーム中の各ピクチャのコード化ビデオデータがピクチャヘッダに先行されるか否かを指定する。
ステップ2.デコーダは、現在ピクチャの現在スライスのスライスヘッダ中の状態シンタックスエレメントSから状態値Vを復号し、これは、現在ピクチャについてピクチャヘッダが使用されるか否かを指定する。
ステップ3.状態値Vが状態値Vに等しくない(または、状態値Vと同じ意味を表す)場合、デコーダは、ビットストリームがコーデック仕様に準拠しないと結論付け得、それを、ビット誤り、データの損失あるいは非準拠ビットストリームまたはエンコーダとして解釈し得る。デコーダは、ビットストリームが準拠しないという知識に基づいて、誤りを報告し、誤り隠蔽を実施し、または他のアクションをとり得る。
ステップ4.状態値Vが第1の値に等しい場合、デコーダは、現在ピクチャについてのピクチャヘッダがないと推論する。デコーダは、現在スライスを復号するとき、スライスヘッダからシンタックスエレメントのセットSを復号し、セットSの復号された値を使用する。
ステップ5.状態値Vが第2の値に等しい場合、デコーダは、現在ピクチャについてのピクチャヘッダがあるものとすると推論する。デコーダは、現在スライスを復号するとき、現在ピクチャについてのピクチャヘッダからシンタックスエレメントのセットTを復号し、セットTの復号された値を使用し、ここで、セットTは、セットSと同じシンタックスエレメントを含んでいる。
この実施形態のバージョンでは、別の別個の状態シンタックスエレメントがない。代わりに、現在のCVSまたはCLVS中のすべての状態シンタックスエレメントが同じ値を有するものとすることを述べるルールがある。これはまた、CVSまたはCLVS中にすべてのピクチャについてのピクチャヘッダがあるか、あるいはCVSまたはCLVS中にピクチャヘッダがないかのいずれかを意味する。
デコーダが、実施形態のこのバージョンを使用して以下のステップの全部またはサブセットを実施し得る。
ステップ1.デコーダは、第1のピクチャのスライスのスライスヘッダ中の状態シンタックスエレメントから状態値Vを復号し、これは、第1のピクチャについてピクチャヘッダが使用されるか否かを指定する。
ステップ2.デコーダは、第2のピクチャのスライスのスライスヘッダ中の状態シンタックスエレメントから状態値Vを復号し、これは、第2のピクチャについてピクチャヘッダが使用されるか否かを指定する。
ステップ3.状態値Vが状態値Vに等しくない(または、状態値Vと同じ意味を表す)場合、デコーダは、ビットストリームがコーデック仕様に準拠しないと結論付け得、それを、ビット誤り、データの損失あるいは非準拠ビットストリームまたはエンコーダとして解釈し得る。デコーダは、ビットストリームが準拠しないという知識に基づいて、誤りを報告し、誤り隠蔽を実施し、または他のアクションをとり得る。
ステップ4.状態値Vが第1の値に等しい場合、デコーダは、第1のピクチャについてのピクチャヘッダがないと推論する。デコーダは、第1のピクチャのスライスを復号するとき、スライスヘッダからシンタックスエレメントのセットSを復号し、セットSの復号された値を使用する。
ステップ5.状態値Vが第2の値に等しい場合、デコーダは、第1のピクチャについてのピクチャヘッダがあるものとすると推論する。デコーダは、第1のピクチャのスライスを復号するとき、第1のピクチャについてのピクチャヘッダからシンタックスエレメントのセットTを復号し、セットTの復号された値を使用し、ここで、セットTは、セットSと同じシンタックスエレメントを含んでいる。
ピクチャヘッダはピクチャヘッダNALユニットを参照し得、したがって、CVSまたはCLVS中にすべてのピクチャについてのピクチャヘッダNALユニットがあるか、あるいはCVSまたはCLVS中にピクチャヘッダNALユニットがないかのいずれかである。
第5の実施形態では、コード化ピクチャの開始の検出が提供される。
この第5の実施形態では、ビットストリーム中のコード化ピクチャの開始が、ピクチャヘッダを見つけること、またはスライスを備えるピクチャについてのピクチャヘッダがないことを指定する値を有する状態シンタックスエレメントをもつNALユニットを見つけることから決定される。
この実施形態の1つの変形態では、デコーダが、ピクチャの第1のVCL NALユニットを決定するために以下のステップを実施し得る。ステップは、プロセスが停止されるまで繰り返される。
ステップ1.デコーダは、ビットストリームから現在のNALユニットを収集する。
ステップ2.デコーダは、現在のNALユニットがピクチャヘッダNALユニットであるかどうか、または現在のNALユニットがVCL NALユニットであるかどうかを決定する。
ステップ3.現在のNALユニットがピクチャヘッダNALユニットである場合、デコーダは、ピクチャの第1のVCL NALユニットが、復号順序において現在のNALユニットに続くVCL NALユニットであると決定し、他の場合、停止する。
ステップ4.現在のNALユニットがVCL NALユニットである場合、デコーダは、現在のNALユニット中の状態シンタックスエレメント値を検査し、状態シンタックスエレメント値が、スライスを備えるピクチャについてのピクチャヘッダがないことを指定する値に等しい場合、デコーダは、ピクチャの第1のVCL NALユニットが現在のNALユニットであると決定し、他の場合、停止する。
ステップ5.デコーダは、新しい現在のNALユニットとして復号順序において次のNALユニットを収集し、ステップ2において続く。
この実施形態の変形態では、状態シンタックスエレメントは、ビットストリーム中のコード化ピクチャの開始を指定する第3の状態値を有し得る。この実施形態の一例では、状態シンタックスエレメントの第1の値は、現在ピクチャについてピクチャヘッダが使用されないことを指定し、状態シンタックスエレメントの第2の値は、現在ピクチャについてピクチャヘッダが使用されることを指定し、状態シンタックスエレメントの第3の値は、現在ピクチャについてピクチャヘッダが使用されないことを指定し、ビットストリーム中のコード化ピクチャの開始を指定する。
発明概念の様々な実施形態が説明されたので、発明概念の様々な実施形態を実施するためにデコーダが実行する動作が説明されるものとする。図8Aおよび図8Bを参照すると、次に、発明概念のいくつかの実施形態による、図8A~図8Bのフローチャートを参照しながら、(図7のブロック図の構造を使用して実装される)デコーダ506の動作が説明される。たとえば、モジュールが図7のメモリ705に記憶され得、これらのモジュールは、モジュールの命令がそれぞれの無線デバイス処理回路703によって実行されたとき、処理回路703がフローチャートのそれぞれの動作を実施するような命令を提供し得る。
ブロック801において、処理回路703は、パラメータセット中の第1の状態シンタックスエレメントから第1の状態値を復号し得、第1の状態値は、CLVSのCVS中のすべてのスライスヘッダ中の第2の状態シンタックスエレメントからの第2の状態値が、すべてのピクチャヘッダについて同じであるものとするか否かを指定する。第1の状態値が、第2の状態シンタックスエレメントからの第2の状態値が同じであるものとすることを指示しない場合、各スライスが単独で復号される。
ブロック803において、処理回路703は、第1の状態値が、第2のシートシンタックスエレメントからの第2の状態値が、すべてのピクチャヘッダについて同じであるものとすることを指示するかどうかを決定し得る。
第1の状態値が、第2のスタットシンタックスエレメントからの第2の状態値が同じであるものとすることを指示することに応答して、処理回路73は、ブロック805において、第1のピクチャのスライスヘッダ中の第2の状態シンタックスエレメントから第2の状態値を復号し得、第2の状態値は、第1のピクチャについてピクチャヘッダが使用されるか否かを指定する。
ブロック807において、第1のピクチャについての状態値が第1の値であることに応答して、処理回路703は、現在ピクチャについてのピクチャヘッダがないと推論し得る。ブロック809において、処理回路703は、スライスヘッダについて、シンタックスエレメントの第1のセットの復号された値を取得するために、シンタックスエレメントの第1のセットを復号し得る。ブロック811において、処理回路703は、第1のピクチャのスライスを復号するために、シンタックスエレメントの第1のセットの復号された値を使用し得る。
ブロック813において、処理回路703は、状態値が第2の値であることに応答して、現在ピクチャについてのピクチャヘッダがあると推論し得る。ブロック815において、処理回路703は、スライスヘッダについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号し得る。ブロック817において、処理回路703は、第1のピクチャの現在スライスを復号するために、シンタックスエレメントの第2のセットの復号された値を使用し得、シンタックスエレメントの第2のセットは、シンタックスエレメントの第1のセットと同じシンタックスエレメントを含んでいる。
ブロック819において、処理回路703は、第2のピクチャのスライスヘッダ中の第2の状態シンタックスエレメントから第2の状態値を復号し得、第2の状態値は、第2の現在ピクチャについてピクチャヘッダが使用されるか否かを指定する。
ブロック821において、第2の状態値が第2の値であることに応答して、処理回路703は、第2のピクチャについてのピクチャヘッダがあると推論し得る。ブロック823において、プロセス回路703は、第2のピクチャについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号し得る。ブロック825において、処理回路703は、第2のピクチャのスライスを復号するために、シンタクティックエレメントの第2のセットの復号された値を使用し得る。
処理回路703は、状態値が第1の値であることに応答して、ピクチャが単一のスライスを含んでいると推論し得る。一実施形態では、処理回路703は、状態値が第1の値であることに応答して、現在ピクチャについての複数のスライスを受信したことに応答してアクションを実施し得る。一実施形態では、アクションを実施することは、ビットストリームがコーデック仕様に準拠しないと決定することを含む。別の実施形態では、アクションを実施することは、ビット誤りが発生したと決定することと、ビット誤りが発生したと決定したことに応答してビット誤りを報告することとを含む。さらなる実施形態では、アクションを実施する際に、処理回路703は、ビット誤りが発生したと決定し得る。処理回路703は、データの損失が発生したと決定し得る。処理回路703は、データの損失が発生したと決定したことに応答して誤り隠蔽を実施し得る。別の実施形態では、アクションを実施することは、エンコーダが非準拠エンコーダであると決定することを含む。
図8のフローチャートからの様々な動作は、デコーダおよび関係する方法のいくつかの実施形態に関して随意であり得る。(以下に記載される)例示的な実施形態1の方法に関して、たとえば、図8Aおよび図8Bのブロック801、803、819、821、823、および825の動作は随意であり得る。
上記で説明された発明概念の別の実施形態では、現在のCVSまたはCLVS中のすべての状態シンタックスエレメントが同じ値を有するものとすることを述べるルールがあり得る。次に図9Aおよび図9Bを参照すると、ブロック901において、処理回路703は、第1のピクチャのスライスのスライスヘッダ中の第1の状態シンタックスエレメントから第1の状態値を復号し得、第1の状態値は、第1のピクチャについてピクチャヘッダが使用されるか否かを指定する。ブロック903において、処理回路703は、第2のピクチャのスライスヘッダ中の第1の日付シンタックスエレメントから第2の状態値を復号し得、第2の状態値は、第2のピクチャについてピクチャヘッダが使用されるか否かを指定する。
第2の状態値が第1の日付値と同じ意味を表さないことに応答して、処理回路703は、ブロック905において、ビットストリームがコーデック仕様に準拠しないと決定し得、アクションを実施し得る。処理回路703は、上記と同じアクションを実施し得る。
第2の状態値が第1の状態値と同じ意味を表すことに応答して、およびその状態値が第1の値であることに応答して、処理回路703は、ブロック907において、現在ピクチャについてのピクチャヘッダがないと推論し得る。ブロック909において、処理回路703は、スライスヘッダについて、シンタックスエレメントの第1のセットの復号された値を取得するために、シンタックスエレメントの第1のセットを復号し得る。ブロック911において、処理回路703は、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第1のセットの復号された値を使用し得る。
第2の状態値が第1の状態値と同じ意味を表すことに応答して、およびその状態値が第2の値であることに応答して、処理回路703は、ブロック913において、現在ピクチャについてのピクチャヘッダがあると推論し得る。ブロック915において、処理回路703は、スライスヘッダについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号し得る。シンタックスエレメントの第2のセットは、シンタックスエレメントの第1のセットと同じエレメントであり得る。ブロック917において、処理回路703は、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第2のセットの復号された値を使用し得る。
上記のように、ビットストリーム中のコード化ピクチャの開始が、ピクチャヘッダを見つけること、またはスライスを備えるピクチャについてのピクチャヘッダがないことを指定する値を有する状態シンタックスエレメントをもつNALユニットを見つけることから決定される。図10を参照すると、ブロック1001において、処理回路703は、ビットストリームからネットワークアブストラクトレイヤ(NAL)ユニットを収集し得る。ブロック1003において、処理回路703は、現在のNALユニットがピクチャヘッダNALユニットであるかどうか、または現在のNALユニットがビデオコーディングレイヤ(VCL)NALユニットであるかどうかを決定し得る。
ブロック1005において、処理ユニット703は、現在のNALユニットがピクチャヘッダNALユニットであることに応答して、ピクチャの第1のVCL NALユニットが、復号順序において現在のNALユニットに続くVCL NALユニットであると決定し得る。
現在のNALユニットがVCL NALユニットであることに応答して、処理回路703は、現在のNALユニット中のステータスシンタックスエレメント値を検査し、状態シンタックスエレメント値が、スライスを備えるピクチャについてのピクチャヘッダがないことを指定する値に等しい場合、ブロック1009において、ピクチャの第1のVCL NALユニットが現在のNALユニットであると決定し得る。
現在のNALユニットがピクチャヘッダNALユニットでないこと、または現在のNAユニットがVCL NALユニットであることに応答して、および状態シンタックスエレメント値が、スライスを備えるピクチャについてのピクチャヘッダがないことを指定する値に等しくない場合、ブロック1011において、新しい現在のNALユニットとして、復号順序において次のNALユニットを収集する。
次に、発明概念のいくつかの実施形態による、図11のフローチャートを参照しながら、(図6の構造を使用して実装される)エンコーダ500の動作が説明される。たとえば、モジュールは、図6のメモリ605に記憶され得、これらのモジュールは、モジュールの命令がそれぞれのエンコーダ処理回路603によって実行されたとき、処理回路603がフローチャートのそれぞれの動作を実施するような命令を提供し得る。
図11を参照すると、ブロック1101において、処理回路603は、現在ピクチャについてのピクチャヘッダがあるか否かを決定し得る。現在ピクチャについてのピクチャヘッダがないと判断したことに応答して、処理回路603は、ブロック1103において、状態シンタックスエレメントの第1の値をビットストリームに符号化し得る。状態シンタックスエレメントは、現在ピクチャのスライス中にまたはパラメータセット中に符号化され得る。ブロック1105において、処理回路603は、現在ピクチャを符号化するために、シンタックスエレメントの第1のセットを使用し得る。
現在ピクチャブロックについてのピクチャヘッダがあると判断したことに応答して、ブロック1107において、処理回路603は、状態シンタックスエレメントの第2の値をビットストリームに符号化し得る。ブロック1109において、処理回路603は、現在ピクチャを符号化するために、シンタックスエレメントの第2のセットを使用し得る。
例示的な実施形態が以下で説明される。
A1.ビットストリームから現在ピクチャを復号する方法であって、方法は、現在ピクチャの現在スライスのスライスヘッダ中の状態シンタックスエレメントから状態値を復号すること(805)であって、状態値は、現在ピクチャについてピクチャヘッダが使用されるか否かを指定する、状態値を復号すること(805)と、状態値が第1の値であることに応答して、現在ピクチャについてのピクチャヘッダがないと推論すること(807)と、スライスヘッダについて、シンタックスエレメントの第1のセットの復号された値を取得するために、シンタックスエレメントの第1のセットを復号すること(809)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第1のセットの復号された値を使用すること(811)と、状態値が第2の値であることに応答して、現在ピクチャについてのピクチャヘッダがあると推論すること(813)と、スライスヘッダについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号すること(815)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第2のセットの復号された値を使用すること(817)であって、シンタックスエレメントの第2のセットが、シンタックスエレメントの第1のセットと同じシンタックスエレメントを含んでいる、シンタックスエレメントの第2のセットの復号された値を使用すること(817)とを含む、方法。
A2.状態値が第1の値であることに応答して、ピクチャが単一のスライスを含んでいると推論することをさらに含む、実施形態A1に記載の方法。
A3.状態値が第1の値であることに応答して、現在ピクチャについての複数のスライスを受信したことに応答して、アクションを実施することをさらに含む、実施形態A1またはA2に記載の方法。
A4.アクションを実施することは、ビットストリームがコーデック仕様に準拠しないと決定することを含む、実施形態A3に記載の方法。
A5.アクションを実施することは、ビット誤りが発生したと決定することと、ビット誤りが発生したと決定したことに応答してビット誤りを報告することとを含む、実施形態A3に記載の方法。
A6.アクションを実施することは、データの損失が発生したと決定することと、データの損失が発生したと決定したことに応答して誤り隠蔽を実施することとを含む、実施形態A3に記載の方法。
A7.アクションを実施することは、エンコーダが非準拠デコーダであると決定することを含む、実施形態A3に記載の方法。
A8.ビットストリームから複数のピクチャを復号する方法であって、方法は、パラメータセット中の第1の状態シンタックスエレメントから第1の状態値を復号すること(801)であって、第1の状態値は、コード化ビデオストリーム(CVS)またはコード化レイヤビデオシーケンス(CVLS)中のすべてのスライスヘッダ中の第2の状態シンタックスエレメントからの第2の状態値が、すべてのピクチャヘッダについて同じであるものとするか否かを指定する、第1の状態値を復号すること(801)と、第1の状態値が、第2の状態シンタックスエレメントからの第2の状態値が同じであるものとすることを指示することに応答して(803)、第1のピクチャのスライスヘッダ中の第2の状態シンタックスエレメントから第2の状態値を復号すること(805)であって、第2の状態値は、第1のピクチャについてピクチャヘッダが使用されるか否かを指定する、第2の状態値を復号すること(805)と、第1のピクチャについての状態値が第1の値であることに応答して、現在ピクチャについてのピクチャヘッダがないと推論すること(807)と、スライスヘッダについて、シンタックスエレメントの第1のセットの復号された値を取得するために、シンタックスエレメントの第1のセットを復号すること(809)と、第1のピクチャのスライスを復号するために、シンタックスエレメントの第1のセットの復号された値を使用すること(811)と、第2のピクチャのスライスヘッダ中の第2の状態シンタックスエレメントから第2の状態値を復号すること(819)であって、第2の状態値は、現在ピクチャについてピクチャヘッダが使用されるか否かを指定する、第2の状態値を復号すること(819)と、第2の状態値が第2の値であることに応答して、第2のピクチャについてのピクチャヘッダがあると推論すること(821)と、第2のピクチャについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号すること(823)と、第2のピクチャのスライスを復号するために、シンタックスエレメントの第2のセットの復号された値を使用すること(825)とを含む、方法。
A9.ビットストリームから複数のピクチャを復号する方法であって、方法は、第1のピクチャのスライスのスライスヘッダ中の第1の状態シンタックスエレメントから第1の状態値を復号すること(901)であって、第1の状態値は、第1のピクチャについてピクチャヘッダが使用されるか否かを指定する、第1の状態値を復号すること(901)と、第2のピクチャのスライスのスライスヘッダ中の第1の状態シンタックスエレメントから第2の状態値を復号すること(903)であって、第2の状態値は、第2のピクチャについてピクチャヘッダが使用されるか否かを指定する、第2の状態値を復号すること(903)と、第2の状態値が第1の状態値と同じ意味を表さないことに応答して、ビットストリームがコーデック仕様に準拠しないと決定すること(905)、およびアクションを実施することと、第2の状態値が第1の状態値と同じ意味を表すことに応答して、状態値が第1の値であることに応答して、現在ピクチャについてのピクチャヘッダがないと推論すること(907)と、スライスヘッダについて、シンタックスエレメントの第1のセットの復号された値を取得するために、シンタックスエレメントの第1のセットを復号すること(909)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第1のセットの復号された値を使用すること(911)と、状態値が第2の値であることに応答して、現在ピクチャについてのピクチャヘッダがあると推論すること(913)と、スライスヘッダについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号すること(915)と、シンタックスエレメントの第2のセットの復号された値を使用すること(917)であって、シンタックスエレメントの第2のセットが、シンタックスエレメントの第1のセットと同じシンタックスエレメントを含んでいる、シンタックスエレメントの第2のセットの復号された値を使用すること(917)とを含む、方法。
A10.ビットストリームから複数のピクチャを復号する方法であって、方法は、ビットストリームから現在のネットワークアブストラクションレイヤ(NAL)ユニットを収集すること(1001)と、現在のNALユニットがピクチャヘッダNALユニットであるかどうか、または現在のNALユニットがビデオコーディングレイヤ(VCL)NALユニットであるかどうかを決定すること(1003)と、現在のNALユニットがピクチャヘッダNALユニットであることに応答して、ピクチャの第1のVCL NALユニットが、復号順序において現在のNALユニットに続くVCL NALユニットであると決定すること(1005)と、現在のNALユニットがVCL NALユニットであることに応答して、現在のNALユニット中の状態シンタックスエレメント値を検査すること(1007)と、状態シンタックスエレメント値が、スライスを備えるピクチャについてのピクチャヘッダがないことを指定する値に等しい場合、ピクチャの第1のVCL NALユニットが現在のNALユニットであると決定すること(1009)と、現在のNALユニットがピクチャヘッダNALユニットでないこと、または現在のNALユニットがVCL NALユニットであることに応答して、および状態シンタックスエレメント値が、スライスを備えるピクチャについてのピクチャヘッダがないことを指定する値に等しくない場合、新しい現在のNALユニットとして復号順序において次のNALユニットを収集すること(1011)とを含む、方法。
A11.通信ネットワークのためのデコーダ(506)であって、デコーダ(506)が、プロセッサ(701)と、プロセッサに結合されたメモリ(703)とを備え、メモリは、プロセッサによって実行されたとき、プロセッサに、現在ピクチャの現在スライスのスライスヘッダ中の状態シンタックスエレメントから状態値を復号すること(805)であって、状態値は、現在ピクチャについてピクチャヘッダが使用されるか否かを指定する、状態値を復号すること(805)と、状態値が第1の値であることに応答して、現在ピクチャについてのピクチャヘッダがないと推論すること(807)と、スライスヘッダについて、シンタックスエレメントの第1のセットの復号された値を取得するために、シンタックスエレメントの第1のセットを復号すること(809)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第1のセットの復号された値を使用すること(811)と、状態値が第2の値であることに応答して、現在ピクチャについてのピクチャヘッダがあると推論すること(813)と、スライスヘッダについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号すること(815)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第2のセットの復号された値を使用すること(817)であって、シンタックスエレメントの第2のセットが、シンタックスエレメントの第1のセットと同じシンタックスエレメントを含んでいる、シンタックスエレメントの第2のセットの復号された値を使用すること(817)とを含む動作を実施させる命令を備える、デコーダ(506)。
A12.メモリ(503)が、プロセッサ(501)によって実行されたとき、プロセッサ(501)に、実施形態A2からA7のいずれか1つに記載の動作を実施させるさらなる命令を備える、実施形態A11に記載のデコーダ。
A13.コンピュータ実行可能命令を備えるコンピュータプログラム製品であって、コンピュータ実行可能命令は、コンピュータ実行可能命令が、デバイス(306)中に備えられるプロセッサ(501)上で実行されたとき、デバイス(306)に、現在ピクチャの現在スライスのスライスヘッダ中の状態シンタックスエレメントから状態値を復号すること(805)であって、状態値は、現在ピクチャについてピクチャヘッダが使用されるか否かを指定する、状態値を復号すること(805)と、状態値が第1の値であることに応答して、現在ピクチャについてのピクチャヘッダがないと推論すること(807)と、スライスヘッダについて、シンタックスエレメントの第1のセットの復号された値を取得するために、シンタックスエレメントの第1のセットを復号すること(809)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第1のセットの復号された値を使用すること(811)と、状態値が第2の値であることに応答して、現在ピクチャについてのピクチャヘッダがあると推論すること(813)と、スライスヘッダについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号すること(815)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第2のセットの復号された値を使用すること(817)であって、シンタックスエレメントの第2のセットが、シンタックスエレメントの第1のセットと同じシンタックスエレメントを含んでいる、シンタックスエレメントの第2のセットの復号された値を使用すること(817)とを含む動作を実施させるように設定された、コンピュータプログラム製品。
A14.さらなるコンピュータ実行可能命令であって、コンピュータ実行可能命令が、デバイス(506)中に備えられるプロセッサ上で実行されたとき、デバイス(506)に、実施形態A2からA7のいずれか一項に記載の方法を実施させるように設定された、さらなるコンピュータ実行可能命令を備える実施形態A13に記載のコンピュータプログラム製品。
A15.コンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、コンピュータ可読記憶媒体は、コンピュータ実行可能命令を有し、コンピュータ実行可能命令は、コンピュータ実行可能命令が、デバイス(306)中に備えられるプロセッサ上で実行されたとき、デバイス(306)に、現在ピクチャの現在スライスのスライスヘッダ中の状態シンタックスエレメントから状態値を復号すること(805)であって、状態値は、現在ピクチャについてピクチャヘッダが使用されるか否かを指定する、状態値を復号すること(805)と、状態値が第1の値であることに応答して、現在ピクチャについてのピクチャヘッダがないと推論すること(807)と、スライスヘッダについて、シンタックスエレメントの第1のセットの復号された値を取得するために、シンタックスエレメントの第1のセットを復号すること(809)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第1のセットの復号された値を使用すること(811)と、状態値が第2の値であることに応答して、現在ピクチャについてのピクチャヘッダがあると推論すること(813)と、スライスヘッダについて、シンタックスエレメントの第2のセットの復号された値を取得するために、シンタックスエレメントの第2のセットを復号すること(815)と、現在ピクチャの現在スライスを復号するために、シンタックスエレメントの第2のセットの復号された値を使用すること(817)であって、シンタックスエレメントの第2のセットが、シンタックスエレメントの第1のセットと同じシンタックスエレメントを含んでいる、シンタックスエレメントの第2のセットの復号された値を使用すること(817)とを含む動作を実施させるように設定された、コンピュータプログラム製品。
A16.さらなるコンピュータ実行可能命令であって、さらなるコンピュータ実行可能命令が、デバイス(306)中に備えられるプロセッサ(501)上で実行されたとき、デバイス(306)に、実施形態A2からA7のいずれか一項に記載の方法を実施させるように設定された、さらなるコンピュータ実行可能命令を有する実施形態A15に記載のコンピュータプログラム製品。
A17.現在ピクチャをビットストリームに符号化する方法であって、方法は、現在ピクチャについてのピクチャヘッダがあるか否かを決定すること(1101)と、現在ピクチャについてのピクチャヘッダがないと判断したことに応答して、状態シンタックスエレメントの第1の値をビットストリームに符号化すること(1103)と、現在ピクチャを符号化するためにシンタックスエレメントの第1のセットを使用すること(1105)と、現在ピクチャについてのピクチャヘッダがあると判断したことに応答して、状態シンタックスエレメントの第2の値をビットストリームに符号化すること(1107)と、現在ピクチャを符号化するためにシンタックスエレメントの第2のセットを使用すること(1109)とを含む、方法。
A18.通信ネットワークのためのエンコーダであって、前記エンコーダが、プロセッサ(501)と、プロセッサに結合されたメモリ(503)とを備え、メモリは、プロセッサによって実行されたとき、プロセッサに、現在ピクチャについてのピクチャヘッダがあるか否かを決定すること(1101)と、現在ピクチャについてのピクチャヘッダがないと判断したことに応答して、状態シンタックスエレメントの第1の値をビットストリームに符号化すること(1103)と、現在ピクチャの現在スライスを符号化するためにシンタックスエレメントの第1のセットを使用すること(1105)と、現在ピクチャについてのピクチャヘッダがあると判断したことに応答して、状態シンタックスエレメントの第2の値をビットストリームに符号化すること(1107)と、現在ピクチャの現在スライスを符号化するためにシンタックスエレメントの第2のセットを使用すること(1109)とを含む動作を実施させる命令を備える、エンコーダ。
A19.コンピュータ実行可能命令を備えるコンピュータプログラム製品であって、コンピュータ実行可能命令は、コンピュータ実行可能命令がデバイス(500)中に備えられるプロセッサ上で実行されたとき、デバイス(500)に、現在ピクチャについてのピクチャヘッダがあるか否かを決定すること(1101)と、現在ピクチャについてのピクチャヘッダがないと判断したことに応答して、状態シンタックスエレメントの第1の値をビットストリームに符号化すること(1103)と、現在ピクチャの現在スライスを符号化するためにシンタックスエレメントの第1のセットを使用すること(1105)と、現在ピクチャについてのピクチャヘッダがあると判断したことに応答して、状態シンタックスエレメントの第2の値をビットストリームに符号化すること(1107)と、現在ピクチャの現在スライスを符号化するためにシンタックスエレメントの第2のセットを使用すること(1109)とを含む動作を実施させるように設定された、コンピュータプログラム製品。
A20.コンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、コンピュータ可読記憶媒体は、コンピュータ実行可能命令を有し、コンピュータ実行可能命令は、コンピュータ実行可能命令がデバイス(500)中に備えられるプロセッサ上で実行されたとき、デバイス(500)に、現在ピクチャについてのピクチャヘッダがあるか否かを決定すること(1101)と、現在ピクチャについてのピクチャヘッダがないと判断したことに応答して、状態シンタックスエレメントの第1の値をビットストリームに符号化すること(1103)と、現在ピクチャの現在スライスを符号化するためにシンタックスエレメントの第1のセットを使用すること(1105)と、現在ピクチャについてのピクチャヘッダがあると判断したことに応答して、状態シンタックスエレメントの第2の値をビットストリームに符号化すること(1107)と、現在ピクチャの現在スライスを符号化するためにシンタックスエレメントの第2のセットを使用すること(1109)とを含む動作を実施させるように設定された、コンピュータプログラム製品。
追加の説明が以下で提供される。
概して、本明細書で使用されるすべての用語は、異なる意味が、明確に与えられ、および/またはその用語が使用されるコンテキストから暗示されない限り、関連する技術分野における、それらの用語の通常の意味に従って解釈されるべきである。1つの(a/an)/その(the)エレメント、装置、構成要素、手段、ステップなどへのすべての言及は、別段明示的に述べられていない限り、そのエレメント、装置、構成要素、手段、ステップなどの少なくとも1つの事例に言及しているものとしてオープンに解釈されるべきである。本明細書で開示されるいずれの方法のステップも、ステップが、別のステップに後続するかまたは先行するものとして明示的に説明されない限り、および/あるいはステップが別のステップに後続するかまたは先行しなければならないことが暗黙的である場合、開示される厳密な順序で実施される必要はない。本明細書で開示される実施形態のいずれかの任意の特徴は、適切であればいかなる場合も、任意の他の実施形態に適用され得る。同様に、実施形態のいずれかの任意の利点は、任意の他の実施形態に適用され得、その逆も同様である。同封の実施形態の他の目標、特徴、および利点は、以下の説明から明らかになる。
本明細書で開示される任意の適切なステップ、方法、特徴、機能、または利益は、1つまたは複数の仮想装置の1つまたは複数の機能ユニットまたはモジュールを通して実施され得る。各仮想装置は、いくつかのこれらの機能ユニットを備え得る。これらの機能ユニットは、1つまたは複数のマイクロプロセッサまたはマイクロコントローラを含み得る、処理回路、ならびに、デジタル信号プロセッサ(DSP)、専用デジタル論理などを含み得る、他のデジタルハードウェアを介して実装され得る。処理回路は、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、キャッシュメモリ、フラッシュメモリデバイス、光記憶デバイスなど、1つまたはいくつかのタイプのメモリを含み得る、メモリに記憶されたプログラムコードを実行するように設定され得る。メモリに記憶されたプログラムコードは、1つまたは複数の通信および/またはデータ通信プロトコルを実行するためのプログラム命令、ならびに本明細書で説明される技法のうちの1つまたは複数を行うための命令を含む。いくつかの実装形態では、処理回路は、それぞれの機能ユニットに、本開示の1つまたは複数の実施形態による、対応する機能を実施させるために使用され得る。
ユニットという用語は、エレクトロニクス、電気デバイス、および/または電子デバイスの分野での通常の意味を有し得、たとえば、本明細書で説明されるものなど、それぞれのタスク、プロシージャ、算出、出力、および/または表示機能を行うための、電気および/または電子回路、デバイス、モジュール、プロセッサ、メモリ、論理固体および/または個別デバイス、コンピュータプログラムまたは命令などを含み得る。
略語
以下の略語のうちの少なくともいくつかが本開示で使用され得る。略語間の不整合がある場合、その略語が上記でどのように使用されるかが選好されるべきである。以下で複数回リストされる場合、最初のリスティングが(1つまたは複数の)後続のリスティングよりも選好されるべきである。
AU アクセスユニット
AUD アクセスユニットデリミタ
ALF 適応ループフィルタ
APS 適応パラメータセット
BLA 切断リンクアクセス
CLVS コード化レイヤビデオシーケンス
CRA クリーンランダムアクセス
CVS コード化ビデオストリーム
CVSS CVS開始
CU コーディングユニット
DPS 復号パラメータセット
DRAP 依存ランダムアクセスポイント
GDR 漸進的復号リフレッシュ
HEVC 高効率ビデオコーディング
IDR 瞬時復号リフレッシュ
IRAP イントラランダムアクセスポイント
LMCS ルーママッピングおよびクロマスケーリング
MPEG モーションピクチャエキスパートグループ
NAL ネットワークアブストラクションレイヤ
NALU NALユニット
NUT NALユニットタイプ
PPS ピクチャパラメータセット
RADL ランダムアクセス復号可能リーディング
RAP ランダムアクセスポイント
RASL ランダムアクセススキップリーディング
RBSP ローバイトシーケンスペイロード
RPL 参照ピクチャリスト
SEI 補足エンハンスメントレイヤ
SPS シーケンスパラメータセット
STSA ステップワイズ時間レイヤアクセス
VCL ビデオコーディングレイヤ
VPS ビデオパラメータセット
VVC 多用途ビデオコーディング
本発明概念の様々な実施形態の上記の説明では、本明細書で使用される専門用語は、具体的な実施形態を説明するためのものにすぎず、本発明概念を限定するものではないことを理解されたい。別段に規定されていない限り、本明細書で使用される(技術用語および科学用語を含む)すべての用語は、本発明概念が属する技術の当業者によって通常理解されるものと同じ意味を有する。通常使用される辞書において規定される用語など、用語は、本明細書および関連技術の文脈におけるそれらの用語の意味に従う意味を有するものとして解釈されるべきであり、明確にそのように本明細書で規定されない限り、理想的なまたは過度に形式的な意味において解釈されないことをさらに理解されよう。
エレメントが、別のエレメントに「接続された」、「結合された」、「応答する」、またはそれらの変形態であると呼ばれるとき、そのエレメントは、他のエレメントに直接、接続され、結合され、または応答し得、あるいは介在するエレメントが存在し得る。対照的に、エレメントが、別のエレメントに「直接接続された」、「直接結合された」、「直接応答する」、またはそれらの変形態であると呼ばれるとき、介在するエレメントが存在しない。同様の番号は、全体にわたって同様のエレメントを指す。さらに、本明細書で使用される、「結合された」、「接続された」、「応答する」、またはそれらの変形態は、無線で結合された、無線で接続された、または無線で応答する、を含み得る。本明細書で使用される単数形「a」、「an」および「the」は、コンテキストが別段に明確に指示するのでなければ、複数形をも含むものとする。簡潔および/または明快のために、よく知られている機能または構築が詳細に説明されないことがある。「および/または」(「/」と略される)という用語は、関連するリストされた項目のうちの1つまたは複数の任意のおよび全部の組合せを含む。
様々なエレメント/動作を説明するために、第1の、第2の、第3の、などの用語が本明細書で使用され得るが、これらのエレメント/動作は、これらの用語によって限定されるべきでないことを理解されよう。これらの用語は、あるエレメント/動作を別のエレメント/動作と区別するために使用されるにすぎない。したがって、本発明概念の教示から逸脱することなしに、いくつかの実施形態における第1のエレメント/動作が、他の実施形態において第2のエレメント/動作と呼ばれることがある。同じ参照番号または同じ参照符号は、本明細書全体にわたって同じまたは同様のエレメントを示す。
本明細書で使用される、「備える、含む(comprise)」、「備える、含む(comprising)」、「備える、含む(comprises)」、「含む(include)」、「含む(including)」、「含む(includes)」、「有する(have)」、「有する(has)」、「有する(having)」という用語、またはそれらの変形態は、オープンエンドであり、1つまたは複数の述べられた特徴、整数、エレメント、ステップ、構成要素または機能を含むが、1つまたは複数の他の特徴、整数、エレメント、ステップ、構成要素、機能またはそれらのグループの存在または追加を排除しない。さらに、本明細書で使用される、「たとえば(exempli gratia)」というラテン語句に由来する「たとえば(e.g.)」という通例の略語は、前述の項目の一般的な1つまたは複数の例を紹介するかまたは具体的に挙げるために使用され得、そのような項目を限定するものではない。「すなわち(id est)」というラテン語句に由来する「すなわち(i.e.)」という通例の略語は、より一般的な具陳から特定の項目を具体的に挙げるために使用され得る。
例示的な実施形態が、コンピュータ実装方法、装置(システムおよび/またはデバイス)および/またはコンピュータプログラム製品のブロック図および/またはフローチャート例示を参照しながら本明細書で説明された。ブロック図および/またはフローチャート例示のブロック、ならびにブロック図および/またはフローチャート例示中のブロックの組合せが、1つまたは複数のコンピュータ回路によって実施されるコンピュータプログラム命令によって実装され得ることを理解されたい。これらのコンピュータプログラム命令は、汎用コンピュータ回路、専用コンピュータ回路、および/またはマシンを作り出すための他のプログラマブルデータ処理回路のプロセッサ回路に提供され得、したがって、コンピュータおよび/または他のプログラマブルデータ処理装置のプロセッサを介して実行する命令は、ブロック図および/またはフローチャートの1つまたは複数のブロックにおいて指定された機能/行為を実装するために、およびそれにより、ブロック図および/またはフローチャートの(1つまたは複数の)ブロックにおいて指定された機能/行為を実装するための手段(機能)および/または構造を作成するために、トランジスタ、メモリロケーションに記憶された値、およびそのような回路内の他のハードウェア構成要素を変換および制御する。
これらのコンピュータプログラム命令はまた、コンピュータまたは他のプログラマブルデータ処理装置に特定の様式で機能するように指示することができる、有形コンピュータ可読媒体に記憶され得、したがって、コンピュータ可読媒体に記憶された命令は、ブロック図および/またはフローチャートの1つまたは複数のブロックにおいて指定された機能/行為を実装する命令を含む製造品を作り出す。したがって、本発明概念の実施形態は、ハードウェアで、および/または「回路」、「モジュール」またはそれらの変形態と総称して呼ばれることがある、デジタル信号プロセッサなどのプロセッサ上で稼働する(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)ソフトウェアで具現され得る。
また、いくつかの代替実装形態では、ブロック中で言及される機能/行為は、フローチャート中で言及される順序から外れて行われ得ることに留意されたい。たとえば、関与する機能/行為に応じて、連続して示されている2つのブロックが、事実上、実質的にコンカレントに実行され得るか、またはブロックが、時々、逆の順序で実行され得る。その上、フローチャートおよび/またはブロック図の所与のブロックの機能が、複数のブロックに分離され得、ならびに/あるいはフローチャートおよび/またはブロック図の2つまたはそれ以上のブロックの機能が、少なくとも部分的に統合され得る。最後に、他のブロックが、示されているブロック間に追加/挿入され得、および/または発明概念の範囲から逸脱することなく、ブロック/動作が省略され得る。その上、図のうちのいくつかが、通信の主要な方向を示すために通信経路上に矢印を含むが、通信が、図示された矢印と反対方向に行われ得ることを理解されたい。
本発明概念の原理から実質的に逸脱することなしに、実施形態に対して多くの変形および修正が行われ得る。すべてのそのような変形および修正は、本発明概念の範囲内で本明細書に含まれるものとする。したがって、上記で開示された主題は、例示であり、限定するものではないと見なされるべきであり、実施形態の例は、本発明概念の趣旨および範囲内に入る、すべてのそのような修正、拡張、および他の実施形態を包含するものとする。したがって、法によって最大限に許容される限りにおいて、本発明概念の範囲は、実施形態およびそれらの等価物の例を含む、本開示の最も広い許容可能な解釈によって決定されるべきであり、上記の詳細な説明によって制限または限定されるべきでない。
参考文献
JVET-Q0255-v1.zip、Versatile Video Coding、B.Bross、J.Chen、S.Liu、Y.K.Wang
JVET-Q0426-v1.zip、Versatile Video Coding、B.Bross、J.Chen、S.Liu、Y.K.Wang

Claims (19)

  1. ビットストリームからピクチャを復号するための方法であって、前記方法は、
    前記ピクチャのスライスについてのスライスヘッダを受信することであって、前記スライスヘッダが状態シンタックスエレメントを備える、スライスヘッダを受信することと、
    前記スライスヘッダ中の前記状態シンタックスエレメントから状態値を復号すること(805)であって、a)前記状態値が第1の値に等しくない場合、前記状態値は、i)前記ビットストリームが、前記ピクチャについてピクチャシンタックスエレメントのセットを備えるピクチャヘッダネットワークアブストラクションレイヤ(NAL)ユニットを含み、前記ピクチャヘッダNALユニットが、復号順序において前記スライスに先行し、前記ピクチャヘッダNALユニットと前記スライスとが、同じアクセスユニットまたはピクチャユニットに属することと、ii)前記スライスヘッダがピクチャシンタックスエレメントの前記セットを備えないこととを指示し、b)前記状態値が前記第1の値に等しい場合、前記状態値は、i)前記スライスヘッダがピクチャシンタックスエレメントの前記セットを含んでいることと、ii)前記ビットストリームが前記ピクチャについてのピクチャヘッダを備えるピクチャヘッダNALユニットを含まないこととを指示する、状態値を復号すること(805)と、
    前記ピクチャの前記スライスを復号するためにピクチャシンタックスエレメントの前記セットを使用することと
    を含み、
    前記ビットストリームが、コード化ビデオシーケンス(CVS)またはコード化レイヤビデオシーケンス(CLVS)を備え、
    前記ピクチャが、前記CVSまたは前記CLVS内のピクチャであり、
    前記CVSまたは前記CLVSが、前記スライスヘッダを含む複数のスライスヘッダを備え、
    前記CVSまたは前記CLVS中に含まれる各スライスヘッダが、前記状態シンタックスエレメントを備え、
    各前記状態シンタックスエレメントが、同じ値を符号化しなければならない、方法。
  2. 前記状態シンタックスエレメントがバイナリフラグである、請求項1に記載の方法。
  3. ピクチャシンタックスエレメントの前記セットが、ピクチャパラメータセット(PPS)を識別するための値を符号化するPPSシンタックスエレメントを備える、請求項1または2に記載の方法。
  4. 前記スライスヘッダを受信することが、前記スライスヘッダとスライスデータとを備えるNALユニットを受信することを含む、請求項1から3のいずれか一項に記載の方法。
  5. 前記状態値が前記第1の値に等しくなく、前記状態値は、前記ビットストリームが前記ピクチャについてのピクチャヘッダを含むことを指示する、請求項1から4のいずれか一項に記載の方法。
  6. 前記スライスヘッダを受信するより前に、前記ピクチャヘッダを受信することをさらに含み、
    前記ピクチャヘッダを受信することが、前記ピクチャヘッダを備える第1のネットワークアブストラクションレイヤ(NAL)ユニットを受信することを含み、
    前記スライスヘッダを受信することが、前記スライスヘッダを備える第2のNALユニットを受信することを含み、
    前記ピクチャヘッダを備える前記第1のNALユニットが、復号順序において前記スライスヘッダを備える前記第2のNALユニットに先行する、
    請求項5に記載の方法。
  7. 前記第1のNALユニットが、非ビデオコーディングレイヤ(非VCL)NALユニットであり、
    前記第2のNALユニットが、ビデオコーディングレイヤ(VCL)NALユニットである、
    請求項6に記載の方法。
  8. 前記第1のNALユニットと前記第2のNALユニットとが、同じアクセスユニットまたはピクチャユニットに属する、請求項6または7に記載の方法。
  9. エンコーダによって実施される方法であって、前記方法は、
    ビットストリームを生成すること
    を含み、前記ビットストリームを生成することは、
    ピクチャのスライスについてのスライスヘッダを生成することであって、前記スライスヘッダが、状態値を符号化する状態シンタックスエレメントを備え、a)前記状態値が第1の値に等しくない場合、前記状態値は、i)前記エンコーダによって生成された前記ビットストリームが、前記ピクチャについてピクチャシンタックスエレメントのセットを備えるピクチャヘッダを備えるピクチャヘッダネットワークアブストラクションレイヤ(NAL)ユニットを含み、前記ピクチャヘッダNALユニットが、復号順序において前記スライスに先行し、前記ピクチャヘッダNALユニットと前記スライスとが、同じアクセスユニットまたはピクチャユニットに属することと、ii)前記スライスヘッダがピクチャシンタックスエレメントの前記セットを備えないこととを指示し、b)前記状態値が前記第1の値に等しい場合、前記状態値は、i)前記スライスヘッダがピクチャシンタックスエレメントの前記セットを含んでいることと、ii)前記ビットストリームが前記ピクチャについてのピクチャヘッダを備えるピクチャヘッダNALユニットを含まないこととを指示する、スライスヘッダを生成すること
    を含み、
    前記ビットストリームが、コード化ビデオシーケンス(CVS)またはコード化レイヤビデオシーケンス(CLVS)を備え、
    前記ピクチャが、前記CVSまたは前記CLVS内のピクチャであり、
    前記CVSまたは前記CLVSが、前記スライスヘッダを含む複数のスライスヘッダを備え、
    前記CVSまたは前記CLVS中に含まれる各スライスヘッダが、前記状態シンタックスエレメントを備え、
    各前記状態シンタックスエレメントが、同じ値を符号化しなければならない、方法。
  10. 前記状態シンタックスエレメントがバイナリフラグである、請求項9に記載の方法。
  11. ピクチャシンタックスエレメントの前記セットが、ピクチャパラメータセット(PPS)を識別するための値を符号化するPPSシンタックスエレメントを備える、請求項9または10に記載の方法。
  12. 前記スライスヘッダをデコーダに送信することをさらに含む、請求項9から11のいずれか一項に記載の方法。
  13. 前記状態値が前記第1の値に等しくなく、前記状態値は、前記ビットストリームが前記ピクチャについてのピクチャヘッダを含むことを指示する、請求項12に記載の方法。
  14. 前記スライスヘッダを前記デコーダに送信するより前に、前記ピクチャヘッダを前記デコーダに送信することをさらに含み、
    前記スライスヘッダを前記エンコーダに送信することが、前記スライスヘッダとスライスデータとを備えるビデオコーディングレイヤ(VCL)ネットワークアブストラクションレイヤ(NAL)ユニットを前記エンコーダに送信することを含み、
    前記ピクチャヘッダを前記エンコーダに送信することが、前記ピクチャヘッダを備える非ビデオコーディングレイヤ(非VCL)NALユニットを前記エンコーダに送信することを含む、
    請求項13に記載の方法。
  15. 前記NALユニットが、同じアクセスユニットまたはピクチャユニットに属する、請求項14に記載の方法。
  16. 処理回路によって実行されたとき、前記処理回路に、請求項1から15のいずれか一項に記載の方法を実施させる命令を備える、コンピュータプログラム。
  17. 請求項16に記載のコンピュータプログラムを含んでいるコンピュータ可読記憶媒体
  18. デコーダ(506)であって、前記デコーダが、
    請求項1から8のいずれか一項に記載の方法を実施する
    ように適応された、デコーダ(506)。
  19. エンコーダ(500)であって、前記エンコーダが、請求項9から15のいずれか一項に記載の方法を実施するように適応された、エンコーダ(500)。
JP2022541628A 2020-01-09 2020-09-24 ピクチャヘッダ存在 Active JP7473656B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062959123P 2020-01-09 2020-01-09
US62/959,123 2020-01-09
PCT/EP2020/076815 WO2021139905A1 (en) 2020-01-09 2020-09-24 Picture header presence

Publications (2)

Publication Number Publication Date
JP2023514662A JP2023514662A (ja) 2023-04-07
JP7473656B2 true JP7473656B2 (ja) 2024-04-23

Family

ID=76763752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022541628A Active JP7473656B2 (ja) 2020-01-09 2020-09-24 ピクチャヘッダ存在

Country Status (5)

Country Link
US (4) US11190792B2 (ja)
EP (1) EP4088469A1 (ja)
JP (1) JP7473656B2 (ja)
KR (1) KR20220119675A (ja)
CN (1) CN115004710A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220119675A (ko) * 2020-01-09 2022-08-30 텔레폰악티에볼라겟엘엠에릭슨(펍) 화상 헤더 존재
EP4088453A4 (en) 2020-02-14 2023-05-10 Beijing Bytedance Network Technology Co., Ltd. COLOCATED IMAGE INDICATION IN VIDEO BITSTREAMS

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023509684A (ja) 2020-01-02 2023-03-09 エルジー エレクトロニクス インコーポレイティド ピクチャヘッダを含む映像情報をコーディングする映像デコーディング方法及びその装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6956600B1 (en) * 2001-09-19 2005-10-18 Bellsouth Intellectual Property Corporation Minimal decoding method for spatially multiplexing digital video pictures
SG10201506682SA (en) * 2010-09-30 2015-10-29 Mitsubishi Electric Corp Moving image encoding device, moving image decoding device, moving image coding method, and moving image decoding method
CN104205819B (zh) * 2012-02-01 2017-06-30 诺基亚技术有限公司 用于视频编码的方法和装置
US20130343465A1 (en) * 2012-06-26 2013-12-26 Qualcomm Incorporated Header parameter sets for video coding
AU2013283173B2 (en) * 2012-06-29 2016-03-24 Ge Video Compression, Llc Video data stream concept
EP3090558A4 (en) * 2014-01-03 2017-08-16 Nokia Technologies OY Parameter set coding
KR20180116835A (ko) * 2017-04-18 2018-10-26 한국전자통신연구원 비디오 비트 스트림 혼합 방법 및 이를 수행하는 장치
MX2021010337A (es) * 2019-02-27 2021-09-28 Huawei Tech Co Ltd Un codificador, un decodificador y metodos correspondientes.
US11395007B2 (en) * 2019-12-12 2022-07-19 Tencent America LLC Method for signaling dependent and independent picture header
US11343524B2 (en) * 2019-12-27 2022-05-24 Tencent America LLC Method for adaptation parameter set reference and constraints in coded video stream
US11399188B2 (en) * 2020-01-01 2022-07-26 Tencent America LLC Method for mixed NAL unit type support in a coded picture
US11356706B2 (en) * 2020-01-08 2022-06-07 Qualcomm Incorporated Storage and delivery of video data for video coding
KR20220119675A (ko) * 2020-01-09 2022-08-30 텔레폰악티에볼라겟엘엠에릭슨(펍) 화상 헤더 존재
US11303892B2 (en) * 2020-01-23 2022-04-12 Qualcomm Incorporated Adaptive rounding for loop filters
US11706428B2 (en) * 2020-04-06 2023-07-18 Tencent America LLC Method for signaling picture header in coded video stream

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023509684A (ja) 2020-01-02 2023-03-09 エルジー エレクトロニクス インコーポレイティド ピクチャヘッダを含む映像情報をコーディングする映像デコーディング方法及びその装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Benjamin Bross, Jianle Chen, Shan Liu, Ye-Kui Wang,Versatile Video Coding (Draft 7) [online],JVET-Q JVET-P2001-vE,ITU-T インターネット<URL:https://jvet-experts.org/doc_end_user/documents/17_Brussels/wg11/JVET-Q0041-v1.zip>,2019年12月05日,pp.90-91

Also Published As

Publication number Publication date
US20210218978A1 (en) 2021-07-15
EP4088469A1 (en) 2022-11-16
US20220078463A1 (en) 2022-03-10
US20230125007A1 (en) 2023-04-20
JP2023514662A (ja) 2023-04-07
US20240064322A1 (en) 2024-02-22
US11490106B2 (en) 2022-11-01
US11190792B2 (en) 2021-11-30
CN115004710A (zh) 2022-09-02
US11778221B2 (en) 2023-10-03
KR20220119675A (ko) 2022-08-30

Similar Documents

Publication Publication Date Title
CN112771885B (zh) 用于针对视频编码的非二进制简档约束信令的方法和装置
KR102079803B1 (ko) 영상 디코딩 방법 및 이를 이용하는 장치
US10091532B2 (en) Bitstream conformance constraints in scalable video coding
US11356667B2 (en) Methods providing encoding and/or decoding of video using a syntax indicator and picture header
US11778221B2 (en) Picture header presence
US20240080493A1 (en) Profile tier level parameter set in video coding
US20220286710A1 (en) Signaling of access unit delimiter
TWI777601B (zh) 靜止圖像設定檔之偵測
KR20220160104A (ko) 양방향 픽처 조건에 기초한 디코딩
WO2021139905A1 (en) Picture header presence
US20220360787A1 (en) Video coding layer up-switching indication
US20230247211A1 (en) Scalability using temporal sublayers
WO2024079334A1 (en) Video encoder and video decoder
KR20220065804A (ko) 세그먼트 존재 정보 제공

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20220826

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240411

R150 Certificate of patent or registration of utility model

Ref document number: 7473656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150